Sunteți pe pagina 1din 202

Capitolul 1

CONCEPTE DE BAZ. OBIECTUL STATISTICII

1.1. Obiectul statisticii i importana acesteia n economie


Statistica este tiina care se ocup cu descrierea i analiza numeric a fenomenelor de mas,
dezvluind particularitile lor de volum, structur, dinamic, conexiune, precum i regularitile sau
legile ce le guverneaz [Trebici, V., 1985].
Exist un mare numr de definiii ale statisticii fapt care are mai multe explicaii; istorice
statistica s-a constituit la confluena mai multor orientri i discipline, dar avnd la origine un caracter
social; metodologice statistica ncorporeaz o serie de metode n care predomin cele cantitative, cu
fundamentarea epistemologic corespunztoare; aplicative prin generalitatea metodelor sale,
statistica se aplic n cele mai variate domenii, de la astronomie la societate, de la microcosmos la
macrocosmos n natur i societate, de la fizica statistic pn la statistica social [Trebici, V., 1985].
O definiie sau alta, struie fie asupra unei faze din demersul metodologic, fie asupra unui
domeniu restrns, fie asupra unui grup de metode, asupra teoriei sau dimpotriv a aplicaiilor.
n prezent statistica dispune de un corp de metode a cror putere de cunoatere este verificat
n variate domenii i de o teorie general n continu dezvoltare. Cultura statisticii devine tot mai mult
o component din cultura general a omenirii contemporane, iar gndirea statisticii o modalitate
tiinific indispensabil pentru analiza i interpretarea unor clase foarte largi de fenomene.
Rezultat al unui ndelungat proces, statistica se prezint cu un corp comun de noiuni organizat
n jurul conceptului de probabilitate, de metode tiinifice, cu fundamentare epistemologic explicit i
cu o varietate de domenii de aplicare, acoperind practic natura i societate.
Astzi, statistica constituie un puternic instrument de cunoatere a lumii nconjurtoare. Marea
majoritate a disciplinelor mprumut de la statistic modelele i procedeele acesteia, indispensabile de
altfel ndeplinirii rolului acestora. Trebuie menionat ns marele pericol la care aceste discipline pot fi
supuse n cazul folosirii necorespunztoare a metodelor i procedeelor statistice.
Analiza i cunoaterea fenomenelor i proceselor social economice se poate realiza numai ca
urmare a unei observri riguroase i metodice, n cursul creia ele pot fi msurate. n cadrul operaiei
de modelare a fenomenelor i proceselor are loc un proces de simbolizare i abstractizare a lor n
vederea analizrii sub aspect cantitativ. Analiza cantitativ constituie o faz premergtoare analizei
calitative. Testarea modelelor construite se realizeaz prin intermediul operaiei de simulare. Pe
parcursul tuturor fazelor de construire i testare a modelelor, statistica este mereu prezent n cmpul
cercetrii tiinifice fiind solicitat de a lua decizii pe baza metodelor i procedeelor pe care le pune la
dispoziie. Modelul construit i testat vine n ajutorul statisticii s aprofundeze cunoaterea
fenomenelor i proceselor.
Modelarea matematic a ctigat tot mai mult teren, dobndind o importan deosebit, odat
cu intensificarea aplicrii modelelor statistice. Culegerea i organizarea datelor rezultate din observri
statistice constituie etapa premergtoare elaborrii unui model. n acest mod, modelul realizat va
reprezenta o machet a realitii, alctuit pe baza datelor din observarea statistic. Pe bun dreptate,
modelarea este considerat o modalitate de cunoatere a realitii nconjurtoare.
Organizarea culegerii, transmiterii i recepionrii informaiilor n cadrul unui sistem economic
constituie obiectivele eseniale ale unui sistem informaional. Un sistem informaional este alctuit din
mai multe circuite informaionale, unde fiecare n parte trebuie s includ operaii de culegere,
transmitere neperturbat a datelor i recepionrii acestora n scopul folosirii lor. Trecerea de la
prelucrarea manual la cea automatizat a tuturor fazelor din cadrul sistemului informaional,
adncete procesul de cunoatere a realitii, permind asimilarea sistemului informaional unui flux
tehnologic informaional, prin transformarea lui ntr-un sistem cibernetic. Organizarea circulaiei

informaiei ntr-un sistem n conformitate cu principiile sistemelor cibernetice, constituie un suport


tiinific n abordarea gestiunii eficiente a acestuia. Avnd n vedere natura nedeterminist a majoritii
elementelor componente dintr-un sistem cibernetic, studierea stabilitii acestora se realizeaz apelnd
tot la statistic. Studii de reglare i echilibru ntr-un sistem cibernetic se pot aborda numai pe baza
unor observri statistice realizate metodic care ne permit s construim modelul matematic n
conformitate cu realitatea.
Informatica, prin aparatul su, se implic tot mai mult n toate fazele de vehiculare i
prelucrare a informaiilor din cadrul sistemelor informaionale, conducnd n acest mod la un salt
calitativ important, cu consecine semnificative i asupra statisticii. Calculatoarele electronice, prin
puterea lor de calcul, conduc la o nou viziune cu privire la funciile statistice, precum i la
modalitile de realizare a acestor funcii. Realizarea automat i n regim interactiv a tuturor
metodelor i procedeelor algoritmizabile din statistic, cu ajutorul calculatorului nu afecteaz cu nimic
obiectul i metoda statisticii. Calculatorul electronic nu constituie dect un instrument de calcul,
degajnd statistica de volumul mare de calcule. n aplicaiile practice implementate cu ajutorul
calculatorului specialistul este absolvit n totalitate de manipularea datelor ct i a operaiilor cu
acestea, concentrndu-se n exclusivitate asupra interpretrii rezultatelor intermediare i finale.
Statistica informaional, care a fost denumit aa de academicianul Octav Onicescu, i-a gsit
aplicaii practice n diverse domenii. Studierea sistemelor n raport cu informaia coninut n acestea,
a permis o abordare sistemic i mai bine fundamentat matematic a realitii. Teoria matematic a
informaiei formuleaz legile cele mai generale cu privire la comenzile, controlul i comunicaiile
dintr-un sistem, stabilind n acelai timp principiile de codificare, prelucrare, pstrare i transmitere a
informaiei de care statistica beneficiaz din plin. Iniiatorul teoriei matematice a informaiei a fost
Claude Shannon, care s-a bazat pe teoria probabilitilor. Teoria iniiat de Shannon a permis
reducerea perturbaiei care influeneaz transmiterea informaiei.
Fiind un proces complex de cunoatere, judecat i aciune, managementul se concretizeaz
prin operaii de informare, analiz i control, punctul esenial constituindu-l momentul lurii deciziei.
Toate aceste operaii folosesc metodele i procedeele statisticii ncepnd cu culegerea (observarea)
datelor i ncheind cu deducerea concluziilor necesare lurii deciziilor. Aceasta a permis conturarea
unei discipline denumit teoria deciziei, avnd drept scop fundamentarea tiinific a procesului
decizional. Deoarece teoria deciziei face apel i la modele deterministe, aceasta se integreaz ntr-un
domeniu mai larg privind matematica aplicat i anume n cercetarea operaional. Cercetarea
operaional este considerat un instrument de conducere naional a proceselor i fenomenelor cu un
nalt grad de complexitate. Aceast disciplin integreaz n cuprinsul su metode i procedee statistice
ct i o mulime de tehnici de natur tiinific, tehnic i de culegere i prelucrare a informaiei.
Decizii n situaii de risc constituie un alt domeniu n care statistica se aplic. Diversele
variante de dezvoltare a unui fenomen sau proces, fie social sau economic, presupune descompunerea
acestuia ntr-o mulime de evenimente care formeaz un cmp complet de evenimente. Anticiparea
celei mai plauzibile variante de dezvoltare a fenomenului presupune cunoaterea distribuiei de
probabilitate asociat acestuia. Acest lucru nu este posibil fr o observare metodic a evoluiei
fenomenului n timp i ca urmare o determinare a legii de probabilitate pe care o urmeaz. Aflarea
distribuiei de probabilitate, utiliznd modele i procedee statistice, permite a aprecia gradul de risc la
care este supus o aciune sau alta.
n marketing statistica se regsete n S.S.D.M. (sistemul suport al deciziilor de marketing), ca
acesta fiind compus din Banca statistic i Banca de modele. SSDM este un ansamblu coordonat
de date, sisteme, instrumente i tehnici, nzestrat cu tehnologia necesar ce ajut o organizaie s
culeag i s interpreteze informaiile relevante referitoare la activitatea sa i la mediul n care
opereaz fcnd din acesta temelia aciunilor de marketing. [Kotler,Ph., 1997].
Pe baza celor prezentate se poate sublinia nc o dat rolul i importana cunoaterii metodelor
i procedeelor puse la dispoziie de statistic n procesul cunoaterii. Nu este lipsit de importan
aportul statisticii nici n domenii ca: medicin, biologie, fizic, chimie, tiine juridice etc. Frecvente
sunt cazurile n care studii ntreprinse n aceste domenii trag concluzii care au la baz o mulime de
date rezultate n urma unor observri statistice, implicnd nemijlocit modele ale inferenei statistice.

Ronald Fisher a remarcat: Ctre statisticieni ne ndreptm pentru a rspunde la problemele


cele mai serioase puse de marile aventuri ale epocii noastre. De fiecare dat cnd se ntreprinde ceva
important, statisticienii sunt n culise. n toate cercetrile tiinifice de baz, ei sunt cei care elaboreaz
planurile de experien sau observaii i tot la ei se recurge pentru a analiza rezultatele pentru a evalua
constatrile i pentru a separa faptele clar demonstrate de cele ce mai cer confirmarea [Trebici, V.,
1985].
Cercetrile tiinifice simt necesitatea unei escorte statistice n dou momente fundamentale
ale cercetrii: momentul de nceput legat de culegerea i prelucrarea datelor i n momentul aplicativ,
de verificarea teoriilor pe calea confruntrii cu realitatea.
Multitudinea de domenii n care statistica se aplic i-a permis lui M.G. Kendall s spun c
Statistica, n sensul cel mai larg, este matricea oricrei tiine experimentale.
1.2. Istoricul statisticii
Statistica, n contextul celorlalte tiine, s-a confruntat ca disciplin de sine stttoare, urmnd
o traiectorie care leag practica de teorie. Preocupri de natur statistic, prin abordri variate a
diverselor fenomene, se pierd n vechimea istoriei. Att n Grecia antic, dar mai cu seam n imperiul
roman, investigaiile arheologice au scos la iveal o serie de date care privesc inventarierea bunurilor,
a resurselor umane, descrierea geografic i politic a diverselor state.
Toate aceste preocupri, indiferent de natura lor, au constituit o consecin a necesitii
practice, executndu-se n mod empiric i fr respectarea unor criterii riguroase. Beneficiari ai acestor
date erau organele fiscale, militare i cele administrative, direct interesate n evaluarea potenialului
uman i material a diverselor forme de organizare teritorial sau statal. Aceste date serveau n
principal nevoilor practice de orientare.
Interesele de ordin tiinific nu au ntrziat prea mult s apar, oblignd statistica s prseasc
stadiul de statistic practic. ncepea s se impun cunoaterea unor fenomene, referitor la care se
cereau o multitudine de date. Ca urmare, apare necesitatea cunoaterii unor tehnici care s permit
desprinderea unor concluzii fundamentale pe baza datelor nregistrate. n faza incipient de
confruntare a statisticii, aceasta se mrginea la descrierea statului, expunerea situaiei geografice,
economice i politice. Acest mod de abordare a statisticii cunoscut sub numele de descrierea
statului a predominat pn n sec. Al 17-lea i al 18-lea cnd a atins punctul culminant, concordnd
cu constituirea n Germania a unei coli, cunoscut sub denumirea de coala descriptiv german.
n conformitate cu normele teoretice, care erau specifice universitilor germane, descrierea
statului s-a conturat ca o disciplin cu obiect propriu de predare. Ulterior, aceast disciplin nscut
din practic, a primit numele de statistic, devenind un obiect de studiu favorit n Germania. Termenul
de statistic definit n spiritul colii din Gttingen, a fost preluat de muli statisticieni recunoscui ai
epocii respective.
Reprezentanii colii de statistic din Germania, s-au ridicat n oarecare msur peste
orientarea pur descriptiv a naintailor, studiile care aveau drept obiectiv, descrierea statului
nregistrnd o nou dimensiune i anume cea numeric. n acest nou context, de mbogire prin
componenta numeric, statistica nu s-a schimbat din punct de vedere a coninutului, ea continund s
rmn o disciplin orientat cu preponderen spre descrierea fenomenelor i nu spre cutarea unor
legi, rmnnd o disciplin caracterizat de un mod de prezentare preponderent verbal. n acest
context au fost elaborate lucrri cu privire la descrierea statelor n diferite ri europene, constituind
astzi valoroase surse de informaie.
n Moldova, cea mai de seam lucrare este Descrierea Moldovei a lui Dimitrie Cantemir.
Aceast lucrare, cu un pronunat caracter monografic n plan geografic, politic, social i cultural, s-a
impus n mod deosebit lumii europene din acea perioad, desemnndu-l pe autor n rndul fruntailor
statisticii descriptive europene.
n perioada de avnt a statisticii descriptive a statului, n Anglia i n afara universitilor, apare
un curent statistic nou, cunoscut sub numele de aritmetica politic. Noul curent din statistic se
caracterizeaz prin analiza datelor de observaie prin procedee matematice, relevarea regularitilor n
fenomenele social-economice, formulri i ncercri de previzionare a unor fenomene.

Implicarea aparatului matematic n descoperirea legitilor care caracterizau fenomenele


constituia un real progres, anticipnd apariia statisticii moderne.
Reprezentanii de seam a noului curent n statistic au insistat n mod deosebit prin lucrri n
domeniul demografiei, deoarece vedeau n studiul populaiei izvorul bogiei i puterii Angliei. Merit
s amintim n acest sens pe John Graunt, William Petty i Edmund Malley.
J. Graunt, analiznd cu atenie registrele de nateri i decese din Londra, a ncercat s gseasc
legitile creterii populaiei, a echilibrului numeric dintre sexe, a fertilitii, morii etc. Studiile lui
Graunt relev, pentru prima oar, preponderena naterilor masculine n raport cu naterile feminine
(107 biei la 100 fete), calculnd primele rate de mortalitate pe grupe de vrst, alctuind i o
rudimentar tabel de mortalitate.
W. Petty, prin lucrrile sale, folosete estimrile cantitative n compararea potenialului uman
i economic al diferitelor state.
E. Halley a fost un reprezentant de seam a colii statistice din acea vreme din Anglia,
abordnd n lucrrile sale subiecte legate de estimarea populaiei ctorva state, bazndu-se pe criterii
ceva mai raionale dect cele adoptate anterior, ct i alctuirea primei tabele complete de mortalitate.
La promovarea principiilor aritmeticii n investigarea fenomenelor economice s-au evideniat
n mod deosebit ali doi reprezentani ai colii engleze: Devanant i King. Ultimul s-a dedicat n mod
special calculelor privind veniturile statului pe calea impozitelor, de asemenea ncercnd s stabileasc
mrimea capitalurilor de care dispunea Anglia n sec. al 17-lea, pierderile suferite n urma rzboaielor,
incendiilor, epidemiilor.
Influena aritmeticii politice engleze s-a fcut simit i n alte ri, conturndu-se un curent al
aritmeticii politice europene. Aritmetica politic s-a impus n lupta cu coala statisticii descriptive din
Germania, prin intermediul lui J.P. Sssmlich. Lucrrile sale se remarc n special prin: cutarea
explicaiei fenomenelor vieii umane i indicarea legilor ce le guverneaz, corelarea fenomenelor
demografice i economice, examinarea fenomenelor n dinamic, identificarea regularitilor n
volumul de date rezultate din observaii etc.
n consecin, se poate afirma c la sfritul sec. al 18-lea, n statistic se prefigurau dou
curente: primul curent corespunztor cruia statistica era neleas ca o descriere empiric i verbal a
caracteristicilor statului (statistica descriptiv) i al doilea curent conform cruia statistica trebuie s
se dedice analizei fenomenelor sociale, n cutarea de legiti ntemeiate cu regularitate pe observaii i
calcule numerice (aritmetica politic).
Statistica, prin curentele sale, ctig teren tot mai mult, iar descrierile statistice devin
preocupri de baz n instituiile publice. Aritmetica politic, sub aspect conceptual, capt o nou
dimensiune odat cu inventarea calculului probabilitilor. Aceast nou ramur a matematicii, avea s
ndeplineasc misiunea fundamentrii tiinifice a preocuprilor statistice de pn atunci. Bernoulli i
Laplace aveau s fie primii care au utilizat modelele teoriei probabilitilor n studiul statistic al
fenomenelor economice i sociale. Bernoulli formuleaz legea numerelor mari, deschiznd drumul
aplicrii calculului probabilitilor n economie. Laplace s-a preocupat de studierea fenomenelor
dependente de diveri factori complexi de aciune, prefigurnd utilitatea acestui calcul i n abordarea
de ansamblu a fenomenelor sociale.
Un alt reprezentant de seam al calculului probabilitilor a fost Gauss, care a definit legea de
repartiie normal. n aceeai perioad, Fourier a publicat un numr de studii despre aplicarea
matematicii n investigaii demografice, iar Poisson descoper legea de repartiie a evenimentelor rare.
Gndirea probabilistic avea s se consolideze n statistic n secolul al 19-leaa, asigurndu-i
progresul i renumele de care se bucur astzi n ntreaga lume. Un reprezentant de seam din aceast
perioad i care a dominat gndirea statistic a acestui secol a fost matematicianul, astronomul i
statisticianul belgian Adolphe Qutelet. Conform teoriei acestui mare gnditor, diversele caractere
fizice, intelectuale i morale ale oamenilor, observai n mas, s-ar echilibra ntr-o fiin fictiv, ideal,
dorit de natur, dar neizbutit. Fiinele umane, conform teoriei omului mediu, s-ar distribui de-o
parte i de alta a acestei fiine ideale. Pentru a desprinde ce este general fiinei umane, A. Qutelet
presupune debarasarea omului de caracterele individuale ale sale care nu sunt dect accidentale. Ideea
de om mediu a constituit izvorul de inspiraie privind o serie de noiuni i concepte noi din statistic,
cum ar fi: repartiie, medie, dispersie, observare de mas, regularitate etc. n conformitate cu teoria lui

A. Qutelet, regularitile deduse ca urmare a unei observri de mas deriv din legi care sunt urmate
de om att n ordinea fizic ct i n cea moral. Lui A. Qutelet i se atribuie, pentru prima oar, o
teorie sintetic a statisticii bazat pe principii, tehnici i procedee statistice. Acesta imprim statisticii
noi direcii de cercetare: cercetarea variaiei i a relaiilor cazuale n masa fenomenelor, sesizarea
regularitilor, abordarea cu prioritate a fenomenelor vieii umane etc. Conform teoriilor lui A.
Qutelet, statistica deine metode unice necesare studierii fenomenelor bazate pe calculul
probabilitilor.
Considerat ca unul din fondatorii economiei matematice, A. Cournot considera statistica ca o
disciplin de baz n abordarea fenomenelor i desprinderea cauzelor regulate ale acestora n
contextul aciunii cauzelor ntmpltoare.
n secolul al 19-lea se ntlnesc diverse preocupri n domeniul statisticii teoretice i practice.
Unele dintre acestea admiteau includerea n sfera statisticii a tuturor fenomenelor cuantificabile
numeric, abstracie fcnd natura lor, n timp ce alii considerau de domeniul statisticii doar studierea
fenomenelor sociale. Mai exista un grup restrns, care restriciona cmpul de aplicare al statisticii la
fenomenele vieii umane.
Contribuii de seam la progresul statisticii i consolidrii acesteia ca fiin au adus i alte coli
de statistic, n decursul sectorului al 19-lea.
Merit, cu prisosin, s fie amintii reprezentanii colii statistice ruse care s-au impus n
domeniul statisticii sociale, dar mai ales n aportul adus n dezvoltarea teoriei probabilitilor. n
concepia lui D.P. Juravski statistica trebuie s aib ca obiect de studiu viaa social cu multitudinea de
fenomene care i aparine, considernd statistica ca o tiin metodologic. P.L. Cebev i A.A.
Markov i-au adus un aport substanial la dezvoltarea teoriei probabilitilor. Cebev demonstreaz
printre altele, teorema central a teoriei probabilitilor i a legii numerelor mari, iar Markov a pus
bazele teoriei moderne a proceselor stochastice i a lanurilor care-i poart numele.
n secolul trecut se contureaz o nou etap n evoluia statisticii, cunoscut ca etapa
constituirii statisticii moderne. n aceasta nou etap statistica depete stadiul descriptiv, de
prezentare simplist a fenomenelor, insistndu-se pe interpretarea analitic a fenomenelor i deducerea
de concluzii inductive avnd la baz datele din observri. Acest lucru nu era posibil dect printr-o
ntreptrundere a statisticii cu matematica pentru a permite gsirea celor mai corespunztoare metode
n atingerea obiectivelor.
F. Galton i K. Pearson reprezentani ai colii statistice anglo-saxone, au elaborat o mare parte
din metodele i procedeele specifice analizei statistice moderne, continuate apoi de R.A. Fisher i alii.
K. Pearson transpune n limbaj matematic ideea de variaie legat a lui Galton, constituindu-se ntr-o
teorie, teoria corelaiei statistice, permind stabilirea diverselor forme de legtur n aplicaii practice
din domeniul vieii sociale.
Prelungirea statisticii la rezolvarea urmtoarelor categorii de probleme: probleme de
specificaie, probleme de observaie i probleme de distribuie se datoreaz lui R.A. Fisher. n noua
concepie despre statistic se pornete de la ipoteze statistice cu privire la fenomenul de observat,
deduciile logice desprinse urmnd a se compara cu datele avute la ndemn. Dac acestea sunt n
concordan, ipotezele avansate se consider valide, cel puin pn la noi observaii mai riguroase. Se
prefigureaz tot mai frecvent ideea, conform creia, preocuprile de a trage concluzii de o valoare
general trebuie s se bazeze pe datele observate din eantion. Cercetarea prin sondaj ncepe s devin
o aplicaie curent, observarea total practicndu-se din ce n ce mai rar i numai n cazuri absolut
necesare. Caracterizarea unei populaii pornind de la datele de observare pe baz de eantion,
presupune o anumit incertitudine, pe care specialistul caut s o reduc ct mai mult. Una din
problemele importante ale statisticii o constituie tocmai msurarea gradului de incertitudine care
privesc concluziile inductive. n concordan cu noile probleme ale vieii sociale i economice,
statistica se implic n mod direct n determinarea riscurilor de eroare i a pierderilor implicate de
deciziile ntemeiate pe o informaie care, prin natura sa, nu poate fi exhaustiv.
n aceast perioad, prin preocuprile mai ales de ordin teoretic, statistica se contureaz ca o
disciplin tiinific. Statistica nregistreaz progrese remarcabile ndeosebi n domeniul teoriei
matematice, conducnd la descoperirea de metode noi de investigare mai elaborate i mai eficiente.
Din punct de vedere pragmatic, statistica pune stpnire pe noi domenii de aplicaie, rezultatele

obinute constituind un imbold privind implicarea statisticii n cele mai variate sectoare ale lumii
sociale i economice.
n multitudinea de definiii care s-au dat i se mai dau statisticii, se pot deosebi dou curente:
unul din acestea consider statistica drept tiin, iar cellalt o admite ca metod. Indiferent crui
curent aparinem, statistica modern prezint dou aspecte diferite, dar complementare: aspectul
descriptiv, nglobat n aa numita statistic descriptiv, care permite fixarea informaiilor aa cum au
rezultat din prelucrarea datelor din observare i aspectul inductiv, nglobat n statistica inferenial,
care ne permite o tratare teoretic a datelor n vederea deducerii de concluzii logice, asociate
observaiilor efectuate. n cadrul unui demers statistic, cele dou aspecte trebuie privite ca dou
momente care aparin unuia i aceluiai proces de cunoatere.
Statistica se dovedete de nenlocuit, n studiul cunoaterii fenomenelor social-economice,
generate de cauze multiple i complexe. Aceste fenomene domin aproape ntreaga activitate social i
economic. Complexitatea acestora ridic mari dificulti n stabilirea legturii fenomen-cauz supus
analizei statistice. Pornind de la date de observare, pe baza calculelor statistice, se pot desprinde legi
statistice, care descriu relaii cauzale de natur statistic. Aceste legi sunt legi cu statut propriu, care
sunt la fel de obiective ca i legile dinamice. Legile statistice sunt caracteristice numai fenomenelor
urmrite printr-un numr mare de cazuri, acolo unde ntregul se manifest prin intermediul unitii
sistemelor componente i nu prin fiecare parte component luat separat. Legea statistic acioneaz ca
o tendin de ansamblu, dedus pe baza unui volum mare de observaii statistice. Legea statistic se
poate pune n eviden numai dac se consider un numr suficient de mare de uniti statistice
elementare ale populaiei de studiat supuse observrii.
Legea numerelor mari, care constituie o expresie a legturii dintre necesitate i ntmplare, se
verific n colectiviti relativ mari i cuprinztoare. n conformitate cu aceast lege, aciunea
conjugat a unui numr mare de factori aleatori, n condiii bine determinate, conduce la rezultate
aproape independente de ntmplare, dnd astfel posibilitatea ca necesitatea s se realizeze. Referindune la prima lege statistic descoperit tim c la natere numrul bieilor ntrece pe cel al fetelor,
raportul iniial admis era de biei 107; fete 100. Particulariznd aceast lege statistic la distribuia pe
sexe a nscuilor n snul fiecrei familii n parte, ar fi imposibil s indicm ce fel de raport exist,
date fiind variaiile sale destul de numeroase i n acelai timp importante pentru diferite familii. O
cercetare statistic care s prezinte rezultate semnificative n acest sens, trebuie ntreprins pe mase
ndeajuns de mari de nateri. nsui J. Bernoulli care a dat acestei legi o form matematic, a inut s
menioneze la vremea sa, c sporirea numrului observaiilor n scopul mrimii gradului de siguran a
deciziei nu constituie ceva nou i neobinuit, deoarece omul indiferent de pregtirea sa tie c sursa de
reuit referitor la o aciune a sa este cu att mai mare, cu ct mai multe observaii sunt luate n
considerare.
1.2.1. Scurt istoric privind evoluia statisticii n Romnia
Despre un nceput de organizare statistic n rile romneti nu poate fi vorba dect din
secolul al. XVIII-lea ncoace. Prima scriere sau recensmnt al locuitorilor pare s fi fost fcut de
Constantin Mavrocordat, cu ocazia reformelor sale n Muntenia i Moldova. Regulamentul organic
(1831) introduce catagrafia sau recensmntul sistematic i periodic. Din 7 n 7 ani trebuia s se fac
categrafia populaiei, dup norme bine stabilite, pentru a servi la aezarea birului i la hotrrea
veniturilor rii.
La 28 aprilie 1859, domnitorul Al. I. Cuza aprob nfiinarea unui birou de statistic n ara
Romneasc, numind ef pe Dionisie Pop Marian, iar la 1 iulie 1859 aprob nfiinarea Direciei de
Statistic din Moldova, sub conducerea lui Ion Ionescu de la Brad.
La 4 august 1862 cele dou organe de statistic se reunesc sub denumirea Oficiului Statistic
pentru Principatele Unite sub conducerea lui Dionisie Pop Marian.
Gndirea statistic romneasc s-a aliniat n contextul amplu al curentelor statistice existente n
Europa. Reprezentanii statisticii romneti au pstrat un contact permanent cu preocuprile statistice
din rile Europei, aducndu-i contribuii de seam att la promovarea statisticii teoretic i practice,
ct i al organizrii ei instituionale. Cei mai de seam reprezentai ai statisticii romneti din acea

perioad au fost Ion Ionescu de la Brad i Dionisie Pop Marian. Primul i-a prezentat punctul de
vedere despre statistic n lucrarea ntitulat Povuri pentru catagrafia Moldovei (1859). Statistica,
n viziunea lui I. I. de la Brad trebuie s cuprind dou pri: o prim parte care s presupun culegerea
datelor de observare, iar a doua parte s implice aparatul matematic. Se regsete n aceste abordri
metodologice, n linii mari, nsui demersul statistic modern, format din dou etape: una descriptiv,
alta inductiv, inferenial..
n concepia lui D. P. Marian statistica trebuie s studieze fenomenele naturale i sociale,
avnd drept scop descoperirea legilor care le guverneaz. Se evideniaz apartenena sa la curentul de
larg circulaie conform cruia obiectul de cercetare al statisticii trebuie s depeasc graniele sferei
fenomenelor sociale.
n spiritul statisticii descriptive europene i la noi n ar s-au scris lucrri statistice, statistica
figurnd ca obiect de studiu n nvmntul romnesc. Un curs de statistic a fost introdus n 1856 la
Facultatea Juridic de la Academia Mihilean din Iai de ctre Al. Papiu Ilarian, care avea drept
obiect descrierea statelor componente ale Europei sub aspect economic i social.
n 1860 apar Analele Statistice pentru cunoaterea Romniei, n care se public lunar date
privind statistica agricol, statistica vmilor, a micrii populaiei precum i studii cu caracter
economic.
n 1918 este creat Institutul Social Romn, form instituionalizat de cercetare sociologic.
Rezultatele au fost publicate sistematic n Arhivele pentru tiin i reform social, aprnd primele
cercetri statistice sub form de monografii. [ Bogdan, V., 1995].
Un recensmnt general al populaiei, cldirilor, ntreprinderilor industriale i comerciale are
loc n 1930. Debutul Anchetei Bugetelor de Familie are loc n 1950, care va deveni cercetare
permanent ntre 1950-1994.
n 1964 are loc o reuniune tiinific cu tema Anchetele selective, cnd pentru prima dat n
Romnia sunt formulate principiile proiectrii i utilizrii unui eantion matre.
ntre 1972-1989 are loc o ntrerupere dureroas a aplicrii sondajelor n studierea fenomenelor
economice datorit sistemului politic din acea vreme.
n prezent se organizeaz o multitudine de anchete, toate funcionnd pe principiile eantionrii
aleatoare.
Cu att mai mult astzi, cnd viaa social i cea economic este stpnit de fenomene i
procese dintre cele mai complexe, statistica vine n sprijinul cercettorului pentru a face lumin.
Descoperirea interdependenelor dintre diverse caracteristici care se ntlnesc n abordri de natur
social-economic constituie premiza consolidrii poziiei omului n raport cu lumea nconjurtoare.
Statistica, prin multitudinea de metode i procedee pe care le pune la dispoziia cercettorului,
permite o abordare tiinific a diverselor probleme care ne stau n fa. Nu ar fi posibile incursiunile
n viitor, prin elaborarea de previziuni i strategii de dezvoltare, fr aportul statisticii. Aceasta ne
ndreptete, pe bun dreptate, s-i acordm atenia cuvenit i n studiul economiei.
1.3. Concepte de baz
1.3.1. Populaia statistic
Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai natur,
care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i populaiei privit ca un
tot unitar. [Florea I.,1998]
O populaie este finit dac include un numr determinat de elemente, dar ea poate fi
considerat drept reprezentativ a unei populaii teoretice infinite. Ca urmare apare necesitatea de a
delimita o populaie n: coninut, spaiu i timp. Se mai denumete i populaia univers.
Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate, zon
etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea consumatorilor unui
produs, mulimea societilor productoare sau concurente ale unui produs, mulimea societilor
distribuitoare, angajaii unei societi etc.
Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc.

Unitatea statistic constituie elementul component, al populaiei statistice, asupra cruia se va


efectua nemijlocit observarea.
Unitatea statistic este purttorul originar de informaie sau subiectul logic al informaiei
statistice. Datorit varietii aspectelor sub care se poate prezenta n fapt, unitatea statistic comport o
definiie precis, care s exclud prin posibilitate de interpretare diferit de ctre observatori i astfel
orice eroare ce poate prejudicia valoarea investigaiei.
n exemplele citate mai sus, unitile statistice sunt: persoana, gospodria, consumatorul,
societatea productoare sau concurent, societatea distribuitoare, angajatul etc.
Se noteaz cu minusculele corespunztoare majusculei ce simbolizeaz populaia statistic,
respectiv ai, b i etc..
Volumul populaiei reprezint numrul unitilor statistice care alctuiesc populaia statistic.
Acesta poate fi finit sau infinit, n funcie de tipul populaiei care poate fi la fel finit sau infinit.
Se noteaz cu N, iar pentru o populaie A, avem:
A : {a1, a2, ..., aN}
Eantion reprezint o submulime a unei populaii statistice, constituit dup criterii bine
stabilite. n raport cu procedeul de formare a eantionului avem eantioane aleatoare i eantioane
dirijate.
Eantionul aleator este format din unitile statistice care rezult printr-un procedeu aleator:
procedeul tragerii la sori, tabelul cu numere ntmpltoare, procedeul extragerilor sistematice.
Eantionul dirijat este constituit pe baza unor informaii auxiliare existente la nivelul populaiei
studiate sau lsnd liber pe anchetator s aleag unitile respectnd doar realizarea structurii
eantionului n funcie de criteriile stabilite.
Se noteaz cu n.
Majoritatea studiilor au ca suport datele provenite de la nivel de eantion, de aici importana
constituirii acestuia i implicit, apelarea la inferena statistic, pentru a estima parametrii la nivelul
populaiei univers.
1.3.2. Variabila statistic
Variabila statistic reprezint o nsuire sau o trstur comun tuturor unitilor unei populaii.
Nivelul nregistrat de o variabil statistic la o unitate oarecare al populaiei se numete realizare sau
starea variabile. [Florea I., 1998].
n general se noteaz cu majusculele de la sfritul alfabetului, X, Y, Z etc. Dac se noteaz cu
X o variabil statistic oarecare, atunci cu x1, x2, ..., xN se vor nota strile variabilei respective.
Variabilele statistice se clasific n raport cu natura, modul de exprimare i modul de variaie.
a) Dup natura lor variabilele statistice pot fi atributive, de timp i de spaiu.
Variabila atributiv exprim un atribut sau nsuire esenial (alta, dect timpul sau
spaiul) unitilor populaiei;
Variabila de timp ne arat timpul n care au luat fiin unitile populaiei sau perioada de
timp n care au existat (exista);
Variabila de spaiu ne arat spaiul n care exist sau au luat natere unitile populaiei.
b) Dup modul de exprimare a strilor deosebim:
Variabil cantitativ este variabila ale crei stri se exprim prin valori numerice. Se mai
numete i variabil metric.
Variabil calitativ este variabila ale crei stri se exprim prin cuvinte sau coduri. Se
mai numete variabil nominal (strile se exprim prin cuvinte) sau variabil ordinal
(strile se exprim prin coduri).
c) dup modul de variaie variabila cantitativ poate fi:
Variabil discret este acea variabil care, n intervalul su de definiie nregistreaz cel
mult valori raionale, variaia are loc n salturi.
Variabil continu este acea variabil care poate lua orice valoare real din intervalul su
de variaie.

Exemple de variabile statistice relativ la populaia format din mulimea consumatorilor unui produs:
- vrsta: variabil atributiv, cantitativ, continu
X = { x1 = [15-20) [20-30) ... }
- frecvena de cumprare: variabil atributiv calitativ
Y = { y1 - foarte rar; y2 rar, ... }
- numr de sortimente cumprate relativ la produsul analizat: variabil atributiv, cantitativ,
discret:
Z = { z1 = 1; z2 = 2, ... }
- localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ
S = { s1 cartierul M sau s2 strada P1, ... }
- data ultimei cumprri a produsului analizat: variabil de timp, cantitativ
T = { t1 = 27.01.2002; t2 = 24.02.2002, ... }
Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi finite
sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei, numit lege de
probabilitate.
Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret sau
continu.
n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic constituie
o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare sunt probabile i n
strns legtur cu un anumit experiment. Strile unei variabile statistice nu sunt probabile, ele
cuantific o trstur proprie fiecrei uniti din populaie.
1.3.3. Observarea statistic
Observarea statistic const n identificarea unitilor populaiei i nregistrarea strilor
variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate prin observare se
numesc statistici.
Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou feluri:
total i parial.
Observarea total este acel tip de observare statistic n care are loc nregistrarea tuturor
unitilor care fac parte din populaie statistic supus studiului. Recensmntul populaiei Romniei
este un exemplu de observare total.
Observarea parial presupune observarea i nregistrarea unui anumit numr de uniti din
populaie, alese dup criterii bine definite.
n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie statistice exhaustive
rezultate prin observarea populaiei univers , fie statisticile rezultate din observarea parial a unui
eantion A, n ambele cazuri scopul final fiind acelai obinerea de informaii la nivelul
populaiei univers A.
1.3.4. Seria statistic
Seria statistic este o construcie care red fie distribuia unei populaii n raport cu una sau mai
multe variabile, fie variaia unei mrimi n timp, n spaiu sau de la o categorie la alta.
Seriile statistice se clasific n raport cu mai multe criterii, astfel:
1. n raport cu numrul variabilelor
Serii statistice unidimensionale, au la baz o singur variabil;
Serii statistice multidimensionale, care au la baz dou sau mai multe variabile.
2. Dup natura variabilelor deosebim:
Serii atributive, care au la baz variabile atributive;
Serii cronologice (de timp sau istorice), care au la baz variabile de timp;
Serii de spaiu sau teritoriale, care au la baz o variabil de spaiu.

3. Dup modul de exprimare a strilor variabilei deosebim:


Serii calitative, care au la baz variabile calitative;
Serii cantitative, care au la baz variabile cantitative i care dup modul de variaie a
variabilei pot fi: discrete (cnd variabila este discret) i continue (cnd variabila este
continu).
4. n raport cu natura indicatorului din care este alctuit seria, avem:
Serii de frecven sau serii de distribuie (repartiie);
Serii de variaie.
Seria statistic rednd distribuia populaiei n raport cu una sau mai multe variabile constituie
o descompunere a acesteia ntr-un numr R de clase. O astfel de serie este format n exclusivitate din
frecvene (absolute cumulate sau necumulate, relative cumulate sau necumulate) i de aceea se numesc
serie de frecven, de distribuie sau de repartiie. Prescurtat se mai folosete i denumirea de
repartiie statistic sau distribuie statistic.
Seria statistic ce red variaia unei mrimi n timp, n spaiu sau de la o categorie la alta se
numete serie de variaie.
1.3.4.1. Seria statistic de repartiie
Conform definiiei de mai sus, prin aceast serie se distribuie unitile unei populaii statistice
n raport cu una sau mai multe variabile.
Fie o serie statistic unidimensional avnd la baz variabila X, respectiv:
x 2 ... xi ... x R
x

(1.1)
X : 1
N 1 N 2 ... N i ... N R

Ni este frecven a absolut a clasei i, i = 1, R i reprezint numrul de unit i ale populaiei din clasa
pentru care variabila X a nregistrat valoarea Xi ,
N1 + N2 + ... + NR = N.
Clasa (grupa) de uniti n raport cu o variabil reunete acele uniti din cadrul populaiei care
nregistreaz aceeai stare a variabilei sau strile variabilei aparinnd unui anumit interval de varia ie.
Ca urmare, n raport cu o variabil statistic populaia poate fi structurat ntr-un anumit numr
de clase.
Exemplu
Fie A populaia statistic reprezentnd unitile de cazare turistic din Romnia, n anul 1999
i X categoria de confort (este o variabil statistic atributiv, cantitativ discret). Distribu ia
acestor uniti n raport cu variabila X este urmtoarea (conform A.S. al Romniei, 2000):
1
2
3
4 5
0

X :
666 1108 1090 290 91 5
- 0 neclasificate;
- 1090 ne arat numrul unitilor de cazare turistice avnd categoria de 2 stele;
De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X, poate fi
format cu frecvene relative, frecvene cumulate absolute sau relative.
Fie seria X format cu frecvene relative:
x x 2 ... xi ... x R

(1.2.)
X : 1
f 1 f 2 ... f i ... f R

fi - ne arat ponderea unitilor din populaie care au nregistrat pentru variabila X starea
xi:
N
fi = i
i = 1, R
N

sau
fi =

Ni
.100
N

i = 1, R

=1

(100 %)

i =1

Exemplu:
1
2
3
4
5
0

X :
0,205 0,341 0,3355 0,089 0,028 0,0015
sau
1
2
3
4
5
0

X :
20,5% 34,1% 33,55% 8,9% 2,8% 0,15%

33,55% reprezint ponderea unitilor de cazare turistic avnd categoria de 2 stele.


Pornind de la seria (1.1) se poate deduce seria format cu frecvene absolute cumulate,
respectiv:
x2
...
xi
...
xR
x

X: 1
N(x1 ) N(x 2 ) ... N(x i ) ... N(x R )

(1.3)

unde: N(xi) reprezint numrul de uniti din populaia studiat pentru care variabila nregistreaz
valori ce nu depesc valoarea xi.
N(x1) = N1
N(x2) = N1 + N2
.........................
N(xi) = N1 + N2 + ... + Ni
.........................
N(xR) = N1 + N2 + ... + NR = N
Exemplu.
1
2
3
4
5
0

X :
666 1774 2864 3154 3245 3250
2864 - ne arat numrul unitilor de cazare turistic avnd cel mult dou stele.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative
cumulate, respectiv:
x2
...
xi
...
xR
x1

X :
FN ( x1 ) FN ( x 2 ) ... FN ( xi ) ... FN ( x R )

(1.4)

unde: FN(xi) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat valori ce
nu depesc valoarea x i.
sau

FN(xi) = f1 + f2 + ... + fi

FN ( x i ) =

N ( xi )
N

(.100)

i = 1, R

Exemplu:
1
2
3
4
5
0

X :
20,5% 54,6% 88,15% 97,05% 99,85% 100%
88,15 % - reprezint ponderea unitilor de cazare turistice avnd cel mult 2 stele.
Aa cum se poate constata din definiia celor dou mrimi de frecvene cumulate, acestea se
pot calcula i are sens elaborarea unor serii statistice doar n cazul n care la baza seriei se gsete o
variabil cantitativ.
Relativ la aceeai populaie statistic studiat A mulime unitilor de cazare turistic din
Romnia n anul 1999, din A.S. al Romniei /2000, se pot extrage alte serii statistice de repartiie, ca
de exemplu:
- distribuia unitilor de cazare n raport cu forma de proprietate (cf. A.S. al Romniei/2000, pg.518).
majoritar de stat majoritar privat

Y :
1290
1960

Aceasta este o serie statistic de repartiie unidimensional avnd la baz o variabil atributiv,
calitativ i format cu frecvene absolute. n aceast situaie se poate elabora seria statistic format
cu frecvene relative, respectiv:
majoritar de stat majoritar privat

Y :
39,69%
60,31%

- distribuia unitilor de cazare n raport cu tipul destinaiei turistice (cf. A.S. al Romniei/2000,
pag.519)

litoral
Z :

729

balnear

montan

Delta
Dunarii

435

691

69

orase resedinta
de judet
inclusiv
Bucuresti
418

alte
localitati

908

Este o serie statistic de repartiie unidimensional avnd la baz o variabil atributiv


calitativ i format cu frecvene absolute. Se poate elabora seria format cu frecvene relative. De
asemenea, se pot elabora serii de repartiie unidimensionale n raport cu numrul de turiti cazai, cu
gradul de utilizare a capacitii n funciune, capacitatea existent etc.
Seria statistic de repartiie bidimensional este o construcie ce red distribuia unei populaii
n raport cu dou variabile.
Astfel, fie populaia statistic A studiat n raport cu variabilele X i Y, rezultatele observrii se
pot grupa ntr-un tabel de forma urmtoare:

x1

x2

...

xj

...

xJ

Total

y1
y2
.
.
yi

N11
N21
-

N12
N22
-

...
...
-

N1j
N2j
-

...
...
-

N1J
N2J
-

N1.
N2.
-

Ni1

N i2

...

Nij

...

NiJ

Ni.

.
.
yI

NI1

NI2

...

NIj

...

NIJ

NI.

Total

N.1

N.2

...

N.j

...

N.J

(1.5)

- Nij - reprezint numrul de uniti pentru care, variabila X nregistreaz starea xj i variabila Y
nregistreaz starea yi ;
- Ni. - numrul de uniti pentru care Y = yi, indiferent de nivelul nregistrat de variabila X;
- N.j - numrul de uniti pentru care X = xj, indiferent de nivelul nregistrat de variabila Y;
- N - numrul total de uniti analizate.
Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare:
x 2 ... x j ... x J
x1

X :

N
N
...
N
...
N
.
1
.
2
.
j
.
J

y
Y : 1
N 1.

y2
N 2.

... y i
... N i.

... y I

... N I .

denumite i serii de repartiie marginale, n raport cu X i Y


y1
Y / X = x j :
N1 j

... y i
... N ij

y2
N2 j

... y I

... N Ij

denumit serie de repartiie unidimensional n raport


X = xj, numrul acestora fiind egal cu numrul de stri a variabilei X.
x1
X / Y = y i :
N i1

x2

...

N i .2

... N ij

xj

...

xJ

... N iJ

j = 1, J

cu

condiionat

de

cu

condiionat

de

i = 1, I

denumit serie de repartiie unidimensional n raport


Y = yi, numrul acestora fiind egal cu numrul de stri a variabilei Y.

De asemenea se poate elabora sau deduce seria de repartiie bidimensional format cu frecvene
relative, respectiv:

x1

...

xj

...

xJ

Total

f11
-

...
-

f1j
-

...
-

f1J
-

f1.
-

fi1
-

...
-

fij
-

...
-

fiJ
-

fi.
-

fI1
f.1

...
...

fIj
f.j

...
...

fIJ
f.J

fI.
1

Y
Y1
.
.
yi
.
.
yI
Total
f ij =

N ij
N

f i. =

N i.
N

f. j =

N. j

i = 1, I

(1.6)

j = 1, J

Exemple:
Relativ la populaia statistic A studiat, din A. S. al Romniei/2000, se poate extrage o serie de
repartiie bidimensional, avnd la baz variabilele:
X - categoria de confort (numr de stele)
Y tipul unitii de cazare turistic
de forma urmtoare:
X
Y
Hoteluri
Moteluri
Hanuri turistice
Cabane turistice
Campinguri
Vile turistice i bungalouri
Tabere colare
Pensiuni turistice
Sate de vacan
Pensiuni agroturistice
Spaii de cazare pe
nave
Total

0
(neclasificate)
57
12
22
83
56
257
176
3
-

Total

259
50
59
69
482
77
110
2

388
53
19
15
212
191
1
210
1

91
5
4
2
122
44
21
1

14
69
7
1

2
3
-

811
120
22
165
142
1145
176
322
1
341
5

666

1108

1090

290

91

3250

Sursa: A.S. al Romniei/2000, pag.515


21 - ne arat numrul de pensiuni agroturistice avnd categoria de confort de 3 stele.
Tabelul de mai sus este o repartiie statistic bidimensional avnd la baz o variabil X
atributiv cantitativ discret i o variabil Y atributiv calitativ, format cu frecvene absolute.

Se poate deduce seria de repartiie bidimensional format cu frecvene relative, respectiv:


X
Y
Hoteluri
Moteluri
Hanuri turistice
Cabane turistice
Campinguri
Vile turistice i
bungalouri
Tabere colare
Pensiuni
turistice
Sate de vacan
Pensiuni
agroturistice
Spaii de cazare
pe nave
Total

Total

0,018
0,004
0,007
0,026
0,017
0,079

0,08
0,015
0,018
0,021
0,148

0,119
0,016
0,006
0,005
0,065

0,028
0,002
0,001
0,0006
0,038

0,004
0,021

0,0006
0,0009

0,25
0,037
0,007
0,051
0,044
0,352

0,054
0,0009

0,024

0,059

0,014

0,002

0,054
0,099

0,034

0,0003
0,065

0,006

0,0003
0,105

0,0006

0,0003

0,0003

0,0003

0,002

0,205

0,341

0,335

0,089

0,028

0,002

0,6% - reprezint ponderea pensiunilor agroturistice avnd categoria de confort de 3 stele, din totalul
unit ilor de cazare turistic.
De asemenea se pot extrage seriile unidimensionale marginale n raport cu X i Y i cele
condiionate, de exemplu:
1
2
3
4 5
0

X :
666 1108 1090 290 91 5
y 2 y3 y 4
y5
y6
y7
y8 y9
y
Y : 1
811 120 22 165 142 1145 176 322 1

y10 y11

341 5

2
3 4 5
0 1

X / Y = pensiuni tustice :
3 77 191 44 7
y y2
Y / X = 3 : 1
91 5

y3

y4
4

y5 y6
2 122

y7

y8
44

y9

y10
21

y11

1.3.4.2. Seria statistic de variaie

Conform definiiei seria de variaie red variaia unei mrimi, n timp, n spaiu sau de la o
categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o variabil de
timp), serii de spaiu i serii categoriale (au la baz variabile atributive). Cele mai des ntlnite sunt
seriile cronologice i seriile de spaiu.
Seriile de variaie au la baz mrimi absolute i relative. Dup unii autori din cadrul mrimilor
absolute fac parte indicatorul de nivel i diferena absolut a unei mrimi, iar din cadrul mrimilor
relative fac parte: indicatorul relativ de intensitate, indicele statistic i diferena relativ a unei mrimi.
Indicatorul de nivel (Y) este o mrime ce reflect nivelul unui fenomen analizat. De exemplu:
producia diferitelor produse, veniturile populaiei, suprafaa cultivat cu principalele culturi,
transportul, exportul, importul etc.
Diferena absolut a unei mrimi ( Y ) exprim diferena dintre nivelul cercetat i nivelul
baz de comparaie al mrimii analizate. Se exprim n aceeai unitate de msur n care este
cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la altul.

Indicele statistic al unei mrimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul baz de
comparaie al mrimii analizate. Ne arat de cte ori se modific acea mrime, de la un nivel la altul.
Diferena relativ a unei mrimi ( RY ) exprim raportul dintre diferena absolut a mrimii
respective i nivelul baz de comparaie al acesteia. Ne arat cu ct la sut se modific mrimea de la
un nivel la altul.
Indicatorul relativ de intensitate (d) se definete ca raport ntre doi indicatori de nivel de
natur diferit i arat gradul de rspndire a fenomenului cuantificat de indicatorul de la numrtor n
raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producia diferitelor culturi
/ ha, densitatea populaiei, producia principalelor produse / locuitor, rata omajului etc.
Greutatea specific (g) reflect structura fenomenului analizat n raport cu strile variabile X,
de la baza seriei.
Seriile cronologice
Seria cronologic reflect evoluia n timp a unei mrimi.
Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s se refere
la un interval de timp.
Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd stocuri
[Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci, instituii, fonduri
fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii de activitate, unitile de
cazare turistic etc.ntr-o astfel de serie nsumarea mrimii analizate nu are sens din punct de vedere al
coninutului, aceasta fiind permis din considerente de calcul, ajustri etc.
Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd fluxuri. De
exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau produse, venituri,
cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel de serie are sens
nsumarea mrimii analizate.
Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a nivelului unei
mrimi Y,
0 1 2 ... t ... T

(1.7)
Y :
y 0 y1 y 2 ... yt ... yT
Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i
diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai sus se
pot calcula cu baz fix (t/t0) (baza de comparaie rmne aceeai) sau cu baz n lan (t/t-1) (baza de
comparaie se schimb, fiind considerat cea precedent nivelului comparat).
Fie seriile cronologice formate cu:
- diferene absolute cu baz fix:
2 ... t
... T
0 1

ty/ t0 :
(1.8)
1/ 0
2/0
t/0
... y ... Ty/ 0
0 y y
t y/ 0 = y (t ) y (0)

- diferene absolute cu baz n lan


0 1
ty/ t 1 :
1/ 0
y

2
2 /1
y

t y/ t 1 = y (t ) y (t 1)

...

t
t / t 1
y

...

...

T
T / T 1
y

...

(1.9)

ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii de
legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd diferenele
absolute cu baza n lan se obin diferenele absolute cu baza fix.
t y/ 0 = 1y/ 0 + 2y/ 1 + 3y/ 2 + ... + t y/ t 1

Scznd diferenele succesive cu baz fix se obin diferenele cu baz n lan.


t y/ 0 t y1 / 0 = y(t ) y( 0) y (t 1) + y (0) = y (t ) y(t 1) = t y/ t 1

Diferena absolut ne arat cu ct se modific mrimea analizat de la un moment la altul. Se


exprim n aceeai unitate de msur n care este cuantificat fenomenul studiat. Dac fenomenul
analizat se exprim valoric, atunci diferena absolut nu reflect prea bine modificrile ce intervin,
impunndu-se utilizarea mrimilor relative respective, indicele statistic i diferena relativ.
Fie seriile cronologice formate cu:
- indici statistici cu baz fix
0 1
I ty / t0 :
1/ 0
1 I y
I yt / 0 =

2
I

2/0
y

... t
... I yt / 0

... T

... I Ty / 0

(1.10)

y (t )
(100%)
y (0 )

- indici statistici cu baz n lan


0 1
I yt / t 1 :
1/ 0
Iy

I yt / t 1 =

2
I

2 /1
y

...
... I

t
t / t 1
y

...
... I

T
T / T 1
y

(1.11)

y (t )
(100%)
y (t 1)

ntre cele dou tipuri de indici exist urmtoarele relaii de legtur:


Fcnd produsul indicilor cu baz n lan pn la o anumit stare a variabilei t, se obine
indicele cu baz fix al clasei respective.
y(1) y (2)
y (t )
y (t )
I 1y / 0 .I y2 / 1 . ... .I yt / t 1 =
.
. ... .
=
= I yt / 01
y(0) y (1)
y (t 1) y(0)
mprind doi indici succesivi cu baz fix se obine un indice cu baz n lan:
y(t ) y(t 1)
y (t )
I ty / 0 : I yt 1 / 0 =
:
=
= I yt / t 1
y(0) y (0)
y (t 1)
Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este mrimea cel mai des
folosit n caracterizarea evoluiei fenomenelor din economie.
Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii formate cu:
- diferene relative cu baz fix
1
0
R yt / t0 :
1/ 0
0 Ry

2
R

2/0
y

...

... R

t /0
y

...

... R Ty / 0

(1.12)

t /0
y

t y/ 0

y (0)

y (t ) y(0) y (t )
=
1 = I ty / 0 1
y(0)
y(0)

sau
R ty / 0 = I yt / 0 /1 100% 100 %

- diferene relative cu baz n lan


1
0
R yt / t 1 :
1/ 0
Ry
R

t / t 1
y

ty/ t 1

y(t 1)

2
R

2 /1
y

...

... R

t / t 1
y

...
... R

T
T / T 1
y

(1.13)

= I ty / t 1 1

sau
R ty / t 1 = I yt / t 1 100% 100%
Diferena relativ ne arat cu ct la sut se modific fenomenul de la un moment la altul.
Aceast mrime la fel ca i indicele statistice, se folosete frecvent n caracterizarea fenomenelor din
economie.
Dac seria cronologic analizat, de forma (1.7) este de intervale, se poate deduce seria
format cu greutatea specific:
0
g y :
g0
g (t ) =

1
g1

2
g2

... t
... g t

... T

... g T

(1.14)

y (t )
T

y (t )
t =1

Exemple:

1. Fie seria cronologic de intervale ce reflect numrul de absolveni de nvmnt superior din
Romnia n perioada (89/90 96/97), astfel:
89 / 90(0) 90 / 91(1) 91/ 92(2) 92 / 93(3) 93 / 94(4) 94 / 95(5) 95 / 96(6) 96 / 97(7)

Y :
25927
29901
33366
34240
47837
57360
80991
28113

conform A.S. al Romniei/1998


Analiza evoluiei acestui fenomen se realizeaz cu ajutorul diferenelor absolute, a indicilor,
diferenelor relative i greutii specifice.
Avem:
1
2
3
4
5
6
7
0

ty/ t0 :
0 2186 1788 5253 6127 19724 29947 52878
5253 ne arat cu ct au fost mai muli absolveni n anul universitar 92/93 fa de anul universitar
89/90.

1
2
3
4
5
6
7
0

ty/ t 1 :
2186 3974 3465 874 13597 9523 23631
3465 ne arat cu ct au fost mai muli absolveni n anul universitar 92/93 fa de anul universitar
91/92.
1
2
3
4
5
6
7
0

I yt / t0 :
1 0,922 1,064 1,187 1,218 1,702 2,04 2,88
1,187 ne arat de cte ori a crescut numrul de absolveni de nvmnt superior din anul 92/93 fa
de anul 89/90.
1
2
3
4
5
6
7
0

I yt / t 1 :
0,922 1,153 1,116 1,026 1,397 1,199 1,412
1,116 ne arat de cte ori a crescut numrul de absolveni de nvmnt superior din anul 92/93 fa
de anul 91/92.
1
2
3
4
5
6
7
0

R ty / t0 :
0 7,78% 6,4% 18,7% 21,8% 70,2% 104% 188%
18,7% - ne arat cu ct la sut a crescut numrul de absolveni de nvmnt superior n anul 92/93
fa de anul 89/90.
1
2
3
4
5
6
7
0

R ty / t 1 :
7,78% 15,3% 11,6% 2,6% 39,7% 19,9% 41,2%
11,6 % - ne arat cu ct la sut a crescut numrul de absolven i de nvmnt superior n anul 92/93
fa de anul 91/92.
1
2
3
4
5
6
7
0

g y :
8,32% 7,68% 8,85% 9,88% 10,14% 14,16% 16,98% 23,98%
9,88 ne arat ponderea absolvenilor din anul universitar 92/93 din totalul absolvenilor perioadei
89/90 96/97.
Considerm seria cronologic ce reflect variaia numrului de studeni /10.000 locuitori (cf.
2.
A.S. al Romniei/2000, pg. 203).
94 / 95 95 / 96 96 / 97 97 / 98 98 / 99 99 / 2000

X :
148
157
160
181
202
112

Aceasta este o serie cronologic de moment avnd la baz indicatorul relativ de intensitate. n mod
asemntor cu exemplul precedent se pot deduce seriile formate cu: X , I X , R X , cu baz fix i cu
baz n lan.
Alte exemple de serii cronologice avnd la baz indicatorul relativ de intensitate:
- rata omajului:

1995 1996 1997 1998 1999

X 1 :
6,7
6,0
6,3
6,8
8,0

- producia de gru i secar la hectar


1994 1995 1996 1997 1998 1999

X 2 :
2535 3082 1760 2964 2561 2776
- rata general de fertilitate:
1989 1990 1991 1992 1993 1994 1995 1996 1997 1998

X :
66,3 56,2 48,7 46,6 44,3 43,3 41,1 39,9 40,6 40,6
Seria statistic de spaiu (teritorial)

Seria statistic de spaiu este o construcie statistic ce reflect variaia n spaiu a unei mrimi.
Seria de spaiu prezint o importan din ce n ce mai mare, datorit dezvoltrii sistemului
informaional, a necesitii comparaiilor internaionale i a comparaiilor ntre regiunile unei ri.
n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic teritorial i
Statistic internaional. n capitolul de Statistic teritorial sunt cuprinse informaii privind:
populaia, fora de munc, condiii de munc, veniturile populaiei, cheltuielile i consumul populaiei,
locuine, asisten social, sntate, nvmnt, cultur, sport, conturi naionale, rezultate i
performane ale ntreprinderilor, agricultur, silvicultur, industrie, transporturi, po t, telecomunicaii,
turism, finane, justiie i starea infracional, pe cele 7 regiuni i Bucureti.
La baza seriei de spaiu se gsesc att mrimi absolute (indicator de nivel, diferena absolut),
ct i mrimi relative (indicator relativ de intensitate, indicele statistic, diferena relativ).
Fie seria statistic Z, de forma urmtoare:
s1
s 2 ... s i ... s R
s

Z : 0
Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R)

(1.15)

unde:
i = 1, R ;
si este o stare a variabilei ce exprim spaiul,
Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate).

Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu:


- diferene absolute cu baz fix:
s1
s2
...
si
...
sR
s
(1.16)
sZ/ s0 : 0
s1 / s0
s2 / s0
si / s0
s R / s0
Z
... Z
... Z
0 Z
sZi / s 0 = Z (i ) Z (0)

- indicii statistici cu baz fix


s1
s2
s
I Zs / s0 : 0
s1 / s0
s2 / s0
IZ
0 IZ
I Zsi / s0 =

Z (i )
(100%)
Z (0 )

...
si
si / s0
... I Z

... s R

... I ZsR / s0

(1.17)

- diferene relative cu baz fix


s
RZs / s0 : 0
0

I Zsi / s0 =

s1

s2

s1 / s0
Z

s2 / s0
Z

...
si
... RZsi / s0

...
sR
(1.18)
... RZsR / s0

sZi / s0
= I Zsi / s0 100%
Z (0)

Se deduc seriile formate cu mrimi absolute i relative calculate doar cu baz fix (se poate alege orice
stare a variabile ce exprim spaiu).
Exemple:
1.
Fie seria de spaiu ce reflect varia ia pe regiuni a Produsului intern brut regional / locuitor
(mil. lei), n anul 1998, cf. A.S. al Romniei, pg. 718.

Bucuresti

Z : (s )
0

26,897

R.Nord RSud R.Sud R.Sud R.Vest R.Nord R.Centru

Est
Est
Vest
Vest
(s1 )
(s2 ) (s3 )
(s4 )
(s5 )
(s6 )
(s7 )

12,564 16,555 14,2 14,803 17,295 15,630 17,769


Se pot deduce serii formate cu Z, Iz, Rz calculate cu baz fix
(s0 = Bucureti), astfel:
(s1 )
(s2 )
(s 3 )
(s 4 )
(s 5 )
(s 6 )
(s 7 )
(s )

sZ/ s0 : 0
0 -14,333 -10,342 -12,697 -12,096 - 9,602 -11,267 - 9,128
- 11,267, ne arat cu ct este mai mic PIBR/locuitor n regiunea Nord-Vest fa de Bucureti.
s
sZ/ s0 : 0
1

s3
s4
s5
s6
s7
s1
s2

0,467 0,615 0,528 0,550 0,643 0,581 0,661

0,581 ne arat de cte ori este mai mic PIBR/locuitor n regiunea Nord-Vest fa de Bucureti.
(s1 )
(s 2 )
(s3 )
(s 4 )
(s5 )
(s6 )
(s7 )
(s )

RZs / s0 : 0
0 - 53,3% - 38,5% - 47,2% - 45% - 35,7% - 41,9% - 33,9%
-41,9 % - ne arat cu ct la sut este mai mic PIBR/locuitor n regiunea Nord-Vest fa de
Bucureti.
3.

Alte exemple, extrase din Anuarul Statistic al Romniei din 2000:

- procentajul n PBN a cheltuielilor publice cu nvmntul


Austria Bulgaria Franta Polonia
X 1 :
3,2
6,0
7,5
5,4

Romnia Ungaria

3,0
4,6

- durata medie de via la natere, n 1998 a persoanelor de sex masculin:


Bulgaria Elvetia India
X 2 :
77
60
68
- rata omajului, n 1998:

Norvegia Romnia Ungaria

76
66
66

Austria Belgia
X 3 :
12,4
7,2

Elvetia Romnia Spania Turcia


.
3,9
10,4
18,8
6,2

Probleme rezolvate
Problema 1.

Produsul intern brut (PIB) al unei ri a crescut n 2006 fa de 2005 cu 12% i a sczut n 2007 fa de
2006 cu 12%. Cu ct s-a modificat procentual PIB n 2007 fa de 2005?
06 / 05
RPIB
= 12%

06 / 05
I PIB
= 1,12

07 / 06
RPIB
= 12%

07 / 06
I PIB
= 0,88

07 / 05
06 / 05
07 / 06
I PIB
= I PIB
I PIB
= 1,12 0,88 = 0,9856

07 / 05
07 / 05
RPIB
= I PIB
1 100% = (0,9856 1) 100% = 1,44%

PIB a sczut n 2007 fa de 2005 cu 1,44%

Problema 2.

Produsul intern brut pe locuitor (PIB/loc) este de 32640$ n Frana i de 26380$ n Spania.
Determinai:
a) cu ct la sut este mai mare PIB/loc n Frana fa de Spania?
b) cu ct la sut este mai mic PIB/loc n Spania dect n Frana?
a)

32640$
F/S
F /S
RPIB
1 100% = 23,73%
/ loc = I PIB / loc 1 100% =
26380$

b)

PIB/loc este mai mare n Frana dect n Spania cu 23,73%

26380$
S/F
S/F
RPIB
1 100% = 19,18%
/ loc = I PIB / loc 1 100% =
32640$

PIB/loc este mai mic n Spania dect n Frana cu 19,18%

Problema 3.

Salariul lui Vasile este de 1530 lei, cu 38,4% mai mic dect salariul lui Ilie. Care este salariul lui Ilie?
Vas / Ilie
Rsal
= 38,4%
Vas / Ilie
Vas / Ilie
Rsal
= (I sal
1) 100%

Vas / Ilie
sal

Vas / Ilie
Rsal
38,4%
=
+1 =
+ 1 = 0,384 + 1 = 0,616
100%
100%

salar (Vasile )
= 0,616
salar ( Ilie)

dar

Vas / Ilie
I sal
=

salar ( Ilie) =

salar (Vasile ) salar (Vasile ) 1530


=
=
= 2483,77lei
Vas / Ilie
I sal
0,616
0,616

Capitolul 2
OBSERVAREA, SISTEMATIZAREA I
PREZENTAREA SERIILOR STATISTICE
2.1. Observarea statistic

Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale, economice
sau de alt natur, etap n care se culeg datele statistice despre fenomenul supus cercetrii. Cercetarea
fenomenelor respective presupune cunoaterea populaiei statistice n vederea surprinderii aciunii
legilor care acioneaz la nivelul acesteia. De calitatea acestei etape, ntr-un proces de cercetare
statistic, depinde i calitatea rezultatelor obinute n celelalte faze.
Observarea statistic presupune identificarea, urmrirea i nregistrarea, dup reguli unitare i
precise, a nivelului atins de variabilele statistice studiate la unitile din care este format populaia
luat n studiu[Florea I., 1998].
Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun cteva
precizri. n primul rnd, observarea statistic presupune urmrirea i nregistrarea unui numr mare
de uniti statistice, ceea ce implic un volum mare de munc. n al doilea rnd, pentru ca cercetarea
populaiei s-i ating scopul, trebuie precizate care sunt variabilele n raport cu care este studiat
populaia. Variabilele statistice ce urmeaz s fie urmrite i nregistrate la nivelul fiecrei uniti din
populaie, trebuie s fie eseniale i s prezinte interes din punct de vedere al studiului ntreprins. n al
treilea rnd, trebuie stabilite criterii exacte pentru delimitarea corect a unitilor statistice care
alctuiesc populaia. i nu n ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai
multe persoane este necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura
corectitudinea necesar datelor rezultate.
Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune: specificarea
unit ilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor statistice care
caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit, nregistrarea strilor
variabilelor statistice considerate.
Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme care s
asigure o pregtire tiinific a observrii statistice:
- delimitarea populaiei supuse observrii;
- definirea unitilor statistice de observat;
- timpul i locul unde va avea loc observarea;
- programul observrii;
- alegerea purttorilor de informaie;
- pregtirea persoanelor ce urmeaz s fac observarea.
Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc fiecare dintre
ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia depinde corectitudinea
celorlalte etape a cercetrii statistice.
Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta se afl
n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce caracterizeaz populaia
supus studiului. n condiiile n care se impune cercetarea doar a unei pri din populaie, atunci
trebuie precizat care anume vor fi unitile ce vor fi supuse observrii, dup ce criterii se selecteaz

acestea din populaia iniial, astfel nct rezultatele cercetri s poat fi extinse la nivelul ntregii
populaii.
Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da loc
confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce trebuie
nregistrate n raport cu variabilele de studiat.
Stabilirea timpului i a locului unde va avea loc observarea are importan din punct de vedere
a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are n statistic dou
accepiuni:
- momentul sau perioada la care se refer datele nregistrate (timpul de referin);
- durata observrii.
Momentul sau perioada la care se refer datele nregistrate trebuie s fie n concordan cu
natura fenomenelor cercetate . n cazul n care observarea presupune nregistrarea unui fenomen n
mod static trebuie precizat un moment critic. Stabilirea momentului critic are n vedere posibilele
repetri sau omisiuni n nregistrarea unitilor datorate evoluiei populaiei n timp. Dac fenomenul
de studiat presupune o nregistrare continu, atunci trebuie precizat perioada de timp n care are loc
observarea. De exemplu, recensmntul populaiei Romniei din anul 2002 a avut ca moment critic
ora zero dintre 17 i 18 aprilie, iar timpul nregistrrii a fost de 7 zile. n cazul indicatorilor care
cuantific activitatea de producie, timpul la care se refer datele nregistrate poate fi luna, trimestrul
sau anul. Observarea statistic trebuie fcut ntr-un timp optim. Recensmntul populaiei ar trebui s
se realizeze de obicei iarna cnd micarea populaiei este redus n comparaie cu celelalte sezoane.
Alegerea momentului critic sau a perioadei de timp la care se refer datele obinute prin
nregistrarea unitilor, trebuie fcut de aa manier nct populaia s fie surprins n starea ei tipic
i natural.
Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus cercetrii
(incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o reprezint familiile
etc.).
n cadrul programului observrii statistice trebuie stabilite variabilele statistice care urmeaz s
fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice trebuie s fie n
consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse. Variabilele statistice care fac
parte din programul cercetrii trebuie s surprind aspectele eseniale, s expliciteze fenomenul sau
procesul studiat, s permit prelucrarea i generalizarea acestora la nivelul ntregii populaii.
Programul observrii trebuie s cuprind un numr optim de variabile. Alegerea unui numr de
variabile prea mare sau prea mic poate duna calitii cercetrii statistice efectuate asupra populaiei n
cauz. Stabilirea programului observrii presupune o consultare reciproc a statisticienilor, care
ntreprind cercetarea i a specialitilor din domeniul considerat.
Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a fi
nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz datele din
observarea unitilor statistice.
Problema selectrii i pregtirii persoanelor care urmeaz s fie angrenate n etapa de
observare, se pune mai ales n cazul n care fenomenul sau procesul de studiat este de mare amploare.
Un asemenea fenomen l constituie recensmntul, care constituie o observare la scar na ional cu un
mare consum de mijloace materiale i financiare.
Observarea statistic se poate desfura n diverse forme n raport cu: natura proceselor socialeconomice de studiat, obiectivul cercetrii, formele de organizare ct i posibilitile practice de
urmrire i nregistrare a unitilor statistice din populaie.
Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem: observarea
total i observarea parial. Observarea total permite nregistrarea, n raport cu variabilele statistice
a tuturor unitilor statistice din populaie, implicnd un volum mare de munc, antreneaz, de obicei,
un numr de persoane i dureaz mult timp. Ca urmare se creaz condiii pentru apariia de erori de
observare, ceea ce va conduce la micorarea eficienei observrii. Forma cea mai frecvent de
observare total o constituie recensmntul populaiei. Avnd n vedere anvergura unei asemenea
observri totale, recensmntul presupune o pregtire prealabil din punct de vedere uman, material i
financiar de reuita creia depinde n mare msur eficacitatea lui. Cu prilejul fiecrui recensmnt se

elaboreaz o metodologice corespunztoare cerinelor perioadei considerate, constituind baza de


referin a tuturor celor implicai n aceast aciune. Observarea total se practic i n domeniul
controlului tehnice de calitate, n cazul produselor de nalt tehnicitate , aa cum ar fi: televizoare,
maini de splat, frigidere, automobile etc. Este necesar o observare total n acest caz, deoarece
constatarea defeciunilor de ctre cumprtori ar implica cheltuieli mult mai mari cu remedierea
acestora n comparaie cu organizarea unei observri totale a loturilor de produse ce urmeaz a fi
scoase pe pia.
n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative,
este suficient realizarea unor observri pariale prin care s se asigure c rebuturile nu depesc un
anumit procent admis. O astfel de observare, care include doar o parte din unitile populaiei supuse
studiului corespunde observrii pariale. Observarea parial constituie o alternativ la observarea
total n cazul populaiilor infinite sau chiar dac sunt finite prin observare are loc distrugerea
acestora. Avnd la baz procedeul observrii pariale se pot evalua rezervele de iei, crbune sau alte
minerale, se poate evalua masa de material lemnos din fondul silvic a unei zone sau la nivelul ntregii
ri. n general, observarea parial se recomand n toate cazurile n care se consider mai avantajoas
dect observarea total. Avantajele acestui tip de observare se materializeaz de cele mai multe ori
ntr-un program de observare mai complex i mai complet, cu cheltuieli de timp i materiale mai
reduse i nu de puine ori cu un grad de exactitate mai ridicat.
Eantionul, ca rezultat al observrii pariale, presupune respectarea cu strictee a principiului
reprezentativitii, n conformitate cu care fiecare unitate statistic din populaie general s aib
aceeai ans de a face parte din eantion. Asigurarea respectrii principiului reprezentativitii n
formarea eantionului de observat permite acestora o structur foarte apropiat cu cea a populaiilor
din care sunt formate. Aceasta ne asigur, cu o anumit probabilitate dinainte fixat, c rezultatele
obinute la nivelul eantionului pot fi extinse la nivelul ntregii populaii. n raport cu legea de
probabilitate urmat de variabilele urmrite n populaia general sunt dou tipuri de eantioane:
eantioane de volum mare i eantioane de volum redus.
O form de observare parial este observarea prin anchet. n cadrul acestei forme de
observare, unitile supuse observrii se aleg n funcie de scopul cercetrii, iar nregistrarea lor se face
sub form de rspunsuri scrise pe care persoanele desemnate n acest sens le dau ntrebrilor dintr-un
chestionar. Persoanele ce urmeaz a fi chestionate primesc chestionarul respectiv rspunznd benevol
la ntrebri.
Observarea statistic n raport cu procedeul folosit este de dou feluri:
- observarea direct;
- observarea indirect.
Observarea direct presupune o observare nemijlocit a unitilor din populaie, care sunt
prevzute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct cu unitile
statistice, fie prin msurare, fie prin interogare, dac unitile sunt persoane. Acest procedeu permite
observatorului perceperea nemijlocit a fenomenelor luate n studiu n vederea msurrii nivelelor
nregistrate de variabilele considerate.
Observarea indirect presupune un intermediar ntre unitile care urmeaz s fie supuse
observrii i observator. Intermediarul poate fi un document special conceput n vederea observrii i
atunci observarea este pe baz de document sau intermediarul poate fi o alt persoan dect
observatorul, caz n care avem observare prin interogare. Observarea prin interogare presupune c
persoana intermediar s fi participat la desfurarea fenomenului sau s fie n msur s dea
informaiile despre nivelul variabilelor care prezint interes pentru studiul ntreprins. Observarea
indirect neimplicnd n mod direct observatorul, constituie o posibil surs de erori.
Suportul pentru culegerea datelor l reprezint chestionarul.
2.1.1. Elaborarea i testarea chestionarului

Chestionarul este o list de ntrebri de diferite forme care sunt puse oral sau n scris n vederea
culegerii de informaii relativ la un subiect [Chirouze Y., 1985]. Redactarea chestionarului este o
problem dificil mai ales n cazul studiilor de pia, pentru c nu exist o formul unic de elaborare

care s conduc la stabilirea unu chestionar foarte bun. De fapt un chestionar este bun, atunci cnd
furnizeaz rspunsuri precise, adevrate i utilizabile. Conceperea unui chestionar se bazeaz foarte
mult pe experien.
Problemele care intervin n elaborarea unui chestionar sunt numeroase i complexe. Acestea nu
vor fi prezentate detaliat n acest studiu, ci vor fi abordate doar n linii mari. Pentru detalii se poate
consulta bibliografia aferent [Javeau C., 1992; Lejeune M., 1994; Vracem P.V., 1989].
Elaborarea chestionarului depinde de obiectivul anchetei. ntrebrile i eventualele probleme
ce intervin n elaborarea lor sunt legate de obiectivele urmrite. Astfel dac informaiile privesc
anumite fapte, evenimente petrecute, atunci ntrebrile sunt relativ uor de formulat. Ceea ce ar putea
mpiedica obinerea de informaii ar fi refuzul celor ntrebai de a da un rspuns exact la unele
ntrebri, datorat unor motive personale sau imposibilitii furnizrii unui rspuns total sau parial
aferent unor evenimente mai ndeprtate. Este evident c lungimea perioadei analizate depinde de
natura faptelor. Dac evenimentele se produc curent atunci perioada este mai scurt, iar dac
evenimentele sunt rare, perioada analizat este mai lung.
n schimb n cazul anchetelor asupra opiniilor, motivaiilor, inteniilor, elaborarea
chestionarului este mai dificil, ntrebrile vor fi formulate i studiate cu o foarte mai atenie. Ca de
exemplu n cazul anchetelor asupra opiniilor, ntrebrile privind exprimarea acestora sunt uor de
formulat, n cea mai mare parte se primesc rspunsuri (fiecare i exprim opinia). Ceea ce este dificil
n culegerea informaiilor privind opiniile l reprezint msurarea intensitii de manifestare a acestora
[Fournis, 1985].
n situaii ca cele formulate mai sus trebuie s se evite ntrebrile care ar conduce la apariia de
erori n rspunsuri. Aceste erori pot s fie provocate voluntar, de ctre repondeni, datorit mascrii
unei atitudini, opinii etc., sau pot fi involuntare datorate nenelegerii clare a problemei n cauz.
Pentru evitarea acestor inconveniente ntrebrile puse trebuie s rspund la o serie de
caracteristici bine definite [Helfer, 1985]. Astfel ele trebuie s fie:
uor de neles, adic s nu conin cuvinte ce nu pot fi nelese de orice repondent;
stimulatoare, adic ntrebrile puse trebuie s incite la rspuns;
precise, s antreneze rspunsuri uoare i s permit o bun prelucrare a datelor culese.
nainte de a vedea n ce manier se prezint chestionarul trebuie rezolvate problemele legate de
coninutul ntrebrilor, ca de exemplu: tipul i forma ntrebrilor, succesiunea lor i codificarea.
Tipuri de ntrebri

Pentru redactarea chestionarului este nevoie s se aleag ntre diferitele tipuri de ntrebri.
Alegerea nu este indiferent, ci fiecare tip corespunde nevoilor specifice anchetei.
Mai muli autori printre care sunt i M. Lejeune, C. Javeau, clasific ntrebrile n:
ntrebri nchise;
ntrebri deschise;
ntrebri semi-deschise.
ntrebrile nchise sunt acele ntrebri pentru care rspunsurile sunt fixate dinainte i
repondenii trebuie s-i aleag din variantele de rspunsuri propuse. Acest tip necesit o precodificare
a rspunsurilor, ceea ce va permite prelucrarea imediat a acestor ntrebri.
ntrebrile nchise sunt uor de exploatat, aceasta determinnd utilizarea frecvent a lor. Acest
tip de ntrebare este eficient atunci cnd ancheta se desfoar asupra faptelor, deoarece variantele de
rspuns pot fi uor delimitate. n schimb n cazul anchetelor asupra opiniilor, motivaiilor, atitudinilor,
este dificil s se asigure pertinena, exclusivitatea i exhaustivitatea prin variantele de rspuns
propuse.
ntrebrile nchise sunt de mai multe tipuri [Chirouze Y., 1985]:
- cu rspuns unic, unde repondentul trebuie s aleag doar o variant de rspuns. Acestea sunt
cel mai uor de prelucrat din punct de vedere statistic.
- cu rspunsuri multiple, unde repondentul poate s aleag mai multe variante de rspuns. Dac
acest numr nu este limitat atunci codificarea i prelucrarea datelor necesit o perioad mai lung,
motiv pentru care se recomand limitarea numrului de rspunsuri.

- cu clasamente, unde repondentul claseaz rspunsurile posibile ntr-o anumit ordine n


funcie de preferinele sale. Aceste tipuri de ntrebri cer un efort mai mare din partea repondentului,
ca urmare ele devin obositoare. Astfel se impune limitarea variantelor de rspuns. De asemenea aceste
ntrebri necesit o perioad mai mare de pregtire a lor pentru prelucrare, iar exploatarea nu este
imediat.
- ntrebri cu scale ale atitudinilor, permit nuanarea rspunsurilor binare pe o gradaie de tip
excelent foarte ru. Aceasta se poate realiza explicitnd fiecare variant prin cuvinte de tipul
excelent, bun, mediu, ru, foarte ru, sau un sistem de note de exemplu, acordnd note de la 1 la 5,
tiind c 1 este pentru foarte ru iar 5 pentru excelent. Aceste ntrebri permit msurarea atitudinilor
folosind instrumente puse la punct de psihologi, iar ataarea de note fiecrei trepte a scalei simplific
prelucrarea i d posibilitatea efecturii unor calcule. n schimb dac scala are prea multe trepte
alegerea unei sau alteia dintre ele devine dificil, de aceea utilizarea unui numr de 5 trepte este cel
mai convenabil. Dac treptele nu sunt bine difereniate i scala nu se schimb de la o ntrebare la alta
atunci repondentul poate avea tendina de a rmne mereu n aceeai zon a scalei.
Claude Jeveau n Lenquette par questionnaire caracterizeaz ntrebrile nchise astfel:
sunt cele care se preteaz cel mai bine la prelucrarea i analiza statistic, rspunsurile
primite pot fi prelucrate imediat fr a necesita analize intermediare complicate;
sunt uor de neles i se poate rspunde repede;
garanteaz un anumit anonimat;
ele pot fi folosite ca ntrebri filtru, servind la gruparea repondenilor;
ele prezint pericolul de a dicta rspunsul celui anchetat n msura n care rspunsul la
care s-a gndit nu figureaz printre cele posibile, el alegnd unul care se apropie cel mai
mult de ceea ce s-a gndit;
ele nu pot fi folosite pentru obinerea de informaii nuanate, corespunztoare atitudinilor,
motivaiilor profunde, aplicarea lor se limiteaz doar la culegerea de informaii obiective.
ntrebrile deschise
O ntrebare deschis este aceea care las pe cel interesat s rspund cum vrea el, neexistnd
nici o constrngere. ntrebrile deschise pot fi prezentate astfel:
complet nestructurate, sunt ntrebrile la care repondenii pot s rspund cum doresc, de
tipul: ce prere avei ... ?
asociere de cuvinte, cnd se dau pe rnd diferite cuvinte iar repondenilor li se cere s noteze
primul cuvnt care le vine n gnd;
completarea frazei, cnd repondenilor li se prezint o fraz incomplet, pe care trebuie s o
completeze;
completarea unei povestiri, cnd repondenilor le este prezentat o povestire incomplet, pe
care trebuie s o continue, etc.
n chestionar trebuie rezervat spaiu suficient pentru completarea ntregului rspuns.
ntrebrile deschise pot fi caracterizate astfel:
dac sunt bine formulate atunci se pot obine informaii asupra oricrui subiect;
ele sunt indispensabile n culegerea informaiilor privind problemele delicate, cum sunt cele
legate de msurarea atitudinilor, nevoilor, motivaiilor;
utilizarea lor este impus n cazurile n care nu pot fi prevzute toate rspunsurile posibile;
formularea lor este foarte delicat, de aceea ele trebuie s fie cuprinztoare, s nu comporte
ambiguiti i contrasensuri;
prelucrarea lor este foarte costisitoare i anevoioas.
ntrebrile semi-deschise (mixte) sunt ntrebri n care principalele rspunsuri posibile sunt
propuse ca n cazul ntrebrilor nchise, dar se las i posibilitatea adugrii de rspunsuri libere n
afara celor propuse, cum sunt ntrebrile deschise [Javeau, 1992].
Aceast form mixt tinde s rezolve problemele de exhaustivitate a ntrebrilor nchise i s
reduc costul de codificare al ntrebrilor deschise. ntrebrile mixte sunt avantajoase atunci cnd sunt

precodificate rspunsurile stabilite, care acoper cea mai mare parte din aria rspunsurilor, rmnnd
ca un numr destul de mic de rspunsuri, obinute pe parcursul anchetei, s fie codificat ulterior.
Aceste ntrebri au urmtoarele caracteristici:
ele contribuie la uurarea prelucrrii deoarece un numr mare de rspunsuri sunt prevzute,
acestea fiind codificate;
ele risc s influeneze reacia repondenilor prin sugerarea posibilelor rspunsuri;
variantele de rspuns sugerate n prima parte a ntrebrii trebuie s fie stabilite foarte
riguros, n general acestea se bazeaz pe o cercetare prealabil, astfel nct s fie evitat
situaia ca cele mai importante i cele mai multe rspunsuri s fie concentrate n partea
deschis a ntrebrii. ntr-o astfel de situaie ntrebrile mixte nu mai sunt avantajoase.
Redactarea chestionarului

Dup ce a fost definit coninutul chestionarului, respectiv diversele domenii ce trebuie regsite
n ntrebri, este necesar s se rezolve problemele legate de forma i de structura chestionarului i
anume acestea depind de urmtoarele aspecte [Javeau C., 1992]:
modul de administrare a chestionarului, care influeneaz lungimea chestionarului, nivelul
de aplicare al ntrebrilor;
tipul de ntrebri ce vor fi utilizate, acesta determinnd modul de prelucrare, termenul
anchetei, mijloacele financiare;
ce limbaj va fi utilizat, acesta depinznd de specificul anchetei, de pregtirea celor ancheta i;
modul de prelucrare ce va fi folosit, adic manual, sau pe calculator;
cum pot fi evitate erorile involuntare realizate de repondeni prin intermediul rspunsurilor
date. Aceste erori pot fi provocate de frica de a nu fi judecat prost, de dorina de a se
conforma normei sociale, de reacia la ntrebrile prea delicate sau personale, de
sugestibilitatea coninutului ntrebrilor.
C. Javeau n Lenquette par questionnaire propune anumite principii de redactare ale unui
chestionar legate de:
a) Ordinea n care sunt puse ntrebrile
Ordinea de succesiune a ntrebrilor depinde de tipul anchetei, de modul de administrare a
chestionarului, de lungimea sa, dar este dificil de propus un model adecvat pentru orice situaie.
b) Textele de introducere i de legtur
Oricare ar fi modul de administrare a chestionarului este necesar s existe texte de introducere
i texte de legtur ntre diferitele pri i mai ales ntre diferitele teme abordate.
c) Prezentarea material i tipografic, prezentarea material a chestionarului trebuie realizat
cu foarte mare atenie, mai ales n cazul administrrii directe.
n concluzie, redactarea unui chestionar presupune munca n echip, necesit mult atenie i
mai ales mult experien deoarece chestionarul este suportul de culegere a datelor iar dac acesta este
ntocmit superficial, chiar dac metodologia de sondaj i tehnicile de prelucrare a datelor sunt foarte
avansate i complexe, rezultatele obinute nu vor fi chiar cele mai bune.
Testarea chestionarului

Oricare ar fi experiena celor care redacteaz chestionarul sunt foarte rare situaiile cnd acesta
se prezint ntr-o form perfect, care s nu necesite mbuntiri. De aceea este nevoie de testarea
chestionarului, respectiv verificarea modului de nelegere, de interpretare i de acceptabilitate a
ntrebrilor.
Testarea chestionarului este absolut necesar n orice situaie i la orice tip de sondaj. Dac cei
anchetai sunt consumatorii, n general marele public, se tie c exist diferen ntre nivelul de cultur
al celor ce redacteaz chestionarul, care sunt specialiti n domeniul respectiv, i repondenii care nu
dispun de limbajul tehnic de specialitate. Astfel n ntrebri s-ar putea regsi cuvinte sau fraze strict de
specialitate i care s nu fie nelese de majoritatea celor anchetai.

Chestionarul este testat pe un numr reduse de persoane aparinnd populaiei studiate,


respectiv n jur de 20, 30 persoane, acest eantion trebuie s cuprind persoane ct mai diferite.
n cursul acestei etape trebuie verificate urmtoarele aspecte: dac termenii utilizai sunt uor
de neles i nu conduc la confuzii; dac ordinea ntrebrilor nu conduce la nici o reacie defavorabil;
dac forma ntrebrilor permite culegerea de informaii dorite; dac ntrebrile nu sunt prea lungi i nu
produc dezinteres sau iritarea celor anchetai; dac anumite ntrebri nu sunt utile; dac textele de
introducere i de legtur sunt suficiente i eficiente; dac variantele de rspuns a ntrebrilor nchise
sunt suficiente; dac numrul ntrebrilor deschise nu este prea mare ca s oboseasc pe cel anchetat.
2.1.2. Modaliti de administrare a chestionarului

Pentru colectarea datelor exist mai multe modaliti, dar nu toate au aceleai avantaje i nu pot
fi utilizate cu indiferen. Alegerea uneia sau alteia depinde de o serie de factori.
Culegerea datelor se poate realiza cu ajutorul urmtoarelor tehnici [Antoine, 1981; Chirouze,
1985; Helfer, 1995]:
ancheta prin interviu direct;
ancheta prin coresponden;
ancheta prin telefon.
1) Ancheta prin interviu direct se caracterizeaz prin aceea c administrarea chestionarului se
face direct la domiciliu, la locul de munc, n strad, la diferite puncte de vnzare, la expoziii , etc.
Astfel, n cazul anchetei la domiciliu sau la locul de munc se pot administra chestionare cu
multe ntrebri i se pot obine numeroase informaii. Calitatea rspunsurilor este asigurat datorit
prezenei anchetatorului al crui rol este i acela de a crea o atmosfer favorabil, de a explica sau
reformula anumite ntrebri care nu sunt foarte explicite, de a prezenta fotografii (mai ales n cazul
testrii inteniilor privind produsele noi), chiar i mostre de produse. Uneori anchetatorul poate oferi
produse celor anchetai, el urmnd s treac dup un timp si s preia chestionarul cu rspunsurile
completate privind calitile produselor testate.
Ancheta la domiciliu are i unele inconveniente. Primul inconvenient este cel legat de prezena
anchetatorului, care poate fi o surs de erori, provenite din transcrierea unor rspunsuri sau din
formularea unor ntrebri. De asemenea de multe ori prezena anchetatorului l determin pe cel
anchetat s se comporte altfel dect dac ar fi singur, aceasta conduce la deformarea rspunsurilor, ele
nu mai sunt sincere, sunt date pentru a impresiona pe anchetator.
Un alt aspect ce trebuie adugat la inconveniente este acela c persoanele din mediul urban
permit destul de greu ptrunderea persoanelor strine n cas, astfel rata non-rspunsurilor provenite
din mediul urban este mult mai mare dect din mediul rural.
Ancheta n strad sau la expoziii, trguri, magazine, are avantajul c se poate realiza un
numr mare de interviuri, ntr-un timp scurt i cu cheltuieli mici. Ancheta la magazine, trguri permite
culegerea de impresii la timp, recente, referitoare la produse, publicitate, promovare etc.
Anchetele n strad au un cmp de aciune limitat i pot fi folosite doar atunci cnd se dorete
obinerea unor informaii ieftine i rapide, calitatea i complexitatea lor neinteresnd foarte mult.
2) Ancheta prin coresponden. Aceast tehnic presupune trimiterea chestionarului, prin
intermediul potei sau a unor anchetatori, la destinatar. De regul destinatarul este ales folosind un
procedeu aleator. n general chestionarul se trimite ntr-un plic care conine i o scrisoare explicativ
prin care repondentul s neleag importana sondajului, a rspunsurilor pe care este rugat s le dea.
De asemenea se trimite i un plic pentru rspuns, iar uneori se specific c n cazul furnizrii
rspunsului repondentul va primi un mic cadou.
Aceast modalitate de administrare a chestionarului poate fi aplicat pentru orice populaie
studiat. Ca o diversificare a acestei modaliti a aprut administrarea chestionarului prin intermediul
faxului. Aceasta fiind folosit n cazul sondajelor n rndul ntreprinderilor i a diferitelor instituii.
Avantajele anchetei prin coresponden sunt legate de cheltuielile potale care sunt cu mult mai
mici dect cheltuielile ocazionate de ancheta la domiciliu. De asemenea dispersia geografic a

corespondenilor poate fi mare fr a afecta costul anchetei. n plus aceast tehnic ofer
repondentului un sentiment de libertate i de anonimat, deoarece el nu vine n contact cu anchetatorul.
Acest anonimat este asigurat atta timp ct nu trebuie s-i scrie adresa pe plicul ce conine rspunsul.
Deoarece ancheta nu se desfoar ntr-un timp foarte limitat, chestionarul poate fi relativ lung.
Un inconvenient al acestei anchete l reprezint rata non-rspunsurilor care este destul de
ridicat, aceasta impunnd trimiterea de noi chestionare altor persoane i deci creterea cheltuielilor
anchetei.
Ceea ce propunem este mbinarea anchetei la domiciliu cu cea prin coresponden, astfel s-ar
mbunti calitatea datelor culese. Respectiv anchetatorul ar avea rolul de a duce chestionarul la
repondent, de a-i da cteva explicaii i de a reveni dup un anumit timp bine specificat pentru a prelua
rspunsurile. Repondentul va trebui s completeze singur chestionarul, asigurndu-se astfel condiiile
ca rspunsurile s nu fie afectate de erori datorate anchetatorului. Rata rspunsurilor ar fi cu mult mai
mare dect n cazul anchetei prin coresponden, dar n acelai timp i cheltuielile vor fi mai mari, n
special cele de deplasare.
Acest tip de administrare este eficient n cazul populaiilor statistice puin dispersate din punct
de vedere geografic.
3) Ancheta prin telefon. Anchetatorul pune o serie de ntrebri persoanelor din eantion, prin
intermediul telefonului. Aceast modalitate de culegere a datelor permite obinerea de informaii rapid,
numerele de telefon fiind extrase din cartea de telefon, iar durata unei convorbiri este de 10-15 minute.
Aceast tehnic este mai economic dect ancheta la domiciliu, cheltuielile cuprind doar tarifele
telefonice. Ca o consecin a cheltuielilor reduse, este faptul c ancheta este eficient atunci cnd
eantionul este dispersat geografic.
Printre avantajele anchetei prin telefon este i acela c tele-anchetatorul poate telefona la
diferite ore din zi i de mai multe ori, pentru a contacta persoanele ce fac parte din eantion. Astfel rata
rspunsurilor este destul de mare.
Deoarece durata convorbirii telefonice este limitat, chestionarul este relativ scurt, ntrebrile
vor fi simple, ceea ce arat c aceast modalitate de culegere a datelor se aplic n cazul temelor mai
simple i care sunt supuse schimbrii ntr-un timp scurt.
Principalul inconvenient este acela c eantionul de cele mai multe ori nu este reprezentativ.
Acesta pentru c nu toat populaia dispune de telefon, iar populaia din mediul rural este foarte greu
de contactat telefonic.
n concluzie alegerea unei tehnici sau a alteia depinde de obiectivele studiului, de
complexitatea informaiilor culese, de volumul eantionului i de dispersia geografic a acestuia, de
bugetul alocat i de timpul acordat pentru sondaj.
Ceea ce se contureaz n momentul de fa este apariia de noi modaliti de culegere a datelor,
mult mai eficiente dect cele aplicate n trecut, cum ar fi folosirea internetului.
2.1.3. Erori de observare

n cele mai multe cazuri observarea statistic presupune i manipularea unui volum mare de
date. Ca atare intervin diferite tipuri de erori:
- eroare de eantionare (de reprezentativitate);
- erori de observare;
- erori datorate non-rspunsurilor.
Eroarea de eantionare exist n toate anchetele prin sondaj, dar ea este nul n cazul observrii
totale (nu constituie obiectul acestei lucrri).
Erorile de observare in de faptul c valoarea nregistrat poate fi o valoare yi* diferit de
valoarea adevrat yi corespunztoare unitii i.
Din categoria erorilor de observare fac parte urmtoarele:
a) Erori datorate dificultilor de vocabular, cum ar fi:
utilizarea unui limbaj savant, prea tehnicist, cnd de regul ntr-un chestionar nu trebuie s
fie folosite dect cuvinte uor de neles;

folosirea unor cuvinte a cror sens este variabil de la un mediu la altul, sau de la un individ
la altul;
folosirea unor cuvinte a crui sens este vag sau sunt prea abstracte.
b) Erori datorate nenelegerii corecte a sensului ntrebrilor, ca de exemplu:
persoanele intervievate declar o alt situaie dect cea normal, cum ar fi cazul declarrii
venitului (cnd cel n cauz declar venitul salarial i nu venitul total realizat), declararea
unei vechi profesii n loc de cea actual etc.;
persoanele intervievate comit erori fie datorate nedefinirii perioadei de referin (o perioad
pentru care se solicit informaii) sau datorate lungimii prea mari, solicitndu-se prea mult
memoria celor anchetai;
nedefinirea exact a unitilor de observat, pentru c sunt ntrebri ce se refer la o persoan,
iar altele la un grup, mai ales n cazul anchetelor organizate n gospodrii;
nenelegerea ntrebrilor foarte lungi, foarte complexe i care conin mai multe ideii n
acelai timp;
folosirea unor ntrebri vagi, abstracte, a cror implicaii nu sunt bine nelese;
dificultatea alegerii unuia sau a mai multor rspunsuri dintr-o list. Este important s se tie
dac rspunsurile se exclud sau nu, dac poi alege doar unul sau mai multe. n general se
prefer o list cu rspunsuri ct mai complet, dar s nu fie prea lung.
c) Erori datorate solicitrii memoriei, i anume:
erori cauzate de uitarea unor evenimente sau reinerea lor parial;
erori cauzate de lungimea perioadei de referin, mai ales atunci cnd ea este mare.
d) Erori datorate lipsei sinceritii n furnizarea informaiilor. Astfel de erori sunt mai
frecvente n cazul rilor unde persoanele nu sunt obinuite cu sondajele. n cadrul acestei categorii sar include:
erori datorate fricii de a declara o situaie aa cum este ea, de exemplu n cazul venitului,
persoanele declar n general salariul, pensia sau ajutorul primit, veniturile suplimentare nu
sunt declarate mai ales de frica impozitelor fiscale;
erori cauzate de dorina impresionrii anchetatorului, de exemplu subestimnd consumul de
alcool, supraestimnd activitile culturale etc.
e) Erori cauzate de anchetatori, i anume:
prin interpretarea unor ntrebri sau suflarea unor rspunsuri, la cei intervievai;
n cazul organizrii de sondaje probabiliste, atunci cnd o unitate este nlocuit cu alta, care
nu este trecut pe lista eantionului, situaie ntlnit mai ales atunci cnd nu se obin
informaii de la unitile ce trebuie supuse observrii.
Pentru reducerea acestor erori este necesar o selecie riguroas a anchetatorilor, o bun
pregtire a acestora, i o testare prealabil a chestionarelor. De asemenea se recomand efectuarea de
controale a anchetatorilor. Depistarea erorilor se poate realiza i n faza de prelucrare a datelor, iar n
funcie de natura lor se pot lua diferite msuri pentru eliminarea efectului acestora.
n concluzie, aa cum spunea J. Desabie atunci cnd o anchet eueaz, cel mai frecvent se
datoreaz erorilor de observare dect erorii de eantionare. De aceea este iraional s consacri mari
eforturi pentru reducerea erorii de eantionare atunci cnd erorile de observare sunt consistente. Dar n
general erorile de observare sunt mult mai mici n cazul anchetelor prin sondaje dect n cazul
recensmintelor, datorate faptului c anchetatorii au o pregtire mult mai bun dect agenii recenzori.
Erorile datorate non-rspunsurilor provin din absena total sau parial a datelor privind
unit ile supuse observrii.
2.2. Sistematizarea i prezentarea datelor statistice

Sistematizarea constituie o etap n cadrul prelucrrii datelor statistice n vederea prezentrii


acestora sub form de serie statistic (tabel de frecvene). Datele obinute ca urmare a procesului de
observare statistic, n forma lor brut, permit o caracterizare amnunit a fiecrei uniti din

populaia considerat. Deoarece, datele rezultate din observare se prezint sub form dezorganizat nu
permit o caracterizare a populaiei n ansamblu.
n vederea atingerii scopului cercetrii statistice ntreprinse i anume acela de a da o
caracterizare de ansamblu a populaiei considerate este necesar ca datele rezultate din observare s fie
supuse unor operaii de sistematizare i prezentare n vederea deducerii a ceea ce este esen ial, tipic i
general n legtur cu populaia.
Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate sub
forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie s fie n
strns dependen cu scopul cercetrii i cu natura fenomenului cercetat.
n raport cu una sau mai multe variabile din programul observrii, se poate construi o serie
statistic, permind astfel diverse ordonri (grupri) a datelor nregistrate. Orice cercetare statistic se
face cu un anumit scop bine precizat. n urma efecturii observrii statistice, indiferent de numrul
variabilelor prevzut n programul cercetrii, prelucrarea datelor rezultate se face n raport cu acelea
care sunt strns legate de scopul final.
Odat precizate variabilele de la baza seriei, se tie care va fi coninutul primului ir de date i
ca urmare este elucidat criteriul n raport cu care informaiile rezultate din observare vor fi ordonate,
necunoscndu-se ns cum se face propriu-zis ordonarea i cum se completeaz primul ir al seriei.
Completarea primului ir de date al unei serii statistice nu presupune doar o simpl aranjare n
ordine cresctoare sau descresctoare a variabilelor numerice sau n ordine alfabetic a strilor
variabilelor calitative. Definirea unei serii, referitor la primul ir de date se realizeaz n raport cu toate
strile variabilei stabilite.
n cazul unei variabile calitative sau cantitative discrete (i care nregistreaz un numr redus
de stri) ce st la baza construirii unei serii, procedeul cel mai simplu de completare a primului ir l
constituie ordonarea sau aranjarea strilor variabilei respective ntr-o anumit ordine. Dac variabila
care st la baza seriei este de variaie continu sau dei discret nregistreaz un numr prea mare de
valori n cadrul populaiei de studiat, ordonarea valorilor acestei variabile va conduce la o frmiare
prea mare a populaiei, ceea ce nu permite evidenierea principalelor aspecte ale acesteia. Pentru
asemenea cazuri, completarea primului ir presupune n primul rnd reunirea n clase distincte a acelor
unit i din populaie pentru care variabila nu prezint variaii esen iale. Ca urmare, n vederea
definitivrii primului ir de date al unei serii, se grupeaz datele n mod corespunztor, fiind necesar n
primul rnd stabilirea claselor.
Operaia de stabilire a claselor presupune mprirea unitilor unei populaii n clase distincte
n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit ordine. n urma
unei asemenea operaii, fiecare unitate trebuie s se gseasc n una i numai una din clasele rezultate.
Aceast operaie nu trebuie s conduc la pierderi de uniti, regsindu-se ns ntr-o alt ordine dect
cea dup care s-a realizat observarea.
De modul cum se face operaia de grupare a unitilor populaiei depinde n mare msur
sesizarea principalelor aspecte calitative care se pot contura n cadrul unei populaii ct i calitatea
informaiilor rezultate n urma prelucrrii datelor respective.
Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se spune c o
clas este omogen dac, pentru unitile care fac parte din ea, variabila de grupare nregistreaz
varia ii nesemnificative.
n cazul seriilor care au la baz o variabil de grupare calitativ sau cantitativ discret,
problema omogenitii nu se ridic deoarece, toate unitile pentru care variabila a nregistrat aceeai
stare constituie o clas.
n cele ce urmeaz se va prezenta operaia de stabilire a claselor n cazul unei serii
unidimensionale.
Dac la baza seriei avem o variabil calitativ, atunci clasele se stabilesc n raport cu strile
acesteia. Pentru fiecare stare a variabilei se va construi o clas. Ca urmare, n acest caz, ntr-o clas vor
intra toate unitile care au nregistrat aceeai stare n timpul observrii n raport cu variabila
considerat.
Pentru o variabil cantitativ, care st la baza construirii unei serii, stabilirea claselor se
realizeaz n mod diferit pentru o variabil discret i pentru o variabil continu.

n cazul unei serii care are la baz o variabil cantitativ discret (numrul strilor nu este
prea mare), clasele se stabilesc n mod asemntor ca i la variabilele calitative, respectiv:
x2 ... xR
x

X : 1
N1 N 2 ,... N R
n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la baz o
variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia considerat
nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul strilor variabilei.
Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu ajutorul intervalelor de
grupare (variaie), fiecare interval cuprinznd un numr oarecare de valori ale variabilei. Ca urmare,
pentru o serie continu, clasele se definesc cu ajutorul intervalelor de grupare.
Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil cantitativ
continu:
determinarea lungimii intervalelor de variaie;
stabilirea formei de scriere a intervalelor de variaie.
Determinarea lungimii intervalelor de variaie conduce la dou situaii:
serii construire cu intervale de lungime egal;
serii construite cu intervale de lungime diferite.
Alegerea unuia din cazurile de mai sus (intervalele de lungime egal sau diferit) trebuie
precedat de o analiz atent a modului de variaie a variabilei n cadrul populaiei. Stabilirea
numrului de intervale de variaie trebuie s asigure satisfacerea urmtoarelor condiii:
- informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar populaia s
nu fie prea frmiat n raport cu variabilele de grupare;
- media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai aproape
de centrul intervalului de variaie respectiv;
- s nu existe grupe vide;
- reprezentarea grafic a seriei rezultate s permit conturarea unei regularit i a fenomenului
de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu este posibil nici n cazul
unui numr mic de intervale deoarece se pierd prea multe date, nici n cazul unui numr
prea mare de intervale, populaia frmindu-se prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport cu
variabila X este normal, urmtoarea expresie:
lx =

xmax xmin
1 + 3,322 lg N

(2.1)

(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul fiind
orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n cazul n care
acestea vor fi de lungime egal. Se elaboreaz seria de intervale de lungime egal dup cum urmeaz:
[x ; (x + l )) ... [xmin + (k 1)lx ; (xmin + klx )) ... [xmin + (R 1)lx ; (xmin + R lx ))

X : min min x
N1
Nk
NR

dac se presupune c au rezultat R intervale, unde Nk, k = 1, R reprezint volumele claselor n care s-a
structurat populaia.
Nu ntotdeauna mprirea domeniului de variaie a variabile n intervale de lungime egal este
relevant din punct de vedere al scopului urmrit n ceea ce privete desprinderea tipurilor calitative
din cadrul populaiei cercetate. Numeroase sunt cazurile practice n care studiul unei populaii n
raport cu o variabil sau mai multe presupune mprirea domeniilor de variaie ale acestora n
intervale de lungime neegal. n asemenea cazuri nu exist o relaie de calcul n acest sens. Stabilirea
intervalelor de variaie se face n direct legtur cu variaia variabilelor i distribuirea unitilor n
raport cu acestea.

Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative atunci
clasele se stabilesc n raport cu fiecare din variabilele considerate prin strile acestora (vezi seria 1.5,
cap. 1).
Nu este recomandat ca numrul variabilelor n raport cu care se studiaz populaia s fie prea
mare, deoarece aceasta duce la o divizare exagerat a populaiei pierzndu-se din vedere aspectele
principale.
Dup ce clasele au fost definite, are loc repartizarea unitilor populaiei n clasele respective,
folosind n acest scop un algoritm adecvat.
Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe statistice
cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical
Analysis System), STATGRAPHICS, etc.

2 - 10 ani
2 - 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
sub 6 luni
2 - 10 ani
peste 10 ani
sub 6 luni
peste 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
2 - 10 ani
6 luni - 2 ani
2 - 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
2 - 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
2 - 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
2 - 10 ani
2 - 10 ani
2 - 10 ani

Mobifon
Mobifon
Nici una
Nici una
Orange
Orange
Nici una
Orange
Orange
Orange
Orange
Mobifon
Nici una
Nici una
Mobifon
Mobifon
Nici una
Orange
Nici una
Mobifon
Orange
Nici una
Orange
Orange
Nici una
Nici una
Nici una
Orange
Nici una
Mobifon
Orange
Nici una
Nici una
Nici una
Orange
Mobifon
Nici una
Orange
Nici una
Nici una
Nici una
Mobifon
Nici una
Mobifon
Orange
Nici una
Mobifon
Orange
Orange
Mobifon
Orange
Mobifon
Orange
Nici una
Orange
Orange
Mobifon
Orange
Nici una
Nici una
Nici una
Orange
Mobifon
Nici una
Mobifon
Mobifon
Orange
Orange
Orange
Orange

Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Abonament social
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Abonament social
Cu 0 impulsuri
Cu 0 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri

50000 - 290000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
290001 - 530000
1490001 - 1730000
50000 - 290000
peste 2000000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
530001 - 770000
1490001 - 1730000
770001 - 1010000
530001 - 770000
50000 - 290000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
50000 - 290000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
530001-770000
290001 - 530000
1010001 - 1250000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
290001 - 530000
290001 - 530000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
290001 - 530000
290001 - 530000
530001 - 770000
1010001 - 1250000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
50000 - 290000
530001 - 770000
290001 - 530000
530001 - 770000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
1730001 - 2000000
770001 - 1010000
50000 - 290000
50000 - 290000
50000 - 290000
530001 - 770000
530001 - 770000
50000 - 290000
770001 - 1010000
50000 - 290000
770001 - 1010000
50000 - 290000
770001 - 1010000 .
290001 - 530000

2
3
2
4
4
4
2
1
1
5
5
3
4
2
1
2
5
3
3
1
5
5
5
1
3
3
5
1
2
3
4
5
5
3
3
3
5
4
3
3
1
3
2
4
3
4
4
4
3
3
2
2
2
5
3
2
1
2
1
1
4
1
3
2
2
3
4
4

nesatisfacatoare
satisfacatoare
slaba
foarte buna
satisfacatoare
satisfacatoare
buna
buna
buna
foarte buna
foarte buna
satisfacatoare
buna
buna
foarte buna
buna
foarte buna
satisfacatoare
buna
nesatisfacatoare
foarte buna
foarte buna
buna
buna
buna
satisfacatoare
satisfacatoare
slaba
satisfacatoare
satisfacatoare
buna
foarte buna
slaba
foarte buna
buna
buna
foarte buna
foarte buna
satisfacatoare
satisfacatoare
buna
buna
satisfacatoare
satisfacatoare
nesatisfacatoare
buna
buna
satisfacatoare
nesatisfacatoare
satisfacatoare
satisfacatoare
satisfacatoare
satisfacatoare
foarte buna
satisfacatoare
satisfacatoare
slaba
satisfacatoare
buna
buna
nesatisfacatoare
satisfacatoare
buna
satisfacatoare
satisfacatoare
satisfacatoare
buna
buna
satisfacatoare
5 buna

nu stiu
da
da
da
da
da
nu stiu
nu stiu
nu
da
da
da
da
da
nu stiu
nu stiu
da
nu stiu
nu stiu
nu stiu
nu stiu
da
da
nu stiu
da
da
da
nu
nu stiu
nu
nu stiu
da
nu stiu
da
da
da
da
nu stiu
nu stiu
nu stiu
da
nu stiu
da
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu
nu stiu
da
da
da
nu
nu stiu
da
da
nu stiu
nu
nu stiu
nu stiu
da
nu stiu
nu stiu
da
nu stiu
da

31 si 40 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
sub 20 ani
sub 20 ani
31 si 40 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
41 si 50 ani
31 si 40 ani
peste 60ani
21 si 30 ani
51 si 60 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
sub 20 ani
51 si 60 ani
41 si 50 ani
51 si 60 ani
31 si 40 ani
21 si 30 ani
peste 60ani
21 si 30 ani
peste 60ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
31 si 40 ani
21 si 30 ani
peste 60ani
51 si 60 ani
21 si 30 ani
sub 20 ani
21 si 30 ani
.
sub 20 ani
sub 20 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
51 si 60 ani
31 si 40 ani
21 si 30 ani
peste 60ani
peste 60ani
31 si 40 ani
31 si 40 ani
sub 20 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
31 si 40 ani
peste 60ani
21 si 30 ani

m
m
f
f
f
f
f
f
m
f
f
m
f
f
f
f
m
f
f
f
f
m
m
f
f
m
m
f
f
m
f
m
m
f
f
m
f
f
m
m
f
f
m
f
m
f
f
f
f
f
m
m
f
m
f
m
f
f
f
f
m
f
f
f
f
f
m
f
m
f

Exemple
Se consider populaia statistic format cu mulimea clienilor unei firme X, datele privind variabilele
statistice obsevate sunt redate n tabelul de mai sus.
Elaborarea seriilor statistice unidimensionale.
De ct timp suntei client?
sub 6 luni
6 luni 2 ani
2 - 10 ani
peste 10 ani
Total

Frecventa Frecventa
abso luta relativa
2
2.9
10
14.3
19
27.1
39
55.7
70
100.0

Frecventa
validata
2.9
14.3
27.1
55.7
100.0

Frecventa
relativa cumulata
2.9
17.1
44.3
100.0

La care companie de telefonie mobil suntei abonat?


Mobifon
Orange
Nici una
Total

Frecventa
abso luta
17
27
26
70

Frecventa
relativa
24.3
38.6
37.1
100.0

Frecventa
validata
24.3
38.6
37.1
100.0

Frecventa
Relative cumulata
24.3
62.9
100.0

Ce tip de abonament RTC folosii?


Cu 0
impulsuri
Cu 50
impulsuri
Cu 100
impulsuri
Abonament
social
Total

Frecventa
abso luta
8

Frecventa
relativa
11.4

Frecventa
Frecventa
validata relativa cumulata
11.4
11.4

11.4

11.4

22.9

52

74.3

74.3

97.1

2.9

2.9

100.0

70

100.0

100.0

Note pentru raportul tarif/calitatea serviciilor


Frecventa
abso luta
1
11
2
14
3
19
4
13
5
12
Total
69
Nu raspund
1
Total
70

Frecventa
relativa
15.7
20.0
27.1
18.6
17.1
98.6
1.4
100.0

Frecventa
validata
15.9
20.3
27.5
18.8
17.4
100.0

Frecventa
relativa cumulate
15.9
36.2
63.8
82.6
100.0

Care a fost valoarea ultimei facturi telefonice RTC achitate de dvs.?


Frecventa
abso luta
50000 - 290000
36
290001 - 530000
12
530001 - 770000
11
770001 - 1010000
5
1010001 - 1250000
2
1490001 - 1730000
2
1730001 - 2000000
1
peste 2000000
1
Total
70

Frecventa
relativa
51.4
17.1
15.7
7.1
2.9
2.9
1.4
1.4
100.0

Frecventa
Frecventa
Validate relativa cumulata
51.4
51.4
17.1
68.6
15.7
84.3
7.1
91.4
2.9
94.3
2.9
97.1
1.4
98.6
1.4
100.0
100.0

Promptitudinea n deservirea clienilor


Frecventa
abso luta
slaba
4
nesatisfacatoare
5
satisfacatoare
26
buna
23
foarte buna
12
Total
70

Frecventa
relativa
5.7
7.1
37.1
32.9
17.1
100.0

Frecventa
validata
5.7
7.1
37.1
32.9
17.1
100.0

Frecventa
relativa cumulata
5.7
12.9
50.0
82.9
100.0

Intenionati s rmnei client RTC?


da
nu
nu stiu
Total

Frecventa
abso luta
31
6
33
70

Frecventa
relativa
44.3
8.6
47.1
100.0

Frecventa
validata
44.3
8.6
47.1
100.0

Frecventa
relativa cumulata
44.3
52.9
100.0

Frecventa
abso luta
7
27
21
2
5
7
69
1
70

Frecventa
relativa
10.0
38.6
30.0
2.9
7.1
10.0
98.6
1.4
100.0

Frecventa
Frecventa
validata relativa cumulata
10.1
10.1
39.1
49.3
30.4
79.7
2.9
82.6
7.2
89.9
10.1
100.0
100.0

Frecventa
abso luta
46
24
70

Frecventa
relativa
65.7
34.3
100.0

Frecventa
Frecventa
validata relativa cumulata
65.7
65.7
34.3
100.0
100.0

Vrsta
sub 20 ani
21 si 30 ani
31 si 40 ani
41 si 50 ani
51 si 60 ani
peste 60ani
Total
Nu raspund
Total

Sexul
f
m
Total

Serii de repartiii bidimensionale


La care companie de telefonie mobila sunteti abonat? * intentionati s rmnei client RTC?
intentionati sa ramaneti client RTC?

La care companie de
telefonie mobila
sunteti abonat?
Total

Mobifon
Orange
Nici una

da
4
10
17
31

nu
3
3
6

nu stiu
10
14
9
33

Total

17
27
26
70

Vrsta * promptitudinea in deservirea clientilor


promptitudinea in deservirea clientilor
slaba
Varsta

sub 20 ani
21 si 30 ani
31 si 40 ani
41 si 50 ani
51 si 60 ani
peste 60ani

Total

2
1
1

nesatisfacatoare satisfacatoare
4
2
13
2
4

buna
3
7
9

3
2
26

Total
foarte buna
7
27
21
2
5
7
69

3
5
1

2
2
23

3
12

Care a fost valoarea ultimei facturi telefonice RTC achitate de dvs.? * Ce tip de abonament RTC
folositi?

Care a fost valoarea


ultimei facturi
telefonice RTC
achitate de dvs.?
(mii lei)

50 - 290
290 - 530
530 - 770
770 - 1010
1010 - 1250
1490 - 1730
1730 - 2000
peste 2000

Total

Ce tip de abonament RTC folositi?

Total

Cu 0
Cu 50
Cu 100 Abonament
impulsuri impulsuri impulsuri
social
2
4
29
1
2
10
2
9
1
2
2
2
1
1
1
1

36
12
11
5
2
2
1
1

52

70

2.3. Reprezentri grafice

Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spaiu) cu privire la
forma static sau evoluia dinamic a fenomenului cuantificat de seria respectiv.
Graficul asociat unei serii constituie o imagine spaial a fenomenului de cercetat, permind
eviden ierea rapid a structurii, dinamicii i tendinei de dezvoltare a acestuia. Reprezentrile grafice
sunt folosite att n scopul cunoaterii populaiei n cauz, ct i pentru popularizarea unor rezultate
din diverse domenii de activitate.
Elaborarea complet i corect n acelai timp a unui grafic presupune elucidarea urmtoarelor
elemente: titlul graficului, scara de reprezentare, reeaua graficului, semnele convenionale i notele.
Titlul graficului trebuie s fie scurt, clar i semnificativ pentru coninutul fenomenului reliefat
prin seria considerat.
n cele mai frecvente cazuri un grafic se traseaz ntr-un sistem de axe rectangulare xOy. Pe
fiecare din cele dou axe se reprezint valorile variabilelor X, respectiv Y. Un astfel de punct marcat se
mai numete punct cotat. Scara de reprezentare reunete mulimea tuturor punctelor cotate. n cazul n
care variabila nregistreaz valori mici, gradarea scrii ncepe n principiu de la zero, dac variabila
nregistreaz valori mari se consider o alt origine stabilit cu aproximaie. Pentru a nu ncrca prea
mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un anumit interval
convenabil ales. Distanele dintre dou puncte cotate consecutive se numete intervalul graficului.
Cnd intervalele sunt egale atunci avem scri uniforme, n caz contrar avem scri neuniforme.
Scara aritmetic este o scar uniform n timp ce scara logaritmic sau cea binomial constituie
exemple de scri neuniforme.
Reeaua graficului permite identificarea cu uurin n plan sau n spaiu a punctelor
corespunztoare valorilor nregistrate de variabilele n cauz. Sistemul axelor rectangulare (n plan sau
spaiu) constituie cele mai uzuale reele n reprezentarea grafic a seriilor statistice.
Semnele convenionale se pot materializa ntr-o reprezentare grafic prin inscripii, fie printr-o
legend.

Inscripia trebuie s fie scurt i semnificativ i plasat ct mai bine n raport cu elementul
din grafic pe care l expliciteaz.
Legenda se folosete pentru a explicita folosirea semnelor, culorilor sau diverselor hauri
folosite n graficul n cauz. Legenda se plaseaz nafara graficului, n colul din stnga sau dreapta
jos.
n cazul graficelor complexe, pentru o nelegere mai bun, sunt necesare unele explicaii, care
se dau sub form de note. Notele generale privesc n ansamblu graficul i se plaseaz chiar sub titlul
graficului. Notele speciale privesc poriuni din grafic i sunt legate de acestea prin diverse semne de
trimitere. Notele se plaseaz n partea de jos a diagramei, n colul din stnga sub reea.
n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n
reprezentarea seriilor statistice ce descriu fenomenele social-economice.
Histograma

Graficul specific seriilor care au la baz o variabil continu (de intervale) este histograma.
Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe abscis se trec
intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara frecvenelor se construiete
n conformitate cu respectarea principiului proporionalitii ntre frecvene i segmentele delimitate pe
scara ordonatelor. Pentru fiecare interval de variaie a seriei (xi-1 xi) se construiete un dreptunghi a
crui baz este chiar lungimea intervalului, iar cealalt latur se determin din condiia
proporionalitii ariei dreptunghiului cu mrimea indicatorului n clasa respectiv.
Latura necunoscut a dreptunghiului, notat cu Li se determin din urmtoarea relaie:
Li . li = k . Ni

(2.2)

unde:
li = latura cunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
Li = latura necunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
Ni = frecvena absolut a clasei i;
k = un coeficient de proporionalitate care se alege n raport cu scara de reprezentare.
Din relaia (2.2) se deduce Li:
N
Li = k i ,
i = 1, R
li
unde: li = xi - xi-1, adic diferena dintre limita superioar i cea inferioar a intervalului de variaie.
Mulimea tuturor dreptunghiurilor astfel determinate, formeaz histograma ataat seriei.
Poligonul frecvenelor

Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv cantitativ
continu i format cu frecvene absolute sau relative, simple sau cumulate. Trasarea acesteia
presupune realizarea n prealabil a histogramei. Poligonul frecvenelor se obine unind prin segmente
de dreapt mijloacele laturilor superioare ale dreptunghiurilor, din care este alctuit histograma.
Poligonul frecvenelor poate fi construit i direct, fr intermediul histogramei. Aceasta
presupune ridicarea de perpendiculare din mijlocul fiecrui interval de variaie, a cror
lungimi(inaltimi) sunt proporionale cu frecvenele intervalelor corespondente. Unind prin segmente
de dreapt vrfurile acestor perpendiculare, se obine graficul dorit. Graficul produce o imagine a
funciei densitate de probabilitate empirice (n cazul utilizrii frecvenelor simple), sau a funciei de
repartiie empiric (n cazul utilizrii frecvenelor cumulate). Poligonul frecvenelor este un grafic
important pentru aproximarea formei distribuiei populaiei studiate, ct i pentru compararea a dou
distribuii pe aceeai diagram.

Exemplu i figura
Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de repartiie reprezentnd populaia
Romniei sub 40 de ani pe grupe de vrst.
Grupa
de vrst (ani)
04
59
10 14
15 19
20 24
25 29
30 34
35 39

Populaia
1147065
1330733
1737153
1701881
1978835
1792822
1698268
1335039

Figura 2.1 Histograma si poligonul frecventelor

populatia

Distributia populatiei Romaniei sub 40 ani pe grupe de varsta

04

59

10 14

15 19

20 24

25 29

30 34

35 39

grupa de varsta (ani)

Diagramele de structur

Punerea n eviden sub form grafic a structurii unei populaii statistice este posibil apelnd
la diagramele de structur. n acest sens se prezint: dreptunghiul, ptratul, cercul i semicercul de
structur. Aceste tipuri de grafice permit reprezentarea grafic a seriilor unidimensionale construite cu
mrimi de structur( frecvene relative, greutate specific). Cel mai des folosit este cercul de structur
denumit i diagrama sectorial (piechart).
Cercul de structur

Se construiete un cerc de raz oarecare a crei suprafa se consider c reprezint volumul


ntregii populaii n cauz (exprimat n frecvene absolute sau relative). Fiecare clas n care este
divizat populaia supus studiului este reprezentat printr-un sector de cerc de arie direct
proporional cu volumul clasei. Trasarea sectorului de cerc presupune determinarea msurii n grade a
unghiurilor la centru a fiecrui sector. Unghiul la centru de 360o corespunde volumului ntregii
populaii. Unghiurile sectoarelor de cerc care reprezint clase din populaie trebuie s fie proporionale
cu volumul acestora (exprimat n frecvene absolute sau relative). Unui procent i corespunde 3,6o cu
procentul corespunztor clasei respective.

i = f i (%).

360o
100%

(2.3)

Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd distribuia
voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie 1996:
Formaiunea
Politic
Voturi
Obinute (%)

CDR

PDSR

USD

UDMR

PRM

PUNR

37,0

28,7

16,1

7,7

5,6

4,9

Figura 2.2 Cercul de structur


Rezultatele alegerilor parlamentare pentru Senat din 3 nov 1996

5,60%

4,90%

7,70%
37%

CDR
PDSR
USD
UDMR
PRM
PUNR

16,10%

28,70%

Semicercul de structur

Construcia acestuia este asemntoare cu a cercului de structur, cu a cercului de structur, cu


deosebirea c volumul populaiei cercetate este reprezentat printr-un semicerc de 180o, cu respectarea
aceluiai principiu conform cruia unghiurile la centru corespunztoare sectorului prin care se
reprezint clasele trebuie s fie proporionale cu indicatorii care le reprezint. n acest caz, unui
procent i corespunde 1,8o, unghiurile la centru corespunztoare sectoarelor se vor determina nmulind
1,8o cu procentele corespunztoare claselor respective.
Diagramele prin benzi (barchart)

Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribuia unei populaii n
raport cu o variabil cantitativ discret sau calitativ. Benzile au aceeai lime (baz), iar lungimea
(nlimea) lor este direct proporional cu frecvena clasei reprezentate. Numrul benzilor este egal cu
numrul claselor n care este mprit populaia studiat. De asemenea se pot lua n considerare o
variabil sau dou. n reprezentri se utilizeaz benzi simple sau benzi grupate. Poziia benzilor poate
fi orizontal sau vertical.
Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd nivelul PNB/loc
n $ calculat pe baza puterii de cumprare n Romnia i alte ri est-europene, n 1998
ara
PNB/loc ($)

Bulgaria
4683

Cehia
12197

Polonia
7543

Romnia
6153

Slovacia
9624

Ungaria
9832

Figura 2.3 Diagram prin benzi simple


PNB/loc ($) in 1998
14000
12197
12000
10000

9624

9832

Slovacia

Ungaria

7543

8000

6153
6000
4683
4000
2000
0

Bulgaria

Cehia

Polonia

Romnia

Cronograma (historiograma)

O categorie foarte important de serii o constituie seriile cronologice, a cror reprezentare


grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz ntr-un sistem de axe
rectangulare. Se consider seria cronologic de forma (1.7):
0 1 2 ... t ... T

Y :
y0 y1 y2 ... yt ... yT
unde: t = 0,T , reprezint momentele (sau perioadele) de timp care se reprezint pe axa absciselor, iar
mrimile yt se reprezint pe axa ordonatelor. Fiecrei perechi de valori (t, yt), t = 0,T i corespunde un
punct n planul axelor rectangulare. Unind prin segmente de dreapt punctele consecutive, astfel
determinate, se obine ceea ce se numete cronogram. La construirea cronogramei trebuie avut n
vedere dac seria cronologic este de momente sau de intervale. Cnd se reprezint o serie cronologic
de momente, caz n care indicatorii seriei nu se pot nsuma, momentul t se trece n dreptul gradaiei
respective. n cazul reprezentrii unei serii cronologice de intervale, unde indicatorii se pot nsuma,
perioadele se trec n dreptul segmentelor ce reprezint perioada respectiv.
n acelai sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care pot fi
exprimate n aceeai unitate de msur sau n uniti de msur diferite. n cazul n care indicatorii cu
care sunt construite seriile sunt exprimai n aceeai unitate de msur, atunci pe axa ordonatelor se
construiete o singur scar, iar dac indicatorii seriilor sunt exprimai n uniti de msur diferite,
atunci se construiesc scri de reprezentare corespunztoare pe axa ordonatelor. Cronogramele asociate
unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii i sesizarea
perioadelor critice n evoluia acestora.
Exemplu: Din Anuarul Statistic al Romniei (2000) am extras seria care urmeaz, rednd numrul
total de autoturisme nscrise n circulaie la sfritul anului n Romnia n perioada 1994-1999.
Anul
Autoturisme
nmatriculate
1994
2020017
1995
2197477
1996
2391869
1997
2605465
1998
2822254
1999
2980014

Figura 2.4 Cronograma


Evolutia numarului de autoturisme inscrise in circulatie
in perioada 1994-1999

numar autoturisme in circulatie

3500000
3000000
2500000
2000000
1500000
1000000
500000
0
1993

1994

1995

1996

1997

1998

1999

2000

anul

Cartograma i cartodiagrama

Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor statistice de
spaiu. Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaiului (sub form
de hart) n interiorul cruia se manifest fenomenul care este cuantificat de seria de reprezentat. n
interiorul hrii astfel realizat, prin diverse culori sau nuane ale aceleiai culori, prin hauri sau prin
diferite diagrame, este evideniat intensitatea dezvoltrii fenomenului cercetat precum i mrimea
indicatorilor seriei.
Cartograma n culori sau nuane ale aceleiai culori se utilizeaz pentru redarea intensitii
manifestrii unui fenomen. Acest tip de grafic este recomandat n special atunci cnd intensitatea
fenomenului surprins de seria de spaiu nu prezint o variaie prea mare pentru a nu apela la prea multe
culori sau nuane ale acestora, care s ngreuneze citirea graficului.
Cnd realizarea unei cartograme n culori este prea costisitoare sau culorile i nuanele sunt
greu de reprodus este utilizat cartograma prin hauri. i n acest caz densitatea haurilor trebuie s
redea diferene de intensitate a fenomenului n spaiu surprins de seria de reprezentat. Dup ce harta a
fost desenat i mprit n conformitate cu strile variabilei de spaiu ce st la baza seriei, n
interiorul fiecrei subdiviziuni se utilizeaz hauri a cror intensitate s fie proporional cu
intensitatea fenomenului cuantificat de indicatorul cu care s-a construit seria.
Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spaiu, realizndu-se
ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi,
cerc, ptrat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de spaiu ce exprim volumul
investi iilor strine pe judee, la noi n ar, se procedeaz astfel: n primul rnd se deseneaz harta
Romniei, delimitndu-se judeele; n cadrul fiecrui jude se deseneaz o figur geometric oarecare
convenabil aleas, a crei arie sau mrime s fie direct proporional cu volumul investiiilor strine
din judeul respectiv.
i acest tip de reprezentare grafic i are o larg aplicabilitate n special n urmrirea acelor
fenomene de natur economic sau social care sunt urmrite n spaiu.
Norul statistic

Norul statistic constituie o modalitate de reprezentare grafic a seriilor atributive de repartiie


bidimensionale. Se consider o serie bidimensional de repartiie n raport cu variabilele discrete X i
Y. n sistemul de axe rectangulare xOy se marcheaz toate punctele de coordonate (xj, yi );
i = 1, I; j = 1, J pentru care frecvenele Nij 0. Mrimea acestor frecvene se poate marca pe grafic n
dou moduri:

dac frecvenele sunt mici, atunci pentru fiecare punct de pe grafic


(xj, yi ); i = 1, I; j = 1, J pentru care Nij 0, se marcheaz attea puncte de cte ori se repet
perechea respectiv.
- dac ns frecvenele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame
areale prin cercuri ale cror arii trebuie s fie proporionale cu rdcina ptrat a frecvenelor
pe care le reprezint.
n cazul n care cele dou variabile X i Y sunt continue, ntruct la intersec ia a dou intervale se
formeaz o rubric (csu), frecvenele diferite de zero se reprezint n interiorul acestei rubrici, fie
prin puncte, fie prin diagrame areale cu respectarea unuia din cele dou moduri de elaborare mai sus
amintite. Poriunea sau fia n care sunt cuprinse punctele norului statistic se numete corelogram i
servete n principal legturii dintre variabile.
Exemplu
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la preuri diferite
(P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a nregistrat un anumit
nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:

Nr. crt.

Cerere (C)

1
2
3
4
5
6
7
8
9
10
11
12
13

Pre (P)

15,4
3,2
4,9
10,5
8,0
5,1
7,6
11,3
14,0
6,4
13,2
8,8
12,1

Venit (V)

1,4
5,1
2,5
1,7
1,8
3,4
2,1
1,6
3,6
3,5
1,9
1,8
1,9

620
530
490
800
630
410
670
920
990
320
520
700
730

Figura 2.5 Norul de puncte n raport cu Pret i Cerere


18
16
14

cerere

12
10
8
6
4
2
0
0

3
pret

CAPITOLUL 3

PARAMETRII REPARTIIILOR
EMPIRICE UNIDIMENSIONALE

Organizarea datelor rezultate din observarea statistic sub form de serie de frecvene,
constituie o prim etap a prelucrrii acestora. O serie statistic red sub form rezumativ (sintetic)
o prim imagine asupra populaiei de studiat n raport cu variabila de la baza seriei.
Pornind de la repartiia statistic, ca form sintetic de prezentare a rezultatelor observrii, se
pot deduce o serie de caracteristici specifice populaiei considerate, cum ar fi:
- nivelul mediu al variabilei;
- structura populaiei n raport cu variabila considerat;
- variaia variabilei n raport cu nivelul mediu al acesteia;
- forma dup care se dispun unitile populaiei n jurul valorii medii.
Caracterizarea numeric a acestor aspecte poate fi realizat prin urmtorii parametri
(caracteristici):
- parametrii tendinei centrale;
- parametrii de structur;
- parametrii variaiei;
- parametrii concentrrii;
- parametrii formei.
Se prezint, n cele ce urmeaz, aspecte legate de definirea, semnificaia i modaliti de calcul
pentru fiecare parametru.
3.1. Parametrii tendinei centrale

Parametrii din aceast grup au menirea de a eviden ia poziia n jurul creia se grupeaz
ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat printr-un numr se
numete poziie central. Ea poate fi evideniat prin:
- valoarea medie X ;
- valoarea median (M e ( X )) ;
- valoarea modal (M o ( X )) .

( )

A. Valoarea medie
Valoarea medie reprezint principalul parametru care caracterizeaz tendina central a unei
repartiii statistice.
n vederea definirii parametrului valoarea medie se consider o populaie statistic studiat n
raport cu variabila cantitativ X i o func ie G(x1,x2,,xR) unde xi, i = 1, R , reprezint strile variabilei
X. Funcia G exprim o anumit nsuire esenial, un atribut al populaiei n raport cu variabila X.
Aceast funcie se numete funcie determinant.
Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant funcia
determinant, adic:
(3.0)
G ( x1 , x 2 ,..., x R ) = G X , X ,..., X .

Aceast egalitate se ntlnete sub denumirea de relaia lui BOIARSKI-KISINI. n funcie de


forma analitic a funciei G, din relaia (3.0) se deduce expresia analitic (indicatorul) de calcul a
valorii medii X .
Determinarea, pe aceast cale, a valorii medii X , este destul de anevoioas. Utilizarea acesteia
presupune stabilirea coninutului (semnifica iei) i a formei analitice a func iei determinante G, pentru
fiecare caz n parte. Dar, valoarea medie X poate fi definit ca un raport a dou mrimi din care se
deduce aceeai expresie pentru X ca i din (3.0).
Exist, aadar, dou modaliti echivalente de definire a valorii medii, criteriul relaiei
determinante a lui Boiarski-Kisini i criteriul raportului, ultima fiind mai accesibil. Criteriul
raportului presupune raportarea volumului fenomenului cercetat la volumul populaiei. Acesta
presupune cuantificarea volumului fenomenului n funcie de natura lui.
Pentru a exemplifica cele prezentate mai sus, se consider populaia familiilor dintr-o
localitate, cercetat n raport cu numrul de copii. Datele rezultate din observare se prezint ca o serie
de repartiie de forma:
xi
X :
N i i =.1, R
n acest caz, funcia determinant are urmtoarea form:
R

G (x1 , x2 ,..., x R ) = xi N i
i =1

semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de copii pe
familie se particularizeaz relaia (3.0) dup cum urmeaz:
R

x N = X N
i

i =1

i =1

de unde rezult:
R

x
X =

Ni

i =1
R

i =1

La acelai rezultat se putea ajunge pornind de la faptul c numrul mediu de copii pe familie se poate
exprima ca un raport ntre numrul total de copii i numrul de familii din localitatea respectiv, adic:

Nr. total de copii


(3.1)
Nr. de familii
n acest exemplu, fenomenul fiind de matur demografic, volumul acestuia se cuantific prin numrul
total de copii la nivelul populaiei statistice considerate. Aceasta este n direct concordan cu natura i
semnificaia variabilei n raport cu care se face cercetarea statistic.
X=

Cunoaterea naturii parametrului valoare medie, conduce la o definiie mai complet i plin
de semnificaie.
Pentru a nelege semnifica ia valorii medii X , trebuie subliniat faptul c, n general, variaia
unui fenomen, de orice natur, i n particular variaia unei variabile X n raport cu care este cercetat o
populaie, este determinat de aciunea simultan a dou categorii de factori: factori eseniali i factori
neeseniali.
n categoria factorilor eseniali intr acei factori care acioneaz asupra tuturor unitilor
populaiei n mod continuu i n acelai sens, determinnd, n principal, nivelul de dezvoltare a
variabilei pentru fiecare unitate component din populaie.
Factorii eseniali se conjug n aciunea lor cu factorii neeseniali, care, n general, au un
caracter aleator, sunt numeroi i neuniform rspndii printre unitile populaiei.

Fiecare din factorii considerai neeseniali acioneaz numai asupra unui anumit numr de
unit i din populaie. Ca urmare, acetia pot contribui fie la creterea nivelului variabilei (pentru unele
unit i din populaie), fie la scderea nivelului variabilei (pentru alte uniti din populaie).
La rndul lor factorii eseniali nu acioneaz cu aceeai intensitate asupra tuturor unitilor din
cadrul populaie considerate, determinnd, n acest fel, variaia neuniform a variabilei respective n
cadrul populaiei.
n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a unei serii
statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea nregistra variabila n
cadrul populaiei cercetate n condiiile n care factorii neeseniali nu s-ar fi manifestat, iar factorii
eseniali ar fi acionat asupra unitilor din populaie cu aceeai intensitate.
Parametrul valoarea medie, calculat pentru o serie statistic, pune n eviden ceea ce este
comun, general i esenial sub aspectul nivelului de dezvoltare al variabilei, n raport cu care este
studiat o populaie.
n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a indicatorilor
cu care aceasta este construit, exist mai multe posibiliti de calcul a valorii medii.
Funcia determinat G, sub forma sa cea mai general, are urmtoarea expresie analitic:
1

R K
K
G( x1 , x 2 ,..., x R ) = xi f i
i =1

(3.2)

Pornind de la respectare condiiei (3.0) se determin expresia de calcul a valorii medii.


Pentru diverse valori ale lui k, n strict concordan cu coninutul i semnificaia funciei G, se
ntlnesc mai multe tipuri de medii:
- media armonic (k = -1);
- media aritmetic (k = 1);
- media patratic (k = 2);
- media cubic (k = 3);
- media de ordinul k n general.
n caz concret, valoarea medie real X este aceea care se obine prin indicatorul (mediu)
rezultat fie prin aplicarea criteriului relaiei determinante, fie criteriului raportului.
Modaliti de calcul a valorii medii
1. Media aritmetic
Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii
statistice, aa cum rezult din practica statistic.
Se consider acum dou serii statistice de repartiie, una format din frecvene absolute, iar
cealalt din frecvene relative:
xi
X :
(3.4)
N i i =.1, R

de unde rezult:
xi
X :
f i i =.1, R

(3.5)

Avnd n vedere respectarea relaiei (3.0) se gsesc urmtoarele expresii de calcul pentru media
aritmetic:
- n cazul seriilor de forma (3.4) se obine:

i =1

i =1

xi N i = X N i
de unde rezult:
R

Ni

i =1

X =

(3.6)

i =1

- n cazul seriilor de forma (3.5) se obine:


R

fi = X fi

i =1

i =1

de unde rezult, prin definiie, media aritmetic ponderat, exprimat cu ajutorul frecvenelor
relative, respectiv:
R

x
X=

fi

i =1
R

= xi f i

(3.7)

i =1
i

i =1

Expresia (3.6) reprezint, prin definiie, expresia de calcul a mediei aritmetice ponderate pentru o serie
discret, unde ponderile sunt nsi frecvenele absolute N1, N2,NR.
Pentru cazul particular n care frecvenele absolute sunt egale ntre ele, adic:
N1 = N2 = = NR = C
Relaia de calcul (3.6) devine:
R

xi C
X =

i =1
R

C xi
=

i =1

CR

x
=

i =1

(3.8)

i =1

reprezentnd media aritmetic simpl a unei reparti ii discrete.


Fie o serie de repartiie, care are la baz o variabil continu X, respectiv:
xi 1 xi

X :
f i i =.1, R

(3.9)

Dac s-ar cunoate densitatea f(x) a variabilei X, atunci, prin definiie, media aritmetic teoretic
(sperana matematic) a acesteia, notat cu E(X), ar fi:
+

E ( X ) = xf ( x)dx

(3.9)

Cum densitatea sa de probabilitate f(x) nu se cunoate, aceasta se aproximeaz n fiecare interval de


varia ie (clas), prin raportul dintre frecvena intervalului i lungimea sa, respectiv prin:

f1
f2
fR
,
,....,
x1 x 0 x 2 x1
x R x R 1
Aplicnd relaia de calcul (3.9) se deduce expresia de calcul a mediei aritmetice, dup cum urmeaz:
XR

E( X ) = M ( X ) = X1 = X =
R

i =1

xi

xf ( x)dx

X0

i =1 xi 1

fi
dx =
xi xi 1

i
R
R
fi
fi
x2
fi
x 2 xi21
x dx =
/ xxii 1 =
i
=
xi xi 1 xi 1
2
2
i =1 xi xi 1
i =1 xi xi 1

R
fi
x + xi 1
(xi + xi 1 ) = i
fi
2
i =1 2
i =1
x +x
Folosind notaiile: i i 1 = xi' , X 1 = M ( X ) = E ( X )
2
'
unde x i reprezint mijlocul intervalului i, ob inem relaia:

X = xi' f i

(3.10)

i =1

Relaia (3.10) ne arat c media aritmetic a unei serii de intervale se reduce la media aritmetic a unei
serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de variaie.
Pentru cazul particular de serie care are la baz o variabil alternativ de forma:
1
0

X :
N1 N 2
calculnd media aritmetic, obinem:
R

x
X =

Ni

i =1

0 N 1 + 1 N 2 N 2
=
= f2
N1 + N 2
N

(3.11)

i =1

Ca urmare, media aritmetic a unei serii care are la baz o variabil alternativ coincide cu frecvena
relativ a strii notat cu 1.
n vederea nelegerii mai profunde a celor prezentate mai sus, se consider, n cele ce urmeaz,
dou exemple concludente n acest sens.
Exemplu
Angajaii unei societi comerciale se distribuie dup salariul lunar cuvenit conform urmtoarei serii
de reparaie continu :

1,6 2,0 2,0 2,4 2,4 2,8 2,8 3,2 3,2 3,6 3,6 4,0

X :
13
18
6
4
2
7
unde variabila X este exprimat n milioane lei. Pentru determinarea salariului mediu pe angajat, se
recurge la transformarea seriei de intervale ntr-o serie discret, dup cum urmeaz:

1,8 2,2 2,6 3,0 3,4 3,8

X :
7 13 18 6 4 2
Salariul mediu se determin astfel:
6

x N
X =

'
i

i =1

1,8 7 + 2,2 13 + 2,6 18 + 3,0 6 + 3,4 4 + 3,8 2 12 ,72


=
= 2,544 mil.lei
50
5

i =1

Presupunem
c
este
necesar
determinarea
ponderii
agenilor
economici,
dintr-un anumit jude care au nregistrat pierderi n anul calendaristic ncheiat. Datele nregistrate de la
institu iile competente se aranjeaz ntr-o serie alternativ de forma:
1
0
.
X :
850 150
unde starea 1 pentru variabila X corespunde acelor ageni care au nregistrat pierderi n anul
considerat. Media (ponderea) agenilor cu capital de stat care au nregistrat pierderi se determin
astfel:
6

x N
X =

'
i

i =1

0 850 + 1 150 150


=
= 0,15 (15%).
1000
1000

i =1

n judeul considerat, 15% din agenii economici cu capital de stat au nregistrat pierderi n anul
calendaristic considerat.
Proprieti ale mediei aritmetice

Prezentarea celor mai reprezentative proprieti ale mediei aritmetice prezint importan din punct de
vedere al aplicaiilor practice, ilustrnd, n acest fel, i posibilitile de calcul simplificat al acestui
indicator. n acest sens, prezentm urmtoarele proprieti:

1 Media aritmetic a unei constante este egal cu constanta respectiv, adic, dac la baza
unei serii se afl o variabil care a nregistrat o singur stare, X = C, atunci aplicnd relaia de calcul a
valorii medii se obine:
M ( X ) = M (C ) = C = C

(3.12)

2 Media produsului dintre o variabil X i o constant k este egal cu produsul dintre media
variabilei X i constanta respectiv:
R

i =1

i =1

M ( k X ) = k xi fi = k xi f i = k X = k M ( X )

(3.13)

unde, am considerat o serie discret format cu frecvene relative. n acelai mod se procedeaz i
n cazul unei serii de frecvene absolute.

3 Media aritmetic a sumei a dou sau mai multe variabile este egal cu suma mediilor acestora:
M(X1 + X2 + + Xr) = M(X1) + M(X2) + + M(Xr)

(3.14)

Pentru a nu ngreuna scrierea i pentru a nelege mai bine, se demonstreaz aceast proprietate pentru
cazul a dou variabile X, Y. Se consider o populaie cercetat n raport cu cele dou variabile X i Y
pentru care se cunoate X i Y i se intenioneaz calcularea mediei M(X + Y). Rezultatele cercetrii
se dau sub forma tabelului 1:
Tabelul.1
X
Y
ym

x1

x2

xi

xn

TOTAL

N1m

N2m

Nim

Nnm

N.m

-----------------------------------------------

.
yj

.
N1j

N2j

Nij

Nnj

N.j
.

-----------------------------------------------

y2

N12

N22

Ni2

Nn2

N.2

y1

N11

N21

Ni1

Nn1

N.1

TOTAL

N1.

N2.

Ni.

Nn.

xi Ni.
M (X ) =

i =1

x N
i

i =1

i.

i.

i =1

y
M (Y ) =

j =1

N
j =1

N. j
.j

j =1

N. j

(x

M (X +Y ) =

+ y j )N1 j +... + (xi + y j )N ij + ... + (xn + y j )N nj

j =1

j =1

j =1
n

ij

i =1 j =1
m
m
m
n
n
n

1
= x1 N ij + ... +xi N ij + ... +xn N nj + ... + y1 N i1 + ... + y j N ij + ... + ym N im =
N
j =1
j =1
j =1
i =1
i =1
i =1

1
(x1 N1. + ... + xi Ni. + ... + xn N n. + ... + y1 N.1 + ... + y j N. j + ... + ym N.m ) =
N

x1 N1. + ... + xi N i. + ... + xn N n. y1 N .1 + ... + y j N. j + ... + ym N. m


+
=
N
N
(3.15)

= M(X) + M(Y)

4 Media produsului a r variabile dou cte dou independente este egal cu produsul mediilor
acestora:
M(X1 X2 XR) = M(X1) M(X2) M(Xr)

(3.16)

Din aceleai motive ca i n cazul propriettii anterioare, se va demonstra aceast proprietate pentru
cazul particular, cnd r = 2. Vom nota cele dou variabile cu X i Y. Pornind de la seria
bidimensional dat sub form tabelar (vezi tabelul nr.1), rezult:
n

x
M (X Y ) =

y j N ij

i =1 j =1
n

(3.17)

ij

i =1 j =1

Din ipotez, X i Y sunt independente, deci putem scrie:


P(X = xi i Y = yj) = P(X = xi) P(Y = yj)
i = 1, n; j = 1, m

rela ie care tradus n limbajul frecvenelor devine:


Nij = Ni. N.j i = 1, n; j = 1, m
nlocuind relaia (3.18) n (3.17) avem:

(3.18)

xi y j Ni. N. j
i =1 j =1
n

M (X Y ) =

Nj

i =1 j =1

i =1

j =1
m

i.

i =1

j =1
m

N N
i.

i =1

=
.j

j =1

xi Ni.
=

xi Ni. y j N. j

N. j

i =1

= M ( X ) M (Y ).
.j

j =1

Pornind de la cele patru proprieti ale mediei aritmetice se pot deduce o serie de consecine ale
acestora, frecvent ntlnite n calcule statistice privind media. Prezentm n acest sens urmtoarele
consecine:

a) Fcnd media sumei dintre o variabil X i o constant C se obine suma dintre media variabilei
i constanta respectiv:
M(X + C) = M(X) + C

(3.19)

Aceast proprietate se ob ine ca o particularizare a proprietii 3, pentru r = 2 i X2 = C. Dac


constanta C are semnul negativ, atunci rela ia (3.19) devine:
M(X C) = M(X) C
De unde rezult:
M(X) = M(X C) + C

(3.20)

Aceast ultim relaie, 3.20, conduce la concluzia conform creia, dac strile unei variabile
cantitative cresc sau descresc cu o constant C, atunci i media noii variabile obinute crete sau
descrete cu acea constant.

b) Dac valorile unei variabile X sunt simplificate cu o constant, atunci media variabilei X
descrete de acel numr de ori.
Dac n proprietatea 2, constanta este de forma 1/k, atunci, relaia (3.13) devine:
X 1
M = M (X )
k k

de unde rezult:
X
M (X ) = k M
k

(3.21)

c) Primele dou consecine conduc la relaia de calcul simplificat a indicatorului media


aritmetic. n acest sens, se face urmtoarea transformare asupra variabilei X:

Z=

X C
k

(3.22)

unde C i K sunt dou constante, iar Z numele variabilei rezultate.


Aplicnd operatorul medie asupra relaiei (3.22) se obine:
M(k Z) = M(X) C
M(X) = M(Z) k + C
X C
M (X ) = M
k +C
k

(3.23)

Aceast ultim relaie (3.23), constituie formula de calcul simplificat a mediei aritmetice.
Avantajul maxim privind aplicarea acestei relaii se obine alegnd pentru constanta C starea de
mijloc a seriei care are la baz variabila X, iar pentru k valoarea care reprezinta cel mai mare
divizor comun al tuturor diferenelor X-C.
Formula (3.23) se particularizeaz dup cum seria, care are la baz variabila X, este o serie
construit cu frecvene absolute sau cu frecvene relative:
- n cazul unei serii construit cu frecvene absolute, de forma:
x
X : i
N i i =1, R
se ob ine:
R xi C
k N i
k + C
X = i =1 R

Ni

i =1

(3.24)

- n cazul unei serii construite cu frecvene relative, de forma:


x
X : i
f i i =1, R
se obine:
R x C
X = i
f i k + C.
i =1 k

(3.25)

Formulele (3.24) i (3.25) se aplic n mod frecvent, sub denumirea de formula de calcul
simplificat, pentru determinarea mediei aritmetice, n cazul seriilor construite cu indicatorii
frecven absolut i relativ.

d) Proprietatea de adiiune a mediei aritmetice.


Se presupune o populaie care este structurat n raport cu un criteriu C cantitativ sau
calitativ, n P clase, C1, C2, , Cp. Atunci media aritmetic a variabilei X, n raport cu care este
studiat populaia, se poate ob ine ca o medie a mediilor variabilei din cele P clase.
n vederea demonstrrii afirmaiei fcut mai sus, se consider populaia dat, structurat n
raport cu criteriul C n urmtorul tabel cu dou intrri:
Tabelul nr.2
C
X
xR

C1

C2

CP

TOTAL

N1R

N2R

NPR

N.R

-------------------------------

x2

N12

N22

NP2

N.2

x1

N11

N21

NP1

N.1

TOTAL

N1.

N2.

NP.

Media aritmetic a variabilei X, X , se calculeaz conform relaiei:


X=

1 R
x i N .i
N i =1

n fiecare din cele P clase, se calculeaz mediile aritmetice respective:


X1 =

1 R
xi N1i
N1. i =1

X2 =

1 R
xi N 2i
N 2. i =1

................................
XP =

1 R
xi N Pi .
N P. i =1

Fcnd media acestor medii i notnd-o cu X / C rezult:


X /C =
=

1 P
1
X i Ni. = N X 1 N1. + X 2 N 2. + .... + X P N P. =
N i =1

1
[(x1 N11 + x2 N12 + ... + xR N1R + ) + ( x1 N 21 + x2 N 22 + ... + xR N 2 R + ) +
N

+ ... + ( x1 N P1 + x 2 N P 2 + ... + x R N PR )] =

1
[ x1 ( N11 + N 21 + ... + N P1 ) + ... + x2 ( N12 + N 22 + ... + N P 2 ) + ... + xR (N1R + N 2 R + ... + N PR )] =
N
1
1 R
= (x1 N.1 + x2 N.2 + ... + xR N. R ) = xi N.i = X .
N
N i =1
=

Ca urmare a celor de mai sus, rezult:

X = X / C.
Urmtoarele trei proprieti ale mediei aritmetice nu sunt lipsite de importan att pentru uurina
calculelor ct i pentru capitolele care urmeaz.

5 Dac frecvenele absolute cu care s-a construit o serie, se simplific cu o constant, atunci media
aritmetic a seriei respective nu se modific.
Se consider seria de forma:

xi
X :
N i i =1, R
Ni
, unde d reprezint o valoare cu care se divid toate frecvenele absolute. Se
d
formeaz o nou serie cu aceste frecvene:

Se noteaz cu N i' =

x
X ' : i '
N i =1, R
a crei medie aritmetic este:
R

'

X =

xi N i'

xi

i =1

i =1

'
i

i =1

i =1

Ni
d

Ni
d

x
=

Ni

i =1

=X

i =1

Pentru a se obine un maxim de eficien din punct de vedere a volumului calculelor mediei
aritmetice, este nevoie ca d s fie ales drept cel mai mare divizor comun a tuturor frecvenelor
absolute cu care a fost construit seria.
6 Media aritmetic a unei serii este cuprins ntre valoarea minim i valoarea maxim pe care o
nregistrez variabila X, care st la baza seriei.

x min X x max
Aceast dubl inegalitate rezult din urmtorul ir de inegaliti:
R

x min =

x min N i

xi N i

i =1

i =1

i =1

N
i =1

=X

N
i =1

max

Ni
= x max .

i =1

7 Suma abaterilor liniare ale valorilor unei variabile de la media aritmetic este nul.
Pornind de la o serie, care are la baz o variabil cantitativ X, de forma:

x
X : i
f i i =1, R
printr-o transformare adecvat rezult urmtoarea serie:

(X X ): x

f i i =1, R

(3.26)

Calculnd media aritmetic a seriei (3.26) se ob ine:

M X X = x i X f i = x i X f 1 + x 2 X f 2 + ... + x R X f R =
i =1

= x1 f 1 + x 2 f 2 + ... + x R f R X ( f 1 + f 2 + ... + f R ) = X X = 0
tocmai ceea ce s-a afirmat n enunul acestei proprieti.
8 Proprietatea de minim a mediei aritmetice, se formuleaz astfel:

M ( X X ) 2 M ( X x0 ) 2
unde x0 este un numr real oarecare.
ntr-adevr, din:

(x 0 ) = M ( X x 0 ) 2
rezult:

' ( x 0 ) = 2 M ( X x 0 ) = 0
de unde:

x0 = M(X) c.c.t.d.
Deci, valoarea medie a unei serii calculat cu media aritmetic, n sensul metricii folosite, e cea mai
apropiat de ansamblul valorilor variabilei X.
Exemplu

Reconsiderm exemplul cu privire la distribuia angajailor unei societi comerciale n raport cu


salariul lunar:
1,6 2,0 2,0 2,4 2,4 2,8 2,8 3,2 3,2 3,6 3,6 4,0

X :
13
18
6
4
2
7
unde valorile variabilei X sunt exprimate n milioane lei.
Aplicnd relaia de calcul simplificat (3.24), unde C=260, iar k=40, se obine:
R xi C
k N i
k +C =
X = i =1 R

Ni

i =1

1,80 2,60
2,20 2,60
2,60 2,60
3,00 2,60
3,40 2,60

7 +
13 +
18 +
6 +
4
40
40
40
40
40

=
40 +
50
3,80 2,60

2
40
40 + 2,60 = 0,14 0,13 + 0,06 + 0,08 + 0,06 40 + 2,60 = 0,28 + 2,60 =
+

50
50
5
= 2,544 .. mil.lei

2. Media armonic

Se consider o serie de forma:


xi
X :
N i i =1, R

(3.27)

n cazul unei serii discrete de forma (3.27), media armonic notat cu X 1 se definete prin:
R

N
X 1 =

i =1

(3.28)

1
Ni

i =1 x i
R

numit i formula mediei armonice ponderate.


Dac ponderile sunt egale ntre ele, adic N1=N2==NR=N*, atunci relaia (3.28) devine:
R

N
X 1 =

i =1
R

i =1

1
N*
xi

i =1

(3.29)

1
xi

care reprezint formula mediei armonice simple.


n cazul unei serii care are la baz o variabil continu X, respectiv,

x x
X : i 1 i
N i i =1, R
procednd ca la media aritmetic, pentru media armonic rezult:
R

N
X 1 =

i =1

1
Ni

'
i =1 x i
R

(3.30)

unde xi reprezint mijlocul intervalului i, i = 1, R .


i n acest caz, dac ponderile sunt egale, se obine relaia de calcul a mediei armonice simple, de
forma:

X 1 =

R
R

i =1

1
x i'

(3.31)

Proprieti ale mediei armonice


Cteva proprieti ale acestui indicator sunt absolut necesare n vederea simplificrii volumului de
calcule necesare pentru obinerea valorii medii.

1 Media armonic este cuprins ntre cea mai mic i cea mai mare valoare a variabilei X,
nregistrat n populaia cercetat
x min X 1 x max
Dubla inegalitate este rezultat din:
R

x min =

Ni

Ni

i =1

i =1

X 1 =

i =1

min

Ni

1
Ni

i =1 x i

i =1

x
i =1

= x max

Ni

max

2 Dac valoarea medie a unei serii avnd la baz variabila X, a fost calculat cu indicatorul media
armonic, atunci, trebuie s fie verificat urmtoarea rela ie:
R

x
i =1

i =1

X 1

Ni =

Ni

respectiv, relaia determinant Boiarski-Kisini.

3 Media armonic a unei serii nu se modific dac ponderile ce intervin n calculul acestui
indicator se simplific cu aceeai constant. Efectul maxim privind simplificarea volumului de
calcule, se ob ine dac se alege cel mai mare divizor comun al tuturor ponderilor, cu care urmeaz a
se simplifica acestea.
4 Pentru dou serii, care au la baz aceeai variabil X de forma:

x
X : i
N i i =1, R

x
X : i
mi i =1, R

ntre care exist urmtoarea relaie de legtur:


m i = k x i N i ; i = 1, R

(3.32)

media armonic apare ca oa form transformat a mediei aritmetice.


Urmtoarele egalit i sunt relevante n acest sens:
R

X 1 =

mi

k xi N i

i =1

i =1

i =1

i =1

1
mi
xi

1
k xi N i

i =1 x i
R

Ni
=X

i =1

Ca urmare, dac ntre cele dou sisteme de ponderi mi i Ni exist o relaie de forma (3.32), media
armonic este identic cu media aritmetic.
Exemplu

Se consider o ntreprindere industrial format din 5 secii unde se cunosc productivitile medii n
fiecare secie la nivel de muncitor ct i a realizrilor totale la nivelul fiecrei secii. Datele din
tabelul 3 redau acest lucru:

Tabelul nr.3
Secia

Productivitatea medie pe muncitor

TOTAL REALIZRI

300

300.000

400

450.000

350

400.000

380

420.000

420

500.000

i sunt exprimate n mii lei.

Pornind de la acest tabel, se construiete urmtoarea serie:


400
350
380
420
300
.
X :
300.000 450.000 400.000 420.000 500.000
unde se respect relaia mi = xi Ni, Ni reprezentnd numrul de muncitori din secie i, i = 1,5 . Ca
urmare, valoarea medie a acestei serii se poate determina folosind media armonic, dup cum
urmeaz:
R

m
X 1 =

i =1

i =1

1
mi
xi

300.000 + 450.000 + 400.000 + 420.000 + 500.000


=
1
1
1
1
1
300.000 +
450.000 +
400.000 +
420.000 +
500.000
300
400
350
380
420
2.070.000
= 372.168 [lei / muncitor ]
5562

Valoarea medie, astfel obinut, reprezint productivitatea medie pe muncitor la nivel de


ntreprindere, ntr-o perioad considerat.
Exemplu
a) Se cunosc urmtoarele date pentru un grup de ri din Europa Central:

Ungaria
Romnia
Austria
Cehia
Slovacia
di
107
93
97
129
110
Ni 9.981.334 22.303.522 8.150.835 10.241.138 5.414.937
unde: di densitatea medie a populaiei rii i (loc/km2);
Ni numrul locuitorilor din ara i (loc).
S se calculeze densitatea medie a populaiei pe ansamblul rilor supuse observrii.
Dac considerm densitatea medie a grupului de ri ca o medie aritmetic ponderat, ponderile fiind
numrul de locuitori ai rii respective, obinem:
i d i N i
d =
= 104 loc/km2
N
i
i

b) Se cunosc urmtoarele date pentru un grup de ri din Europa Central:


Ungaria
Romnia
Austria
Cehia
Slovacia
di
107
93
97
129
110
Si
93.030
238.392
83.871
78.866
48.845
unde: di densitatea medie a populaiei rii i (loc/km2);
Si suprafaa rii i (km2).
S se calculeze densitatea medie a populaiei pe ansamblul rilor supuse observrii.
Dac considerm densitatea medie a grupului de ri ca o medie aritmetic ponderat, ponderile fiind
suprafeele rilor respective, ob inem:
i d i S i
= 102 loc/km2
d =
S
i
i

La punctele a) i b) se obin rezultate diferite. Se pune problema care dintre cele dou relaii de calcul
este corect.
Conform criteriului raportului, valoarea medie trebuie s fie un raport just, logic, ntre dou mrimi. n
cazul nostru densitatea medie este egal cu numrul de locuitori pe ansamblul arilor considerate
raportat la suma suprafeelor rilor respective. Ob inem astfel n cele dou cazuri:
a) Dac avem la dispoziie date cu privire la di i Ni :
d=

N total
=
S totala

N
S

d=

N total
=
S totala

d
i

b) Dac avem la dispoziie date cu privire la di i Si :

N
S

Ni

d S
S
i

Ca urmare, calculul densitii medii ca o medie aritmetic ponderat, ponderile fiind numrul de
locuitori ai rilor respective este incorect. Dac vrem s folosim numrul de locuitori ca ponderi,
vom putea doar printr-o medie armonic ponderat.

3. Media geometric
Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media geometric
notat cu X g (sau X o ) este definit prin expresia:

X g = N x1N 1 x2N 2 ...xRN R

(3.33)

Din (3.33), pentru media geometric ponderat exprimat cu frecvene relative se deduce:
1/ N

Xg =

N1

N2

NR

x 2 ... x R

R N
= x i i
i =1

Ni / N

= xi
i =1

= xi i

(3.34)

i =1

Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru
diversele variante de medie geometric, rmn variabile cu singura modificare c valorile xi,
i = 1, R , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei:
xi' =

xi 1 + xi
,
2

i = 1, R

(3.35)

4. Media de ordin superior (k>1)

n practica statistic, privind calculul valorii medii a unei serii atributive unidimensionale, cei mai
frecvent utilizai indicatori sunt media aritmetic i media armonic. Exist totui situaii cnd seria
statistic are la baz o variabil ale crei stri sunt puteri superioare lui 1 (xik ) . Valoarea medie, a
unor astfel de serii, se determin cu ajutorul momentului de ordin corespunztor la care sunt
ridicate strile variabilei. Indicatorul media ptratic, notat cu X 2 , corespunde cazului particular
cnd valorile variabilei X sunt la puterea 2, (k=2). Relaia de calcul pentru media ptratic este
urmtoarea:
R

2
i

Ni

i =1

X2 =

(3.36)

i =1

Formula de calcul (3.36) corespunde cazului cnd seria are la baz o variabil X i este construit
cu frecvene absolute. n cazul n care seria este construit cu frecvene relative, relaia de calcul
pentru media ptratic este:
R

X2 =

2
i

(3.37)

fi

i =1

n general, indicatorul media de ordinul k, notat cu X k , se determin dup cum urmeaz:


- pentru serii formate cu frecvene absolute:
R

x
Xk = k

k
i

Ni

(3.38)

i =1
R

i =1

- pentru serii formate cu frecvene relative:


R

Xk = k

k
i

fi

(3.39)

i =1

Indicatorul media de ordinul k constituie forma cea mai general, de la ea putndu-se ajunge la
ceilal i indicatori de calcul pentru diferite valori particulare date lui k. Pornind de la relaia (3.39),
pentru diverse valori ale lui k se obine:
k = -1

X 1 = x i1 f i
i =1

k=1

X 1 = xi fi

- media armonic

- media aritmetic

i =1

k=2

X 2 = x i2 f i
i =1

k=3

X 3 = x i3 f i
i =1

1/ 2

- media ptratic

1/3

- media cubic

B. Valoarea median

Valoarea median, notat cu M e este acea valoare a variabilei cantitative X care mparte repartiia n
dou pri egale, respectiv:
FN (Me ) = 1 / 2 sau N (M e ) =

N
2

(3.41)

Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau
continu.
Pentru o repartiie discret, calculul medianei nu implic probleme deosebite i nici un volum
mare de calcule.

Se consider o repartiie cu frecvene absolute:


x x2 ... xi ... xR
.
X : 1
N1 N 2 ... N i ... N R

(3.42)

n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:
a) volumul N al populaiei este un numr impar;
b) volumul N al populaiei este un numr par.
n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului medianei,
notat cu rM e , conform urmtoarei rela ii:
rM e =

1 R
Ni = N (M e )
2 i =1

(3.43)

a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a crui
N
parte ntreag indic numrul de uniti din populaie pentru care variabila X a nregistrat
2
valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat urmtoare celei de rang
N
2 adic:

M e = x N

+1
2

(3.44)

b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca urmare la
mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci se gsesc dou
valori, mediana calculndu-se n acest caz ca media aritmetic a acestora. Relaia de calcul a
medianei, n acest caz, este:

x N + x N
Me =

2 +1

(3.45)

Pentru o repartiie continu, calculul valorii mediane presupune verificarea egalitii (3.41) i ca
urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic un volum
mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat. Acest lucru va
conduce la o expresie aproximativ de calcul a valorii mediane, care necesit un volum redus de
calcule.

Pentru acesta se consider o repartiie continu n raport cu variabila X, i anume:


x x1 x1 x 2 ... x i 1 x i ... x R 1 x R
.
X : 0
...
...
N2
Ni
N R
N1

(3.46)

unde intervalele xi-1-xi, i = 1, R pot fi de lungime egal sau neegal. Calcularea rangului medianei
va permite stabilirea intervalului n care se afl valoarea median, interval numit i interval median.
Se cumuleaz frecvenele absolute din aproape n aproape pn ce este ndeplinit inegalitatea:
N 1 + N 2 + ... + N i

1
N
2

Ultima frecven Ni cumulat, ne permite s indicm intervalul median [x i 1 x i ) . Ca urmare,


M e [xi-1-xi), i deci se poate scrie:
(3.47)

M e = xi 1 + x

unde x este distana de la limita inferioar a intervalului median (xi-1) pn la median. Pentru
determinarea medianei mai trebuie cunoscut aceast distan x .
Determinarea distanei x , de la limita inferioar a intervalului median pn la median se poate
face n ipoteza c n intervalul median frecvena absolut se distribuie proporional cu lungimea
intervalului, de unde rezult:
N ( M e ) N ( xi 1 )
Ni
=
x
xi xi 1

(3.48)

unde:
N ( M e ) - reprezint frecvena absolut cumulat pn la median (rangul medianei);
N ( x i 1 ) - reprezint frecvena absolut cumulat pn la limita inferioar a intervalului median care
se mai numete i suma frecvenelor intervalelor premergtoare intervalului median.

Valoarea necunoscut x rezult din egalitatea (3.48):


x =

N ( M e ) N ( xi 1 )
( xi xi 1 )
Ni

care nlocuit n (3.47), permite gsirea formulei aproximative de calcul a medianei:


M e = xi 1 +

N ( M e ) N ( xi 1 )
( xi xi 1 ) (3.49)
Ni

Introducndu-se urmtoarele notaii mai sugestive:


xi 1 = xM e

- limita inferioar a intervalului median;

Ni = N M e

- frecvena absolut a intervalului median;

xi xi 1 = lM e

- lungimea intervalului median,

formula aproximativ de calcul a medianei devine:


M e = xM e +

N ( M e ) N ( xM e )
NM e

lM e

(3.50)

Aceeai expresie de calcul a medianei este folosit i n cazul n care seria continu este format din
frecvenele relative, cu urmtoarele precizri:
rM e = FN (M e ) =

1 R
1
fi =
2 i 1
2

FN (M e ) - reprezint suma frecvenelor relative ale intervalelor premergtoare intervalului


median;
f M e - notaie sinonim pentru N M e reprezentnd frecvena relativ a intervalului median.

Cu aceste notaii relaia (3.50) devine:


M e = xM e +

FN ( M e ) FN ( xM e )
FM e

lM e

Pe lng procedeul expus anterior, mai exist i un procedeu grafic de calcul a valorii medianei.
Acest procedeu poate conduce la rezultate cel puin la fel de bune, mai ales n cazul seriilor care au
la baz o variabil continu, deoarece, nu mai este necesar persupunerea repartizrii proporionale
a frecvenei n intervalul median, cu condiia ca reprezentarea grafic a seriei s se fac ct mai
exact posibil. n acest sens, se construiete poligonul cumulativ cresctor al seriei i se duce o
paralel la axa Ox prin punctul de ordonat 1/2N. Abscisa punctului de intersecie a acestei paralele
cu poligonul cumulativ cresctor va fi valoarea median a seriei respective.
Exemplu

Urmtorul exemplu, privind calculul medianei unei serii, va permite evidenierea tehnicii de calcul
a acestui parametru ct i semnificaia lui. Repartiia angaja ilor ntr-o societate comercial, n
raport cu salariul lunar, este caracterizat prin urmtoarea serie:
160 200 200 240 240 280 280 320 320 360 360 400

X :
7
13
18
6
4
2

unde valorile variabilei X sunt exprimate n dolari.

Prima etap n calculul medianei l constituie calculul rangului, dup cum urmeaz:
rM e =

1 R
1
50
N i = (7 + 13 + 18 + 6 + 4 + 2 ) =
= 25
2 i =1
2
2

nsumnd frecvenele succesiv pn ce valoarea obinut depete rangul, rezult c intervalul care
va conine mediana este [240-280). Fiind vorba de o serie care are la baz o variabil continu,
mediana se determin conform relaiei(3.50).
M e = xM e +

N ( M e ) N ( xM e )
NM e

lM e = 240 +

25 20
100
40 = 240 +
= 251,111$
18
9

Ca urmare, jumtate din angaja ii societii respective ctig cel mult 251,111$ i cealalt jumtate
ctig cel puin 251,111$ n perioada n care s-a fcut observarea. Relevant, n acest sens, pare a
fi urmtoarea serie construit, avnd n vedere mediana:
160,000 251,111 521,111 400,000

50%
50%

care constituie repartiia celor dou jumti din populaia angajailor societii respective.

C. Valoare modal

Valoarea modal Mo(X) a unei repartiii reprezint aceea valoare a variabilei X creia n corespunde
frecvena cea mai mare. Acest parametru se mai numete modul, valoare dominant, sau mod i se
noteaz cu Mo.
Mod de calcul:

a) Pentru o serie de repartiie discret, dat sub forma:


x x ... x i ... x R
.
X : 1 2
f 1 f 2 ... f i ... f R

(3.51)

valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de calcul. n
cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru care frecvena
este cea mai mare.
b) Pentru serii de repartiie continue, respectiv:
x x1 x1 x 2 ... x i 2 x i 1 x i 1 x i
X : 0
f2
...
f i 1
fi
f1

x i x i +1 ... x R 1 x R

f i +1
...
fR

(3.52)

modala nu poate fi determinat direct. Intervalul cruia i corespunde frecvena cea mai mare, se
numete intervalul modal i va conine modala. S presupunem c intervalul modal este xi-1-xi.
Se vor prezenta dou modaliti de calcul a modalei, una care se bazeaz pe aproximarea densitii
de probabilitate f(x) de-a lungul a trei intervale de variaie (intervalul modal i cele dou intervale
cu care se nvecineaz), iar cealalt metod permite gsirea unei formule de calcul aproximativ, a
crei deducie se bazeaz pe principiul repartizrii uniforme a frecvenei de-a lungul intervalului
modal.
Prima metod de calcul a modalei presupune estimat densitatea de probabilitate f(x). Odat gsit
f(x), valoarea modal va fi acea valoare a lui x pentru care f(x) nregistreaz valoarea maxim.
Aceast metod se bazeaz pe posibilitatea aproximrii densitii f(x) de-a lungul celor 3 intervale
precizate cu un arc de parabol de forma:
f(x) = ax2 + bx + c

unde, a, b, c sunt trei parametri ce trebuie determinai. Se reprezint grafic seria, doar pentru cele
trei intervale, (printr-o histogram) dup cum urmeaz:

Estimarea celor trei parametrii a,b i c se face utiliznd metoda ariilor, conform creia suprafaa
mrginit de acrcul de parabol, axa Ox i cele dou perpendiculare ridicate n punctele de abcis xi2 i xi+1 i suprafaa celor trei dreptunghiuri care formeaz histograma seriei de-a lungul celor trei
intervale, s fie egale. Respectarea acestei condiii conduce la urmtorul sistem de ecuaii:
x i 1 2
ax + bx + c dx = f i 1
xi 2

xi
2
ax + bx + c dx = f i
x i 1

x i +1 2
ax + bx + c dx = f i +1
xi

(3.53)

dac seria este de intervale egale. Un calcul elementar de integrale definite printr-o funcie
polinomial, transform egalitile (3.53) ntr-un sistem liniar de ecuaii n necunoscutele a, b, c.
Rezolvnd acest sistem, se afl estimaiile pentru cei trei parametri [5].
Determinarea modalei implic gsirea punctului pentru care f(x) i atinge maximul. Acest punct va
fi chiar modala i se calculeaz din condiia:
(3.54)

f(x) = 0

Rezolvnd ecuaia (3.54), soluia acesteia x = Mo reprezint valoarea modal dac mai are loc i
urmtoarea condiie:
(3.55)

f(Mo) < 0

A doua metod de calcul a modalei se bazeaz pe repartizarea uniform a frecvenei de-a lungul
intervalului modal. Presupunnd c intervalul xi-1-xi este intervalul modal, urmtoarea schem
grafic:
x

xi-1

Mo

xi

ne permite s scriem:
(3.56)

Mo = xi-1 + x

unde s-a notat cu x distana necunoscut de la limita inferioar a intervalului modal pn la


modal. Gsirea necunoscutei x se face din urmtoarea egalitate de rapoarte:
f i f i 1
x

f i f i +1

(x i x i 1 ) x

(3.57)

care semnific repartizarea uniform a frecvenelor de-a lungul intervalului modal. Pentru
simplitatea expresiilor se introduc urmtoarele notaii:
f i f i 1 = 1
f i f i +1 = 1
x i x i 1 = l M o

care nlocuite n (3.57) conduc la:


1
1
=
x lMo x

(3.58)

Printr-un calcul simplu, din (3.58), rezult urmtoarea expresie de calcul pentru x :
x =

1
lMo
1 + 1

care nlocuit n (3.56), conduce la formula de calcul aproximativ a modalei:


M o = x i 1 +

1
lMo
1 + 1

(3.59)

Dac se face notaia xMo=xi-1, atunci relaia (3.59) devine:


M o (x ) = x M o +

1
lMo
1 + 1

(3.60)

unde:
Mo - reprezint valoarea modal;
xMo - reprezint limita inferioar a intervalului modal;

1 - reprezint diferena dintre frecvena intervalului modal i frecvena intervalului


precedent;
1 - reprezint diferena dintre frecvena intervalului modal i frecvena intervalului
urmtor;
lMo - reprezint lungimea intervalului modal.

O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o serie
are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal evideniaz faptul
c populaia n cauz este neomogen. Calculul valorii modale, n asemenea cazuri, presupune o
delimitare mai riguroas a obiectului observrii ct i a populaiei care urmeaz s fie studiat. O
alt cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a dou cte
dou sau trei cte trei intervale etc., pn se ajunge la o serie unimodal.
n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana. Pentru serii
uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri:

Mo = X 3 X Me

unde X este media aritmetic a variabilei X.


Calculul valorii modale reprezint un deosebit interes pentru activitatea practic. Avnd n vedere
c semnificaia acestui parametru indic acea valoare a variabilei nregistrat de cele mai multe
uniti din populaie se poate afla: ora la care sunt solicitate cele mai multe convorbiri telefonice,
ora de vrf privind transportul n comun, mrimea cea mai solicitat la nclminte etc.
Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea medie se
bucur de o mai mare reprezentativitate. Dac, n plus, avem M e = M o = X , innd seama c
valoarea median nu este influenat de valorile extreme ale variabilei, se poate afirma c mediana
reprezint un grad de reprezentativitate mai mare dect valoarea medie.

Exemplu:

Reconsiderm exemplul privind distribuia angajailor unei societi comerciale n raport cu salariul
lunar:
160 200 200 240 240 280 280 320 320 360 360 400

X :
7
13
18
6
4
2

unde variabila X este exprimat n dolari. Calculul valorii modale presupune n primul rnd gsirea
intervalului modal. Frecvena cea mai mare este 18 i ca urmare, intervalul modal este 240-280.
Intervalul modal fiind gsit, se poate aplica relaia (3.60) de calcul a valorii modale:
M o = xM o +

1
5
200
l M o = 240 +
40 = 240 +
= 251,764$
1 + 1
5 + 12
17

n concluzie, putem afirma c cei mai muli anagajai ai societii comerciale respective au un salar
lunar n jur de 251,764 $.
3.2. Parametrii de structur

Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o variabil
sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea structurii unei
populaii poart denumirea de valori quantile. Valorile quantile ale unei serii de repartiie
unidimensionale sunt acele mrimi nregistrate de variabila X, care mpart seria n n pri egale (mai
precis mparte populaia n n pri egale). n acest caz se vor calcula p quantile (p = n-1 ). Pentru o
serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea egalitate este
satisfcut de cele p quantile:
q1

q2

xR

f ( x)dx = f ( x)dx = ... =

x1

q1

q n 1

f ( x)dx =

1
n

(3.61)

unde cele n-1 quantile s-au notat cu q1, q 2, , q n-1.


Relaia (3.61) se particularizeaz pentru cazul seriilor discrete, dup cum seria este construit cu
frecvene relative:
q1

q2

f = f
i

x1

xR

= ... = f i =

q1

q n 1

1
n

(3.62)

sau cu frecvene absolute:


q1

q2

xR

x1

q1

q n 1

N i = N i = ... = N i =

N
n

(3.63)

unde fiecare nsumare din relaiile (3.62) i (3.63) reprezint cumularea absolut sau relativ a
unitilor statistice cuprinse ntre limitele de nsumare.
Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel:
FN (q p ) = p

1
N
sau N ( q p ) = p , p = 1, n - 1
n
n

Modul de calcul a valorilor quantile difer n raport cu tipul seriei.


Fie o serie de repartiie, care are la baz o variabil X discret, de urmtoarea form:

x x2 ... xi ... xR
.
X : 1
N1 N 2 ... N i ... N R

(3.64)

Pentru calculul valorii quantile de ordinul p ( p = 1, n 1) , n prima etap trebuie determinat rangul
acesteia:
rq p = N ( q p ) = p

N
n

(3.65)

Se disting dou cazuri:


a) dac pN se divide cu n atunci quantila de ordin p se calculeaz ca o medie aritmetic simpl a
valorilor variabilei X, de ordinul rangului i al rangului majorat cu o unitate, dup cum urmeaz:
qp =

x rq p + x ( rq p +1)

(3.66)

b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei X
corespunztoare pari ntregi a rangului majorat cu o unitate:
q p = x [ rq

+1]

(3.67)

n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1 quantile trebuie
s satisfac relaia (3.61). Determinarea quantilelor din asemenea egaliti ar presupune cunoaterea
densitii de probabilitate f(x). Ori n activitatea practic f(x) se aproximeaz prin diverse procedee,
implicnd un volum exagerat de calcule. n vederea gsirii unor formule aproximative de calcul a
quantilei de ordin p ( p = 1, n 1) se consider o serie de variaie continu, ale crei intervale de
variaie nu trebuie s fie neaprat egale ca lungime:

x x1 x1 x 2 ... x i 1 x i ... x R 1 x R
.
X : 0
...
...
N2
Ni
N R
N1

(3.68)

n prima etap se determin rangul quantilei de ordinul p ( p = 1, n 1) conform urmtoarei relaii:


1 R
rq p = N ( q p ) = p N i
n i =1

(3.69)

Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i
intervalul quantilei de ordinul p ( p = 1, n 1) . Cumulnd frecvenele pe clase pn la egalarea s-au
depirea rangului, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p N i
n i =1

(3.69)

ultima frecven adunat va corespunde intervalului quantilei de ordinul p ( p = 1, n 1) . Prin


urmare, quantila de ordinul p, qp, se calculeaz conform relaiei:
(3.70)

q p = x i 1 + x

unde am presupus intervalul xi-1-xi ca intervalul quantilei de ordinul p, iar x reprezint distana,
necunoscut nc, ntre limita inferioar a intervalului quantilei de ordinul p i valoarea din acest
interval cu care coincide quantila de ordin p.
Distana necunoscut x se poate obine folosind principiul repartizrii proporionale a frecvenei
pe toat lungimea intervalului quantilei, n conformitate cu urmtoarea egalitate de rapoarte:
N (q p ) N ( x i 1 )

de unde se deduce x,

Ni
x i x i 1

x =

N (q p ) N ( x i 1 )
Ni

( x i x i 1 )

nlocuind expresia lui x n relaia (3.70) se obine:

q p = x i 1 +

N (q p ) N ( x i 1 )
Ni

( x i x i 1 )

(3.71)

se introduc urmtoarele notaii:


x q p = x i 1 reprezentnd limita inferioar a intervalului quantilei de ordinul p;
l q p = x i x i 1 - reprezint lungimea intervalului quantilei de ordinul p;
N q p = N i - reprezint frecvena absolut a intervalului quantilei qp, care nlocuite n (3.71) conduc

la formula de calcul:
q p = xqp +

N (q p ) N ( x q p )
Nq p

lqp

(3.72)

pentru p = 1, n 1 .
Procedeul de determinare a quantilei de ordinul p = 1, n 1 este acelai i n cazul n care seria
(3.68) este format din frecvene relative. Caracterizarea structurii unei serii se poate face utiliznd
diverse cazuri particulare de valori quantile.
Valoarea median (Me) este i un parametru de structur obinndu-se ca un caz particular de
quantil, cnd n=2. Dac pentru o serie se cunoate Me (quantila de ordinul 2), atunci structura
populaiei poate fi redat astfel:

X Me
X : min
50%

M e xmax

50%

(3.73)

semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X valori
cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a nregistrat
pentru X valori cuprinse ntre median i valoarea maxim a lui X. Formula de calcul a Me se poate
gsi ca un caz particular, n=2, a relaiei (3.72).
Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4. Cele trei
quartile, care se obin, notate: Q1, Q2 i Q3 sunt acei parametri de structur care mpart populaia n
patru pri egale.
n raport cu mediana, quartila nti Q1, se numete quantila mic (inferioar), quartila a doua Q2
coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q3 se numete quartila
mare (superioar). Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n
raport cu variabila X:
x Q1
X : min
25%

Q1 Q 2
25%

Q 2 Q3
25%

Q3 X max
25%

(3.74)

ceea ce semnific o structurare a populaiei supus studiului n patru pari egale. Aceasta nseamn
c 25% din unitile popupaiei nregistreaz valori pentru variabila X mai mici dect quartila mic,
25% din unitile populaiei nregistreaz valori, n raport cu aceeai variabil X, cuprinse ntre
quartila mic i cea mijlocie, 25% vor avea valori cuprinse ntre quartila mijlocie i quartila mare,

iar restul 25% din unitile populaiei vor avea valorile pentru variabila X cuprinse ntre quartila
mare i valoarea maxim a lui X.
Relaiile de calcul pentru quartile sunt cazuri particulare ale relaiilor de calcul pentru quantilele de
ordin p ( p = 1, n 1 . Etapele sunt aceleai, presupunndu-se mai nti calculul rangurilor celor 3
quartile, apoi determinarea efectiv a acestora. Valorile efective pentru cele 3 quartile se determin
n mod diferit, dup cum seria este discret sau continu. n continuare se va detalia modul de
calcul al quartilelor n mod separat pentru fiecare tip de serie n parte. Pentru cazul seriilor discrete
calculul rangurilor pentru cele trei quartile se face conform formulelor:
1 R
1 R
rq1 = 1 N i = N i
4 i 1
4 i =1

(3.75)

1 R
1 R
rq 2 = 2 N i = N i
4 i =1
2 i =1

(3.76)

1 R
rq 3 = 3 N i
4 i =1

(3.77)

Expresiile de calcul pentru cele trei quartile sunt diferite, dup cum valorile rangurilor
corespunztoare lor sunt ntregi sau nu. Determinarea quartilelor presupune stabilirea acelor valori
pentru variabila X care corespund rangurilor acestora i valorilor lui X corespunztoare rangurilor
majorate cu o unitate. n cazul n care rangurile sunt valori ntregi, quartilele se calculeaz ca media
aritmetic simpl a valorilor lui X corespunztoare rangului i rangului majorat cu o unitate.
R

Dac p N i , ( p = 1,3) , se divide cu 4 atunci relaiile de calcul pentru quartile sunt:


i =1

x rQ + x ( rQ

Q1 =
Q2 =

+1)

x rQ + x ( rQ
2

(3.78)

+1)

(3.79)

Q3 =

x rQ + x ( rQ
3

+1)

(3.80)

iar dac p N i , ( p = 1,3) , nu se divide cu 4 atunci relaiile de calcul pentru quartile sunt:
i =1

Q1 = x [ rQ1 +1]

(3.81)

Q2 = x[ rQ

+1]

(3.82)

+1]

(3.83)

Q3 = x[ rQ

n cazul seriilor de variaie continu etapele privind determinarea celor 3 quartile sunt aceleai. Mai
nti se calculeaz rangul corespunztor pentru fiecare din cele trei quartile, urmnd ca pe baza
acestora s se calculeze efectiv quartilele. Rangul quartilei nti se determin conform relaiei:
rQ1 =

1 R
Ni
4 i =1

iar primul interval care satisface inegalitatea:

(3.84)

N i + N 2 + ... + N i

1 R
Ni
4 i =1

va reprezenta intervalul quartilei mici. Acest interval fiind gsit, quartila mic se determin
conform relaiei:
Q1 = x Q1 +

N (Q1 ) N ( x Q1 )
N Q1

l Q1

(3.85)

Pentru quartila mijlocie, Q2, calculele se pot face n conformitate cu procedeul dat pentru median.
n cazul quartilei mari, Q3, rangul se calculeaz astfel:
1 R
rQ3 = 3 N i
4 i =1

(3.86)

iar primul interval care satisface inegalitatea:


1 R
N1 + N 2 + ... + N i 3 N i
4 i =1

va constitui intervalul quantilei mari. Calculul efectiv al quartilei mari se face conform relaiei:
Q3 = x Q3 +

N (Q3 ) N ( x Q3 )
N Q3

l Q3

(3.87)

Semnificaia simbolurilor folosite n relaiile de calcul pentru cale 3 quantile deriv imediat din
cazul general prezentat pentru quantile.
Valorile decile constituie acel caz particular al valorilor quantile pentru care n=10. Valorile decile
reprezint acei indicatori de structur care mpart populaia supus studiului n 10 pri egale.
Urmnd acelai procedeu, relaiile de calcul pentru valorile decile se deduc din cazul general ca i
pentru cazul medianei i al quartilelor. Pentru cazul seriilor de variaie discret n prima faz se
calculeaz rangurile n conformitate cu urmtoarea formul de calcul:
rD p = p

Dac valoarea expresiei p

10

N ;
i

p = 1,9

(3.88)

i =1

se divide cu 10, atunci relaiile de calcul pentru cele 9 decile

i =1

sunt:
Dp =

x rD p + x (rD p +1)

iar dac valoarea expresiei p

p = 1,9

(3.89)

nu se divide cu 10, atunci relaiile de calcul pentru valorile

i =1

decile sunt:
D p = x[ rD p +1] ;

p = 1,9

(3.90)

n cazul seriilor de variaie continu, prima faz const n calcularea rangurilor:


rD p = p

10

N ;
i

i =1

p = 1,9

Pentru fiecare decil Dp, p = 1,9 , se determin intervalul decil corespunztor, conform inegalitii:
N1 + N 2 + ... + N i p

1 R
N i ; p = 1,9
10 i =1

dup care se calculeaz decila corespunztoare conform relaiei:


D p = x Dp +

N (D p ) N ( x Dp )
N Dp

l Dp

Pentru cazul particular, n=100, quantilele de ordinul p = 1,99 se numesc procentile i reprezint
acele valori ale variabilei X care mpart seria respectiv n 100 de pri egale.
3.3. Parametrii variaiei

Studiul unor populaii statistice prezint importan numai din punct de vedere al unor mrimi care
variaz de la o unitatea la alta sau de la un grup de uniti la altul. Valorile nregistrate de o
variabil cantitativ, n raport cu care este studiat o populaie, de datoresc aciunii diferiilor factori
eseniali i neeseniali. Intensitatea diferit cu care se pot manifesta factorii eseniali ct i sensul
contrar cu care pot aciona factorii neeseniali n raport cu fiecare unitate, provoac nivele diferite
nregistrate de variabile n raport cu care este studiat populaia. Problema msurrii variaiei unei
variabile cantitative este important pentru a vedea n ce msur valoarea medie a acesteia poate
reprezenta ntrega populaie. Dac abaterile de la valoarea medie sunt neeseniale atunci se poate
afirma c populaia este omogen i c acest parametru poate reprezenta tendina central, iar dac
aceste abateri sunt mari atunci populaia este eterogen i valoarea medie nu are capacitatea de a
reprezenta populaia. Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri,
parametrul valoarea median poate s-i ia locul. Aceeai problem se pune i n acest caz, de a
vedea n ce msur valoarea median este sau nu reprezentativ pentru populaia n cauz. O alt
problem care nu se poate rezolva fr a studia i msura variaia nregistrat de o variabil n
raport cu care este studiat o populaie, o constituie verificarea de ipoteze. n activitatea practic, de
multe ori pornind de la valorile unor parametrii calculai pe baza datelor culese relativ la un numr
mic de uniti, este necesar a fi extini la nivelul ntregii populaii sau de a se verifica anumite
ipoteze statistice. Parametrii variaiei se pot calcula att sub form absolut ct i relativ, i
msoar mprtierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea
median.
Ca urmare, n funcie de elementul de referin folosit n msurarea variaiei, deosebim:
- parametrii variaiei n raport cu valoarea medie;
- parametrii variaiei n raport cu valoarea median.
3.3.1. Parametrii variaiei n raport ca valoarea medie

Din aceast grup fac parte:


-

amplitudinea sau variaia maxim;


variaia maxim i variaia minim fa de valoarea medie;
abaterea medie liniar;
abaterea medie ptratic.

Amplitudinea (variaia maxim) - (facultativ)


Variaia maxim i variaia minim de la valoarea medie - (facultativ)
Abaterea medie liniar - (facultativ)

Abaterea medie ptratic

Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii medii
ct i n scopul estimrii unor parametri necunoscui. Abaterea medie ptratic, notat cu x , se
definete ca fiind media ptratic a abaterilor valorilor variabilei X, de la valoarea medie X , adic:

x = M (X X )2

(3.97)

Valoarea lui ne arat cu ct se abat n medie valorile variabilei n raport cu media.


Un calcul intermediar n aflarea acestui parametru, l constituie calcularea ptratului abaterii medii
ptratice, care se numete dispersie sau varian i are urmtoarea expresie de calcul:

x2 = M ( X X ) 2 = V ( X )

(3.98)

V(x) reprezint o alt notaie pentru varian, pe lng 2x . Variana fiind un calcul intermediar n
aflarea abaterii medii ptratice, n cele ce urmeaz se va prezenta modul de calcul al acesteia.
Relaia de calcul a varianei (3.98) se particularizeaz n raport cu tipul seriei. n cazul unei
serii care are la baz o variabil X discret, conform definiiei, variana are expresia:
R

(x
x2 =

X )2 Ni

i =1

(3.99)

i =1

dac seria este format cu frecvene absolute sau:


R

x2 = ( x i X ) 2 f i

(3.100)

i =1

dac seria este format cu frecvene relative.


Pentru serii cu fercvene (absolute sau relative) egale, printr-un calcul simplu se ajunge la
urmtoarea expresie de calcul a varianei:
R

2
x

(x

X )2

i =1

Repartiia Bernoulli (alternativ), frecvent utilizat n aplicaiile practice de estimare a parametrilor,


de forma:
1 0

X :
p q

are X = p, iar variana pq dup cum rezult din urmtorul calcul:


2

x2 = ( xi X ) 2 f i = (1 p )2 p + (0 p )2 q = q 2 p + p 2 q =
i =1

= pq (q + p ) = pq = p (1 p )

Dac variana seriei alternative de mai sus este vzut ca o funcie de variabila p, adic:

x2 ( p ) = p (1 p )
atunci se poate gsi p astfel nct x2 ( p ) s fie maxim. Punnd condiia ( x2 ( p ) ) = 0 rezult:
'

2
x

'

( p ) = 1 (1 p ) + p ( 1) = 0
1
2

1 2 p = 0 p =

1
2

1 1
2 2

x2 = =

1
= 0, 25
4

1
, atunci variana maxim a unei serii alternative de medie p este 0,25,
2
rezultat utilizat n estimarea unor parametrii necunoscui cu privire la studierea diferitelor populaii.

Ca urmare, dac p =

n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform
urmtoarei relaii:
xR
2
x

(x X )

f ( x) dx

(3.101)

x1

a crei aplicare presupune cunoaterea densitii de repartiie f(x). Aproximnd densitatea f(x) cu
densitatea empiric, dup cum urmeaz:
f ( x)

fi
; x [ x i 1 , x i ); i = 1, R
x i x i 1

se ajunge la aceleai relaii de calcul (3.99) i (3.100) unde n loc de xi se pune x i' reprezentnd
mijlocul intervalului i calculat conform relaiei:
x i' =

x i 1 + x i
, i = 1, R .
2

Pentru o serie dat, variana calculat nu are interpretare, dar dac se extrage rdcina ptrat din
acesta se obine un numr care se exprim n aceleai uniti de msur ca i variabila de la baza
seriei. Acest numr (valoare) reprezint abaterea medie ptratic, simboliznd cu ct se abate n
medie n plus sau minus orice valoare xi a variabilei X de la valoarea medie X .
Parametrul abaterea medie ptratic se poate exprima i sub form relativ, caz n care se numete
coeficientul de variaie a lui Pearson, i se noteaz cu Vx. Expresia de calcul este:
Vx =

x
X

100%

(3.102)

i arat cu cte procente se abat n medie valorile variabilei fa de medie. Coeficientul de variaie a
lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit n aprecieri comparative
privind gradul de reprezentativitate a valorii medii calculate. Deoarece gradul de reprezentativitate
a valorii medii este n raport invers cu mrimea coeficientului de variaie a lui Pearson, se poate
afirma, n cazul mai multor serii, c este mai reprezentativ valoarea medie a acelei serii pentru care
Vx este mai mic. n concluzie, trebuie reinut c parametrul abaterea medie ptratic sub form
absolut x i sub form relativ Vx sunt indicatori fundamentali utilizai n msurarea variaiei unei
variabile.

Att abaterea medie liniar, ct i abaterea medie ptratic constituie o msur a variaiei medii,
primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x x ) .
Deoarece calcularea abaterii medii ptratice i implicit a varianei necesit un volum mare de
calcule, prezentarea unor proprieti ale varianei n vederea reducerii volumului de munc este
inevitabil. dispersia este media aritmetica a patratelor abaterilor individuale fata de media

Propriet ti ale varianei


1. Variana unei constante este egal cu zero.
Lundu-se X = C i aplicnd relaia de calcul a varianei se obine:

V(X) = V(C) = M[(C-C)2] = M(0) = 0

(3.103)

2. Variana unei variabile X este independent de schimbarea originii.


Fie o serie care are la baz variabila X, a crei origine este zero. Pornindu-se de la aceasta se
construiete o nou serie care are la baz variabila Y=X-x0, a crei origine este x0 . Demonstrarea
acestei proprieti presupune de artat c:

V(X) = V(Y)
innd cont de definiia varianei avem:
V (Y ) = M (Y Y ) 2 = M [( X x 0 ) M ( X x 0 )] 2 =
= M ( X x0 X + x0 ) 2 = M ( X X ) 2 = V ( X )

ceea ce demonstreaz afirma ia mai sus enunat. Aceast proprietate i gsete aplicate n calculul
varianei pentru acele serii a cror variabile nregistreaz valori mari. n scopul reducerii volumului
de calcule se vor micora toate valorile variabilei cu o constant x0, convenabil aleas, nct noua
serie obinut s nregistreze valori mici pentru variabil.
Dac ntre dou variabile Y i X exist urmtoarea relaie liniar:

Y = aX+b
atunci are loc urmtoarea egalitate:

V(Y) = a2 V(X)
Conform definiiei varianei, se poate scrie:
V (Y ) = M (Y Y ) 2

(3.104)

Valoarea medie a varibilei Y este:


M (Y ) = Y = M ( a X + b) = a M ( X ) + b

care nlocuit n (3.104) ne conduce la:

V (Y ) = M Y Y

= M (a X + b a M ( x) b ) =

= M ( a ( x M ( x)) 2 = a 2 M ( X X ) 2 = a 2 V ( X )

ceea ce trebuia demonstrat.

4. Variana unei variabile, fiind un moment centrat de ordinul doi, se poate exprima cu ajutorul
diferenei dinter momentul de ordinul doi i ptratul momentului de ordinul nti al variabilei,
adic:
V ( X ) = M (X 2 ) (M ( X ))

(3.105)

Urmtorul calcul simplu ne conduce la egalitatea de mai sus:

V (X ) = M X X

= M (X 2 2X X + X ) = M (X 2) 2 X M (X ) + X
2

= M ( X 2 ) 2 X + X = M ( X 2 ) X = M ( X 2 ) ( M ( X ))2
Pornind de la relaia (3.105) se poate deduce o nou formul de calcul pentru varian, dup cum
urmeaz:
R

( )

x i2 N i

V ( X ) = M X 2 (M ( X )) =

i =1
R

i =1

R
xi N i
i =1 R

Ni
i =1

xi N i
2
R
R
R

i =1
x i2 N i x i N i
x i2 N i

N
= i =1
= i =1
i =1

N
N
N

dac seria este format din frecvene absolute, sau:

V ( X ) = x f i xi f i
i =1
i =1

2
i

(3.106)

dac seria este format din frecvene relative.


Aceast proprietate este frecvent utilizat n caracterizarea seriilor multidimensionale.

5. Variana sumei a dou variabile X i Y este egal cu suma varianelor acestor variabile, dac cele
dou variabile sunt independente.
Conform relaiei 4. Avem:
2

V ( X + Y ) = M ( X + Y ) (M ( X + Y )) = M X 2 + 2 XY + Y 2
2

(M ( X ) + M (Y )) = M ( X ) + 2 M ( X Y ) + M (Y ) (M ( X ))
2

( )

2 M ( X ) M (Y ) (M (Y )) = M ( X ) + (M ( X )) + M Y 2

(3.107)

(M (Y ))2 + +2M ( X ) M (Y ) 2M ( X ) M (Y ) = V ( X ) + V (Y )
Aceast proprietate se poate generaliza cu uurin, pentru n variabile independente dou cte dou:
V ( X 1 + X 2 + ... + X n ) = V ( X 1 ) + V ( X 2 ) + ... + V ( X n )

(3.108)

6. Variana unei variabile X fa de o constant x0 este mai mare dect variana acestei variabile fa
de media sa cu p tratul diferenei dintre valoarea medie i constanta respectiv. Demonstrarea
acestei proprieti se bazeaz pe urmtorul calcul:

(( ) ( )) =
= M (X X ) + 2(X X )(X x ) + (X x ) =

= M (X X ) + 2(X x ) M (X X ) + (X x ) = M (X X ) + (X x )
2

M ( X x0 ) = M X X + X x0

( )
( X ) = M (X X ) = M ( X x ) (X x )

deoarece M X X = 0 . Ca urmare, se poate scrie:


V

ceea ce constituie ntr-o form simbolic enunul de mai sus.

7. Variana produsului dintre o constant i o variabil este egal cu produsul dintre


constanta la ptrat i varian:
V (a X ) = a 2 V ( X )

(3.109)

Demonstraia acestei proprieti constituie un caz particular al proprietii 3., unde se ia b=0.

8. Variana diferenei dintre dou variabile independente este egal cu suma varianelor
acelor variabile:
V ( X Y ) = V ( X ) + V (Y )

(3.110)

Aceast proprietate rezult imediat fcnd un calcul simplu pornind de la defini ia varianei, innd
cont i de proprietatea 7.

9. Variana sumei a dou variabile dependente este egal cu suma varianelor celor dou variabile
plus covariana dintre cele dou variabile:

((

)(

V ( X + Y ) = V ( X ) + V (Y ) + 2 M X X Y Y

))

(3.111)

Urmtorul calcul este concludent n acest sens:


2

V ( X + Y ) = M (( X + Y ) M ( X + Y )) = M X + Y X Y

2
2
= M X 2 + Y 2 + X + Y + 2 XY 2 X X 2 X Y 2Y X 2Y Y + 2 X Y =

( ) ( )
= M (X ) (X ) + M (Y )

= M X 2 + M Y 2 + X + Y + 2 M X Y X Y Y X + X Y 2 X 2Y

(( )( ))
= V ( X ) + V (Y ) + 2 M ((X X )(Y Y ))
Media M ((X X )(Y Y )) se numete covarian sau variana legat i este util n studiul
2

Y + 2M X X Y Y =

legturilor dintre variabile.


Dac n egalitatea (3.109) se ia a =

1
, k fiind un numr real mai mare dect 1, se ob ine:
k

1
1
V X = 2 V ( X )
k
k

de unde:
1

V ( X ) = k 2 V X
k

(3.112)

Potrivit relaiei (3.112) se poate afirma c dac strile unei variabile cantitative de la baza unei serii
se simplific cu k, atunci variana acelei variabile se micoreaz de k2 ori. Pornind de la relaia:
2

V (X ) = M (X x0 ) X x 0

care constituie nsi proprietatea 6., innd cont de egalitatea (3.112) se poate scrie:
X x0 2 2
V ( X ) = M
k X x0
k

(3.113)

n aplicaiile practice, pe motive de reducere a volumului de munc, constanta x0 se alege mijlocul


seriei, iar mrimea k egal cu cel mai mare divizor comun al diferenelor X-x0.
Relaia (3.113) se numete formul de calcul simplificat al varianei, concretizndu-se n
funcie de natura seriei. Dac seria are la baz variabila X i este construit cu frecvene absolute,
atunci relaia (3.113) devine:
2

xi x0

Ni

k
i =1
R

V (X ) =

k 2 X x0

(3.114)

i =1

iar dac seria este format cu frecvene relative relaia amintit devine:

R xi x0 2

V ( X ) =
f i k 2 X x0

i =1 k

(3.115)

n cazul seriilor continue, calculul simplificat al varianei se efectueaz tot dup una din cele dou
rela ii de mai sus cu deosebirea c n loc de xi se iau n calcul xi, adic mijloacele intervalelor de
variaie.

10. Variana mediei aritmetice a n variabile independente care urmeaz aceeai lege de distribu ie
este egal cu variana uneia dintre variabile mprit la numrul variabilelor considerate. Fie X1,
X2, , Xn cele n variabile pentru care:
V ( X i ) = V ( X ),

i = 1, n

unde V(X) reprezint dispersia comun a celor n variabile. Din faptul c:


1
X + X 2 + ... + X n 1
V 1
= 2 (V ( X 1 ) + V ( X 2 ) + ... + V ( X n )) = V ( X )
n
n

n
i notnd:
n

X
X =

i =1

rezult:

( )

V X =

V (X )
n

(3.116)

n mod analog pentru n variabile independente, abaterea medie ptratic se exprim astfel:

X =

X2
n

(3.117)

expresie care mai poart denumirea de eroarea mediei de selecie, numai dac X1, X2, , Xn sunt
variabile de eantionare.

11. Variana unor variabile normate este unu, iar media este zero. Pentru o variabil X oarecare,
variabila normat ataat este:
Z=

X X

de medie:
XX
M (Z ) = M
X

1
=
M (X X ) = 0
X

i varian:

XX
= M
X
2
Z

1
= 2 mXX

X

X2
=1
X2

12. Regula de adunare a varianelor. Se consider o serie de repartiie, care are la baz variabila X,
iar populaia respectiv de volum N este mprit n R clase n raport cu un criteriu C. Se
demonstreaz c varina n ntrega populaie, care msoar variaia total n raport cu X, este egal
cu suma a dou variane din care una msoar variaia n cadrul grupelor, iar cealalt variaia dintre
grupe. Pentru demonstrarea acestei proprieti se consider o serie de urmtoarea form:

x , x ,..., x1N1
X : 11 12
N1

...

{x , x
i1

...

i2

,..., xiN i

Ni

...
...

{x

R1

, xR 2 ,..., xRN R

NR

unde s-a notat cu {xi1, xi2, ,xiNi} mulimea valorilor nregistrate de uniile din clasa i, aceasta
fiind ntotdeauna posibil avnd n vedere numrul finit de elemente care pot aparine unei clase.
Variaia lui X n cadrul populaiei cercetate se compune din variaia n cadrul celor R
grupe datorat aciunii factorilor neeseniali i variaia de la o grup la alta datorat aciunii
factorilor eseniali care nu acioneaz cu aceeai intensitate asupra unitilor din populaie.
Notnd cu:

x2 - variana variabilei X n grupa i care msoar mprtierea n aceast grup provocat de


i

factori neeseniali;

X2 - variana dintre grupe, care msoar mprtierea de la o grup la alta;


i

x2 - media varianelor grupelor, care msoar variaia medie n cadrul celor R grupe;
i

X i - media din grupa i;

proprietatea enunat mai sus se rezum la urmtoarea egalitate:

x2 = X2 + X2
i

(3.118)

Demonstrarea egalit ii (3.118) pornete de la expresia varianei totale care pentru seria de mai sus
poate fi scris astfel:

Ni

(x

ij

ij

i =1 j =1

x2 =

N
Ni

((x
=

ij

i =1 j =1

) (

))

i =1 j =1

Ni

ij

Xi + Xi X

ij

Ni

i =1 j =1
R

Xi + Xi X

i =1 j =1

Ni

Ni

) (x

ij

i =1 j =1
Ni

(x

ij

i =1 j =1

Ni

) + (X

Ni

) +2 (x
2

ij

i =1 j =1

)(

X Xi X

i =1 j =1

Ni

ij

i =1 j =1
Ni

(x

ij

) (X

i =1 j =1

Ni

Ni

Ni

ij

ij

i =1

(X

i =1

i =1

) N

i =1

x2 Ni
=

X
Ni

i =1 j =1

ij

X Ni

(x

i =1 j =1

i =1 j =1

i =1 j =1

(X

Ni

X Ni

i =1
R

i =1

= x2i + X2

i =1

deoarece:
R

Ni

)(

2 xij X i X i X
i =1 j =1
R

N
i =1 j =1

ij

= 2

Ni

ij

Ni

(x
R

X i xij X X i2 + X i X

i =1 j =1

Ni

ij

i =1 j =1

R Ni
R Ni
R Ni
R Ni
xij X i xij X X i2 + X i X

i =1 j =1
i =1 j =1
i =1 j =1
= 2 i =1 j =1
R
Ni

i
=
1

Ni
Ni

R
x
xij

ij
R
R
R

j =1
j =1
2
X i N Ni X N Ni X i Ni + X X i Ni
i =1
i =1
i =1
i
i
=
= 2 i =1
R

Ni

i =1

R
R
R
R

X i2 N i X X i N i X i2 Ni + X X i Ni
i =1
i =1
i =1
=0
= 2 i =1
R

Ni

i =1

Prin urmare, dac o populaie este mp rit n R clase n raport cu un criteriu C, atunci variaia
variabilei X n cadrul fiercrei clase poate fi consecina aciunii unor factori neeseniali. Calculnd
valoarea medie X i n fircare clas se elimin cota parte din nivelul atins de variabil n clasa i ca
urmare a aciunii factorilor reziduali, iar variana n clasa i msoar mprtierea n interiorul
clasei provocat de aceti factori.
Componenta de dispersie x2i , reprezentnd media dispersiilor claselor, msoar variaia
medie la nivel de populaie, cauzat de factorii reziduali. n general, factorii eseniali se manifest
cu o intensitate diferit de la o unitate la alta ct i de la o clas la alta conducnd la diferene ntre
mediile claselor i media n populaia considerat. Aceste abateri sunt msurate de componenta de
dispersie X2 , numit varian a dintre grupe.
i

Dac relaia (3.118) se mparte cu 2x i se nmulete cu 100% se ob ine:


100% =

X2

2
x

100% +

X2
100%
x2
i

rela ie care ne arat procentual cota parte din variaia unei variabile provocat de aciunea factorilor
eseniali i respectiv de aciunea factorilor neeseniali.
Regula de adunare a variantelor, permite evaluarea influenei fiecrei categorii de factori
(eseniali sau neeseniali) asupra variaiei totale a unei variabile n raport cu care este studiat
populaia.
Cunoscnd variana unei variabile, extrgndu-se rd cina ptrat se obine abaterea
medie ptrat, parametru de baz utilizat n msurarea variaiei medii a unei variabile X:

X = X2

(3.119)

Mrimea parametrului abaterea medie p tratic permite, printre altele, o apreciere cu privire
la gradul de reprezentativitate a valorii medii. Aceasta deoarece exist serii pentru care, n raport cu
variabila considerat, dei x nregistreaz valori mici este posibil ca unele dintre valorile lui X s se
abat n realitate foarte mult de la valoarea medie.
Exemplu:

Urmtorul exemplu constituie un model de calcul al varianei i abaterii medii ptratice utiliznd
att definiia ct i relaia de calcul simplificat. n acest sens se consider distribuia agenilor
economici care au realizat profit la sfritul anului trecut. Se consider populaia agenilor
economici n cauz care i desfoar activitatea ntr-o anumit zon geografic. Seria de repartiie
a celor 1160 de ageni economici, care au realizat profit este:
0 50 50 100 100 150 150 200 200 250

X :
250
350
260
130
170
unde variabila profit X are valorile exprimate n milioane lei.
Profitul mediu X este:

X =

25 17 + 75 25 + 125 35 + 175 26 + 225 13 14,100


=
= 121,55 mil.lei
116
116

Variana calculat conform definiiei este:


5

X2 =

(x

'
i

) N
2

i =1

i =1
2
2
2
(
25 121,55) 17 + (75 121,55) 25 + (125 121,55) 35
=
+

116
(175 121.55) .26 + (225 121.55) 2 .13
+
=
116
2
2
2
2
2
(
96,55) 17 + (46,55) 25 + (3,45) 35 + (53,45) 26 + (103,45) 13
=
=
116
426.465,68
=
= 3676,428
116
2

de unde:

X = X2 = 3676 ,428 = 60,63 mil .lei


Valoarea obinut pentru x de 60,63 mil. lei reprezint cu ct se abate n medie profitul fiecrui
agent economic de la profitul mediu considerat de 121,55 mil. Lei. Utiliznd relaia de calcul
simplificat se obine aproximativ (din cauza rotunjirilor) aceeai abatere medie ptratic:
2

xi' x0

Ni

k
2
i
=
1
X2 = 5
k 2 X x0 =
Ni
5

i =1
2
2
2
25 1252

75 125
175125
225125
17 +
25 +
26 +
13 +

50
50
50
50

116

502 (121,55 125) =

( 2)2 17 + (1)2 25+ 12 26 + 22 13 502

116
11,903 = 3685,34511,903 = 3673,442

de unde x = 60,61 mil. lei. n relaia de calcul simplificat s-a luat x0 = 125, adic mijlocul seriei,
iar k = 50, fiind cel mai mare divizor al tuturor diferenelor xi' x0 , i = 1,5 .

Abaterea medie p tratic exprimat sub form relativ, prin intermediul coeficientului de
variaie Pearson este:
VX =

X
X

100% =

60,61
100% 49,86%
121,55

reprezentnd abaterea medie n procente a profiturilor nregistrate de cei 1160 de ageni economici
de la profitul mediu.

3.3.2. Parametri variaiei n raport cu valoarea median - (facultativ)


3.4. Parametrii concentrrii - - (facultativ)
3.5. Parametrii formei
Parametrii prezentai n acest capitol, pn acum, au scos n eviden diferite aspecte
eseniale ale populaiei statistice. Conform celor prezentate, parametrul valoare medie pune n
eviden ceea ce este tipic, general i esenial n populaia considerat n raport cu variabila X.
Parametrii de structur au menirea de a permite studierea i caracterizarea structurii unei populaii
n raport cu aceeai variabil. Parametrii variaiei sunt utili n studierea mprtierii (dispersrii)
unitilor unei populaii fa de valoarea medie sau valoarea median, n raport cu o variabil
oarecare.
Din aplicaiile practice, precum i din alte surse, s-au constatat c graficele pot avea diverse
forme, dintre care: form de coplot, form de U, J, L sau alte forme. Ceea ce prezint importan,
nefiind surprins de nici un parametru prezentat, l constituie modul de repartizare a valorilor
variabilei de o parte i de alta a valorii medii, considerat i centrul de greutate a seriei. Acest lucru
nu nseamn altceva dect evidenierea acelei curbe care aproximeaz cel mai bine conturul
poligonal al seriei respective i n acelai timp o imagine mai clar asupra gradului de
reprezentativitate a valorii medii.
n marea majoritate a cazurilor, distribu ia unitilor unei populaii se face dup un clopot
(dup legea normal a lui Gauss). Dar unittile nu se distribuie uniform n jurul valorii medii, ceea
ce poate conduce la nclinaii ntr-o direcie sau alta a valorii medii. Aceast distribuire neuniform
poate conduce la cazul cnd diferite serii (diferit distribuite n jurul valorii medii) s aib aceeai
medie, acelai i totu i o curb s fie mai aplatizat dect cealalt, simetric sau mai pu in
simetric. Evidenierea acestor diferene poate fi realizat cu ajutorul parametrilor formei.
Parametrii formei unei serii de repartiie, dup coninut, se clasific n dou grupe:
-

parametrii asimetriei;
parametrii boltirii.

3.5.1. Parametrii asimetriei


Asimetria unei serii se definete n raport cu dispunerea unitilor ntr-o parte sau alta a valorii
medii. n acest sens, o serie de repartiie este simetric n raport cu media sa dac frecvenele
valorilor variabilei X egal dep rtate de valoarea medie sunt egale ntre ele, adic:

) (

f X = f X +
valorile lui X.

oricare ar fi astfel nct X i X + s se afle printre

O serie este asimetric n raport cu valoarea sa medie dac exist cel pu in o pereche de valori ale
variabilei X egal deprtate de X pentru care frecvenele corespunztoare s nu fie egale, adic:

) (

f X f X +

pentru o valoare astfel nct X i X + s se afle printre valorile lui X. Caracterizarea


numeric a gradului de asimetrie a unei serii se realizeaz cu ajutorul urmtorilor parametrii:
-

coeficientul de asimetrie al lui Pearson;


coeficientrul de asimetrie a lui Fisher.

Coeficientul de asimetrie al lui Fisher


Acest parametru se noteaz cu 3, iar expresia sa de calcul este:

3 =

M XX

(3.128)

X3

sau ntr-o form echivalent:

3 =

( )
M (X X )

M X X

Calculnd valoarea acestui parametru, n funcie de semnul ei, avem urmtoarele cazuri:

1. 3 = 0, ceea ce nseamn c M X X = 0, adic suma tuturor abaterilor cu semnul


minus este egal cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare n
acest caz se poate spune c seria este simetric.
3

2. 3 > 0, ceea ce nseamn c M X X > 0. Aceasta este echivalent cu faptul c pe


total suma abaterilor cu semnul plus de la valoarea medie este mai mare dect suma abaterilor cu
semnul minus i ca urmare seria prezint o asimetrie pozitiv.

3. 3 < 0, deci M X X < 0. Aceasta nseamn c pe total, suma abaterilor cu semnul


minus este mai mare dect suma abaterilor cu semnul plus de la valoarea medie. O astfel de serie se
spune c reprezint o asimetrie negativ. Deoarece coeficientul de asimetrie a lui Fisher se
calculeaz cu ajutorul momentului centrat de ordinul al treilea, acesta este mult mai sensibil dect
coeficientul lui Pearson. Dac pentru o serie rolul valorii medii l joac valoarea median atunci
pentru caracterizarea gradului de asimetrie se folosete coeficientul:

' =

(Q3 M e ) (M e Q1 )
(Q3 M e ) + (M e Q1 )

(3.129)

care reprezint raportul dintre diferena abaterilor quantile i suma lor. este un coeficient numeric
cuprins ntre 1 i +1. Dac = 0 se spune c seria este simetric, dac > 0 seria prezint o
asimetrie pozitiv, iar dac < 0 seria prezint o asimetrie negativ.
i acest parametru ofer o imagine mai puin semnificativ asupra gradului de asimetrie al unei
serii.

3.5.2. Parametrii boltirii


Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a
valorii medii ct i pentru compararea reprezentativitii a dou sau mai multe valori medii ce

reprezint serii diferite. Parametrul M X X d o caracterizare numeric sub form absolut a


gradului de boltire a unei serii. Sub form relativ, gradul de boltire se msoar cu parametrul:
B4 =

M X X

(3.130)

X4

Pentru a nelege semnificaia boltirii unei serii, se consider dou serii statistice care au la baz
variabilele X i Y, iar
X = Y; X = Y

Mai presupunem, n plus, c cele dou distribu ii au form de clopot pentru care 3X = 3Y , adic
ambele sunt simetrice. Dei s-ar prea c cele dou serii nu au nimic care s le deosebeasc, totui
reprezentndu-le grafic rezult dou curbe de forma:

X =Y

X = Y

unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou serii
nu sunt caracterizate de aceeai boltire. Boltirea unei serii este util pentru a da o caracetrizare mai
exact reprezentativitii valorii medii. n cazul exemplului prezentat mai sus, att mediile ct i
abaterile medii p tratice sunt egale i ca urmare, coeficientul de variaie al lui Pearson este acelai
pentru cele dou serii. Deci rezult c ambele valori medii prezint acelai grad de
reprezentativitate. Cu toate acestea, graficele celor dou serii contrazic concluzia dedus n urma
comparrii celor doi coeficieni de variaie. Valoarea medie cea mai reprezentativ n seria n care
cele mai multe uniti ale populaiei cercetate au nregistrat valori, mai apropiate de valoarea medie.
Pentru o astfel de serie, mprtierea fa de valoarea medie fiind mic, graficul are o form mai
ascu it n cazul seriei X i mai plat n cazul seriei Y.
Nivelul boltirii pentru o serie oarecare dat se msoar cu ajutorul parametrului B4, a crui
expresie de calcul este dat de relaia (3.130). Valoarea lui B4 pentru o distribu ie normal este
egal cu 3. Pentru orice alt curb corespunztoare unei serii date i aproximat cu un clopot,
raportul ntre momentul centrat de ordinul patru i ptratul momentului centrat de ordinul al doilea,
este un numr diferit de 3, curba respectiv fiind mai ascuit sau mai plat dect curba normal a
lui Gauss.
Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui
Gauss, Fisher a stabilit urmtoarea expresie de calcul al coeficientului boltirii, notat cu B4:

'
4

B =

M X X

X4

(3.131)

sau:
B4 = B4-3
expresie cunoscut n literatura de specialitate sub denumirea de exces al seriei.
Urmtoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dac B4 =0 (adic B4 = 3) atunci seria n cauz prezint aceeai boltire cu a curbei normale (excesul
este nul);
- dac B4 > 0 (adic B4 > 3) atunci boltirea corespunztoare curbei respective este mai nalt i mai
ascuit dect curba normal (serie leptokurtic);
- dac B4 < 0 (adic B4 < 3) atunci boltirea corespunztoare curbei respective este mai plat (mai
joas i mai larg) dect curba normal (serie platikurtic).
Asimetria i boltirea joac un rol nsemnat n caracterizarea formei unei serii atributive de
repartiie. Cu ajutorul parametrilor prezentai poate fi format o imagine mai clar asupra unei serii
deja construite, asupra msurii n care seria respectiv poate fi reprezentat de valoarea sa medie.

3.6. Probleme
Problema 1
Avnd n vedere populaia societilor comerciale supus observrii concretizat n tabelul urmtor:
Nr

Marc

Jud. unde
i are
sediul

Ramura
unde i

Capital
social

Cifra de
afaceri

%
profit

desf. activ.

1.

994

Cluj

industrie

8.083.365

2.309.871

49 %

2.

1006

Cluj

industrie

9.611.744

10.761.787

419.175

49 %

3.

3588

Bucureti

industrie

10.116.125

7.694.483

467.496

49 %

4.

3685

Bucureti

industrie

8.053.025

11.561.823

969

49 %

5.

2994

Timi

industrie

2.121.925

2.317.951

80.880

60 %

6.

928

Cluj

agricultur

4.678.625

271.610

60 %

7.

929

Cluj

agricultur

888.490

159.351

60 %

8.

932

Cluj

agricultur

1.566.623

5.747.524

1.097

60 %

9.

3382

Bucureti

servicii

1.076.050

5.377.189

17.363

60 %

10.

12

Alba

transporturi

2.152.325

4.400.044

8.681

60 %

11.

25

Alba

transporturi

2.990.126

871.025

60 %

12.

53

Alba

servicii

510.285

773.886

38.935

60 %

13.

991

Cluj

transporturi

507.277

330.839

60 %

14.

1004

Cluj

transporturi

4.845.214

5.359.855

12.436

60 %

15.

3096

Timi

transporturi

5.963.750

9.931.327

90.223

60 %

16.

3043

Timi

transporturi

3.410.000

5.387.876

13.238

60 %

17.

47

Alba

construcii

6.270.418

541.334

49 %

18.

32

Alba

construcii

2.007.911

91.896

976

60 %

19.

3322

Vlcea

construcii

3.354.625

6.855.127

145.649

60 %

20.

966

Cluj

construcii

7.546.425

9.345.803

225.865

60 %

21.

972

Cluj

construcii

4.116.425

3.720.863

375.052

60 %

22.

1005

Cluj

construcii

4.629.025

8.000.906

400.575

60 %

23.

Alba

agricultur

6.848.825

176.728

1.960

60 %

24.

26

Alba

agricultur

9.709.000

3.864.087

1.087

49 %

25.

2956

Timi

agricultur

520.686

542.748

60 %

26.

2959

Timi

agricultur

2.086.534

37.793

60 %

27.

3264

Vlcea

agricultur

1.891.958

988.769

62.668

60 %

28.

3290

Vlcea

agricultur

3.114.550

2.812.349

78.300

60 %

29.

3296

Vlcea

servicii

5.389.225

12.456.122

390.659

49 %

30.

964

Cluj

servicii

5.874.950

6.240.445

23.583

60 %

X1 judeul (localitatea) unde i are sediul principal;


X2 ramura (subramura) n care i desfoar activitatea;
X3 capital social;

X4 cifra de afaceri;
X5 profitul;
X6 procent din capitalul social care se vinde cu titlul gratuit.
Se cere:
1. s caracterizai seria ce red repartiia unitilor din populaie dup variabilele X3 sau X4;
2. determinai i interpretai parametrii tendinei centrale pentru aceast serie: valoarea medie,
valoarea modal i cea median;
3. analiza statistic a reprezentativitii valorii medii (sub forma absolut i relativ);
4. analiza statistic a reprezentativitii valorii mediane (sub forma absolut i relativ);
5. analiza statistic a structurii populaiei, n raport cu aceeai variabil (utiliznd valoarea median,
valorile quartile i un grafic de structur);
6. analiza comparativ a gradului de concentrare a unitilor din populaie, n raport cu cele dou
variabile alese de noi;
7. analiza statistic a asimetriei i boltirii repartiiei;
8. calculul valorii medii, respectiv a dispersiei, utiliznd formule de calcul simplificat.
1.

[0,5 2,1)
X 3 :
9

[2,1 3,7) [3,7 5,3) [5,3 6,9) [6,9 8,5) [8,5 10,1)
6

Aceast serie unidimensional, ce red repartiia unitilor din populaie dup variabila X3 capital
social, este o serie atributiv cantitativ continu i are la baz indicatorul frecven absolut.
2. Parametrii tendinei centrale:
Valoarea medie:
capitalul social total 1,3 9 + 2,9 6 + 4,5 4 + 6,1 5 + 7,7 3 + 9,3 3
=
=
volumul populatiei
30
= 4,286 mld.lei
X3 =

Deci, dac toate societile comerciale din eantion ar avea acest capital social mediu, suma
capitalurilor sociale ce aparin celor 30 de societi comerciale ar rmne neschimbat.
Valoarea median:
n = 30 (numr par)
Calculm rangul medianei:
n
rM e = = 15 M e [2,1 3,7 ) intervalul median
2

Me = 2,1 +
Presupunem c frecvena unitilor care nregistreaz variante ntr-un interval este proporional cu
lungimea intervalului.
1,6 mld. lei .. 6 soc. com. = 1,6 mld. Lei
Me = 2,1 + 1,6 = 3,7 mld. lei.

Deci, jumtate din societile comerciale au capital social mai mic de 3,7 mld. lei i cealalt jumtate
din aceste societ i l au mai mare de 3,7 mld. lei.
[0,5 3,7 )
X 3 :
50%

[3,7 10,1)
50%

Valoarea modal:
Calculm rapoartele

ni

xi xi 1

n1
9
=
= 5,6
x1 x0 2,1 0,5

n4
5
=
= 3,1
x4 x3 6,9 5,3

n2
6
=
= 3,8
x2 x1 3,7 2,1

n5
3
=
= 1,9
x5 x4 8,5 6,9

n3
4
=
= 2,5
x3 x2 5,3 3,7

n6
3
=
= 1,9
x6 x5 10,1 8,5

max {5,6; 3,8; 2,5; 3,1; 1,9; 1,9} = 5,6


M0 [x0, x1), deci M0 [0,5-2,1) intervalul modal
0 / 1
lM 0
0 / 1 + 0 / 1
90
M 0 = 0,5 +
1,6 = 1,7 mld .lei
(9 0) + (9 6)

M 0 = xM 0 +

Deci, cele mai multe societi comerciale au capital social n jur de 1,7 mld.lei (dar nu mai mult de
9 sociati).
3. Analiza statistic a reprezentativitii valorii medii
Indicatori:
variana:
6

X2 =

(x X ) n
2

'
i

i =1

unde:
xi' =

xi + xi 1
2

mijlocul unui interval

9 (1,3 4,3) + 6 (2,9 4,3) + 4 (4,5 4,3) + 5 (6,1 4,3) + 3 (7,7 4,3)
+
3
30
2
3 (9,3 4,3)
+
= 7,293mld.lei
30
Deoarece dispersia este destul de mare, nsemn c valoarea medie nu este prea reprezentativ
(adic nu foarte multe variante sunt apropiate de ea).

X2 =

abaterea medie p tratic

X = X2 = 7,3 = 2,7 mld.lei


3

Capitalul social al fiecrei societti comerciale se abate n medie de la capitalul social mediu de
4,3 mld.lei cu 2,7 mld.lei.

coeficientul de variaie al lui Pearson


X
V X 3 = 3 100%
X3
2,7
VX3 =
100% = 62,8%
4,3
Deoarece VX 3 = 62,8% >30%, rezult c populaia este destul de eterogen, iar valoarea medie n
aceast situaie nu este prea reprezentativ.

4. Caracetrizarea reprezentativitii valorii mediane


Avem nevoie de 2 coeficieni:
Q3 Q1
=?
2
Q Q1
-relativ: 3
=?
2 Me

-absolut:

Me = 3,7 mld.lei
Calculm cuartilele Q1 i Q3:
Q1 = ?

1 1
rQ1 = n = 30 = 7 Q1 [0,5 2,1)
4 4

N (Q1 ) N xQ1
Q1 = xQ1 +
lQ1
N Q1

( )

unde:
xQ1 - marginea inferioar a intervalului n care se afl Q1;
N (Q1 ) - frecvena cumulat pn la Q1;

N (X Q ) - frecvena cumulat pn la xQ1 ;


!
N Q1 - frecvena intervalelor n care se afl Q1.
7,5 0
1,6 = 1,83 mld.lei
9
25% din societile comerciale cu capitalul social 1,83 mld.lei
iar 75% din societile comerciale cu capitalul social >1,83 mld.lei
Q1 = 0,5 +

Q3 = ?
3 3

rQ3 = n = 30 = 22
4 4

Q3 = xQ3 +

Q3 = 5,3 +

Q3 [5,3 6,9)

( )l

N (Q3 ) N xQ3
N Q3

Q3

22,5 19
1,6 = 6,42 mld.lei
5

75% din societile comerciale cu capitalul social 6,42 mld.lei


iar 25% din societile comerciale cu capitalul social >6,42 mld.lei

Abaterile intercuartile vor fi:

Q3 Q1 6,42 1,83
= 2,3 mld .lei
2 =
2
Q Q
1
3
100 62%
2 M e
Abaterea variantelor pentru capitalul social dintre Q1 i Q3 de la valoarea median, deci pentru 50%
din populaie, este de 2,3 mld.lei. Mediana nu este prea reprezentativ.
Pentru msurarea abaterii de la valoarea median pentru 80% din populaie, vom folosi abaterile
interdicile:
D D1
-absolut: 9
=?
2
D D1
-relativ: 9
=?
2 Me
Me = 3,7 mld.lei
Calculm cuartilele D1 i D9:
D1 = ?
1 1

rD1 = n = 30 = 3 D1 [0,5 2,1)


10 10

D1 = xD1 +

( )l

N ( D1 ) N xD1
ND

D1

30
1,6 1 mld.lei
9
10% din populaie are capitalul social 1 mld.lei
iar 90% din populaie are capitalul social >1 mld.lei
D1 = 0,5 +

D9 = ?
rD9 = xD9 +

N ( D9 ) N ( xD9 )
N D9

l D9

27 24
1,6 = 8,5 mld.lei
3
90% din societile comerciale cu capitalul social 8,5 mld.lei
iar 10% din societile comerciale cu capitalul social >8,5 mld.lei
D9 = 6,9 +

Abaterile interdecile vor fi:

D9 D1 8,5 1
=
= 3,75 mld .lei
2
2
D D
8,5 1
1
9
100 =
100 101,4%
2 M e
2 3,7
Abaterea variantelor pentru capitalul social dintre D1 i D9 de la valoarea median, deci pentru 80%
din populaie, este de 3,75 mld.lei (mediana nu este prea reprezentativ pentru ele).
5. Analiza statistic a structurii populaiei
graficul de structur : vom construi seria statistic ce are la baz indicatorul frecven relativ:

[0,5 2,1) [2,1 3,7 ) [3,7 5,3) [5,3 6,9 ) [6,9 8,5)
X 3 :
20%
13%
17%
10%
30%
360 .. 100 %
a1 .. 30%
a1 = 108
360 .. 100 %
a2 .. 20%

a2 = 72

360 .. 100 %
a3 .. 13%

a3 = 46,8

360 .. 100 %
a4 .. 17%

a4 = 61,2

360 .. 100 %
a5 .. 10%

a5 = 36

360 .. 100 %
a6 .. 10%

a6 = 36

[8,5 10,1)
10%

Structura societilor din eantion, dup capitalul social


Parametrii de structur :
Legenda: Capitalul social (mld.lei)

10%
10%

1-[0,5-2,1)

30%

2-[2,1-3,7)
3-[3,7-5,3)
4-[5,3-6,9)

17%

5-[6,9-8,5)
6-[8,5-10,1)

20%

13%

mediana:

[0,5 3,7 ) [3,7 10,1)

X :
50%
50%
cuartilele: Q1 = 1,83 mld.lei
Q2 = Me = 3,7 mld.lei
Q3 = 6,42 mld. Lei

Me = 3,7 mld.lei

[0,5 1,83) [1,83 3,7 )


X :
25%
25%

[3,7 6,42) [6,42 10,1)


25%

25%

6. Parametrii concentrrii:

ind . agr. serv. transp. constr.

X 2 :
9
4
6
6
5
5

Energia informaional: E X 2 = f i 2 ;
i =1

1
E X 2 ;1
5

25 + 81 + 16 + 36 + 36
0,22 (concentrare destul de mic)
900
1
E
k
E0 =
1
1
k
1
EX 2
5 = 0,22 0,2 = 0,025 (concentrare mic)
EoX 2 =
1
0,8
1
5

EX 2 =

[0,5 2,1)
X3 :
9

[2,1 3,7) [3,7 5,3) [5,3 6,9) [6,9 8,5) [8,5 10,1)
6

1
E X 3 ;1
6

81 + 36 + 16 + 25 + 9 + 9
0,195 (concentrare destul de mic)
900
1
EX 3
6 = 0,195 0,16 = 0,042 (concentrare mic)
=
1
0,84
1
6

EX 3 =

EoX 3

Populaia prezint o concentrare mai mare n raport cu variabilele X3 (capital social), fa de variabila
X2 (ramura de activitate).
7. Asimetria:

3 =

M X3 X3

coeficientul de asimetrie a lui Pearson

X 3 = 2,7 mld.lei
X 3 = 4,3 mld.lei

(X

3 ( 3)

3 X3 :
9

M X3 X3 =

3 =

( 1,4)3

0,23 1,83 3,43


4
5
3

53

27 9 + 2,7 6 + 0,008 4 + 5,8 5 + 39,3 3 + 125 3


8,76
30

8,76
8,76
=
= 0,45 repartiia este asimetric pozitiv fa de valoarea medie deoarece 3>0.
3
2,7
19,683
Boltirea:

3 =

(X

M X3 X3

X4

( 3)
X ) :
9

M X3 X 3 =

( 1,4)4
6

0,2 4 1,84
4
5

3,4 4
3

54

81 9 + 3,78 6 + 0,0016 4 + 10,44 5 + 133,62 3 + 625 3


= 102,65
30

102,65
102,65
3 =
3 = 1,93 3, = 1,07 repartiia aceasta este mai puin boltit dect
4
2,7
53,14
repartiia de la legea normal, deoarece 4 < 0.

4 =

8. Calculul simplificat al valorii medii:


X 3 = 4,286 mld.lei
Construim seria cu ajutorul mijloacelor intervalelor:

1,3 2,9 4,5 6,1 7,7 9,3

X 3 :
6
4
5
3
3
9
alegem c = 6,1 i d = 1,61 Y =

Y=

Y =

Y3 c
d

X 3 6,1 3 2 1 0 1 2

:
6
4 5 3 3
1,6
9

3 9 2 6 4 + 3 + 6 27 12 4 + 9
= 1,133
=
30
30

X 3 = Y 1,6 + 6,1 = 1,133 1,6 + 6,1 = 6,1 1,8128 = 4,287 mld.lei

Problema 2
Un numr de 32 de cadre didactice au efectuat ntr-o lun, fiecare cel mult dou norme. Distribu ia
acestora n raport cu salarul de ncadrare i numrul normelor efectuate este:
N

Total

S
6,2 - 6,6
5,8 - 6,2
5,4 - 5,8
5 - 5,4
Total

4
4
4
4
16

4
4
4
4
16

8
8
8
8
32

S-a notat cu N numrul normelor i S salarul exprimat n milioane lei. Folosind proprietatea
media produsului a dou variabile este egal cu produsul mediilor s se calculeze venitul mediu
obinut de un cadru didactic n luna respectiv. Pentru a folosi proprietatea mai sus enunat este
necesar ca cele dou variabile implicate S i N s fie independente. Acesta rezult imediat din
distribuia bidimensional dat.
Trebuie artat c: M(S) M(N) = M(SN)

16 1 + 16 2
= 1,5
32
5,2 8 + 5,6 8 + 6 8 + 6,4 8 185,6
M (S ) =
=
= 5,8
32
32
4 (5,2 + 5,6 + 6 + 6,4) + 8 (5,2 + 5,6 + 6 + 6,4 ) 4 23,2 + 8 23,2
M (S N ) =
=
=
32
32
278,4
=
= 8,7 mil.lei
32
M(S) M(N) = 1,5 5,8 = 8,7 mil.lei.
M (N ) =

Un cadru didactic a primit n medie pe luna respectiv 8,7 mil.lei.

Problema 3
Cunoatem urmtoarea distribu ie a 52 de societi comerciale cu acelai profil de activitate, n
raport cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnzrilor (mil. lei).
X
Y
( 60 ; 80 ]
( 40 ; 60 ]
[ 20 ; 40 ]
Total

[3;5]

(5;7]

(7;9]

Total

2
3
14
19

7
10
2
19

8
5
1
14

17
18
17
52

Se cere:
1) S se verifice regula de adunare a varianelor
2) n ce proporie volumul vnzrilor depinde de cheltuielile cu publicitatea ?
Rezolvare:
1) Y =

30 17 + 50 18 + 70 17 2600
=
= 50
17 + 18 + 17
52

VTOT = Y2 =
Y
Y
Y

(30 50)2 17 + (50 50)2 18 + (70 50)2 17 = 13600 = 261,54


17 + 18 + 17

52

30 14 + 50 3 + 70 2 710
=
= 37,37
14 + 3 + 2
19

X (5;7]

30 2 + 50 10 + 70 7 1050
=
= 55,26
2 + 10 + 7
19

X (7;9]

30 1 + 50 5 + 70 8 840
=
= 60
1+ 5 + 8
14

X [3;5]

(37,37 Y )

VEXP =

19 + (55,26 Y ) 19 + (60 Y ) 14
=
19 + 19 + 14
2

2
2
2
(
37,37 50) 19 + (55,26 50 ) 19 + (60 50) 14
=
= 95,32

52

Y2
Y2

Y2

X [3;5 ]

X (5; 7 ]

X ( 7 ;9 ]

(30 37,37)2 14 + (50 37,37)2 3 + (70 37,37)2 2 = 177,28

(30 55,26)2 2 + (50 55,26)2 10 + (70 55,26)2 7 = 161,77

(30 60)2 1 + (50 60)2 5 + (70 60)2 8 = 157,14

14 + 3 + 2

2 + 10 + 7

1+ 5 + 8

VREZ = Y2 =

Y2

X [3; 5 ]

19 + Y2

X ( 5;7 ]

19 + Y2

19 + 19 + 14

X ( 7 ;9 ]

14
=

177,28 19 + 161,77 19 + 157,14 14


= 166,19
52

Se observ c:
Y2 Y2 / X + Y2 / X
261,54 95,32 + 166,19

Y
VEXP
95,32
2)
100% = 2X 100% =
100% = 36,4%
VTOT
261,54
Y
Volumul vnzrilor depinde n proporie de 36,4% de cheltuielile cu publicitatea i n proporie de
63,6% de ali factori.

Problema 4
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee produsul a fost propus la preuri diferite
(P), veniturile consumatorilor (V) fiind i ele diferite. Pe fiecare pia s-a nregistrat un anumit nivel al
cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13

Cerere (C)
15,4
3,2
4,9
10,5
8,0
5,1
7,6
11,3
14,0
6,4
13,2
8,8
12,1

Pre (P)
1,4
5,1
2,5
1,7
1,8
3,4
2,1
1,6
3,6
3,5
1,9
1,8
1,9

Venit (V)
620
530
490
800
630
410
670
920
990
320
520
700
730

Determinai:
a) cererea medie;
b) variana pentru variabila cerere;
c) cu ct se abate n medie cererea de la o pia la alta;
d) cu ct la sut se abate n medie cererea de la o pia la alta.
Obs. Rezolvarea decurge n mod analog pentru celelalte variabile.
a) Cererea medie C este:
15,4 + 3,2 + 4,9 + ... + 8,8 + 12,1 120,5
C =
=
= 9,27 u.m.
13
13
b) Variana C2 se calculeaz conform definiiei:
13

(x
C2 =

X ) Ni
2

i =1

13

i =1

ntruct seria prezint frecvene absolute egale N i = 1, i = 1,13 , se utilizeaz urmtoarea expresie de
calcul a varianei:
13

(x X ) (15,4 9,27) + (3,2 9,27)


=
=
2

C2
c) C =

i =1

13

2
C

13

= 13,48 = 3,67 u.m.

+ ... + (12,1 9,27)

175,2277
= 13,48
13

cererea se abate n medie de la o pia la alta cu 3,67 u.m.

d) Abaterea medie ptratic exprimat sub form relativ, prin intermediul coeficientului de variaie
Pearson este:

3,67
CV (C ) = C 100% =
100% = 39,59%
C
9,27
cererea se abate n medie cu 39,59% de la o pia la alta

Problema 5
Repartiia angajailor ntr-o societate comercial, n raport cu salariul lunar (exprimat n lei), este
caracterizat prin urmtoarea serie:

560 700 700 840


X :
143
75

840 980 980 1120 1120 1260 1260 1400

196
68
43
25

S se determine:
a) valoarea median;
b) valoarea modal;
c) valorile quartile, valorile decile (vom calcula ca exemplu D1, D3, D7) i valorile centile (vom calcula
ca exemplu C58, C76).
Rezolvare:
a) Prima etap n calculul medianei o constituie calculul rangului, dup cum urmeaz:
1 R
1
550
rMe = N i = (75 + 143 + 196 + 68 + 43 + 25) =
= 275
2 i =1
2
2
Urmtoarea etap const n determinarea intervalului median. nsumnd frecvenele succesiv, pn ce
valoarea obinut depete rangul, rezult c intervalul care va conine mediana este [840-980).
N 1 + N 2 + ... + N i > rM e

75 + 143 + 196 = 414 > 275


M e [840 980)
n fine, ultima etap este cea n care se determin valoarea median. Fiind vorba de o serie care are la
baz o variabil continu, mediana se obine conform relaiei:
N (M e ) N x M e
M e = xM e +
l M e , unde
N Me

( )

x M e - limita inferioar a intervalului median;

N (M e ) - frecvena absolut cumulat pn la median (rangul medianei);


N xM e - frecvena absolut cumulat pn la intervalul median;

( )

N M e - frecvena absolut a intervalului median;


l M e - lungimea intervalului median.

275 218
(980 840) = 880,71 lei
196
Aadar, jumtate dintre angajaii societii respective ctig cel mult 880,71 lei, iar cealalt jumtate
ctig cel puin 880,71 lei n perioada n care s-a fcut observarea.
Relevant n acest sens este urmtoarea serie, construit avnd n vedere mediana, i care
constituie repartiia celor dou jumti din populaia angajailor:
M e = 840 +

560 880,71 880,71 1400

Y :
50%
50%

b) Calculul valorii modale presupune n primul rnd gsirea intervalului modal (a intervalului cruia i
corespunde frecvena cea mai mare). Frecvena cea mai mare este 196 i ca urmare, intervalul modal
este [840-980).
n continuare se aplic relaia de calcul a valorii modale:
1
M o = xM o +
l , unde
1 + 1 M o
x M o - limita inferioar a intervalului modal;
1 - diferena dintre frecvena intervalului modal i frecvena intervalului precedent;
1 - diferena dintre frecvena intervalului modal i frecvena intervalului urmtor;
l M o - lungimea intervalului modal.
196 143
53
(980 840) = 840 +
140 881 lei
(196 143) + (196 68)
53 + 128
Putem afirma c cei mai muli angajai ai societii comerciale respective au un salar lunar n jur de
881 lei.

M o = 840 +

c) Pentru calculul valorilor quartile se determin mai nti rangul fiecrei quartile.
1 R
N
550
rQ1 = 1 N i =

rQ1 =
= 137,5
4 i =1
4
4
1 R
N
550
rQ2 = 2 N i = 2

rQ2 = 2
= 275
4 i =1
4
4
1 R
N
550
rQ3 = 3 N i = 3

rQ3 = 3
= 412,5
4 i =1
4
4
n continuare se determin intervalele quartile:

- primul interval care satisface inegalitatea: N 1 + N 2 + ... + N i

1 R
N i este [700-840) i reprezint
4 i=1

intervalul quartilei mici Q1;

75 + 143 = 218 > 137,5


Q1 [700 840)
- pentru quartila mijlocie Q2, intervalul cutat este chiar intervalul median [840-980);
1 R
N 1 + N 2 + ... + N i 2 N i
4 i =1
Q2 = M e [840 980)
75 + 143 + 196 = 414 > 275
1 R
- primul interval care satisface inegalitatea N 1 + N 2 + ... + N i 3 N i este [840-980) i reprezint
4 i =1
intervalul quartilei mari Q3;
75 + 143 + 196 = 414 > 412,5
Q3 [840 980)
Etapa final const n calculul valorilor quartile dup urmtoarea relaie:
N (Q p ) N xQ p
Q p = xQ p +
lQ p , p = 1,3 , unde
N Qp

( )

xQ p - limita inferioar a intervalului quartilei Qp;


N (Q p ) - rangul quartilei Qp;

( )

N xQ p - frecvena absolut cumulat pn la intervalul quartilei Qp;


N Q p - frecvena absolut a intervalului quartilei Qp;
lQ p - lungimea intervalului quartilei Qp.

137,5 75
(840 700) = 761,19 lei, ceea ce nseamn c 25% dintre angajaii
143
societii ctig cel mult 761,19 lei
275 218
(980 840) = 880,71 lei
Q2 = 840 +
196

25% dintre angajaii societii au un salar cuprins ntre 761,19 lei i 880,71 lei
Q1 = 700 +

412,5 218
(980 840) = 978,93 lei
196

25% dintre angajaii societii au un salar cuprins ntre 880,71 lei i 978,93 lei. Mai putem
spune i c 25% dintre angajaii societii ctig cel puin 978,93 lei.
Relevant n acest sens este urmtoarea serie, construit avnd n vedere valorile quartile:
Q3 = 840 +

560 761,19 761,19 880,71 880,71 978,93 978,93 1400

Z :
25%
25%
25%
25%

Calculul decilelor:
ntr-o prim faz se calculeaz rangul conform relaiei:
1 R
N
rD p = p N i = p , p = 1,9
10 i =1
10
550
550
550
Obinem:
rD1 = 1
= 55 ;
rD3 = 3
= 165 ; rD7 = 7
= 385
10
10
10
Pentru fiecare decil Dp, p = 1,9 , se determin intervalul decil corespunztor, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p N i , p = 1,9
10 i =1
75 > 55
D1 [560 700)

75 + 143 = 218 > 165

D3 [700 840)

75 + 143 + 196 = 414 > 385 D7 [840 980)


n final se calculeaz decila corespunztoare, dup relaia:
N (D p ) N x D p
D p = xDp +
l D p , p = 1,9 , unde
N Dp

( )

x Dp - limita inferioar a intervalului decilei Dp;

N (D p ) - rangul decilei Dp;

( )

N x D p - frecvena absolut cumulat pn la intervalul decilei Dp;


N D p - frecvena absolut a intervalului decilei Dp;
l D p - lungimea intervalului decilei Dp.
55 0
(700 560) = 662,67 lei
75
10% dintre angaja i ctig cel mult 662,67 lei, respectiv 90% dintre angajai ctig cel puin
662,67 lei
165 75
D3 = 700 +
(840 700) = 788,11 lei
143
30% dintre angaja i ctig cel mult 788,11 lei, respectiv 70% dintre angajai ctig cel puin
788,11 lei
385 218
D7 = 840 +
(980 840) = 959,29 lei
196
70% dintre angaja i ctig cel mult 959,29 lei, respectiv 30% dintre angajai ctig cel puin
959,29 lei

D1 = 560 +

Calculul centilelor:
Se calculeaz rangul dup relaia:
1 R
N
rC p = p
Ni = p
, p = 1,99
100 i=1
100
550
550
Obinem:
= 319 ;
= 418
rC58 = 58
rC76 = 76
100
100
Se determin intervalul corespunztor, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p
N i , p = 1,99
100 i =1
75 + 143 + 196 = 414 > 319
C58 [840 980)

C 76 [980 1120)
75 + 143 + 196 + 68 = 482 > 418
n final se calculeaz centila corespunztoare, dup relaia:
N (C p ) N xC p
C p = xC p +
l C p , p = 1,99
N Cp

( )

319 218
(980 840) = 912,14 lei
196

58% dintre angajaii societii ctig cel mult 912,14 lei, respectiv 42% dintre angajai ctig
cel puin 912,14 lei
C 58 = 840 +

C 76 = 980 +

418 414
(1120 980) = 988, 24 lei
68


76% dintre angajaii societii ctig cel mult 988,24 lei, respectiv 24% dintre angajai ctig
cel puin 988,24 lei.
Probleme propuse:
1. n vederea studierii situaiei actuale pe piaa aciunilor, s-a format un eantion reprezentativ de
volum 40, a crui repartiie n raport cu preul (n mii lei) este:

10 16 16 22 22 28 28 34 34 40

X :
5
15
10
6
4
Se cere:
a)
b)
c)
d)
e)
f)

preul mediu;
preul nregistrat de cele mai multe aciuni din eantion;
acel pre care divide eantionul n dou pri egale;
reprezentativitatea preului mediu;
s se calculeze cu ct se abate n mediu preul unei aciuni din eantion de la preul mediu;
folosind valorile cuartile s se studieze structura aciunilor n raport cu preul.

2. ntr-o firm s-au realizat 40 de produse n cadrul unui trimestru. Acestea au fost propuse
prelucrrii n mod secvenial n dou secii de producie. Repartiia produselor realizate n raport
cu costurile (mii lei) din cele dou secii a fost:
C2
C1
62 66
58 62
54 58
50 58

100 - 108

108 - 116

116 - 124

124 - 132

3
1
1

2
5
10
3

1
3
5
1

1
1
3

Folosind proprietatea conform creia media sumei a dou variabile este egal cu suma mediilor
acestora, calculai costul mediu pe produs.
3. Distribuia a 100 de angajai din trei ramuri de activitate diferite, n raport cu salarul primit este:
R
S
8,0 8,5
7,5 8,0
7,0 7,5
6,5 7,0
6 6,5
Total

R1

R2

R3

6
6
7
11
10
40

8
7
10
5

7
8
5

30

10
30

Folosind proprietatea de aditiune a mediei aritmetice s se calculeze salarul mediu pe angajat.

Capitolul 4
ANALIZA LEGTURILOR DINTRE VARIABILELE
UNEI REPARTIII MULTIDIMENSIONALE
n capitolul precedent au fost prezentate metode statistice de analiz ale seriilor
unidimensionale. n capitolul de fa ne propunem abordarea unor metode statistice caracteristice
studiului seriilor multidimensionale. Scopul acestora este de a identifica i utiliza eventualele legturi
care se pot manifesta ntre dou sau mai multe variabile. Ne pot interesa: existena legturii,
intensitatea acesteia, forma funcional a legturii, parametrii i reprezentativitatea ei privind
fenomenul cercetat. Problematica legturilor dintre variabile este foarte curent ntlnit n economie.
Spunem c salariul unui angajat este n funcie de productivitatea muncii sale, vechimea n munc,
responsabilitatea activitii sale, etc ; sau cererea dintr-un produs este n funcie de preul produsului,
venitul consumatorilor, etc. De fiecare dat, att n teoria economic, ct i n aplica ii se ntlnete
expresia fie funcia cererii. n realitatea economic ns, aceast funcie nu se d, nu se cunoate,
ci trebuie estimat pornind de la o baz de date. Aceast problem de estimare a unei funcii i alte
probleme colaterale ei fac obiectul acestui capitol.
Pentru a putea aborda studiul legturilor dintre variabile trebuie s tim n primul rnd dac
exist sau nu o legtur ntre variabilele studiate (sau ntre fenomenele pe care acestea le reprezint) i
care este natura acestora. Putem clasifica legturile dinte variabile astfel :
1. Leg tura nul. Semnific lipsa oricrei legturi ntre dou sau mai multe fenomene sau
variabile care cuantific fenomenele. De exemplu, o legtur nul se manifest ntre nlimea unui
angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta primului ministru. Din
punct de vedere statistic, spunem c ntre dou variabile X i Y exist o legtur nul, sau nu exist
legtur, dac cov( x, y ) = 0 .
2. Legtura determinist . Spunem c ntre variabilele X i Y exist o legtur determinist
dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de legturi se ntlnesc n special
n fizic, unde de exemplu viteza este egal cu distana mprit la timp: v = d / t , sau fora este egal
cu masa nmulit cu acceleraia: F = m a . Astfel de exemple exist i n economie, unde rata
profitului este egal cu profitul mprit la cifra de afaceri: r = / C . A. 100% . Legtura este
determinist pentru c variabila r este perfect determinat de celelalte dou: i C.A. Adic pentru
o anumit valoare a profitului i o anumit valoare a cifrei de afaceri nu putem avea dect o singur
valoare a ratei profitului.
3. Leg tura statistic. Se mai numete i stocastic sau probabilist. Este tipul de legtur cel
mai des ntlnit n tiinele sociale, deci i n economie. Fiecrei valori xi a variabilei X i corespunde
o distribuie de valori ale variabilei Y. Matematic, o astfel de legtur se exprim sub forma
y = f ( x) + , unde am notat prin componenta aleatoare rezidual, datorat aciunii asupra lui Y a
celorlal i factori dect X. Dei s-ar putea spune c prin luarea n considerare a tuturor factorilor care
influeneaz variabila Y, legtura este intrinsec determinist, n tiinele economice vom ntlni
aproape ntotdeauna un numr foarte mare de factori, care nu pot fi identifica i i cuantificai n
totalitatea lor. Asfel, funcia care l expliciteaz pe Y are dou componente: una determnist,
f ( x1 , x2 ,..., xn ) , cuprinznd variabilele cuantificabile de care depinde Y, i una aleatoare, ,
cuprinznd variabilele ce nu au putut fi cuantificate.
Sudiul legturilor dintre variabile s-a dezvoltat ntr-o disciplin aparte, numit econometrie. n
capitolul de fa nu ne propunem deci dect o introducere n aceast problematic, fr a aborda
elemente de inferen statistic specifice acestor legturi. n cele ce urmeaz vom prezenta cteva
aspecte legate de variabile i fenomenele reprezentate de acestea, probleme att de natura aparatului
statistic utilizat, ct i de aplicabilitatea lui n contextul economic.
1. Natura probabilist a legturilor. Aceast natur are ca urmare un anume grad de
nedeterminare ceea ce duce la o dificil identificare a corelaiilor dintre variabile. Nedeterminarea

parial se datoreaz multitudinii factorilor care determin un anumit fenomen. Mecanismul proceselor
economice este adeseori deosebit de complex, presupunnd existena unui numr foarte mare de
factori de luat n considerare. Structurile cauzale se pot dovedi a fi complicate, cauza unui fenomen
depinznd la rndul ei de o alt cauz. De asemenea legturile pot fi att univoce ct i biunivoce,
dou variabile putnd fi n acelai timp cauz i efect. De multe ori chiar teoria economic poate
clarifica situaia, mecanismul formrii cererii de exemplu fiind explicat prin pre i venit. n alte cazuri
ns, din lipsa unei teorii pertinente ntr-un anumit domeniu se poate ncepe prin instrumentul statistic,
iar dac anumite ipoteze formulate se adeveresc prin efectuarea observaiilor, se ncearc o justificare
economic a rezultatului gsit. Aceast din urm cale poate fi totui periculoas dac explicaia
economic nu este gsit, deoarece din punt de vedere statistic se poate identifica o corelaie puternic
ntre dou variabile aparent fr nici o legtur ntre ele, deoarece se realizeaz prin intermediul unei a
treia variabile, care poate fi cauza comun a celorlalte dou.
Toat aceast argumentaie mai sus expus nu este fcut cu scopul de a ncurca i mai mult
cititorul, ci pentru a atrage atenia att asupra coplexit ii problematicii acestui capitol, ct i a
modului de utilizare a aparatului statistic ce urmeaz a fi expus, nu ntr-un mod mecanic, dup o
anumit reet, ci n strns legtur cu teoria economic.
2. Variabilele endogene, exogene i reziduale. n studiul legturilor dintre fenomene intervin
mai multe tipuri de variabile, dup rolul jucat de ele n funcia care expliciteaz legtura. Variabila
efect, cea pe care dorim s o explicm prin intermediul altor factori se numete variabil endogen
(sau explicat sau dependent ) i obinium s o notm cu Y. Factorii de influen (cei cuantificabili),
variabilele prin care explicitm fenomenul, se numesc variabile exogene (sau explicative sau
factoriale). Obinuim s le notm cu X 1 , X 2 ,..., X n . Variabilele care au influen asupra fenomenului
cercetata, a variabilei endogene, dar care nu pot fi identificate sau cuantificate, se grupeaz sub forma
unei variabile reziduale, notat cu .
Identificarea variabilelor explicative n scopul studierii influenei lor asupra celei dependente
se bazeaz pe cunotinele i experiena specialistului n domeniul cercetat, dar i pe metode statistice
specifice. n economie majoritatea legturilor ntre variabile sunt cunoscute pornind de la teoria
economic. Totui, fiecare situaie economic concret poate presupune o alt intensitatea a legturii,
o alt influen a fiecrui factor asupra variabilei enndogene. n alte cazuri ns, dependenele teoretice
nu se cunosc, ci trebuie identificate pe baza observrii fenomenelor studiate. Aceste fenomene vor
trebui ns urmrite n timp pentru a verifica dac legtura este una conjunctural sau ine de un
anumit mecanism economic.
n funcie de situaia concret n fiecare domeniu sau caz, n alegerea variabilelor explicative se
poate proceda n dou moduri:
a) Introducerea succesiv a variabilelor n model (funcie). Pentru nceput se aleg variabilele
presupuse a fi cele mai semnificative. Dac fenomenul cercetat nu este suficient de bine
explicat de acestea, se mai introduc variabile pn la obinerea unei funcii satisfctoare.
b) Eliminarea succesiv a variabilelor din model. Dac funcia care conine toate variabilele
explicative (sau potenial explicative) este prea ncrcat, se poate renuna la o parte din
ele, care se dovedesc neeseniale, adic explic o prea mic parte din fenomenul cercetat.
Alegerea uneia sau alteia din metode poate depinde i de scopul cercetrii. Scopul studiului trebuie
s ne indice precis variabila de explicat i ne poate sugera unele variabile explicative. Alegerea
acestora ns, poate s fie condiionat de bugetul alocat care s nu permit o extindere prea mare a
numrului lor. n acelai timp un numr mare de variabile explicative explic mai bine un
fenomen, dar face modelul mai complicat, mai dificil de neles i utilizat. Scopul este deci
identificarea unui model ct mai simplu, dar care s cuantifice ct mai mult variaia explicit.
3. Multicoliniaritatea. Aa cum am mai precizat, un model cuprinde o variabil de explicat Y
i cteva variabile explicative X 1 , X 2 ,..., X n . Acestea din urm trebuie s fie independente ntre
ele, dar corelate cu variabila dependent. n cazul n care condiia nu este ndeplinit, apare
fenomenul de multicoliniaritate. Neluarea n considerare a acestuia duce la erori de estimare i
dificulti de utilizare a modelului. De exemplu, nu putem ti cum se modific Y la o modificare a
unei variabile factoriale oarecare X i , n condiiile n care celelalte rmn constante. Corelaia

dintre ele nu permite modificarea uneia fr modificarea celorlalte. n acest fel, nu putem simula
prin funcie o anumit situaie prin modificarea valorilor variabilelor factoriale i studiul
impactului acestor modificri asupra celei endogene.
Eliminarea multicoliniaritii se face prin renunarea la unele variabile ntre care exist
corelaii. Putem proceda astfel, deoarece nu se pierde toat informaia coninut n ele, ea existnd
de asemenea n mare parte n variabilele rmase. Nu trebuie exagerat totui eliminarea, deoarece
duce la o mai proast specificare a varianei explicate.
4. M surarea variabilelor. Variabilele din model trebuie exprimate n aa fel nct s
permit o ct mai uoar i corect prelucrare, estimare i utilizare. Este vorba att de unitatea de
msur, ct i de indicatorul n care sunt exprimate. Nu sunt rare situaiile n care este preferat
utilizarea diferenelor relative i absolute, a indicilor, logaritmilor, exponenilor, etc.
5. Modelul matematic. Este o etap care urmeaz n mod firesc dup stabilirea variabilelor
din model. Si aici n majoritatea cazurilor teoria economic este cea care ne furnizeaz i forma
legturii. n multe situaii ni se pare normal ca relaia dintre factori trebuie s fie aditiv,
multiplicativ, exponenial, etc, sau dup o funcie compus. Enumerm aici cu titlu de exemplu
funciile Cob-Douglas, Tornquist, Philips. n cazul n care tipul relaiei matematice nu este
precizat, acest rol revine instrumentului statistic. Cea mai simpl metod o constituie utilizarea
unui grafic adecvat punerii n eviden a formei legturii. Totui, concluziile obinute pe baza
metodelor statistico-matematice trebuie corelate cu teoria economoc, pentru c putem trage
adeseori concluzii pripite, datorate unor valori conjuncturale ale variabilelor, cu un rol foarte mare
al factorilor reziduali.
6. Calitatea datelor. Datele ce se afl la dispoziia utilizatorului au de asemenea o mare
importan. Calitatea proast a acestora poate deteriora rezultatele modelului, chiar n urma
parcurgerii reuite a etapelor construirii acestuia.
Un aspect al calitii datelor l reprezint numrul de observaii, acurateea i corectitudinea
culegerii i nregistrrii lor. O funcie va fi cu att mai bun cu ct se bazeaz pe o baz de date
mai important. Ne putem uor imagina ce concluzii eronate am putea s trgem dintr-o funcie care
explic inteniile de vot pentru un candidat sau partid n funcie de diverse variabile proprii
electorului ca vrsta, profesia, venitul, etc, dac studiul are loc pe folosind date cu privire la trei
persoane.
Un alt aspect l reprezint omogenitatea populaiei supuse studiului. Cu ct populaia este
mai omogen, cu att se mrete ponderea varianei explicate pe baza acelorai variabile. Pentru
populaii foarte eterogene se poate dovedi benefic o mprire a acestora n clase i construirea
unui model n fiecare clas.
n cazul (i este cel mai des ntlnit) n care datele provin dintr-un eantion este necesar
urmrirea reprezentativitii eantionului pentru populaia din care a fost extras. Altfel, rezultatele
modelului nu pot fi extinse pentru ntreaga populaie. Lund acelai exemplu de mai sus, ne putem
imagina ce concluzii am putea trage la nivelul ntregului electorat dac datele disponibile s-ar
referi numai la un singur segment de vrst sau venit.
Analiza legturii dintre variabilele unei repartiii multidimensionale presupune abordarea
urmtoarelor probleme, care se pot constitui i n etape ce trebuie parcurse n demersul statistic
necesar:
1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu variabilele
cercetate
2. Analiza statistic a existenei legturii
3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate
4. Formularea unor ipoteze cu privire la forma matematic a legturii
5. Estimarea parametrilor funciei de regresie
6. Analiza reprezentativitii funciei de regresie
Aceste etape pot fi parcurse integral sau parial, n funcie de natura variabilelor. Pentru variabilele
calitative nu vor fi parcurse (n statistica descriptiv) dect primele trei, deoarece posibilitile de

prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi parcurse n cazul variabilelor
cantitative.

4.1. Organizarea rezultatelor observ rii populaiei sau eantionului n raport cu variabilele
cercetate
n scopul utilizrii facile a informaiei culese la nivelul populaiei sau eantionului, rezultatele
observrii vor fi sistematizate ntr-o form convenabil prelucrrii lor. Se prefer de obicei o form
tabelar a prezentrii, care poate sugera unele idei de lucru pentru etapele urmtoare, prin unele
remarci cu privire la valorile pe care le-au nregistrat variabilele.
Tabelul 4.1
Nr. crt.

X1

X2

Xn

y1

x11

x21

xn1

y2

yN

x12
...
...

x1N

x22
....
...

x2 N

xn 2
...

xnN

...

Aceast form de prezentare este una primar. Evident, dac necesitile oricreia din etapele
urmtoare o cer, datele pot fi prezentate i sub alte forme tabelare sau grafice convenabil alese.

4.2. Analiza statistic a existenei leg turii


n studiul analizei existenei legturii vom folosi att elemente de statistic deja abordate n
capitolele anterioare, cum ar fi tabelele i graficele, ct i parametri (coeficien i) specifici acestui
capitol. Deoarece prezint particulariti distincte, vom aborda separat problematica subcapitolului
n funcie de tipul variabilelor.

4.2.1. Analiza statistic a existenei legturii pentru variabile calitative


Un prim instrument ce ne st la ndemn este tabelul de corelaie, un tabel cu dou intrri,
reprezentnd o repartiie bidimensional. Modul de construcie al unui astfel de tabel se cunoate
de la seriile statistice.
Tabelul 4.2
X

x1

x2

xi

xI

Total

yJ

N1 J
.

N2J
.

N iJ
.

N IJ
.

N J
.

yj

N1 j

N2 j

N ij

N Ij

N j

y2

.
N12

.
N 22

.
.

.
N i2

.
.

.
NI2

.
N 2

y1

N11

N 21

N i1

N I1

N 1

N1

N 2

N i

N I

Total

O prim ipotez asupra existenei sau inexistenei legturii ne este furnizat de metode pur
descriptive, ca studiul tabelului de corelaie sau a norului de puncte asociat. Urmrim dac
frecvenele absolute N ij iau valori apropiate n tot tabelul, caz n care nu exist legtur ntre
variabilele X i Y, iar norul de puncte asociat prezint o repartizare omogen a punctelor pe
domeniul de valori al variabilelor. Dac frecvenele se repartizeaz dup una din diagonale sau o
curb oarecare sugernd existena unei legturi, norul de puncte asociat prezint o grupare a
punctelor dup o anumit form (o dreapt sau o curb). Cu ct norul de puncte este mai grupat, cu
att ne putem atepta mai mult la existena unei legturi.
Metodele descriptive amintite anterior sunt imediate i uor de utilizat, dar nu pot stabili clar
existena sau inexistena unei legturi. Pentru aceasta, ne vom folosi de metode cantitative, din
care cea mai utilizat este 2 . Dup cum vom vedea, aceasta utilizeaz doar frecvenele ca
informaie numeric. Evident, pentru variabilele cantitative, existena strilor numerice permite
folosirea unor metode care s in cont de acestea.
Metoda const n esen n a compara frecvenele absolute observate cu cele teoretice
corespunztoare cazului n care nu exist legtur. Frecvenele teoretice se vor calcula fcnd apel
la teoria probabilitilor. Asociem tabelului o urn cu N bile, reproducnd structura populaiei n
raport cu variabilele X i Y. Considerm N ij bile cu inscripia (i, j ) . Dac evenimentele X = xi i
Y = y i sunt independente, putem scrie:

N i N j

= Pij
N N
notnd cu Pij produsul probabilitilor celor dou evenimente. Putem astfel calcula toate
P( X = xi ; Y = yi ) = P( X = xi ) P(Y = yi ) =

frecvenele teoretice. Suma lor fiind egal cu 1, ele vor fi comparabile cu frecvenele relative
empirice. Pentru a le putea compara cu frecvenele absolute, le vom nmuli cu N. Astfel:
N i N j
N N j
N ij = Pij N = i
N =
N N
N

unde N ij sunt frecvene absolute teoretice. Obinem deci dou tabele, unul cu frecvenele absolute
reale, observate i altul cu frecvenele absolute teoretice corespunztoare cazului n care nu exist
legtur ntre variabile. Dac ntre acestea nu exist nici o diferen, concluzionm c nu exist
legtur ntre variabile. Va trebui ns s ne bazm n aprecieri pe o msur global a distanei
dintre cele dou tabele, respectiv ale frecvenelor teoretice i empirice. Aceast msur o definim
astfel:
I
J ( N N )2
2 = ij ij
N ij
i =1 j =1
Observm c dac N ij = N ij , i = 1,..., I j = 1,..., J nu exist legtur, iar 2 = 0 . Dimpotriv, cu
ct frecvenele empirice difer mai mult de cele teoretice, cu att 2 ia valori mai mari.
Ca o concluzie, distingem cele dou cazuri:
1) Dac 2 = 0 nu exist legtur ntre variabile
2) Dac 2 >> 0 exist legtur ntre variabile
n statistica descriptiv ne limitm doar la a judeca egalitatea sau nonegalitatea cu zero. n
realitate ns, pentru a garanta cu o anumit probabilitate existena legturii, 2 trebuie s
depeasc un anumit prag. Acesta ne este dat de statistica inferenial prin legea de probabilitate
2 . Astfel,
I
J ( N N )2
2
= ij ij
N ij
i =1 j =1
este o variabil 2 cu v = ( I 1)( J 1) grade de libertate. Vom compara deci valoarea calculat a
lui 2 cu valorile tabelate.

2
Dac 2 > tab
( v , p ) putem afirma cu un risc de eroare p c exist legtur ntre variabilele X i

Y. Valoarea tabelat o privim ca pe un prag peste care trebuie s treac valoarea calculat a lui 2
pentru a accepta cu o anumit probabilitate existena legturii. Cu ct riscul de eroare dorit este
2
mai mic, cu att pragul va fi mai exigent, adic tab
( v , p ) va avea o valoare mai mare.
Procedeul prezentat anterior ne permite identificarea existenei legturii dintre dou variabile,
dar nu i a intensitii acesteia. Totui, pornind de la el se pot construi coeficieni care s ne
permit i aprecierea intensitii legturii, aa cum se va vedea n seciunile urmtoare.

Exemplu
Dintre societile comerciale cotate la Bursa de Balori Bucureti am extras un eantion de 34 societi.
S se studieze existena i intensitatea legturii dintre variabilele n raport cu care s-a fcut observarea:
X domeniul de activitate al firmei i Y riscul aciunilor societii.
X
Y
Mic
Mediu
Mare
Total

Industrie
3
10
2
15

FinanciarBancar
1
2
5
8

Alte
Domenii
7
4
11

Total
11
16
7
34

Avem astfel distribuia empiric (observat) a societ ilor n raport cu cele dou variabile. Indicatorul
de la baza seriei este frecvena absolut:
N 11 = 3
N12 = 1
N13 = 7

N 21 = 10
N 31 = 2

N 22 = 2
N 32 = 5

N 23 = 4

N 33 = 0

Deducem frecvenele absolute teoretice, corespunztoare cazului n care nu exist legtur ntre
variabile:
11 15
= 4,85
34
16 15
*
= 7,06
N 21
=
34
7 15
*
N 31
=
= 3,09
34
N 11* =

11 8
= 2,59
34
16 8
= 3,76
=
34
78
=
= 1,54
34

N12* =
*
N 22
*
N 32

11 11
= 3,56
34
16 11
*
= 5,18
N 23
=
34
7 11
*
N 33
=
2,26
34
N 13* =

Scriem i sub form tabelar aceast repartiie teoretic:


X

Industrie

Y
Mic
Mediu
Mare
Total

4,85
7,06
3,09
15

FinanciarBancar
2,59
3,76
1,65
8

Calculm distana dintre cele dou tabele:

Alte
Domenii
3,56
5,18
2,26
11

Total
10
16
7
34

=
2

i =1 j =1

2 =

( N ij N ij ) 2
N ij

(3 4,85) 2 (1 2,59) 2 (7 3,56) 2


+
+
+
4,85
2,59
3,56
+

(10 7,06)2 (2 3,76)2 (4 5,18) 2


+
+
+
7,06
3,76
5,18

(2 3,09) 2 (5 1,65)2 (0 2,26) 2


+
+
= 16,77
3,09
1,65
2,26
2 >> 0 deci exist legtur ntre variabile la nivel de eantion
+

Pentru a verifica dac legtura exist i la nivel de populaie, facem apel la valorile tabelate ale
distribuiei de probabilitate 2 .
I = 3 , J = 3 , v = (3 1)(3 1) = 4
2
pentru p = 5% , tab
= 9,49

2
2 > tab
deci cu un risc de eroare de 5% acceptm existena legturii ntre cele dou
variabile
2
pentru p = 1% , tab
= 13,28

2
deci cu un risc de eroare de 1% acceptm existena legturii ntre cele dou
2 > tab
variabile

4.2.2. Analiza statistic a existenei legturii pentru variabile cantitative


Testul 2 prezentat n seciunea precedent poate fi utilizat i pentru studiul existenei
legturii dintre variabilele cantitative. Totui, acesta nu utilizeaz ca informaie numeric dect
frecvenele. n cazul variabilelor cantitative, beneficiem ca informaie numeric att de frecvene
ct i de strile variabilelor.
Aa cum s-a vzut n capitolul anterior, dac dispunem de o repartiie bidimensional, putem
descompune variana total a variabilei de explicat Y ca sum a varianelor datorate variabilei
explicative X i respectiv celorlali factori, adic:
Y2 = Y2 / X + Y2 / X
Dac nu exist legtur, adic X nu are nici o influen asupra lui Y, mediile condiionate Y / X
vor fi identice, iar dispersia lor va fi nul: Y2 / X = 0 .
Putem reine deci ca regul de decizie n statistica descriptiv:
1) Dac Y2 / X = 0 nu exist legtur ntre variabile
2) Dac Y2 / X >> 0 exist legtur ntre variabile
n statistica inferenial, la fel ca n cazul utilizrii 2 va trebui s facem apel la legile de
probabilitate, pentru a stabili o valoare care trebuie depit pentru a garanta cu o anumit
probabilitate existena legturii.

4.3. Analiza statistic a intensitii leg turii sau a gradului de asociere dintre variabilele
observate
Ca i n cazul existenei legturii, o prim apreciere a intensitii se poate face pe baza tabelului de
corelaie i a norului de puncte. Cu ct frecvenele mai mari sunt mai grupate n jurul uneia din

diagonalele tabelului de exemplu sau punctele norului sunt mai grupate n jurul unei linii, cu att
legtura este mai intens. n ceea ce privete metodele cantitative de apreciere, ele sunt mult mai
precise i ne pot oferi valori numerice ale intensitii sau gradului de asociere. Aceste metode sunt
ns diferite n funcie de tipul variabilelor i de aceea le vom aborda separat.

4.3.1. Gradul de asociere sau intensitatea legturii dintre variabilele calitative


Pentru variabilele calitative preferm s folosim noiunea de grad de asociere deoarece coeficienii
utilizeaz modul de asociere a strilor variabilelor i frecvenele, nu strile variabilelor ca n cazul
variabilelor numerice.

Coeficientul de asociere (contingen ) al lui Pearson


Acest coeficient se bazeaz pe metoda 2 utilizat la existena legturii, folosind frecvenele
absolute din tabelul de corelaie. Se poate utiliza ca o metod rapid (aceast facilitate exist chiar
i n soft-urile de birotic cum ar fi Microsoft Excel) i pentru variabilele cantitative, dar se pierde
o parte din informaie prin neutilizarea strilor numerice ale acestora.
Relaia de calcul a coeficientului este:
C=

2
N + 2

unde N este volumul populaiei. Ne intereseaz care sunt limitele acestui coeficient, pentru a-i
putea aprecia valorile numerice pe care le ia. Reamintim c 2 este o msur global a distanei
dintre dou repartiii: cea observat i cea teoretic corespunztoare cazului n care nu exist
legtur ntre variabile.
dac 2 = 0 atunci C = 0
- dac 2 atunci C 1
Ca urmare, 2 [ 0 ; 1 )
Interpretarea gradului de asociere (intensitii legturii) pe baza coeficientului este urmtoarea:
- dac C = 0 legtura este nul (lipsa legturii)
- dac C ( 0 ; 0,3 ) legtura este de intensitate slab
- dac C [ 0,3 ; 0,7 ) legtura este de intensitate medie
- dac C [ 0,7 ; 1 ) legtura este de intensitate puternic
Desigur aceste limite nu trebuie interpretate ntr-o manier foarte rigid. O legtur este tot medie
att la 0,35 ct i la 0,68. Prezint mai mult interes compararea intensitii legturii dintre aceleai
dou variabile pentru aceeai populaie n momente de timp diferite sau pentru populaii similare.
-

Exemplu
Utilizm acelai exemplu de la existena legturii.
Intensitatea legturii:
coeficientul de asociere al lui Pearson
C=

16,77
= 0,57
34 + 16,77
legtura dintre cele dou variabile este de intensitate medie
coeficientul de asociere al lui Ciuprov
C=

2
N +2

T=

2
2
=
max 2
N ( I 1)( J 1)

16,77
= 0,50
34 (3 1)(3 1)
conform i acestui coeficient legtura dintre domeniul de activitate i riscul aciunilor este de
intensitate medie.
T=

4.3.2. Gradul de asociere sau intensitatea legturii dintre variabilele ordinale


Variabilele ordinale sunt tot variabile calitative, dar ale cror stri sunt ierarhizabile. Ca exemplu
putem da inteligena sau performanele fizice ale indivizilor, atractivitatea unei firme sau a unei
ri din punctul de vedere al investitorilor, renumele firmei, etc. Un grup de firme se poate ordona
n raport cu renumele, dar pentru aceast variabil nu exist o unitate de msur foarte obiectiv,
astfel nct s putem spune c o firm este de 2,7 ori mai renumit dect alta. Ordonarea unit ilor
populaiei n raport cu strile variabilei aduce un plus de informaie fa de variabilele calitative
neordinale, informaie ce poate fi valorificat prin construirea unor coeficieni specifici lor care s
aprecieze intensitatea legturii, mai bine fundamentai dect cei anteriori.

Coeficientul de corelaie a rangurilor al lui Kendall


Pentru a putea utiliza acest indicator toate unitile populaiei trebuie s poat fi ordonate n raport
cu variabilele pentru care cercetm intensitatea legturii. Presupunem o populaie de volum n
observat n raport cu m variabile. Unitilor statistice li se atribuie ranguri n raport cu fiecare
variabil dup urmtoarea schem redat n tabelul urmtor.
Tabelul 4.3
unitatea
stat.
variabila
X1

A1

A2

Ai

An

r11

r12

r1i

r1n

X2

r21

r22

r2i

r2 n

Xj

r j1

rj 2

r ji

r jn

Xm

rm1

rm 2

rmi

rmn

Vom numi rang al unitii statistice Ai n raport cu variabila X j numrul natural r ji care indic
locul ocupat de valoarea variabilei X j nregistrat la unitatea Ai n irul ordonat al valorilor
variabilei X j nregistrate la cele n uniti considerate. Astfel, pentru fiecare variabil, rangurile
vor fi primele n numere naturale.
Legtura dintre cele m variabile va fi considerat de intensitate maxim dac dac o unitate
oarecare Ai are acelai rang n raport cu toate variabilele. O astfel de situaie este redat n tabelul
urmtor.

Tabelul 4.4
unitatea
stat.

A1

A2

Ai

An

X2

Xj

Xm

Variabila
X1

Cu ct situaia real se va apropia mai mult de situaia prezentat n tabel, respectiv rangurile se
vor dispune cam n aceeai ordine, cu att legtura va fi mai intens i invers, cu ct rangurile vor
diferi mai mult n raport cu diversele variabile, cu att legtura va fi mai slab.
Vom ncepe prezentarea corelaiei simple, ntre dou variabile X i Y. Legtura va fi direct i de
intensitate maxim dac tabelul construit pe seama rangurilor arat astfel:
Tabelul 4.5
unitatea
stat.
variabila
X
Y

A1

A2

Ai

An

1
1

2
2

i
i

n
n

n situaia contrar, n care legtura este invers i de intensitate maxim tabelul va arta astfel:
Tabelul 4.6
unitatea
stat.
variabila
X
Y

A1

A2

Ai

An

1
n

2
n-1

i
n-I+1

n
1

n toate celelalte cazuri de dispunere posibil a rangurilor, legtura va fi de intensitate mai


slab sau nul. Coeficientul de corelaie construit de Kendall va lua valoarea 1 pentru legtura
direct de intensitate maxim i 1 pentru legtura invers de intensitate maxim.
Pentru a putea construi coeficientul, vom defini mai nti indicatorul de concordan (P) i
respectiv indicatorul de discordan (Q). n raport cu variabila X se ordoneaz cresctor rangurile
unitilor, iar n raport cu variabila Y pstrm ordinea unitilor i deci o succesiune oarecare
(rezultat din ordonarea n raport cu X) a rangurilor. O astfel de situaie este redat n tabelul de
mai jos:
Tabelul 4.7
unitatea
stat.
variabila
X
Y

A1

A2

Ai

An

1
r1

2
r2

I
ri

N
rn

unde ri , i = 1,..., n reprezint unul i numai unul din numerele naturale de la 1 la n.


Pentru fiecare rang ri , i = 1,..., n , se determin numrul rangurilor mai mari dect ri
situate la dreapta, numr pe care l notm cu Pi . nsumnd toate numerele Pi , i = 1,..., n se obine
un numr notat cu P pe care l numim indicator de concordan.
n mod asemntor, pentru fiecare rang ri , i = 1,..., n , se determin numrul rangurilor
mai mici dect ri situate la dreapta, numr pe care l notm cu Qi . nsumnd toate numerele Qi ,
i = 1,..., n se obine un numr notat cu Q pe care l numim indicator de discordan. Relativ la
aceti doi indicatori se verific relaia:
n( n 1)
P+Q =
2
Pe baza indicatorilor de concordan i discordan construim coeficientul de corelaie simpl a
rangurilor al lui Kendall, definit astfel:
P Q
PQ
=
=
P + Q n( n 1)
2
n cazul unei legturi directe de intensitate maxim, P va lua valoare sa maxim, iar Q pe cea
n( n 1)
minim, adic: P =
iar Q = 0 , deci = 1 .
2
n cazul unei legturi inverse de intensitate maxim, P va lua valoare sa minim, iar Q pe
n (n 1)
deci = 1 .
cea maxim, adic: P = 0 iar, Q =
2
n cazul lipsei legturii, P = Q , iar = 0 .
Putem determina astfel intervalul n care va fi cuprins , respectiv [-1 ; 1] . Interpretarea
intensitii legturii pe baza acestui coeficient se va face astfel:
- dac > 0 legtura este direct
- dac = 0 legtura este nul
- dac < 0 legtura este invers
- dac [0 ; 0,3) legtura este de intensitate slab
-

dac [0,3 ; 0,7) legtura este de intensitate medie

dac [0,7 ; 1] legtura este de intensitate puternic

Exemplu
Vom lua ca exemplu 10 firme dintr-un anumit domeniu n raport cu variabilele X=renumele firmei
(ct este de cunoscut n rndul consumatorilor) i Y=ncrederea n produsele firmei. Rezult dup
observare urmtorul tabel al rangurilor:
Tabelul 4.8
unitatea
stat.
Variabila
X
Y

A1

A2

A3

A4

A5

A6

A7

A8

A9

A10

1
2

2
3

3
1

4
5

5
6

6
4

7
7

8
9

9
8

10
10

Calculm indicatorii de concordan i discordan:


P = 8 + 7 + 7 + 5 + 4 + 4 + 3 + 1 + 1 = 40
Q = 1+1 + 0 +1 +1+ 0 + 0 +1 + 0 = 5
De unde rezult coeficientul de corelaie a rangurilor al lui Kendall:

P Q 40 5
=
= 0,78
P + Q 40 + 5
deci ntre renumele firmei i ncrederea n produsele sale exist o legtur direct foarte puternic.

Coeficientul de concordan multipl a rangurilor al lui Kendall


Trecem acum la cazul mai general, cu m variabile, pentru o populaie de volum n. Legtura va fi
de intensitate maxim dac dac fiecare unitate a populaiei are acelai rang n raport cu toate
variabilele. Deoarece ntre dou variabile poate exista o legtur direct, ntre altele dou o
legtur invera, nu putem aprecia pe ansamblu un sens al legturii. De aceea, coeficientul va fi
unul de cuncordan i nu de corelaie. El se definete tot pe baza tabelului rangurilor, considernd
urmtorul sistem de numere:
S = {S1 , S 2 ,..., S k ,..., S n }
unde S k , k = 1,..., n este suma rangurilor pentru cele m variabile n raport cu unitatea Ak . Dac
legtura este direct de intensitate maxim, avem:
S = {m , 2 m , ... , nm}
Dac nu exist legtura (rangurile sunt perfect amestecate) avem:
S1 = S 2 = ... = S k = ... = S n
iar dispersia lor va fi nul.
Calculm dispersia n cazul legturii de intensitate maxim:
m + 2 m + ... + nm m( n + 1)
=
n
2
2
2
2
m
+
(
2
m
)
+
...
+
(
nm
)
m 2 (n + 1)(2n + 1)
M (S 2 ) =
=
n
6
2
2
m (n 1)
S2 = M ( S 2 ) [ M ( S )]2 =
12
Considernd c dispersia efectiv a sistemului S este proporional cu concordana dintre
cele m variabile, coeficientul de concordan multipl a rangurilor al lui Kendall se definete
astfel:
2 (efectiva ) S2 (efectiva)
k = S2
=
m 2 (n 2 1)
S (maxima)
12
Deoarece ne arat doar intensitatea, nu i sensul legturii, k [0 ; 1] . Interpretarea intensitii
legturii pe baza acestui coeficient se va face astfel:
- dac k = 0 legtura este nul
- dac k [0 ; 0,3) legtura este de intensitate slab
- dac k [0,3 ; 0,7) legtura este de intensitate medie
- dac k [0,7 ; 1] legtura este de intensitate puternic
M (S ) =

Exemplu
Ca exemplu, lum aceleai 10 fime, dar pe lng variabilele X=renumele firmei (ct este de
cunoscut n rndul consumatorilor) i Y=ncrederea n produsele firmei vom lua n calcul i
Z=performanele economice (poate fi cifra de afaceri, profitul, mrimea dividendelor, etc).
Tabelul 4.9
unitatea
stat.
Variabila
X
Y
Z
S

A1

A2

A3

A4

A5

A6

A7

A8

1
2
2

2
3
4

3
1
1

4
5
5

5
6
3

6
4
7

7
7
8

8
9
6

14

14

17

22

23

A9
9
8
10
27

A10
10
10
9
29

5 + 9 + 5 + 14 + 14 + 17 + 22 + 23 + 27 + 29
= 16,5
10
52 + 9 2 + 5 2 + 14 2 + 14 2 + 17 2 + 222 + 232 + 27 2 + 292
M (S 2 ) =
= 339,5
10
S2 (efectiva ) = M (S 2 ) [M ( S )]2 = 339,5 16,52 = 67,25
M (S ) =

m 2 (n 2 1) 32 (102 1)
=
= 74,25
12
12
2 (efectiva ) 67,25
k = S2
=
= 0,91
S (maxima) 74,25
Exist deci o legtur de intensitate foarte mare ntre renumele firmei, ncrederea n produsele ei i
performanele sale economice.

S2 (maxima) =

Coeficientul de corelaie a rangurilor al lui Spearman


Ca i coeficientul similar propus de Kendall, i acesta se calculeaz pornind de la tabelul de
concordan a rangurilor. Ne vom folosi de diferenele d i dintre ranguri pentru aceeai unitate a
populaiei relativ la cele dou variabile. Coeficientul are urmtoarea expresie:
n

6 d i2

= 1

i =1

n(n 2 1)
Vom lua ca exemplu numeric aceeai populaie i variabile ca i n cazul coeficientului similar al
lui Kendall. Limitele celor doi coeficieni sunt aceleai, la fel i interpretrile valorilor numerice.
Tabelul 4.10
unitatea
stat.
variabila
X
Y
di

A1

A2

A3

A4

A5

A6

A7

A8

A9

A10

1
2
-1

2
3
-1

3
1
2

4
5
-1

5
6
-1

6
4
2

7
7
0

8
9
-1

9
8
1

10
10
0

6(1 + 1 + 4 + 1 + 1 + 4 + 0 + 1 + 1 + 0)
= 0,92
10(10 2 1)
Exist deci o legtur puternic ntre cele dou variabile. Valoarea numeric este diferit fa de
cea a coeficientului lui Kendall. Nu trebuie privite ns ntr-un mod foarte rigid valorile obinute.

= 1

Nu este important alegerea unuia sau altuia din coeficien i, ci folosirea aceluiai coeficient pentru
aceeai populaie la momente diferite de timp sau populaii perechi.

Exemplu
Coeficientul de corelaie a rangurilor al lui Spearman cazul n care dou sau mai multe ranguri sunt
identice. Se consider 10 mrci de automobile n raport cu variabilele X gradul de apreciere i de
ncredere al utilizatorilor i Y nivelul de siguran (poate fi reprezentat de punctajul obinut la testele
de specialitate sau de elementele de siguran activ i pasiv din dotare). Se cere s se caracterizeze
legtura dintre cele dou variabile, dac aceasta exist.
Avem urmtorul tabel al rangurilor:
unit. statistic A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
variabila
X
1
2
3
4
5
6
7
8
9
10
Y
2
1
2
4
7
5
8
6
8
10
di
-1
1
1
0
-2
1
-1
2
1
0
Se poate observa c n cazul variabilei Y exist uniti statistice care au acelai rang (deci au aceeai
valoare a variabilei), i anume: A1 i A3 au rangul 2, respectiv A7 i A9 au ambele rangul 8. Alte
asemenea situaii sunt frecvent ntlnite n ntrecerile sportive (fotbal, gimnastic, etc.), n analiza
competiional (care vizeaz alctuirea topului firmelor de pe o anumit pia), dar i n alte domenii.
Coeficientul de corelaie a rangurilor al lui Spearman are expresia:
n

6 d i2

= 1

i =1
2

n n 1
6 (1 + 1 + 1 + 0 + 4 + 1 + 1 + 4 + 1 + 0 )
6 14
84
= 1
= 1
= 0,92
Deci: = 1
2
10 99
990
10 (10 1)
Exist deci o legtur direct foarte puternic ntre cele dou variabile considerate.

4.3.3. Intensitatea leg turii dintre variabilele cantitative


n cazul variabilelor calitative i ordinale am construit coeficieni care s msoare
intensitatea legturii bazndu-ne doar pe frecvene sau ranguri. Variabilele cantitative dispun de
stri numerice pe care le vom utiliza n construirea unor indicatori specifici.

Raportul de corelaie
Folosind regula de adunare a varianelor descompunem variana total a variabilei de explicat Y ca
sum a varianelor datorate variabilei explicative X i respectiv celorlali factori, adic:
Y2 = Y2 / X + Y2 / X
Variana explicit Y2 / X este cu att mai mare cu ct mediile condiionate Y / X sunt mai diferite
ntre ele. Ceea ce le face s difere este numai influena lui X, deoarece am mprit populaia n
grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim variana explicit ca o
mrime absolut a intensitii legturii dintre X i Y i ponderea varianei explicite n variana
total ca o mrime relativ. Raportul de corelaie are expresia:
Vexp
V
RYX =
= 1 rez
Vtot
Vtot
sau sub forma ei matematic:
RYX =

Y2 / X
Y2 / X
=
1

Y2
Y2

Pentru a-i gsi limitele ne raportm la cele dou situaii extreme:

dac nu exist legtur ntre X i Y, mediile condiionate Y / X sunt egale ntre ele, deci
Y2 / X = 0 i RYX = 0
dac legtura este de intensitate maxim, nu exist influene ale altor factori dect X asupra
lui Y, nu exist variaie n cadrul grupelor, deci Y2 / X = 0 i RYX = 1 .

n consecin, raportul de corelaie aparine intervalului RYX [0 ; 1] . Interpretarea intensitii


legturii pe baza acestui coeficient se va face astfel:
- dac RYX = 0 legtura este nul
- dac RYX [0 ; 0,3) legtura este de intensitate slab
- dac RYX [0,3 ; 0,7) legtura este de intensitate medie
- dac RYX [0,7 ; 1] legtura este de intensitate puternic.

Exemplu
Cunoatem urmtoarea distribuie a 52 de societi comerciale cu acelai profil de activitate, n raport
cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnzrilor (mil. lei).
X
[3 ;5 ]
(5 ;7 ]
(7 ;9 ]
Total
Y
( 60 ; 80 ]
2
7
8
17
( 40 ; 60 ]
3
10
5
18
[ 20 ; 40 ]
14
2
1
17
Total
19
19
14
52
S se aprecieze intensitatea legturii dintre cheltuielile cu publicitatea i volumul vnzrilor.
Folosim raportul de corelaie:
R XY

Y2 X
V EXP
=
=
VTOT
Y2
95,32
= 0,3645
261,54
= 0,604

RXY =
R XY

Legtura dintre cele dou variabile este de intensitate medie. Din dispunera frecvenelor n tabelul de
corelaie i calculul mediilor condiionate ne d m seama c legtura este direct.

4.4. Formularea unor ipoteze cu privire la forma matematic a legturii


Dac ntre dou variabile (ambele cantitative !) se constat existena unei legturi de o anumit
intensitate, ne punem problema posibilitii modelrii legturii printr-un model matematic. O prim
etap n acest demers este formularea unei ipoteze ct mai verosimile cu privire la forma legturii. n
acest scop, pe baza tabelului de corelaie construim norul statistic i linia poligonal a mediilor
condiionate ale variabilei dependente.

Y / x4

Y / x3

Y / x2
Y / x1

x1

x2

x3

x4

n func ie de forma liniei frnte obinute i a poziiei punctelor norului fa de ea se formuleaz o


ipotez cu privire la forma func iei de regresie. Dac dorim s studiem o legtur multipl, respectiv
dependena lui Y fa de variabilele factoriale X 1 , X 2 ,..., X n atunci pentru fiecare pereche (Y , X 1 ) ,

(Y , X 2 ) , (Y , X n ) desenm cte un nor statistic. Forma general a variabilei Y n funcie de variabilele


factoriale X 1 , X 2 ,..., X n se scrie:
Y = f ( X 1 , X 2 ,..., X n ) +
unde f ( X 1 , X 2 ,..., X n ) reprezint funcia de regresie care aproximeaz cel mai bine forma legturii,
iar o variabil aleatoare numit rezidual, care nsumeaz efectul altor factori dect cei luai n
calcul. Aceti factori nu sunt specificai din diferite motive: fie nu au fost identificai, fie nu pot fi
msurai, fie efectul lor este nesemnificativ pentru explicarea variabilei de explicat, etc. Obinuim s
mai notm funcia de regresie f ( X 1 , X 2 ,..., X n ) cu Y ( X 1 , X 2 ,..., X n ) deoarece reprezint o valoare
medie a lui Y condi ionat de valorile pe care le iau variabilele X 1 , X 2 ,..., X n . Funcia de regresie
poate avea diferite expresii matematice. Vom da n cele ce urmeaz cteva exemple, nsoite de forme
posibile ale norurilor de puncte corespunztoare.
1) Funcie liniar: Y = Y ( X ) + = a + bX +
Y

2) Funcie parabolic: Y = Y ( X ) + = a + bX + cX 2 +
Y

1
3) Funcie hiperbolic: Y = Y ( X ) + = a + b +
X
Y

X
X

4) Funcie exponenial: Y = Y ( X ) + = a b +
Y

Am prezentat doar cteva din formele uzuale ale funciilor de regresie, dar mai pot exista i altele, sau
combinaii ale lor (funcii complexe). Pentru regresia multipl, forma cea mai simpl o constituie
regresia liniar multipl care arat astfel:
Y = Y ( X 1 , X 2 ,..., X n ) + = a0 + a1 X 1 + ... + a n X n +
Pentru un astfel de model, reprezentarea grafic nu mai este posibil, deoarece nu mai este
vorba de o curb n plan, ci de o hipersuprafa ntr-un hiperspaiu cu n+1 dimensiuni.

4.5. Estimarea parametrilor funciei de regresie


Este o etap care se succede firesc alegerii formei funciei. n estimarea parametrilor va trebui
s inem cont de abaterea punctelor norului fa de modelul matematic ales Y ( X 1 , X 2 ,..., X n ) , datorat
altor factori dect X 1 , X 2 ,..., X n , considerai neeseniali, cuantificai prin variabila rezidual .
Y

Y (X )

Principiul de la care se pornete n estimarea parametrilor este cel al patratelor minime.


Minimizm suma patratelor abaterilor valorilor observate ale lui Y de la nivelul calculat prin
Y ( X 1 , X 2 ,..., X n ) . Condiia de minim a sumei este echivalent cu condiia de minim a mediei:
M [Y Y ( X 1 , X 2 ,..., X n )] = M ( 2 ) minim
2

Ecuaia Y ( X 1 , X 2 ,..., X n ) care descrie legtura dintre Y i factorii de influen X 1 , X 2 ,..., X n se


numete ecuaia de regresie. Metoda regresiei const n modelarea legturilor statistice prin ecuaia de
regresie. Deoarece problema de minim se poate rezolva doar cunoscnd forma particular a funciei,
vom aborda estimarea parametrilor seprat, pe tipuri de funcii.
Regresia liniar
n ipoteza n care legtura dintre Y i factorii si de influen X 1 , X 2 ,..., X n este liniar, ecuaia de
regresie va fi de forma:
Y ( X 1 , X 2 ,..., X n ) = a0 + a1 X 1 + a 2 X 2 + a n X n
Coeficienii a0 , a1 , a 2 ,..., an se numesc parametrii modelului i vor rezulta din minimizarea urmtoarei
funcii cu (n+1) necunoscute:
2
G (a0 , a1 ,..., an ) = M [Y (a0 + a1 X 1 + ... + a n X n )]

Condiiile de minim constau n anularea celor (n+1) derivate pariale ale funciei G (a0 , a1 ,.., a n ) n
raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la urmtorul sistem de ecuaii:
G (a0 , a1 ,..., a n )
= 2M [Y (a0 + a1 X 1 + ... + a n X n )] = 0

a0

G (a0 , a1 ,..., a n ) = 2M [Y (a0 + a1 X 1 + ... + a n X n )] X j = 0

a j
j = 1, n
sau ntr-o form echivalent:
M (a0 + a1 X 1 + ... + a n X n ) = M (Y )

M (a0 + a1 X 1 + ... + a n X n ) X n = M (Y ) X j

j = 1, n

de unde rezult:
a0 + a1M ( X 1 ) + ... + a n M ( X n ) = M (Y )

a0 + a1M ( X 1 X j ) + ... + an M ( X n X j ) = M (YX j )

j = 1, n

Prin rezolvarea acestui sistem liniar de ecuaii n raport cu necunoscutele a0 , a1 ,..., a n , se obin
valorile parametrilor ecuaiei de regresie. Astfel, legtura statistic dintre Y i X 1 , X 2 ,..., X n este
modelat prin aproximare cu o legtur funcional. Pentru cazul cu doi factori X 1 i X 2 , ecuaia de
regresie se scrie:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2
iar sistemul de ecuaii devine:
a0 + a1 M ( X 1 ) + a 2 M ( X 2 ) = M (Y )

2
a0 M ( X 1 ) + a1M ( X 1 ) + a 2 M ( X 1 X 2 ) = M (YX 1 )

2
a0 M ( X 2 ) + a1M ( X 1 X 2 ) + a2 M ( X 2 ) = M (YX 2 )
Prin substituia lui a 0 din prima ecuaie i nlocuirea lui n celelalte, obinem:

a1 M ( X12 ) [M ( X1 )]2 + a2 [M ( X1 X 2 ) M ( X1 )M ( X 2 )] = M (YX1) M (Y )M ( X1 )

a1[M ( X1 X 2 ) M ( X1 )M ( X 2 )] + a2 M ( X 22 ) [M ( X 2 )]2 = M (YX2 ) M (Y )M ( X 2 )

Dac pentru a aduce la o form mai simpl notm cu:


mij = M [ X i M ( X i )] [ X j M ( X j )] = M ( X i X j ) M ( X i )M ( X j )

care reprezint covariaia dintre variabilele X i i X j , obinem:


a1m11 + a 2 m12 = m01

a1m12 + a 2 m22 = m02

de unde putem obine valorile parametrilor:


m m m12 m02
a1 = 01 22
m11m22 m122
m m m12 m01
a 2 = 11 02
m11m22 m122
De aici l vom deduce i pe a 0 , care a fost substituit n prima ecuaie. Astfel, a0 , a1 , a 2 sunt
valorile parametrilor modelului liniar cu trei variabile. nlocuind valorile parametrilor n ecuaia de
regresie se obine:
m
m12
m11 m12
(Y ( X 1 , X 2 ) M (Y )) 10
( X 1 M ( X 1 )) +
m21 m22
m20 m22
+

m10

m11

m20

m21

(X 2 M ( X 2 )) = 0

Pentru a face relaia mai accesibil, introducem matricea de variaie i covariaie:


m00 m01 m02

( 3)
M = m10 m11 m12
m

20 m21 m22
i notnd complementul algebric al elementului m0 j cu M oj( 3) , j = 0,1,2 ecuaia de regresie devine:
( 3)
(Y ( X 1 , X 2 ) M (Y ) ) + M 01(3) ( X 1 M ( X 1 ) ) + M 02(3) ( X 2 M ( X 2 ) ) = 0
M 00

Pentru cazul mai general al legturii liniare dintre Y i X 1 , X 2 ,..., X n , matricea de variaie i covariaie
este:
m00 m01 ... m0n

m10 m11 ... m1n


( n +1)
M
=
...
... ... ...

m
...
m
n0
n1
nn
iar ecuaia de regresie se poate scrie:
( n+1)
M 00
(Y ( X1, X 2 ) M (Y )) + M01(n+1) (X1 M ( X1 )) + ...+ M 0(nn+1) ( X n M ( X n )) = 0

Matricea de variaie i covariaie M ( n+1) este simetric n raport cu prima diagonal. Elementele mii
de pe diagonala principal sunt varianele variabilelor Y , X 1 , X 2 ,..., X n , iar elementele mij , i j
reprezint covarianele dintre variabilele corespunztoare.

Regresia liniar simpl


n cazul regresiei liniare simple, cu variabila endogen Y i factorul X 1 , matricea de variaie i
covariaie este:
m01
m

M ( 2 ) = 00
m10 m11
iar ecuaia de regresie devine:
m11 (Y ( X ) M (Y )) m10 ( X 1 M ( X 1 ) ) = 0
de unde l putem exprima pe Y ( X ) ca:
m
m
Y ( X ) = 10 X 1 + M (Y ) 10 M ( X 1 )
m11
m11
de unde rezult coeficien ii:
a 0 = M (Y )
a1 =

m10
X1
m11

m10
M ( X1)
m11

Regresia parabolic
n economie sunt numeroase exemplele n care legtura dintre fenomene i deci variabilele
care le cuantific nu este liniar. Dac Y reprezint recolta la hectar dintr-un produs agricol, iar X
cantitatea de ngrminte, ne vom da seama chiar i intuitiv c o anumit cretere a lui X nu provoac
aceeai cretere a lui Y pe tot intervalul de variaie al celor dou variabile. La valori mari ale cantitii
de ngrminte, acestea provoac saturaie sau chiar nocivitate, ducnd la o stagnare, respectiv
diminuare a produciei. Alte exemple pot fi: legtura dintre vechimea n munc i mrimea salariului,
dintre cheltuielile cu publicitatea i volumul vnzrilor, etc.
Determinarea parametrilor funciei parabolice de regresie se poate face fie aplicnd direct
funciei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat anterior. n ambele
cazuri vom exemplifica pentru parabola de ordinul doi.

a)

Estimarea parametrilor prin aplicarea direct a metodei patratelor minime

Ecuaia de regresie a modelului se scrie:


Y ( X ) = a0 + a1 X + a 2 X 2
Din condiia de minimizare a expresiei:
2
G (a0 , a1 , a2 ) = M [Y Y ( X )]
avem urmtoarele egaliti:
G (a0 , a1 , a2 )
=0
a0
G (a0 , a1 , a2 )
=0
a1
G (a0 , a1 , a2 )
=0
a2
din care rezult sistemul de ecuaii:
2 M Y (a 0 + a1 X + a 2 X 2 ) = 0

2
2 M (Y (a 0 + a1 X + a 2 X ) )X = 0

2
2
2 M (Y (a 0 + a1 X + a 2 X ) )X = 0

[
[
[

care este echivalent cu:


a0 + a1M ( X ) + a2 M ( X 2 ) = M (Y )

2
3
a0 M ( X ) + a1M ( X ) + a 2 M ( X ) = M (YX )

2
3
4
2
a0 M ( X ) + a1M ( X ) + a 2 M ( X ) = M (YX )
Rezolvnd acest sistem n necunoscutele a0 , a1 , a2 , rezult parametrii ecuaiei de regresie parabolice.
n mod asemntor se poate proceda pentru orice regresie neliniar.

b) Estimarea parametrilor prin reducerea la cazul liniar


Avnd modelul parabolic de ecuaie:
Y ( X ) = a0 + a1 X + a2 X 2

facem substituiile:
X = X1
X 2 = X2
dup care ecuaia devine:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2
care reprezint un model liniar cu doi factori. Elementele matricei de variaie i covariaie vor arta
astfel:
m00 = M (Y 2 ) ( M (Y )) 2 = Y2
m01 = m10 = M (YX ) M (Y ) M ( X ) = cov(Y , X )
m02 = m20 = M (YX 2 ) M (Y )M ( X 2 ) = cov(Y , X 2 )
m11 = M ( X 2 ) ( M ( X )) 2 = X2
m12 = M ( X 3 ) M ( X ) M ( X 2 ) = cov( X , X 2 )

m22 = M ( X 4 ) (M ( X 2 )) 2 = X2 2
Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o problem de
regresie liniar, care se rezolv conform cazului liniar. n cazul mai general, dac ecuaia de regresie
este un polinom de gradul n:
Y ( X ) = a0 + a1 X + a 2 X 2 + ... + an X n
efectund substitu iile:
X = X 1 ; X 2 = X 2 ; ... ; X n = X n
obinem cazul liniar n raport cu (n+1) variabile.

Regresia exponenial
Dac ecuaia de regresie are form exponenial:
Y (X ) = a bX
se ncearc aducerea la forma liniar. Mai nti se logaritmeaz ecuaia:
lg Y ( X ) = lg a + X lg b
iar apoi se fac substitu iile:
Z ( X ) = lg Y ( X )
a0 = lg a
a1 = lg b

Rezult astfel modelul liniar simplu:


Z ( X ) = a0 + a1 X

Regresia hiperbolic
Dac ecuaia de regresie are form hiperbolic:

Y (X ) = a + b

1
X

se face substituia:
1
X1 =
X
de unde rezult modelul liniar:
Y ( X 1 ) = a + bX 1
n matricea de variaie i covariaie elementele vor fi:
m00 = M (Y 2 ) ( M (Y )) 2 = Y2
1
1

1
m01 = m10 = M Y M (Y ) M = cov Y ,
X
X
X

1 1
m11 = M 2 M
X X

2
= 1 / X

4.6. Analiza reprezentativitii funciei de regresie


Coeficientul de corelaie
Construcia lui este similar cu a raportului de corelaie, cu deosebirea c variana n fiecare
grup este calculat folosind suma patratelor abaterilor fa de valorile ajustate prin funcia de regresie
i nu fa de media grupei. Ca urmare, coeficientul de corelaie va fi specific fiecrei funcii n parte.
Expresia lui de calcul (admis aici fr demonstraie) este:
det M
rYX = 1
m00 M 00
rYX [0 ; 1]
Interpretarea acestui coeficient n funcie de valorile pe care le poate lua este urmtoarea:
- dac rYX [0 ; 0,3] funcia nu este reprezentativ pentru modelarea legturii dintre variabile
- dac rYX (0,3 ; 0,7] funcia are o reprezentativitate medie pentru modelarea legturii
dintre variabile
- dac rYX (0,7 ; 1] funcia este foarte reprezentativ pentru modelarea legturii dintre
variabile
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficien ilor este bine s fie comparate cu
ale altor coeficieni, ai altor funcii. Pentru aceeai repartiie de exemplu, pentru funciile de regresie
alese ca fiind posibilecalculm coeficienii de corelaie i l reinem pe cel mai mare, considernd acea
funcie ca fiind cea mai reprezentativ.
n cazul regresiei liniare simple, formula coeficientului poate fi adus la o form echivalent
mai simpl:
m00 m01

M ( 2) =
m10 m11
rYX = 1
=

m m m01 m10
det M
= 1 00 11
=
m00 M 00
m00 m11
m01

m00 m11

M ( XY ) M ( X ) M (Y )
Y X

m01 m10
=
m00 m11

4.8. Probleme
Problema 1
Se cunoate urmtoarea distribu ie a 52 de societi comerciale cu acelai profil de activitate, n raport
cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y volumul vnzrilor (mil. lei).
Y
X
[ 3 ; 5 ] ( 5 ; 7 ] ( 7 ; 9 ] Total
( 60 ; 80 ]
2
7
8
17
( 40 ; 60 ]
3
10
5
18
[ 20 ; 40 ]
14
2
1
17
Total
19
19
14
52
Se cere:
1) pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a funciei de regresie;
2) n ipoteza unei forme liniare a dependenei dintre Y i X, s se calculeze parametrii funciei de
regresie;
3) s se studieze reprezentativitatea funciei de regresie pentru modelarea legturii dintre cele
dou variabile;
4) care este valoarea medie a volumului vnzrilor pentru un nivel al cheltuielilor cu publicitatea
de 5,5 milioane lei?;
5) aceleai cerine de la punctele 2), 3) i 4) pentru o form parabolic a dependenei dintre Y i
X.
1)
Y 80
70
60
50
40
30
20
3

9
X

Pe baza graficului reprezentnd mediile condiionate ale lui Y n raport cu X, reinem ca posibile
funcii de regresie:
- funcia liniar:
Y = a + b X +
- funcia parabolic: Y = a + b X + c X 2 +
2)

Pentru funcia liniar Y = a + b X + , prin minimizarea sumei p tratelor abaterilor, ob inem:


M ( X Y ) M ( X ) M (Y )
b=
2
M X 2 [M ( X )]
a = M (Y ) b M ( X )
4 19 + 6 19 + 8 14
M (X ) =
= 5,81
19 + 19 + 14
4 2 19 + 6 2 19 + 8 2 14
M (X 2 ) =
= 36,23
19 + 19 + 14
30 17 + 50 18 + 70 17 2600
M (Y ) =
=
= 50
17 + 18 + 17
52

( )

M (X Y ) =

1
( 4 30 14 + 6 30 2 + 8 30 1 +
52
+ 4 50 3 + 6 50 10 + 8 50 5 +
+ 4 70 2 + 6 70 7 + 8 70 8) = 305

305 5,81 50
14,5
=
= 5,86
2
2,4739
36,23 5,81
a = 50 5,86 5,81 = 15,95
Putem astfel scrie funcia de regresie liniar:
Y = 15,95 + 5,86 X +
b=

Y ( X ) = 15,95 + 5,86 X
3)

Calculm coeficientul de corelaie liniar simpl:


M ( X Y ) M ( X ) M (Y )
rYX =
X Y

Y2 =

(30 50)2 17 + (50 50)2 18 + (70 50)2 17 = 13600 = 261,54


17 + 18 + 17

52

Y = 16,17
X2 =

(4 5,81)2 19 + (6 5,81)2 19 + (8 5,81)2 14 = 2,5


19 + 19 + 14

X = 1,58
305 5,81 50
= 0,567
16,17 1,58
Funcia liniar are o reprezentativitate medie pentru modelarea legturii dintre Y i X.
rYX =

4)

Y ( X ) = 15,95 + 5,86 X

Y (5,5) = 15,95 + 5,86 5,5 = 48,18


Prin urmare, pentru o valoare a cheltuielilor cu publicitatea de 5,5 milioane lei, se obine un volum
mediu al vnzrilor de 48,18 milioane lei.
5)
Pentru funcia parabolic Y = a + b X + c X 2 + se calculeaz elementele matricii de
varia ie i covariaie:
m00 = Y2 = 261,54
m01 = M ( X Y ) M ( X ) M (Y ) = 305 5,81 50 = 14,5
1
( 4 2 30 14 + 6 2 30 2 + 8 2 30 1 +
52
+ 4 2 50 3 + 6 2 50 10 + 8 2 50 5 +
+ 4 2 70 2 + 6 2 70 7 + 8 2 70 8) = 1979,23

M X 2 Y =

( )

m02 = M X 2 Y M X 2 M (Y ) = 1979,23 36,23 50 = 167,73


m11 = X2 = 2,5

( )

M X3 =

4 3 19 + 6 3 19 + 8 3 14
= 240,15
19 + 19 + 14

( )
( )
4 19 + 6 19 + 8 14
M (X ) =
= 1669,85
19 + 19 + 14
= M (X ) M (X ) M (X ) = 1669,85 36,23 36,23 = 357,24

m12 = M X 3 M ( X ) M X 2 = 240,15 5,81 36,23 = 29,65


4

m22

Ob inem astfel matricea de variaie i covariaie:


261,54 14,5 167,73

(3 )
M = 14,5
2,5
29,65
167,73 29,65 357,24

Calculm complemenii algebrici:


2,5
29,65
1+1
M 00 = ( 1)
= 2,5 357,24 29,65 29,65 = 13,98
29,65 357,24
1+ 2

14,5
29,65
= 206,78
167,73 357,24

1+ 3

14,5
2,5
= 10,6
167,73 29,65

M 01 = ( 1)

M 02 = ( 1)

Coeficienii parabolei de regresie se obin prin metoda p tratelor minime:

( )

M 2 = M Y Y X, X 2

))

min

a + b M ( X ) + c M (X 2 ) = M (Y )

a M ( X ) + b M (X 2 ) + c M ( X 3 ) = M ( X Y )
a M ( X 2 ) + b M (X 3 ) + c M (X 4 ) = M (X 2 Y )

( )]

M 00 [Y ( X ) M (Y )] + M 01 [X M ( X )] + M 02 X 2 M X 2 = 0
M
M
M
M
Y ( X ) = M (Y ) + 01 M ( X ) + 02 M (X 2 ) 01 X 02 X 2
M 00
M
M 00
M 00
14444
442444004443 123
123
a

Astfel:
a = 50

206,78
10,6
5,81 +
36,23 = 8,46
13,98
13,98

206,78
b =
= 14,79
13,98
10,6
c =
= 0,76
13,98
Putem scrie deci funcia de regresie parabolic:
Y = 8,46 + 14,79 X 0,76 X 2 +

sau

Y ( X ) = 8,46 + 14,79 X 0,76 X 2

Calculm coeficientul de corelaie parabolic:


rYXX 2 = 1

det M (3 )
m00 M 00

rYXX 2 = 1

2435,224
= 0,578
261,54 13,98

det M (3 ) = 261,54 2,5 357,24 + 14,5 29,65 167,73 + 14,5 29,65 167,73
167,73 2,5 167,73 14,5 14,5 357,24 29,65 29,65 261,54 =

= 2435,224
Aadar, funcia parabolic are o reprezentativitate medie pentru modelarea legturii dintre Y i X,
fiind mai reprezentativ, dar nu semnificativ, dect dreapta de regresie.
Y ( X ) = 8,46 + 14,79 X 0,76 X 2
Y (5,5) = 8,46 + 14,79 5,5 0,76 5,5 2 = 49,9
Prin urmare, pentru o valoare a cheltuielilor cu publicitatea de 5,5 milioane lei, se obine un volum
mediu al vnzrilor de 49,9 milioane lei.

Problema 2
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la preuri diferite
(P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a nregistrat un anumit
nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
Nr.
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13

Cerere (C)
15,4
3,2
4,9
10,5
8,0
5,1
7,6
11,3
14,0
6,4
13,2
8,8
12,1

Pre (P)
1,4
5,1
2,5
1,7
1,8
3,4
2,1
1,6
3,6
3,5
1,9
1,8
1,9

Venit (V)
620
530
490
800
630
410
670
920
990
320
520
700
730

1) S se formuleze ipoteze cu privire la forma legturii dintre cerere (C) i pre (P). Pentru formele
funciilor de regresie reinute ca fiind posibile, s se calculeze parametrii funciilor i
reprezentativitatea acestora.
2) Similar pentru legtura dintre cerere i venit.
3) S se calculeze parametrii funciei care modeleaz legtura liniar multipl dintre cerere i factorii
si e influen. Analizai reprezentativitatea acestei funcii n raport cu reprezentativitatea funciilor de

regresie simple. Care va fi valoarea estimat a cererii pe o pia unde preul de vnzare va fi 3,2 iar
venitul mediu al consumatorilor de 550 ?
1) Construim norul de puncte n raport cu P i C:
18
16
14

cerere

12
10
8
6
4
2
0
0

pret

Reinem ca forme posibile ale func iei de regresie:


- dreapta: C ( P) = a1 + b1 P
1
- hiperbola: C ( P) = a 2 + b2
P
a) Pentru primul caz, cel al dreptei de regresie, avem:
1,4 + 5,1 + 2,5 + ..... + 1,9
= 2,485
M ( P) =
13
1,4 2 + 5,12 + 2,5 2 + ..... + 1,9 2
M (P 2 ) =
= 7,273
13
15,4 + 3,2 + 4,9 + ..... + 12,1
= 9,269
M (C ) =
13
15,4 1,4 + 3,2 5,1 + 4,9 2,5 + ..... + 12,1 1,9
M (CP ) =
= 20,81
13
M (CP ) M (C )M ( P) 20,81 9,269 2,485
=
b1 =
= 2,025
7,273 2,4852
M ( P 2 ) [ M ( P)]2
a1 = M (C ) b1 M ( P) = 9,269 + 2,025 2,485 = 14,3
Dreapta de regresie se scrie:
C ( P) = 14,3 2,025 P
Calculm reprezentativitatea dreptei de regresie:
(1,4 2,458) 2 + (5,1 2,458) 2 + ..... + (1,9 2,458) 2
P2 =
= 1,1
13
P = 1,049

C2 =

(15,4 9,269) 2 + (3,2 9,269) 2 + ..... + (4,9 9,269) 2


= 13,479
13

C = 3,671
rC , P =

M (CP) M (C ) M ( P) 20,81 9,269 2,485


=
= 0,58
C P
3,671 1,049

Drepta de regresie are o reprezentativitate medie.


b) Pentru al doilea caz, cel al hiperbolei de regresie, facem schimbarea de variabil:
1
Z=
P
Datele cu privire la cerere i noua variabil Z:
Nr.
1
2
3
4
5

C
15,4
3,2
4,9
10,5
8,0

Z
0,714
0,196
0,400
0,588
0,556

Nr.
6
7
8
9
10

5,1
7,6
11,3
14,0
6,4

Z
0,294
0,476
0,625
0,278
0,286

Nr.
11
12
13

13,2
8,8
12,1

Z
0,526
0,556
0,526

0,714 + 0,196 + 0,400 + ..... + 0,526


= 0,462
13
0,714 2 + 0,196 2 + 0,400 2 + ..... + 0,526 2
M (Z 2 ) =
= 0,238
13
15,4 0,714 + 3,2 0,196 + ..... + 12,1 0,526
M (CZ ) =
= 4,639
13
M (CZ ) M (C )M ( Z ) 4,639 9,269 0,462
b2 =
=
= 14,527
M ( Z 2 ) [M ( Z )]2
0,238 0,4622
a2 = M (C ) b2 M ( Z ) = 9,269 14,527 0,462 = 2,56
M (Z ) =

Hiperbola de regresie se scrie:


1
P
Calculm reprezentativitatea hiperbolei de regresie:
C ( P) = 2,56 + 14,527

Z = 0,1519
C = 3,671
rC ,Z =

M (CZ ) M (C )M ( Z ) 4,639 9,269 0,462


=
= 0,64
C Z
3,671 0,1519

Drepta de regresie are o reprezentativitate medie, dar este mai reprezentativ dect dreapta.

2) Construim norul de puncte n raport cu V i C:


20
18
16

consum

14
12
10
8
6
4
2
0
0

200

400

600

800

1000

1200

venit

Reinem ca form posibil a funciei de regresie:


- dreapta: C (V ) = a3 + b3 V
620 + 530 + ..... + 730
M (V ) =
= 640,8
13
620 2 + 530 2 + ..... + 7302
M (V 2 ) =
= 444731
13
M (C ) = 9,269
15,4 620 + 3,2 530 + ..... + 12,1 730
= 6340 ,7
M (CV ) =
13
M (CV ) M (C ) M (V ) 6340,7 9,269 640,8
=
b3 =
= 0,01176
444731 640,8 2
M (V 2 ) [M (V )]2
a3 = M (C ) b3 M (V ) = 9,269 0,01176 640,8 = 1,73
Dreapta de regresie se scrie:
C (V ) = 1,73 + 0,01176 V
Calculm reprezentativitatea dreptei de regresie:
V2 = 34146
V = 184,8

C = 3,671
M (CV ) M (C ) M (V ) 6340,7 9,269 640,8
rC ,V =
=
= 0,59
C V
3,671 184,8
Drepta de regresie are o reprezentativitate medie.
3) Pentru funcia de regresie liniar multipl C = a4 + b4 P + c4 V + , calculm elementele matricii
de variaie i covariaie:
m00 = C2 = 13,479
m01 = M (CP) M (C ) M ( P) = 20,81 9,269 2,485 = 2,223
m02 = M (CV ) M (C )M (V ) = 6340,7 9,269 640,8 = 401,12
m11 = P2 = 1,1

1,4 620 + 5,1 530 + ... + 1,9 730


= 1529,4
13
m12 = M ( PV ) M ( P)M (V ) = 1529,4 2,485 640,8 = 62,99
m22 = V2 = 34146
M ( PV ) =

Ob inem astfel matricea de variaie i covariaie:


13,479 2,223 401,12

(3 )
M = 2,223
1,1
62,99
401,12 62,99 34146

Calculm complemenii algebrici:


1,1
62,99
M 00 = (1)1+1
= 33593
62,99 34146
M 01 = (1)1+ 2

2,223 62,99
= 50640
401,12 34146

M 02 = (1)1+3

1,1
2,223
= 301,2
401,12 62,99

Ob inem astfel coeficienii regresiei:


a 4 = 7,3

b4 = 1,507
c4 = 0,00897
Putem scrie deci funcia de regresie liniar multipl:

sau

C = 7,3 1,507 P + 0,00897 V +


C ( P,V ) = 7,3 1,507 P + 0,00897 V

Calculm coeficientul de corelaie liniar multipl:


rCPV = 1

det M ( 3)
m00 M 00

rCPV = 1

219406
13,479 33593

rCPV = 0,72
Funcia liniar multipl este foarte reprezentativ pentru modelarea legturii dintre consum (C) i
factorii si de influen: preul produsului (P) i venitul consumatorilor. Observm c funcia multipl
are un coeficient de corelaie mai mare dect ceilali coeficieni, ai funciilor de regresie cu cte un
singur factor. Se confirm astfel teoria conform creia o variabil este cu att mai bine explicat, cu
ct numrul de variabile explicative este mai mare.

C ( P,V ) = 7,3 1,507 P + 0,00897 V


C (3,2 ; 550) = 7,3 1,507 3,2 + 0,00897 550 = 7,4

Pe o pia unde produsul se va vinde la un pre de 3,2 iar venitul mediu al consumatorilor este 550, ne
ateptm la o valoare cea mai probabil a consumului de 7,4.

Problema 3
Din diverse surse de statistic internaional, cunoatem cu privire la 16 state ale lumii valorile
variabilelor X = P.I.B./locuitor (mii $) i Y = cheltuielile pentru activiti de turism pe locuitor (mii $):
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

X (mii $)
9.8
15.3
12.8
30.1
22.0
18.1
13.4
28.1
29.0
11.6
25.3
10.9
19.4
21.7
18.2
27.7

Y (mii $)
0.97
1.23
1.59
6.69
3.4
1.82
1.71
5.11
6.02
1.42
3.84
1.36
2.01
3.29
2.42
5.03

1) Folosind un grafic adecvat i elemente din teoria economic, s se formuleze ipoteze cu privire la
forma posibil a funciei de regresie.
2) Pentru una din formele funcionale selectate, s se estimeze parametrii i s se scrie funcia.
3) Decidei care funcie este mai bun, att pe baza coeficienilor de corelaie, ct i pe baza valorilor
previzionate pe baza funciilor.
1) Construim norul de puncte n raport cu cele dou variabile:

Cheltuieli cu servicii turistice /


loc. (mii $)

Norul de puncte si functia de regresie exponentiala


7
6
5
4
3
2
1
0
5

10

15

20

25

30

35

30

35

P.I.B. / loc. (mii $)

Cheltuieli cu servicii turistice /


loc. (mii $)

Norul de puncte si functia de regresie liniara


7
6
5
4
3
2
1
0
5

10

15

20
P.I.B. / loc. (mii $)

25

La o prim vedere, ambele funcii par adaptate pentru modelarea legturii, punctele norului nefiind
prea ndepartate de ele. Dac judecm pu in din punct de vedere economic, cererea de servicii turistice
este cresctoare n raport cu P.I.B./loc., ceea ce este valabil pentru ambele funcii. Trebuie s inem
cont ns c serviciile turistice sunt ntr-o msur important un bun de lux, deci cu o elasticitate
supraunitar a cererii n raport cu venitul. Mai potrivit pare deci funcia exponenial.
2) Funcia exponenial dintre cele dou variabile, sub forma ei determinist se scrie:
Y = a bX
care prin logaritmare devine:
ln Y = ln a + ln b X
iar sub forma aleatoare:
ln Y = ln a + ln b X +
Facem urmtoarele schimbri de variabil:
ln Y = Z
ln a = A
ln b = B
Funcia devine :
Z = A+ B X +
care este o funcie liniar. Datele numerice pentru estimarea parametrilor le prezentm n tabelul
urmtor:
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

X (mii $)
9.8
15.3
12.8
30.1
22.0
18.1
13.4
28.1
29.0
11.6
25.3
10.9
19.4
21.7
18.2
27.7

Z=lnY
-0.030
0.207
0.464
1.901
1.224
0.599
0.536
1.631
1.795
0.351
1.345
0.307
0.698
1.191
0.884
1.615

A + B M ( X ) = M (Z )

2
A M ( X ) + B M ( X ) = M ( XZ )

M ( X ) = 19,59
M ( X 2 ) = 428,81
M (Z ) = 0,9199
M ( XZ ) = 21,91

M ( XZ ) M ( X ) M (Z ) 21,91 19,59 0,9199


=
= 0,08634
M ( X 2 ) M ( X )2
428,81 19,59 2
A = M ( Z ) B M ( X ) = 0,9199 0,08634 19,59 = 0,7715
De unde:
B=

b = e 0,08634 = 1,0902
a = e 0,7715 = 0,4623

Putem scrie deci funcia de regresie:


Y = 0, 4623 1,0902 X +
3) Calculm coeficienii de corelaie pentru funcia exponenial, respectiv cea liniar. Cum i cea
exponenial a fost liniarizat, avem:
M ( XZ ) M ( X ) M (Z )
RZX =
= 0,97
X Z
M ( XY ) M ( X ) M (Y )
RYX =
= 0,95
X Y
Funcia exponenial este deci mai reprezentativ.
Pentru a compara valorile prezise prin cele dou funcii, trebuie s calculm i parametrii
funciei liniare. Fr a mai detalia calculele, scriem funcia:
Y = 2,328 + 0,2723 X +
Pentru o valoare a venitului de 7000 $ (X=7) ob inem:
- pentru funcia exponenial
Y (7) = 0,4623 1,0902 7 = 0,85
- pentru funcia liniar
Y (7) = 2,328 + 0,2723 7 = 0,42 rezultat evident absurd
Ca urmare, i valorile prezise de cele dou funcii o indic pe cea exponenial ca fiind cea adecvat
modelrii legturii dintre PIB/loc i cheltuielile cu servicii turistice.

Capitolul 5
INDICII STATISTICI
Pentru studierea fenomenelor economice i sociale este adesea nevoie s descriem i s studiem
varia ia unor mrimi. Indicele statistic este o funcie ale crei valori numerice exprim variaia relativ
total sau parial a unei mrimi ntre dou situaii (dou perioade, dou spaii diferite, dou categorii).
Fie Z o mrime a crei variaie constituie obiectivul de studia i un parametru de care
depinde mrimea Z, respectiv Z = Z(). Relativ la parametrul , acesta poate exprima timpul, spaiul
sau anumite categorii economice sau sociale. Considernd dou stri oarecare ale parametrului ,
respectiv = j cu Z() = Z(j) i = k cu Z() = Z(k), atunci, n sens clasic, indicele mrimii Z este:
Z( k )
I Yk / j =
Z( j )
Dup numrul de uniti la care se refer mrimea Z, indicii sunt:
- indici elementari sau individuali, ce msoar variaia unei mrimi relativ la o singur unitate
statistic a populaiei. De exemplu, pentru mrimea Z = x.y, avem:
x( k )
y( k )
Z ( k ) x( k ) y( k )
I xk / j =
, I ky / j =
i
=
x( j )
y( j )
Z ( j ) x( j ) y( j )
- indici sintetici sau de grup, ce msoar variaia unei mrimi relativ la dou sau mai multe
unit i ale populaiei.

De exemplu Z = xi y j , unde i reprezint unitatea statistic, x i z fiind factorii ce se msoar


i =1

la nivelul tuturor celor m uniti. Indicele sintetic este:


xi ( k ) y i ( k )
Z( k ) i
k/ j
IY =
=
Z ( j ) xi ( j ) y i ( j )
i

Frecvent, n domeniul economic, prezint interes studiul unei mrimi de tip valoare Z = V = pi qi ,
i =1

unde pi sunt preuri iar qi sunt cantiti.


Dup natura parametrului , indicii sunt:
indici ai dinamicii, unde exprim timpul;
indici teritoriali, unde exprim spaiul;
indici ai unor categorii, unde exprim o anumit categorie economic sau social.
Indicii dinamici dup modul de comparare a strilor parametrului sunt:
indici cu baz fix;
indici cu baz n lan.
O abordare sistemic a indicilor unei mrimi i mparte n:
indici ai variaiei integrale;
indici ai variaiilor factoriale, denumii i indici factoriali.

5.1. Indicele variaiei integrale


Fie Z = f(x1, x2, ..., xm) modelul ce exprim dependena mrimii Z de factorii x1, x2 , ..., xm.
Variaia mrimii Z rezultat prin aciunea tuturor factorilor de influen, se numete varia ie
integral. Indicele variaiei integrale aferent mrimii Z este:
Z( k )
I zk / j =
Z( j )
Proprieti ale indicelui variaiei integrale:
i) Identitatea (reflexivitatea)
I zk / k = 1
respectiv:
Z (k )
I zk / k =
=1
Z (k )
ii) Reversibilitatea (simetria)
1
I zk / j I zj / k = 1 sau
I zk / j =
I zj / k
adic:
Z( k )
1
1
I zk / j =
=
=
Z ( j ) Z ( j ) I zj / k
Z( k )
iii) Circularitatea (tranzactivitatea)
Fie j, h i k trei stri a parametrului , h fiind starea intermediar atunci:
I zh / j I zk / h = I zk / j
deoarece
Z ( h ) Z( k ) Z( k )
I zh / j I zk / h =

=
= I zk / j .
Z ( j ) Z ( h ) Z( j )

5.2. Indicii factoriali


Indicii I z / x1 , I z / x 2 ,..., I z / x m exprimnd cote pri din variaia mrimii Y determinate, respectiv de
factorii x1, x2, ..., xm constituie sistemul de indici factoriali ai mrimii Y. Lipsa unei definiii efective a
condus cercetarea spre gsirea unor algoritmi de calcul ai indicilor factoriali. Cei mai cunoscui
algoritmi au ca trstur comun meninerea la un nivel constant a factorilor nestudiai, fiind numii i
sisteme de ponderare.
Principalele tipuri de indici factoriali (sisteme de ponderare) utilizai n practic sunt:
indicii de tip Laspeyres;
indicii de tip Paasche;
indicii de tip Fisher.
Se cunosc o serie de alte expresii de calcul a indicilor factoriali, destinate n principal pentru
calculul indicelui preurilor (Moldovan, 1999).

5.2.1. Indicii factoriali de tip Laspeyres


Cunoscut iniial sub denumirea de indicele preurilor, indicele de tip Laspeyres a fost definit avnd n
vedere o mrime exprimnd valoarea:
r

V = pi qi
i =1

unde pi sunt preuri iar qi cantiti. Indicele factorial al preurilor, de tip Laspeyres se determin
conform relaiei:
r

pi ( k )qi ( j )

j =1

k/ j

I V / p ( L ) =
r
p i ( j )qi ( j )
i =1

unde:
pi(j) preul din perioada de baz;
pi(k) - preurile din perioada curent;
qi(j) cantitile din perioada de baz;
qi(k) cantitile din perioada curent.
Asemntor se poate scrie expresia indicelui volumului fizic (a cantitii):
r

p ( j)q (k )
i

k/ j
V /q

( L) =

j =1

p ( j )q ( j )
i

i =1

Avnd n vedere expresiile celor doi indici, n Florea (1986) se deduce o regul general pentru
elaborarea indicilor factoriali de tip Laspeyres: partea din variaia unei mrimi determinat de un
factor se ob ine meninnd ceilali factori la nivelul baz de comparaie. Astfel, n cazul mrimii Z
depinznd de m factori, adic Z = f(X1, X2, ..., Xm), avem:
f ( x1 ( k ), x 2 ( j ),..., xi ( j ),..., x m ( j ))
I Zk // xj ( L...L...L ) =
1
f ( x1( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))
f ( x1 ( j ), x2 ( j ),..., xi (k ),..., xm ( j ))
I Zk // xji ( L L... ...L) =
f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))
I Zk // xj m ( L L...L...) =

f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm (k ))
.
f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))

Exemplu 1.
Relativ la sortimentele importate, dintr-o anumit grup de mrfuri, dispunem de urmtoarele
informaii:
Sortiment
an j
an k
Cantitate
Pre unitar de
Cantitate
Pre unitar de
importat
import
importat
import
S1
18
10
15
18
S2
15
6
25
12
S3
25
14
30
20
Se cere:
a) indicele valorii importului pentru aceast grup de mrfuri;
b) indicele preului de import respectiv indicele cantitii importate (a volumului importului),
ambii de tip Laspeyres.
Rezolvare
a) Valoarea importului, din aceast grup de mrfuri (format din trei sortimente), se determin astfel:
3

V = pi q i
i =1

unde:
pi preul unitar de import al sortimentului i;
qi cantitatea importat din sortimentul i.
Indicele exprimnd variaia integral a valorii importului este:
V ( j ) 15 18 + 25 12 + 30 20 1170
IVk / j =
=
=
= 1,890
V (k ) 18 10 + 15 6 + 25 14
620
IVk / j = 1.890 indic o cretere a valorii importului, n anul k fa de anul j, de 1.89 ori.

b) Indicii factoriali, de tip Laspeyres


3

k/ j
V/p

(L ) =

p (k )q ( j )
i

i =1
3

p ( j )q ( j )
i

18 18 + 12 15 + 20 25 1004
=
= 1,619
18 10 + 15 6 + 25 14
620

i =1
3

k/ j
V /q

(L ) =

p ( j )q (k )
i

i =1
3

p ( j )q ( j )
i

10 15 + 6 25 + 14 30 720
=
= 1,162
18 10 + 15 6 + 25 14 620

i =1

Urmare a creterii preurilor unitare, valoarea importului a crescut, n anul k fa de anul j, de 1,619
ori. Privind acest indice factorial ca un indice sintetic al preurilor, rezultatul obinut arat cci per
ansamblu celor trei sortimente preurile unitare au crescut de 1,619 ori.
Modificarea cantitilor importate a determinat o cretere a valorii importului, n anul k fa de
anul j, de 1,162 ori, sau cantitile importate au crescut per ansamblu de 1,162 ori.

5.2.2. Indicii factoriali de tip Paasche


Paasche, spre deosebire de Laspeyres, pentru a defini indicele preurilor, pondereaz preurile
bunurilor cu cantitile din perioada curent. Prin urmare, rezult:

p ( k ) q (k )
i

k/ j
V/p

( P) =

j =1
r

p ( j)q (k )
i

i =1

Asemntor se poate deduce expresia de calcul a indicelui volumului fizic:


r

p (k )q (k )
i

k/ j
V /q

( P) =

j =1
r

p ( k )q ( j )
i

i =1

i n acest caz, n Florea (1986) autorul deduce o regul general pentru elaborarea indicilor
factoriali de tip Paasche: partea din variaia unei mrimi determinat de un factor se ob ine
meninnd ceilali factori la nivelul curent. Pentru mrimea Z, depinznd ce m factori, indicii
factoriali de tip Paasche sunt:
f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( k ))
I Zk // xj ( P...P...P ) =
1
f ( X 1 ( j ), X 2 ( k ),..., X i ( j ),..., X m ( k ))
.........
f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( k ))
k/ j
I Z / x ( P P... ...P ) =
i
f ( X 1( k ), X 2 ( k ),..., X i ( j ),..., X m ( k ))
.........
f
(
X
1( j ), X 2 ( j ),..., X i ( j ),..., X m ( k )) .
I Zk // xj ( P P...P... ) =
m
f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( j ))

5.2.3. Indicii factoriali de tip Fisher


Irving Fisher n 1922 a stabilit o nou expresie de calcul a indicelui preurilor pornind de la
limitele indicilor Laspeyres respectiv Paasche. Astfel, indicii Fisher se exprim ca o medie geometric
a indicilor Laspeyres i Paasche:
IVk // pj ( F ) = IVk // pj ( L ) I Vk // jp ( P ) (indicele preurilor)
k/ j
k/ j
k/ j
IV / q ( F ) = IV / q ( L ) IV / q ( P ) (indicele volumului fizic).
n Florea (1986) se extinde acest principiu de calcul pentru o mrimi Z depinznd dup o lege oarecare
de m factori. Astfel, indicii factoriali obinu i n urma aplicrii principiului Fisher sunt definii ca o
medie geometric a tuturor indicilor factoriali de tip Laspeyres i Paasche, relativ la acelai factor,
determina i prin toate succesiunile posibile de analiz a factorilor.

Spre exemplu n cazul n care mrimea Y depinde de doi factori, respectiv Z = f(X1, X2), indicii
factoriali se exprim astfel:
f ( X1( k ),X 2( j )) f ( X1( k ),X 2( k ))
I zk // xj ( F ) = I zk // xj ( L ) I zk // xj ( P ) =

1
1
1
f ( X1( j ), X 2( j )) f ( X1( j ), X 2( k ))
k/ j

k/ j

k/ j

I z / x ( F ) = I z / x ( L ) I z / x ( P ) =
2
2
2

f ( X1( j ),X 2( k )) f ( X1( k ),X 2( k ))

f ( X1( j ),X 2( j )) f ( X1( k ),X 2( j ))

Dac mrimea Z depinde de 3 factori, respectiv Z = f(X1, X2, X3), avnd 6 succesiuni de analiz a
factorilor, indicii factoriali au urmtoarele expresii:

2
2
I zk // xj ( F ) = 6 I zk // xj ( L L ) I zk // xj ( L P ) I zk // xj ( P L ) I zk // xj ( P P )
1
1
1
1
1

2
2
I zk // xj ( F ) = 6 I zk // xj ( L L ) I zk // xj ( L P ) I zk // xj ( P L ) I zk // xj ( P P )
2
2
2
2
2

2
2
I zk // xj ( F ) = 6 I zk // xj ( L L ) I zk // xj ( L P ) I zk // xj ( P L ) I zk // xj ( P P )

3
3
3
3
1

Justificm n continuare aceste expresii. Dac mrimea Z depinde de 3 factori se nregistreaz 6


succesiuni de studiere a influenei factorilor asupra variaiei mrimii. O prim succesiune poate fi
urmtoarea (X1, X2, X3), iar indicii factoriali vor nregistra urmtoarele expresii:
f ( X 1( k ), X 2 ( j ), X 3 ( j ))
k/ j
I z / x ( L L ) =
1
f ( X 1( j ), X 2 ( j ), X 3 ( j ))
f ( X 1 ( k ), X 2 ( k ), X 3 ( j ))
I zk // xj ( P L ) =
2
f ( X 1 ( k ), X 2 ( j ), X 3 ( j ))
f ( X 1( k ), X 2 ( k ), X 3 ( k ))
I zk // xj ( P P ) =
3
f ( X 1 ( k ), X 2 ( k ), X 3 ( j ))
Astfel, factorii a cror influen a fost msurat sunt considerai la nivelul lor din perioada curent, iar
cei. n notaia indicilor au intervenit simbolurile L, P i , unde L semnific faptul c
factorul se menine la nivelul baz de comparaie, P factorul se menine la nivelul curent, iar
acel factor este analizat. Indiferent de ordinea n care sunt analizai factorii, poziia lor n model nu se
schimb . Pentru toate succesiunile vor fi prezentai indicii factoriali, fr a fi redate expresiile lor.

Succesiunea

X1

(X1, X3, X2)

I z / x1 (L L)

(X1, X2 X3)

I z / x1 ( L L )
I z / x1 ( P L )

(X2, X1, X3)


(X2 X3, X1)
(X3, X1, X2)

I z / x1 ( P P )
I z / x1 ( L P )

(X3, X2, X1)

I z / x1 ( P P )

X2

X3

I z / x2 ( P P )
I z / x2 ( P L )

I z / x 3 ( P L )

I z / x2 ( L L )
I z / x2 ( L L )

I z / x 3 ( P P )

I z / x2 ( P P )
I z / x2 ( L P )

I z / x 3 ( L L )

I z / x 3 ( P P )
I z / x 3 ( L P )
I z / x 3 ( L L )

Dac mrimea Z depinde de m factori, indicii factoriali se determin ca o medie geometric a m!


indici ob inui prin cele m! succesiuni.

5.3. Testul Fisher i indicii factoriali


5.3.1. Testul Fisher
Referitor la definirea axiomatic a indicilor factoriali, I.Fisher a propus un test care i
poart numele i care conine un ansamblu de cerine (axiome) pe care trebuie s le satisfac
indicii factoriali ai unei mrimi, pentru a putea fi considerai indici factoriali buni. Aceste
axiome, ce compun testul Fisher, sunt:
a) identitatea (reflexivitatea), respectiv:
I zk // xk = 1

b) reversibilitatea n timp (simetrie), respectiv:


I zk // xj =

1
I zj // xk

c) Circularitatea (tranzitivitatea), respectiv produsul indicilor cu baz n lan trebuie s fie egal
cu indicele cu baz fix. Considernd trei stri succesive j, h, k, atunci:
h/ j

k/ j

I z / x I zk // xh = I z / x
d) Reversibilitatea factorilor (completitudinea), respectiv produsului indicilor factoriali este
egal cu indicele varia iei integrale a mrimii analizate.

I zk // xj I zk // xj ...I zk // xj = I zk / j
1
2
m
e) Proporionalitatea indicelui, adic, dac indicii individuali sunt egali cu A, indicele sintetic
trebuie s fie egal i el cu A.
f) Cerina de determinare a indicelui. Indicele sintetic nu trebuie s devin nul, nedefinit sau
nedeterminat, dac unul din indicii pariali devine nul, nedefinit sau nedeterminat.
g) Omogenitatea (comensurabilitatea) indicelui. Valoarea indicelui trebuie s fie independent de
schimb rile unitilor de msur.
h) Cerina schimbrii bazei indicelui. Rezultatul mpririi a doi indici din dou perioade diferite,
calculai cu aceeai metod i avnd aceeai baz trebuie s fie independent de alegerea bazei.
Se rein primele patru cerin e ca fiind mai importante.

5.3.2. Indicii factoriali prin prisma testului Fisher


n continuare se vor raporta indicii factoriali definii anterior, la testul Fisher (redus la cele 4
cerine). Sunt valabile urmtoarele enunuri.
a) Toi indicii sunt reflexivi.
De exemplu, n cazul factorului xi avem:
f ( X 1( k ),...X i ( k ),..., X m ( k ))
I zk // xk ( L... ...L ) =
=1
i
f ( X 1( k ),...X i ( k ),..., X m ( k ))
f ( X 1 ( k ),...X i ( k ),..., X m ( k ))
I zk // xk ( P ... ...P ) =
= 1.
i
f ( X 1 ( k ),...X i ( k ),..., X m ( k ))

b) n general, indicii Laspeyres i Paasche nu sunt simetrici, n schimb indicii Fisher sunt
simetrici.
De exemplu, n cazul indicilor Laspeyres avem:
I zk // xj ( L... ...L ) I zj // xk ( L... ...L ) =
i

f ( X 1( j ),...X i ( k ),..., X m ( j )) f ( X 1( k ),...X i ( j ),..., X m ( k ))

1
f ( X 1 ( j ),...X i ( j ),..., X m ( j )) f ( X 1 ( k ),...X i ( k ),..., X m ( k ))
Un calcul similar arat c indicii Fisher sunt simetrici.
c) Nici unul dintre indicii factoriali prezentai pn aici nu sunt tranzitivi.
De exemplu, n cazul indicilor Laspeyres avem:
=

h/ j

I z / x ( L... ...L ) I zk // xh ( L... ...L ) =


i
i
=

f ( X 1( j ),...X i ( h ),..., X m ( j )) f ( X 1 ( h ),...X i ( k ),..., X m ( h ))

f ( X 1( j ),...X i ( j ),..., X m ( j )) f ( X 1( h ),...X i ( h ),..., X m ( h ))

f ( X 1 ( j ),...X i ( k ),..., X m ( j ))
= I zk // xj
i
f ( X 1( j ),...X i ( j ),..., X m ( j ))

d) Dintre indicii factoriali prezentai, numai indicii Fisher verific condiia de completitudine a
testului. Astfel, de exemplu, n cazul n care mrimea Z depinde de doi factori, Z = f(X1, X2), avem:
I zk // xj I zk // xj ( F ) =
1
2

f ( X 1 ( k ), X 2 ( j )) f ( X 1 ( k ), X 2 ( k ))

f ( X 1 ( j ), X 2 ( j )) f ( X 1( j ), X 2 ( k ))

f ( X 1 ( J ), X 2 ( K )) f ( X 1( k ), X 2 ( k )) f ( X 1( k ), X 2 ( k ))

=
= I zk / j
f ( X 1 ( j ), X 2 ( j )) f ( X 1( k ), X 2 ( j )) f ( X 1( j ), X 2 ( j ))
Observm c indicii factoriali de tip Fisher satisfac cele mai multe axiome, fiind reflexivi,
simetrici respectiv verific condiia de completitudine a testului Fisher.

5.4. Alte metode de calcul a indicilor factoriali - (facultativ)


Exemplu 2.
Considerm mrimea Z=C reprezentnd cheltuielile privind consumul a dou produse. Datele
referitoare la factorii si de influen, adic preul mediu de cump rare i cantitatea cump rat, pentru
dou luni consecutive sunt prezentate n tabelul urmtor:
Produs
Produs A
Produs B

Aprilie 2004
Pre mediu
3400
890

Cantitate
2 (kg)
10 (buc)

Mai 2004
Pre mediu
3550
1100

cantitate
3 (kg)
8 (buc)

a) indicele variaiei integrale a mrimii C;


b) indicii factoriali ai mrimii C, de tip Laspeyres, Paasche respectiv Fisher. Verific rezultatele
obinute condiia de completitudine a testului Fisher?
c) calculul restului nedescompus din metoda schimb rilor simultane;
d) exprimarea indicilor factoriali sintetici n funcie de indicii elementari corespunztori.
Rezolvare
a) Mrimea C se exprim n funcie de pre i cantitate astfel:
n

C = p i qi
i =1

unde:
pi preul mediu unitar al produsului i;
qi cantitatea cumprat din produsul i;
n cazul analizat avem n=2.
Notm cu: 0 - luna aprilie
1 - luna mai.
Indicele exprimnd variaia total a mrimii C se determin astfel:
C (1) 19450
1/ 0
IC
=
=
= 1,2388
C (0 ) 15700
2

C (1) = pi (1)qi (1) =3550 3 + 1100 8 = 19450


i =1
2

C (0 ) = pi (0 )qi (0 ) =3400 2 + 890 10 = 15700


i =1

1/ 0
C

I = 1,2388 arat o cretere a cheltuielilor cu consumul celor dou produse, n luna aprilie fa de
luna mai, de 1,238 ori.

b) Indicii factoriali
b1) Indicii factoriali Laspeyres
2

pi (1)qi (0 )

3550 2 + 1100 10 18100


1/ 0
i =1
IC
=
=
= 1,1528
/ p ( L ) = 2
C (0 )
15700
pi (0 )qi (0 )
i =1
2

pi (0 )qi (1)

1/ 0
i =1
IC
/ q ( L ) = 2

pi (0 )qi (0 )

3400 3 + 890 8 17320


=
= 1,1032
C (0 )
15700

i =1

1,1528 ne arat de cte ori ar fi crescut cheltuielile C, dat s-ar fi modificat numai preurile, cantitile
rmnnd constante la nivelul lunii aprilie.
1,1032 arat de cte ori ar fi crescut cheltuielile C dac s-ar fi modificat numai cantitile cumprate,
iar preurile ar fi rmas constante la nivelul lunii aprilie.
Verificm cerina de completitudine a testului Fisher, astfel:
1/ 0
1/ 0
1/ 0
IC
/ p ( L )I C / q ( L ) = 1,1528 1,1032 = 1,27177 I C

deci aceasta nu este ndeplinit.

b2) Indicii factoriali Paasche


pi (1)qi (1)
C1
19450
1/ 0
I C / p ( P ) = i
=
=
= 1,12298
(
)
(
)
pi 0 qi 1 3400 3 + 890 8 17320
i

pi (1)qi (1)
19450
1/ 0
I C / q ( P ) = i
=
= 1,0746
pi (1)qi (1) 18100
i

1,12298 ne arat de cte ori ar fi crescut cheltuielile C dac s-ar fi modificat numai preurile,
cantit ile rmnnd constante la nivelul lunii mai.
1,0746 ne arat de cte ori ar fi crescut cheltuielile C dac s-ar fi modificat numai cantitile
cump rate, preurile rmnnd constante la nivelul lunii mai.
Cerina de completitudine a testului Fischer, respectiv:
1/ 0
1/ 0
1/ 0
IC
/ p ( P )I C / q (P ) = 1,12298 1,0746 = 1,20675 I C

nu este verificat.

b3) Indicii factoriali Fisher


1/ 0
1/ 0
1/ 0
IC
/ p (F ) = I C / p ( L )I C / p (P ) = 1,1528 1,12298 = 1,1378
1/ 0
1/ 0
1/ 0
IC
/ q (F ) = I C / q (L )I C / q (P ) = 1,1032 1,0746 = 1,0888 .
1/ 0
1/ 0
1/ 0
IC
/ p (F ) I C / q ( F ) = 1,1378 1,0888 = 1,2388 = I C

Indicii Fisher verific condiia de completitudine a testului Fisher.

Astfel,
1,1378 ne arat de cte ori cresc cheltuielile C pe seama modificrii preurilor de cumprare.
1,0888 ne arat de cte ori cresc cheltuielile C pe seama modificrii cantit ilor cump rate.
c) facultativ
d) Exprimarea indicilor sintetici n funcie de indicii elementari
n

Considernd mrimea C = C i , unde Ci = piqi reprezint cheltuiala cu produsul i, indicele variaiei


i =1

integrale este:
1/ 0
IC

C i (1)
C (1)
=
= i
C (0 ) C i (0 )
i

C (1)
1/ 0
1/ 0
Notnd prin I C
rezult c Ci (1) = I C
Ci (0 ) .
= i
i
i
C i (0 )
1/ 0
1/ 0
nlocuind pe Ci(1) cu expresia I C
, avem:
C i (0 ) , n I C
i

1/ 0

Ci (1)

C i (1)
i
1/ 0
i
i
=
IC =
Ci (0 )
Ci (0 )
i
i
IC

deci indicele exprimnd variaia integral a mrimii C se poate determina ca o medie aritmetic
ponderat a indicilor elementari (ICi).
Astfel:
C (1) 10650
1/ 0
IC
= 1 =
= 1,566
1
C1 (0) 6800
C (1) 8800
1/ 0
IC
= 2 =
= 0.9887
2
C 2 (0 ) 8900
1,566 6800 + 0,9887 8900
= 1,2388
I C1 / 0 =
15700
La fel se pot exprima i indicii factoriali n funcie de indicii elementari ai factorilor respectivi.
Ca atare, avnd indicele Laspeyres:
pi (1) qi (0 )
1/ 0
I C / p ( L ) = i
pi (0 ) qi (0 )
i

i indicele elementar al preului, respectiv:


I 1p/ 0 =
i

pi (1)
pi (0 )

1/ 0
nlocuind p i(1) cu pi (1) = I 1p/ 0 pi (0 ) , n expresia indicelui I C
/ p ( L ) , rezult:
i
1/ 0

Ip

1/ 0
i
IC
/ p ( L ) =

pi (0 ) q i (0 )

pi (0 ) qi (0 )
i

Deci, indicele factorial de tip Laspeyres se exprim ca o medie aritmetic ponderat a indicilor
elementari.

Relativ la indicele factorial de tip Paasche,


pi (1)qi (0 )

1/ 0
i
IC
/ p ( L ) =

pi (0 )qi (0 )
i

i la indicii elementari ai preului, respectiv:


I 1p/ 0 =
i

pi (1)
pi (0 )

1
1/ 0
nlocuind pe pi(0) cu expresia pi (1)
n expresia indicelui I C
, rezult:
/ p ( P )
1/ 0
Ip
i

1/ 0
IC
/ p ( P ) =

pi (1)qi (1)
i

1
1 / 0 pi (1)qi (1)
i I
p
i

Deci, indicele factorial de tip Paasche se determin ca o medie armonic ponderat a indicilor
elementari.
Numeric rezult:
3550
I 1p/ 0 =
= 1,044
1
3400
iar
1/ 0

Ip

1/ 0
( ) i
IC
/ p L =

I 1p/ 0 =
2

pi (0 ) qi (0 )

pi (0 ) qi (0 )

1100
= 1,236
890

1,400 6800 + 1,236 8900


= 1,1528
15700

i
1/ 0
IC
/ p ( P ) =

pi (1) q i (1)
i

1 / 0 p i (1) qi (1)
i I
p

19450
1
1
10650 +
8800
1,044
1,236

= 1,112298

Asemntor se pot exprima i indicii factoriali ai cantitii n funcie de indicii elementari.

5.5. Principalii indici utilizai n economie


n cadrul indicatorilor statistici, indicii ocup un loc important. Cu ajutorul indicilor se cuantific
n mod sintetic micarea relativ a fenomenelor. Principalii indici sintetici (de grup) urmrii i
utilizai pe scar larg de ctre agenii economici sunt:
1. indicii preurilor de consum;
2. indicele preurilor produciei industriale;
3. indicele salariilor;
4. indicii bursieri.
Acetia sunt calcula i i publica i periodic de ctre institu ii specializate.

5.5.1. Indicii preurilor de consum


Indicele general al preurilor de consum m soar evolu ia de ansamblu a preurilor m rfurilor
achiziionate i a tarifelor serviciilor utilizate de ctre populaia unei ari, ntr-o perioad curent fa
de o perioad anterioar considerat baz de comparaie. n ara noastr, indicii preurilor de consum

se calculeaz lunar i se public n Buletinul Statistic de Preuri respectiv n Anuarul Statistic al


Romniei.
Metodologia de calcul
Metodologia de calcul a indicelui preurilor de consum n ara noastr este n general armonizat
cu metodologia utilizat de Oficiul de Statistic a Uniunii Europene (EUROSTAT). Acest indice se
calculeaz ca i un indice factorial de tip Laspeyres, relativ la mrimea Z reprezentnd cheltuielile de
consum ale populaiei:
n

Z = p i qi
i =1

unde qi reprezint cantitile cump rate iar pi preurile respectiv tarifele la care au fost cump rate
mrfurile i serviciile.
Se tie c indicele preurilor de tip Laspeyres se poate exprima ca i o medie aritmetic ponderat
a indicilor individuali ai preurilor:
n

k/ j
Z/p

( L ) =

qi ( j ) pi (k )
i =1
n

q ( j) p ( j)
i

q ( j ) p ( j ) p (k ) / p ( j )
i

i =1
n

q ( j) p ( j)

i =1

i =1

i =1

i =1

= k i ( j ) p i (k ) / p i ( j ) = I pki/ j k i ( j )
unde k i ( j ) =

qi ( j) pi ( j)
n

q ( j) p ( j)
i

indic ponderea cheltuielilor cu produsul i n total cheltuieli, n perioada

i =1

de baz, i se numete coeficient bugetar al produsului i. Aceti coeficieni redau structura de consum
a populaiei.
Indicele preurilor de consum se calculeaz n baza acestei forme de exprimare a indicelui
Laspeyres, ca i medie aritmetic ponderat a indicilor individuali ai preurilor:
n

I Zk // pj ( L ) = I pki/ j k i ( j ) .
i =1

n practica statistic din ara noastr se calculeaz i se public:


- indicele preurilor de consum cu baz fix (luna octombrie 1990);
- indicele preurilor de consum cu baz n lan;
- indicele preurilor de consum fa de luna decembrie a anului precedent;
- indicele preurilor de consum pe ntregul an fa de media anului precedent
metodologia de calcul vezi Baron i alii, 1996);
- indicele mediu lunar al preurilor de consum (Baron i alii, 1996).

(pentru

Culegerea datelor statistice


Calculul efectiv al indicelui presupune:
a) stabilirea eantionului de mrfuri i servicii reprezentative pentru consumul populaiei (co
de mrfuri i servicii);
b) calculul indicilor individuali ai preurilor I pki/ j ;

c) determinarea coeficienilor de ponderare k i ( j ) , cu care se introduce sortimentul i n


calculul indicelui general al preurilor.
a) Eantionul de mrfuri i servicii cuprinde circa 1430 de sortimente cu pondere semnificativ n
consum. Nomenclatorul utilizat este structurat pe trei nivele de agregare: grupe, posturi i sortimente,
sortimentele fiind concretizate n diverse marfuri i servicii.

Indicii individuali ai preurilor calculai pentru fiecare sortiment se agreg la nivel de post de
cheltuieli, grupe respectiv la nivel de indice general, prin utilizarea ponderilor constante (n prezent
cele din 1997). Utilizarea ponderilor constante permite comparaii ale evoluiei preurilor n timp.
b) Indicii individuali ai preurilor I pki/ j , pentru fiecare sortiment, se determin n baza datelor
culese ntr-un eantion al punctelor de vnzare. Sondajul se realizeaz n mai multe faze, n prima faz
fiind stabilit un eantion al localitilor (42) avnd n vedere criterii precum volumul vnzrilor de
mrfuri i servicii, numrul populaiei .a.. Din aceste localiti sunt selectate centre de cercetare (68).
Punctele de vnzare supuse observrii sunt magazine i uniti prestatoare de sevicii din centrele de
cercetare, volumul eantionului fiind de aproximativ 6000 puncte de vnzare.
Preurile unitare ale mrfurilor i serviciilor din co ul consumatorului sunt observate sptmnal
n aceste puncte de vnzare. Media lunar a preului fiecrui produs sau serviciu notat p(k) se
compar cu preurile n perioada de baz p(j) obinndu-se indicele individual al preului.
c) Determinarea coeficienilor de ponderare k i ( j ) se realizeaz n baza datelor ob inute prin
Ancheta Integrat n Gospod rii. Aceasta este o cercetare statistic parial, fiind reprezentate n
eantion familii de salariai, patroni, rani, omeri, pensionari. ntr-un caiet special pus la dispoziia
fiecrei familii din eantion se completeaz zilnic toate intrrile de bani i toate ieirile b neti din
gospod rie, precizndu-se totodat sursele, respectiv destinaia acestora. Prin centralizarea lunar a
acestor bugete de familie se obin o serie de informaii, cum ar fi ponderarea cheltuielilor cu fiecare
bun sau serviciu n totalul cheltuielilor, consumurile medii din diferite produse etc. Practic, coeficienii
bugetari k i ( j ) utilizai n calculul indicelui preurilor se actualizeaz doar la intervale de civa ani,
atunci cnd se contat c mutaiile intervenite n structura cheltuielilor efectuate de populaie sunt
semnificative. O analiz a acestor mutaii n ara noastr relev o tendin de cretere, n ultimii ani, a
ponderii serviciilor n consum.
Utilizri ale indicelui preurilor
Indicele preurilor de consum (IPC) este utilizat n principal pentru:
a) Calculul ratei inflaiei (RI):
RI = ( IPC 1) 100% .
n pactica statistic, mrimea inflaiei se cuantific de regul pe baza indicelui preurilor de consum.
Astfel calculat, rata inflaiei indic ritmul de cretere al preurilor mrfurilor i al tarifelor seviciilor
din consumul populaiei. O alt msur a inflaiei propus n literatur este deflatorul PIB.
Rata inflaiei este unul din cei mai cunoscu i indicatori macroeconomici. Deciziile luate la nivel
macroeconomic respectiv microeconomic in seama n general de evolu ia acestui indice. Este
deasemenea indicatorul cel mai prezent n mass media.
b) Determinarea indicatorilor reali
Exprimarea n preuri constante sau comparabile a unui indicator permite evidenierea evolu iei
reale a acestuia, eliminndu-se astfel influena creterii preurilor.
In general, pentru a ob ine evoluia real a unei marimi economice se va imp ri nivelul
(nominal) al acesteia la indicele preurilor cu baz fix. Este indicat a se utiliza un indice al preurilor
adecvat indicatorului analizat, n msura n care acesta este disponibil.
Indicele general al preurilor este utilizat pentru deflaionarea consumului privat, st la baza
calculrii veniturilor reale ale populaiei, a salariului respectiv a pensiei reale etc. Este utilizat de
asemenea ca punct de plecare n indexarea salariilor i a pensiilor.

5.5.2. Indicele preurilor produciei industriale


Exprim evoluia per ansamblu a preurilor/ tarifelor industriale fabricate i livrate de ctre
productorii interni, ntr-o perioad curent faa de o perioad baz de comparaie. Se are n vedere
doar primul stadiu de comercialiare a produselor/seviciilor.
Se calculeaz cu un indice factorial de tip Laspeyres, relativ la mrimea:

Z = pi qi = volumul valoric al productiei


i =1

unde pi reprezint preul de vnzare (preul tranzaciei) al produsului i;


qi cantitatea vndut din produsul i.
Astfel, indicele preurilor produciei industriale, calculat pentru piaa intern, este:
I Zk // pj ( L ) = I pki/ j k i ( j )
i

unde k i ( j ) =

qi ( j ) pi ( j )
n

q ( j) p ( j)
i

reprezint ponderea valorii produciei industriale tranzacionat din

i =1

produsul i n total producie industrial tranzacionat, n perioada de baz j.


Preurile considerate n calculul indicelui preurilor produciei industriale nu conin TVA, dar
includ unele impozite i taxe specifice podusului. Indicii individuali ai preurilor se agreg succesiv
avnd n vedere Clasificarea Activitilor Economiei Naionale (CAEN). In prezent se utilizeaz
ponderile din anul 1996.

5.5.3. Indicele salariilor


Exprim evolu ia salariilor n perioada curent fa de perioada de baz. mpreun cu indicele
preurilor de consum este folosit pentru analiza nivelului de trai.
Se calculeaz ca un indice factorial Laspeyres, relativ la mrimea
n

Z = ni si = fond total de salarii


i =1

unde:
si salariul mediu al personalului din activitatea i;
ni numrul de persoane din activitatea i.
n

I Zk // sj (L ) =

n ( j )s ( j ) n ( j ) s ( j ) s (k ) / s ( j )
i

i =1
n

n ( j )s ( j )
i

i =1

i =1
n

n ( j)s ( j )
i

i =1

i =1

i =1

= vi ( j ) s i (k ) / si ( j ) = I ski / j vi ( j )
unde vi ponderea fondului de salarii a personalului din activitatea i n total fond de salarii.

5.5.4. Indicii bursieri


Indicele bursier reflect evoluia general a cursurilor unui ansamblu de titluri. Piaa bursier
reprezint barometrul cel mai sensibil al unei economii. Msurarea evoluiei acesteia se realizeaz prin
intermediul indicilor bursieri. Principalii indici bursieri se difereniaz dup: eantionul titlurilor
considerate n coul indicelui, reprezentativitate, mod de calcul respectiv natura variabilelor luate n
calcul (Todea, 2002). Eantionul titlurilor ce intr n coul indicelui va putea suferi modificri, pentru
a rmne reprezentativ n timp. In ceea ce privete modul de calcul, s-au propus diferite metode,
fiecare avnd avantaje respectiv dezavantaje. Prezentm n continuare principalele metode de calcul
utilizate n calculul celor mai cunoscu i indici bursieri.
a) Indicele factorial de tip Laspeyres
In acest caz, indicele bursier se calculeaz ca i un indice factorial relativ la mrimea CB, numit
capitalizare bursier:

CB = ci ni
i =1

unde:
ci reprezint cursul (preul) titlului i;
ni numrul de titluri de tipul i tranzacionate (volumul) ;
m numrul de titluri considerate n calculul indicelui (n co ul indicelui).
Indicele bursier de tip Laspeyres este un indice factorial al preului, cu baz fix:
m

t/0
CB / c

(L ) =

n (0 )c (t )
i

i =1
m

n (0 )c (0 )
i

i =1

Periodic, baza indicelui este ajustat, pentru a se nltura unele neajunsuri legate de meninerea
constant a ponderilor.
Principalii indici bursieri din lumea fianciar sunt calculai n acest mod. Amintim aici urmtorii
indici:
- S&P 500, calculat pentru 500 de aciuni, cele mai reprezentative de pe piaa american. A
fost lansat n 1943, baza sa fiind de 10 puncte;
- Topix ia in calcul titlurile (1250) din prima categorie cotate pe piaa japonez. Baza sa este
de 100 puncte, iar data lansrii 04.01 1968;
- Nikkei 300 cuprinde 300 de titluri din prima categorie a pieei din Tokyo. A fost lansat n
1993;
- CAC 40 este principalul indice francez. A fost lansat n anul 1997, baza sa fiind de 1000
puncte;
- FTSE 100 este principalul indice britanic, fiind lansat n 1983, cu baza 1000 de puncte.
Indicele cuprinde 100 de titluri din domenii diferite (69 industriale, 21 financiare, 5
petroliere, 2 de investiii, 2 miniere, 1 firm de comer internaional).
In ara noastr , indicele oficial al pieei bursiere este indicele BET (Bucharest Exchange
Trading), calculat pentru un eantion de 10 societi, cele mai reprezentative. A fost lansat la
19.09.1997, baza sa fiind de 1000 puncte. Se calculeaz deasemenea ca i un indice factorial
Laspeyres, cu baz fix. Indicele BET constituie suport al tranzaciilor la termen, la Bursa Monetar
Financiar i de Mrfuri Sibiu. Se mai calculeaz i se public indicele BET Composite, care ia n
calcul toate aciunile cotate la Bursa de Valori Bucureti.
b) Indicele de tipul mediei aritmetice
Indicele bursier se calculeaz n acest caz dup formula :
m
c (t )
I t / 0 = B0 i
i =1 c i (0)
unde :
- B0 reprezint valoarea indicelui la momentul lansrii;
- ci cursul (preul) titlului i;
- m este numrul de titluri considerate n calculul indicelui (n co ul indicelui).
Intervin aici indicii elementari, cu baz fix, ai cursurilor celor n titluri. Acest mod de calcul nu ine
seama de capitalizarea bursier, respectiv de importana diferitelor titluri pe pia.
Cel mai important indice calculat dup aceast relaie este indicele Dow-Jones Industrial Average
(DJIA). Prima modalitate de calcul a unui indice bursier este de acest tip i dateaz din 1884, autorii ei
fiind Charles Dow i Eduard Jones. n practic, indicele Dow-Jones se calculeaz astfel: unul pentru
industrie (Dow-Jones Industiral) pe baza indicilor individuali a 30 titluri emise de cele mai importante
societi industriale din SUA, al doilea este un indice Dow-Jones pentru transporturi, cuprinznd 20
titluri a celor mai importante firme din domeniu, al treilea indice Dow-Jones se calculeaz pentru

servicii publice i cuprinde titluri emise de 15 societi. Cei trei indici sunt reunii ntr-un indice global
Dow-Jones, caracteriznd una din pieele bursiere ale SUA NYSE (New-York Stock Exchange).
O variant a indicelui Dow-Jones o constituie indicele bursier japonez Nikkey Dow Jones,
instituit n 1950 i calculat pe baza cursurilor a 225 aciuni cotate la bursa oficial (Tokio Stock
Exchange).
c) Indicele geometric
Indicele bursier se calculeaz n acest caz ca i o medie geometric a indicilor individuali ai
cursurilor titlurilor din co ul indicelui:
I ct / 0 = m I ct1/ 0 I c2t / 0 L I cmt / 0 .
Cel mai cunoscut indice calculat dup aceast relaie este indicele bursier FT-30 (Financial Times
Industrial Ordinary).
Indicele de tip medie aritmetic respectiv indicele geometric nu au o fundamentare economic i
nici statistic, pentru c n primul rnd nici o expresie nu are n vedere structura titlurilor. Indicele
unui grup mai restrns sau mai larg de titluri trebuie s exprime efectul schimbrii cursurilor asupra
capitalizrii bursiere, deci este indicat s fie un indice factorial.

Exemplul 3. Ob inerea prin agregare a indicelui preurilor de consum.


Avnd la dispoziie datele privind coeficien ii bugetari i indicii preurilor pentru diverse grupe de
mrfuri servicii ce fac parte din eantionul pe baza cruia se calculeaz indicele preurilor n Romnia,
se cere:
calcularea indicelui preurilor mrfurilor alimentare, n luna noiembrie fa de luna
a)
octombrie;
b)
calcularea indicelui general al preurilor, la nivelul tuturor grupelor de mrfuri i servicii.
Nr.
crt.
I.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
II.
III.

Denumirea
mrfurilor/serviciilor
Mrfuri alimentare, din care:
- produse de morrit i panificaie
- legume i conserve din legume
- fructe i conserve din fructe
- ulei, slnin, grsimi
- carne, preparate din carne i
conserve din carne
- pete i conserve din pete
- lapte i produse lactate
- ou
- zahr, produse zaharoase i
miere de albine
- cacao i cafea
- buturi alcoolice
- alte produse alimentare
Mrfuri nealimentare
Servicii

Coeficien i de
ponderare

Indicele
preurilor

(noiembrie fa
de octombrie)

4692
883
474
255
261
1319

108,0
108,0
111,1
102,7
100,5

62
470
161
276

101,5
105,8
115,6
107,8

163
255
113
4054
1254

102,4
101,5
102,8
104,2
104,9

Rezolvare
a) Considerm mrimea C = pi qi unde:
i

pi reprezint preul de cump rare al produsului i;


qi reprezint cantitatea cump rat din produsul i.

Indicele preurilor de consum, calculat n practica statistic de la noi din ar, este un indice de tip
Laspeyres:
I Ck // pj (L ) = I kpi/ j k i ( j )
i

Indicele preurilor la produsele alimentare va fi egal cu:


I Ck // pj A (L) =

101,6 883 + 108 474 + 111,1 255 + 102,7 261+ 100,5 1319 + 101,5 62
+
4692

105,8 470 + 115,6 161+ 107,8 276 + 102,4 163 + 101,5 255 + 102,8 113
= 103,8
4692
Preurile produselor alimentare au crescut per ansamblu, n luna noiembrie fa de octombrie, de 1.038
ori sau n proporie de 103.8%.
+

b) Indicele preurilor la nivelul tuturor grupelor de produse i servicii este:


I

k/ j
C/ p

(L ) =

I Ck // pj , A (L ) 4692 + I Ck // pj , NA (L ) 4054 + I Ck // pj , S (L ) 1254


10000

103,8 4692 + 104,2 4054 + 104,9 1254


= 104,1
10000
Preurile mrfurilor i tarifele serviciilor din consumul populaiei au crescut per ansamblu, n luna
noiembrie fa de octombrie, de 1,041 ori sau n proporie de 104,1%.
=

Exemplul 4. Deflaionarea
Vnzrile trimestriale ale unei societi avnd ca obiect de activitate desfacerea laptelui de
consum, sunt urmtoarele:
trim.I trim.II trim.III trim.IV
mld.lei
Y :
1560
1880
1000 1280

Creterile de pre de la un trimestru la altul au fost de 4 % n trim.II, 3 % n trim.III i 6 % n trim.IV.


Se cere s se determine evolu ia real (neafectat de infla ie) a vnzrilor din acest produs.
Rezolvare

Creterile de pre se reprezint sub form de indici astfel:


/I
I II
= 1,04
p

/ II
I III
= 1,03
p

/ III
I IV
= 1,06
p

Pentru a corecta vnzrile, avem nevoie de indicele preului calculat cu baz fix, respectiv fa de
trim.I. Pentru calcularea indicilor cu baz fix ne folosim de proprietatea de circularitate a indicilor,
respectiv:
/I
/I
I III
= I II
I pIII / II
p
p
/I
/ II
/ III
I IV
= I pII / I I III
I IV
p
p
p

Astfel,

I pIII / I = 1,04 1,03 = 1,0712


I pIV / I = 1,04 1,03 1,06 = 1,1355

n acest caz evoluia vnzrilor reale trimestriale ale societii (exprimate n preuri constante, ale
trimestrului I), obinute din cele iniiale prin mprire la indicele preului cu baz fix, sunt:
trim.I trim.II trim.III trim.IV
.
Y :
1000 1230,8 1456,3 1655,6

Exemplul 5. Calculul indicelui bursier, de tip Laspeyres


Presupunem c n coul indicelui bursier intr doar trei tipuri de aciuni. Relativ la acestea cunoatem,
pentru dou cotaii, urmtoarele date:
Tip aciune

Antibotice Iai
Azo Mure
Oltchim

Perioada de baz
19.09.1997
n0
c0
65533
7400
25609
2850
450982
4300

Perioada curent
20.09.2004
nt
482170
40676
418344

ct
3800
3370
1840

Perioad baz de comparaie este considerat aici data la care a fost lansat indicele BET. Prin n s-a
notat numrul de aciuni tranzacionate (volumul) iar c reprezint cursul aciunii.
Se cere:
a) calculai i interpretai indicii individuali de modificare a cursului;
b) calculai i interpretai indicele bursier, de tip Laspeyres;
c) dac indicele bursier la cotaia precedent a fost de 560 puncte, determinai i interpretai rata
rentabilitii pieei (faa de cotaia precedent).
Rezolvare
a) Indicii individuali ai cursului aciunilor sunt:
c (t ) 3800
I ct1/ 0 = 1 =
= 0.513
c1 (0) 7400
c (t ) 3370
I ct2/ 0 = 2 =
= 1.182
c 2 (0 ) 2850
c (t ) 1840
I ct3/ 0 = 3 =
= 0.428
c3 (0 ) 4300
Cursul aciunii Antibiotice Iai a sczut, la 20.09.2004 fa de 19.09.1997, la 51.3%.

b) Indicele bursier se calculeaz ca i un indice factorial relativ la mrimea CB, numit


capitalizare bursier:
3

CB = ci ni
i =1

unde:
ci reprezint cursul (preul) aciunii i;
ni numrul de aciuni de tipul i tranzacionate (volumul).
Indicele bursier de tip Laspeyres nregistreaz valoarea:

n (0)c (t )
i

(L ) =

t/0
CB / c

i =1
3

n (0)c (0)
i

65533 3800 + 25609 3370 + 450982 1840


= 0.467
65533 7400 + 25609 2850 + 450982 4300

i =1

Prin urmare, indicele bursier a sczut de la 1000 de puncte la 467 de puncte.

c) Rata rentabilitii pieei bursiere (fa de cotaia precedent) se determin din relaia
urmtoare:
I t / 0/ c ( L )
R t / t 1 = CB
1.
t 1 / 0
I CB
/ c (L )
Astfel,
0.467
R t / t 1 =
1 = 0.166
0.560
ceea ce indic o scdere a rentabilittii pieei cu 1.66%.
Exemplul 6. Cazul n care factorii se compun dup un model matematic de tip sum de produse
O firm a achizi ionat de la un furnizor, n decursul a doi ani, trei produse. Modul n care s-a
modificat preul acestora, precum i cantitile achiziionate din cele trei produse n perioadele
considerate este ilustrat n tabelul urmtor:
2003
2004
p
q
p
q
1 23
5
28
7
2 29
6
34
4
3 12 15
9
18
S se studieze evoluia valorii acestor produse n funcie de indicele variaiei integrale i indicii
varia iilor factoriale.
Rezolvare
Suntem n cazul:

V = pi qi
i

1. Indicele variaiei integrale


3

p (04) q (04)
i

04 / 03
V

i =1
3

p (03) q (03)
i

28 7 + 34 4 + 9 18 494
=
= 1,053
23 5 + 29 6 + 12 15 469

i =1

valoarea produselor achiziionate a crescut n 2004 fa de 2003 de 1,053 ori

2. Indicii variaiilor factoriale


a) Indicii Laspeyres
3

I V04/ /p03 (L ) =

p (04) q (03)
i

i =1
3

p (03) q (03)
i

28 5 + 34 6 + 9 15 479
=
= 1,021
23 5 + 29 6 + 12 15 469

i =1

valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,021 ori datorit variaiei
preului

p (03) q (04)
i

04 / 03
V /q

(L ) =

i =1
3

p (03) q (03)
i

23 7 + 29 4 + 12 18 493
=
= 1,051
23 5 + 29 6 + 12 15 469

i =1

valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,051 ori datorit variaiei
cantit ii

b) Indicii Paasche
3

04 / 03
V/p

(P ) =

p (04) q (04)
i

i =1
3

p (03) q (04)
i

28 7 + 34 4 + 9 18 494
=
= 1,002
23 7 + 29 4 + 12 18 493

i =1

valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,002 ori datorit variaiei
preului
3

p (04) q (04)
i

I V04/ /q03 (P ) =

i =1
3

p (04) q (03)
i

28 7 + 34 4 + 9 18 494
=
= 1,031
28 5 + 34 6 + 9 15 479

i =1

valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,031 ori datorit variaiei
cantit ii

c) Indicii Fisher

I V04/ /p03 (F ) = I V04/ /p03 (L ) I V04/ /p03 (P ) = 1,021 1,002 = 1,011

valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,011 ori datorit variaiei
preului

I V04/ /q03 (F ) = I V04/ /q03 (L ) I V04/ /q03 (P ) = 1,051 1,031 = 1,041

valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,041 ori datorit variaiei
cantit ii

Exemplul 7. Cazul n care factorii se compun dup un model matematic de tip produs
Se consider o firm pentru care se cunosc urmtoarele date aferente perioadei 2005-2006:
2005 2006
W
0,62
0,78
L
210
272
unde:
W productivitatea/angajat;
L numrul de angajai.
S se studieze pe baza indicelui variaiei integrale i a indicilor variaiei factoriale evolu ia produciei
firmei n perioada 2005-2006.
Rezolvare
Suntem n cazul:

Q =W L

1. Indicele variaiei integrale


W (06) L(06) 0,78 272 212,16
I Q06 / 05 =
=
=
= 1,629
W (05) L(05) 0,62 210 130,2

producia firmei a crescut n 2006 fa de 2005 de 1,629 ori

2. Indicii variaiilor factoriale


a) Indicii Laspeyres
W (06) L(05) 0,78 210 163,8
I Q06/ W/ 05 (L ) =
=
=
= 1,258
W (05) L(05) 0,62 210 130,2

producia firmei a crescut n 2006 fa de 2005 de 1,258 ori datorit influenei


productivitii/angajat
W (05) L(06) 0,62 272 168,64
I Q06/ /L05 (L ) =
=
=
= 1,295
W (05) L(05) 0,62 210 130,2

producia firmei a crescut n 2006 fa de 2005 de 1,295 ori datorit variaiei numrului de
angajai
b) Indicii Paasche

W (06) L(06) 0,78 272 212,16


=
=
= 1,258
W (05) L(06) 0,62 272 168,64

producia firmei a crescut n 2006 fa de 2005 de 1,258 ori datorit variaiei


productivitii/angajat
W (06 ) L(06 ) 0,78 272 212,16
I Q06/ /L05 (P ) =
=
=
= 1,295
W (06) L(05) 0,78 210 163,8

producia firmei a crescut n 2006 fa de 2005 de 1,295 ori datorit variaiei numrului de
angajai
I Q06/ W/ 05 (P ) =

c) Indicii Fisher

I Q06/ W/ 05 (F ) = I Q06/ W/ 05 (L ) I Q06/ W/ 05 ( P ) = 1,258 1,258 = 1,258

producia firmei a crescut n 2006 fa de 2005 de 1,258 ori datorit variaiei


productivitii/angajat

I Q06/ /L05 (F ) = I Q06/ /L05 (L ) I Q06/ /L05 ( P ) = 1,295 1,295 = 1,295

producia firmei a crescut n 2006 fa de 2005 de 1,295 ori datorit variaiei numrului de
angajai

Exemplul 8. Cazul n care factorii se compun dup un model matematic de tip sum
O firm productoare de obiecte sanitare deine trei magazine de desfacere pentru care se
cunoate cifra de afaceri (n mii euro) n perioada 2004-2005:
2004 2005
CA1
28
35
CA2
26
20
CA3
51
70
S se studieze evoluia cifrei de afaceri pe baza indicilor variaiei integrale i factoriale.
Rezolvare
Suntem n cazul:

CA = CA1 + CA2 + CA3

1. Indicele variaiei integrale


CA 05 + CA205 + CA305 35 + 20 + 70 125
05 / 04
I CA
= 104
=
=
= 1,190
CA1 + CA204 + CA304 28 + 26 + 51 105

cifra de afaceri a crescut n 2005 fa de 2004 de 1,190 ori

2. Indicii variaiilor factoriale


a) Indicii Laspeyres
CA105 + CA204 + CA304 35 + 26 + 51 112
05 / 04
I CA
=
=
= 1,067
/ CA1 (L ) =
CA104 + CA204 + CA304 28 + 26 + 51 105

cifra de afaceri a crescut n 2005 fa de 2004 de 1,067 ori datorit variaiei cifrei de afaceri a
magazinului 1
CA104 + CA205 + CA304 28 + 20 + 51 99
05 / 04
I CA
(
L
)
=
=
=
= 0,943
/ CA2
CA104 + CA204 + CA304 28 + 26 + 51 105

cifra de afaceri s-a modificat n 2005 fa de 2004 de 0,943 ori datorit varia iei cifrei de
afaceri a magazinului 2
CA104 + CA204 + CA305 28 + 26 + 70 124
05 / 04
I CA
(
L
)
=
=
=
= 1,181
/ CA3
CA104 + CA204 + CA304 28 + 26 + 51 105

cifra de afaceri a crescut n 2005 fa de 2004 de 1,181 ori datorit variaiei cifrei de afaceri a
magazinului 3
b) Indicii Paasche

CA105 + CA205 + CA305 35 + 20 + 70 125


=
=
= 1,059
CA104 + CA205 + CA305 28 + 20 + 70 118

cifra de afaceri a crescut n 2005 fa de 2004 de 1,059 ori datorit variaiei cifrei de afaceri a
magazinului 1
CA105 + CA205 + CA305 35 + 20 + 70 125
05 / 04
I CA
(
P
)
=
=
=
= 0,954
/ CA2
CA105 + CA204 + CA305 35 + 26 + 70 131

cifra de afaceri s-a modificat n 2005 fa de 2004 de 0,954 ori datorit varia iei cifrei de
afaceri a magazinului 2
CA105 + CA205 + CA305 35 + 20 + 70 125
05 / 04
I CA
(
P
)
=
=
=
= 1,179
/ CA3
CA105 + CA205 + CA304 35 + 20 + 51 106

cifra de afaceri a crescut n 2005 fa de 2004 de 1,179 ori datorit variaiei cifrei de afaceri a
magazinului 3
05 / 04
I CA
/ CA1 ( P ) =

c) Indicii Fisher
05 / 04
05 / 04
05 / 04
I CA
I CA
/ CA1 (F ) =
/ CA1 (L ) I CA / CA1 ( P ) = 1,067 1,059 = 1,063

cifra de afaceri a crescut n 2005 fa de 2004 de 1,063 ori datorit variaiei cifrei de afaceri a
magazinului 1
05 / 04
05 / 04
05 / 04
I CA
I CA
0,943 0,954 = 0,948
/ CA2 (F ) =
/ CA2 (L ) I CA / CA2 (P ) =

cifra de afaceri s-a modificat n 2005 fa de 2004 de 0,948 ori datorit varia iei cifrei de
afaceri a magazinului 2
05 / 04
05 / 04
05 / 04
I CA
I CA
/ CA3 (F ) =
/ CA3 (L ) I CA / CA3 (P ) = 1,181 1,179 = 1,180

cifra de afaceri a crescut n 2005 fa de 2004 de 1,180 ori datorit variaiei cifrei de
afaceri a magazinului 3

Capitolul 6
ANALIZA I PREVIZIUNEA SERIILOR CROLOLOGICE
6.1. Baza de date statistice
n derularea activitii lor, frecvent agenii economici sunt pui n situaia de a anticipa viitorul, iar
apoi de a lua decizii n consecin. Oamenii de afaceri sunt nevoii s previzioneze anual cifra de
afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt interesai de profitul
viitor degajat de investiie, respectiv guvernele de previziunea consumului sau a cheltuielilor
guvernamentale etc.. Ob inerea rapid de previziuni utiliznd modele cantitative de previziune este la
ndemna analitilor, urmare i a softurile de statistic accesibile i uor de exploatat.
Anticiparea, previziunea evoluiei viitoare a fenomenelor economice presupune n primul rnd
cunoaterea istoriei acestora, punerea n eviden a unor legit i privind comportamentul lor trecut.
Baza de date pe care se fundamenteaz analiza evolu iei fenomenelor n timp este constituit din serii
cronologice.
O serie cronologic este o secven de observaii asupra unei variabile, ordonate dup
parametrul timp. Frecvent, msurtorile asupra variabilei sunt efectuate la intervale egale de timp,
seria cronologic fiind prezentat sub forma:
1 2 ... t ... n

Y :
y1 y 2 ... yt ... y n
Din punct de vedere statistic, n contextul modelrii i previziunii, seria cronologic cu datele
observate y1 , y 2 ,...., y n constituie o realizare a secvenei de variabile aleatoare Y1 , Y2 ,...., Yn , adic a
unui proces stochastic de tip discret (Tertico .a., 1985).
n analiza seriilor cronologice este necesar ca lungimea perioadei observate s fie suficient de
lung pentru a face posibil estimarea unui model adecvat calitativ, care s surprind mecanismul real
de generare al fenomenului, respectiv s permit identificarea unor componente ale evolu iei pe
termen lung. De regul se impune utilizarea unor serii cronologice cu cel pu in 15 termeni, respectiv
pentru serii sezoniere este de dorit ca perioada observat s acopere cel puin cinci cicluri sezoniere.
n acelai timp datele trebuie s rmn comparabile n timp. Condiiile n care evolueaz
fenomenul este necesar s rmn n esen aceleai. Astfel, nu este indicat a se utiliza n elaborarea de
modele, serii cronologice ce acoper perioade de schimbri economice sau politice majore, rzboi, sau
alte evenimente excepionale; n analiza evolu iei majoritii indicatorilor economici pentru ara
noastr este indicat ca datele s nceap dup 1989. nainte de aplicarea tehnicilor specifice de analiz
i previziune, dac este necesar, unii indicatori vor fi exprimai n preuri comparabile. Cnd se
analizeaz spre exemplu evolu ia cifrei de afaceri sau a indicatorilor macroeconomici de rezultate i ne
intereseaz evoluia datelor neafectate de schimb rile de pre, este indicat a se exprima datele n
preurile anului baz de comparaie, prin mprirea acestora la un indice adecvat al preurilor. De
asemenea, creterea n timp a unor variabile din economie se datoreaz n principal creterii populaiei,
astfel c n aceste situaii este mai util a se analiza evoluia variabilei per cap de locuitor.
Atunci cnd cronograma indic prezena unor valori aberante, corespunztoare unor greve,
calamiti naturale sau altor evenimente punctuale, acestea vor fi nlocuite cu valorile medii ce ar fi
fost nregistrate n circumstane normale. De asemenea, dac graficul indic puncte de schimbare
brusc a sensului evoluiei, de tipul o tendin cresctoare ce se schimb brusc ntr-una descresctoare,
se vor elabora modele diferite pentru cele doua p ri ale seriei.
Frecvena msurtorilor este condiionat i de practic. Spre exemplu, vnzrile unui magazin
pot fi nregistrate zilnic, profitul poate fi observat lunar i / sau anual respectiv indicele bursier la
ncheierea zilei de cotaie. n general, acolo unde sunt disponibile, poate fi util utilizarea unor date ct
mai frecvente. Datele anuale nu fac posibil observarea caracterului sezonier specific anumitor
indicatori respectiv modelarea unor dependene n care timpul de reacie al variabilei efect este scurt.

Scopul final al tehnicilor de analiz a seriilor cronologice este previziunea. Informaiile ob inute
respectiv modelele elaborate sunt valabile, strict vorbind, doar pentru perioada observat. Atunci cnd
se fac previziuni pornim de la presupunerea c fenomenul va continua s aib acelai comportament
ca i n trecut. Este important ca analistul s se ntrebe n ce msur aceast presupunere este realist,
respectiv s in seama de atept rile sale. Se spune pe bun dreptate c previziunea rmne n
acelai timp tiin i art. Previziunea fenomenelor economice este o sarcin relativ dificil, urmare
a complexitii mediului economic. Abord rile tradiionale sunt uneori subiective i prea
simplificatoare, n timp ce metodele moderne sunt mai riguros fundamentate teoretic dar sunt i mai
complexe, necesitnd experien i o intervenie activ a analistului.

6.2. Indicatori medii specifici seriilor cronologice


Considerm o serie cronologic ce red evolu ia n timp a unui indicator de nivel Y. Pentru ob inerea
unor informaii privind modul de desfurare a fenomenului n medie pe perioada analizat, se face
apel la indicatori medii. Fac parte din aceast categorie: nivelul mediu sau valoare medie a
indicatorului, indicele mediu, ritmul mediu respectiv diferena medie absolut.

6.2.1. Nivelul mediu (valoarea medie) - FACULTATIV


6.2.2. Indicele mediu. Ritmul mediu
Pentru calculul acestui indicator se ntlnesc n literatur mai multe abordri.
a) Indicele mediu este parametrul modelului autoregresiv: (FACULTATIV)
yt = I y yt 1 + t , t = 2, 3,..., n
b) Presupunem c indicii cu baz n lan sunt aproximativ egali: I y2 / 1 = I y3 / 2 = ... = I yn / n1 = I y ,
valoarea comun fiind indicele mediu. n aceast ipotez, i avnd n vedere c I yk / k 1 = y k / y k 1 se
obin urmtoarele relaii:
y 2 = y1 I y

y3 = y 2 I y = y1 ( I y ) 2

y n = y n 1 I y = y1 ( I y ) n1
Din ultima relaie rezult:

yn
y1
expresie de calcul adecvat pentru indicatori ce evolueaz aproximativ exponenial.
I y = n1

c) Se definete I y n raport cu tendina (Florea, 1974): (FACULTATIV)

yt = I y Tt 1 + t .
Exemplu 2. Determinarea indicelui mediu respectiv a ritmului mediu
Se cunoate populaia judeului Cluj la ultimele dou recensminte:
Recens.
5 ian 1977
7 ian 1992
Nr. pop. (mii loc.)
715.7
736.3
n ipoteza unei evolu ii aproximativ exponeniale a populaiei pe perioada 1977-1992, indicele mediu
anual se determin astfel:

736.3
= 1,002
715.7
n perioada 1977-1992, populaia acestui jude a crescut n medie anual de 1,002 ori sau cu 0,2 %.

I y = 15

Dac acest ritm de cretere s-ar fi meninut i dup 1992, n anul 1995 numrul populaiei ar fi fost de:
736.3 ( I y ) 3 = 740.7 mii loc.
Populaia judeului Cluj n anul 1995 a fost de 727.6 mii loc.

6.2.3. Diferena absolut medie


Diferena medie satisface relaia autoregresiv :
y t = y + yt 1 + t , t = 2, 3,...., n
Metoda celor mai mici ptrate, respectiv condiia:

2
t

min, conduce la urmtoarea expresie de

t =1

calcul a diferenei medii absolute:


n

(y
y =

yt 1 )

t =2

n 1

t / t 1
y

t=2

n 1

sau echivalent:

y n y1
.
n 1
Acest mod de calcul conduce la rezultate satisfctoare n condiiile n care indicatorul evolueaz,
pe perioada considerat, aproximativ liniar.
y =

Exemplul 3. Diferena medie absolut


Fondul de locuine din ara noastr a nregistrat o cretere lent dup 1990:
An
Fond de
loc. (mii)

1991
7659

1992
7683

1993
7710

1994
7749

1995
7782

1996
7811

1997
7837

1998
7860

1999
7883

2000
7907

Diferena medie absolut, evaluat din expresia de calcul:


y y1 7907 7659
y = n
=
= 27,5 mii
n 1
9
indic o cretere medie de la un an la altul cu 27,5 mii.

6.3. Componentele unei serii cronologice


n abordarea tradiional, fluctuaiile din seriile cronologice sunt privite ca o rezultant a
suprapunerii urmtoarelor componente: tendina T, componenta ciclic C, sezonier S respectiv
rezidual E. Primele trei componente sunt considerate deterministe, sistematice, determinate de factori
cu aciune continu asupra fenomenului, n timp ce componenta rezidual are caracter aleator fiind
efectul aciunii unor factori imprevizibili, accidentali.
Modelul clasic de descompunere a seriilor cronologice este de regul:
aditiv: Y = T + C + S + E sau
multiplicativ: Y = T C S E respectiv
o combinaie mixt a componentelor seriei.

n acest context, tehnicile de analiz au ca obiective:


separarea fiecrei componente i modelarea comportamentului su, respectiv
previziunea evoluiei fiecrei componente, iar apoi compunerea acestora n scopul obinerii de
previziuni privind evoluia fenomenului Y. Principiul de la baza acestei
tehnici este descompune pentru a modela iar apoi recompune.
Componentele deterministe sunt dificil de definit n termeni exaci.
Tendina sau tendina general red evoluia fenomenului pe termen lung, avnd alura unor funcii
neperiodice, lent variabile n timp. Factori cu aciune permanent asupra fenomenului (ex. creterea
populaiei, progresul tehnic, inflaia) imprim, pe o perioad lung de timp, o tendin de regul
cresctoare sau descresctoare majoritii indicatorilor economici.
Componenta ciclic este observabil analiznd evoluia fenomenului pe termen lung, i se
manifest sub forma unor oscilaii cu perioad i amplitudine ce variaz de regul n timp, un ciclu
acoperind civa ani de zile. Evoluiile ciclice apar n principal urmare a ciclurilor economice sau a
pulsaiilor din cererea unui produs, componenta fiind prezent n evoluia unor indicatori
macroeconomici de rezultate sau din domeniul financiar dar i n alte domenii.
Componenta sezonier se evideniaz sub forma unor cicluri de durat mai mic sau egal cu un
an, i apare n principal datorit ritmului impus de schimbarea anotimpurilor dar i de activiti
economice respectiv sociale (regulariti n plata salariilor, srbtori, vacane, obiceiuri, tradiii, etc.).
Componenta aleatoare sau rezidual se manifest prin fluctuaii aparent aleatoare n jurul
componentelor deterministe, fiind efectul aciunii unor factori cu aciune punctual n timp, de tipul
evenimentelor politice sau meteorologice.
Componenta aleatoare este prezent n toate seriile cronologice, n timp ce o serie poate prezenta
sau nu tendina, variaie ciclic sau sezonier. Evidenierea componentelor deterministe este
dependent i de perioada supus observrii respectiv de frecvena observaiilor. Deseori cronograma
seriei sugereaz componentele prezente.

Exemplul 4. Componentele seriei cronologice


Examinnd cronogramele variabilelor economice din figurile 6.2., 6.3. i 6.4. identificm prezena
urmtoarelor componente:
populaia Romniei n perioada 1990-2000: tendin descresctoare, component aleatoare;
durata medie de via n ara noastr, perioada 1974-2000: component ciclic preponderent,
component aleatoare;
producia trimestrial de bere a Romniei, perioada 1996-2000 (zeci mii hl): uoar tendin de
cretere, component sezonier predominant (durata unui ciclu este de 1 an), component
aleatoare.
Vor face obiectul acestui capitol doar componentele deterministe. Componenta aleatoare nu
trebuie nici ea ignorat deoarece conine informaii utile n previziune, dar pentru analiza i
previziunea acesteia sunt necesare concepte de statistic matematic mai evoluate. Dac nu se
precizeaz altfel, n prezentul capitol pentru previziunea variabilei Y componenta aleatoare se ignor
(se presupune a fi nepredictibil, adic de tip zgomot alb [Granger & all, 1977]). In practic,
identificarea i separarea celor patru componente din seria cronologic nu sunt de regul realizabile cu
exactitate, reziduul rmas dup extragerea estimaiilor componentelor deterministe regsindu-se n
componenta aleatoare.

Figura 6.2. Numrul populaiei Romniei

Figura 6.3. Durata medie de via

Figura 6.4. Producia trimestrial de bere


Pentru rezolvarea exerciiilor din acest capitol s-a fcut uz de pachetul de programe Statistica 1997.

6.4. Modelarea tendinei prin funcii elementare

Evoluia majoritii indicatorilor din economie este dominat de tendin, ceea ce justific importana
acordat acestei componente. Pentru modelarea i previziunea tendinei se au n vedere funciile
elementare lent variabile n timp.
Vom considera n acest paragraf c seria prezint doar tendin i component aleatoare,
modelul de descompunere fiind aditiv respectiv multiplicativ:
yt = Tt + t , respectiv y t = Tt t .
De asemenea, n acest context presupunem ca tendina poate fi modelat suficient de bine prin
funcii elementare.

1. Funcii elementare utilizate n modelarea tendinei


Cele mai uzuale funcii utilizate pentru modelarea tendinei indicatorilor din economie sunt redate n
tabelul 6.1..
Tabelul 6.1. Funcii elementare utilizate n modelarea tendinei
Tendin
liniar

Forma liniarizat

Diferene aprox. constante

ty/ t 1 = y t y t 1

Tt = a + bt
parabol

Tt = a + bt + ct

hiperbol

1
Tt = a + b
t
exponenial

Tt = a b

putere

Tt = a t b
logaritmic

Tt = a + b ln t

T = a + bt + cX

( 2)

t / t 1

= ty/ t 1 ty1 / t 2

Unde X = t

T = a + bX

tty/ t 1 = ty t (t 1) y t 1

1
t
Z = A + Bt

Unde X

unde

tln/ ty1 = ln yt ln y t 1

Z t = ln Tt ; A = ln a; B = ln b
Z = A + bX

Unde

Z t = ln Tt ; A = ln a; X = ln t
T = a + bX
unde

X = ln t

curba logistic

Tt =

a
, a, c > 0
1 + e b ct

2. Stabilirea funciei adecvate pentru modelarea tendinei (FACULTATIV)


3. Estimarea parametrilor tendinei
Pentru estimarea parametrilor tendinei liniare
Tt = a + bt
se utilizeaz metoda celor mai mici p trate, expus n cadrul regresiei. Rolul variabilei exogene
(independente) este jucat aici de variabila timp t:
yt = a + bt + t
t = 1, 2, ... , n .
Expresiile de calcul a parametrilor a, b sunt deci urmtoarele:
n

(t t )( y
b=

Y)

t =1
n

(t t )

,
2

t =1

a = Y bt ,

sau echivalent
b=

M (tY ) M (t ) M (Y )
,
M (t 2 ) [M (t )]2

a = Y bt .
Seria prezint o tendin de cretere atunci cnd b > 0 respectiv de descretere dac b < 0.

Precizm c variabila timp se msoar cu ajutorul scalei de interval, astfel c originea scalei
respectiv unitatea de msur se pot stabili n mod arbitrar. Uneori, pentru u urarea calculelor sunt
stabilite astfel nct t = 0 , variantele variabilei t rezultnd n consecin. Astfel:
- daca n este impar t = ...,3, 2, 1, 0,1, 2, 3,...
- daca n este par t = ...,2,5; 1,5; 0,5; 0,5;1,5; 2,5;...
sau t = ....,5, 3, 1,1, 3, 5,....
Cu excepia curbei logistice, celelalte funcii neliniare din tabelul 6.1. pot fi aduse la o form
liniarizat prin anumite substituii, respectiv prin aplicarea operaiei de logaritmare n cazul funciei
exponeniale i a funciei putere.
Spre exemplu n cazul tendinei exponeniale
Tt = a b t ,
considernd un model de descompunere multiplicativ yt = Tt t , operaia de logaritmare a ambilor
membri conduce la:
ln yt = ln a + t ln b + ln t .
Prin substituiile A = ln a, B = ln b, t = ln t se ob ine forma liniarizat:
ln yt = A + Bt + t .
Aplicnd metoda celor mai mici ptrate, se determin A, B:
M (tX ) M (t )M ( X )
B=
2
M (t 2 ) [M (t )]
A = M ( X ) bM (t )
unde s-a notat X = ln Y , variantele variabilei X fiind deci xt = ln yt , t = 1, 2, ...,K n .
Odat calculai A respectiv B se pot determina parametrii tendinei exponeniale a = e A , b = e B .
n cazul tendinei parabolice:

yt = a + bt + cX + t
unde X = t , pentru estimarea parametrilor a, b, c se utilizeaz relatiile de calcul deduse n cadrul
regresiei liniare multiple, lucrnd eventual cu variante pentru variabila t astfel nct t = 0 (scopul fiind
u urarea calculelor).
Estimarea parametrilor curbei logistice necesit utilizarea unor metode specifice de tipul
procedurilor numerice iterative pentru modele neliniare sau a metodei celor trei puncte (Melard,
1990), metode integrate n softurile pentru statistic.

Exemplul 5. Estimarea tendinei liniare


Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie 1999
iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare:
Luna (t)
Indice (yt)

1
3.7

2
3.8

3
4.1

4
4.3

5
4.5

6
4.8

7
4.9

8
5.1

9
5.3

10
5.5

11
5.6

12
5.8

13
6.0

14
6.2

15
6.3

16
6.5

17
6.6

Cronograma seriei sugereaz prezena unei tendine liniare, peste care se suprapune o component
aleatoare de amplitudine redus:

18
7.0

yt = a + bt + t , t = 1, 2,...,18.
Parametrii tendinei se determin din relaiile:
M (tY ) M (t ) M (Y )
b=
2
M (t 2 ) [M (t )]
a = M (Y ) bM (t ).

Figura 6.6. ---- Indice pre productie industrial; ------ Tendina

Exemplificm din calculele intermediare:


1 + 2 + L + 18
= 9 .5
18
3.7 + 3.8 + L + 7.0
= 5.33
M (Y ) =
18
(1 3.7) + (2 3.8) + L + (18 7.0)
M (tY ) =
= 55.72
18
12 + 2 2 + L + 18 2
M (t 2 ) =
= 117,2
18
M (t ) =

rezultnd
55.72 9.5 5.33
= 0.19,
117.2 (9.5) 2
a = 5.33 0.19 9.5 = 3.55.
Tendina seriei se estimeaz prin funcia de gradul nti:
Tt = 3.55 + 0.19t ,
al crei grafic este redat n figura 6.6..

b=

Exemplul 6. Estimarea tendinei parabolice


Vnzrile dintr-un produs urmeaz n general pe termen lung o tendin conform curbei logistice.
Considernd intervale mai scurte de timp, curba logistic poate fi privit ca o succesiune de tendine:
n prima faz evoluia poate fi schiat printr-o dreapt, urmat apoi de o exponenial, iar n partea
final, pentru perioada de cretere lent respectiv saturaie se apeleaz de regul la o parabol. Datele
de mai jos redau evoluia vnzrilor pe o perioad de 10 luni consecutive din aceast perioad final:
Luna
Vnzri

F
20

M
32

A
40

M
47

I
52

I
60

A
62

S
63

O
65

N
67

Figura 6.7. Evoluia volumului vnzrilor

Considerm adecvat pentru modelarea tendinei un polinom de gradul doi: Tt = a + bt + ct 2


n condiiile n care pentru estimarea parametrilor a, b i c nu facem uz de un soft de statistic,
vom stabili variantele variabilei timp astfel nct t = 0 , respectiv aici (n par) t = 9, 7, K ,1,1, K 7, 9 .
Parametrii sunt n acest caz dai de relaiile:
M (tY )
b=
,
M (t 2 )
c=

M (t 2Y ) M (Y ) M (t 2 )

M (t 4 ) M (t 2 )

a = M (Y ) cM (t 2 ).
Calcule intermediare:
t
yt

t2
tYt
t4
t 2 Yt

-9
20
81

-7
32
49

-5
40
25

-3
47
9

-1
52
1

1
60
1

3
62
9

5
63
25

7
65
49

9
67
81

Media
50.8
33

-180

-224

-200

-141

-52

60

186

315

455

603

82.2

6561

2401

625

81

81

625

2401

6561

1933.8

1620

1568

1000

423

52

60

558

1575

3185

5427

1546.8

Se ob in urmtoarele valori pentru parametrii tendinei:


b = 2.49,
c = 0.15,

a = 55.86,

Tt = 55.86 + 2.49t 0.15t 2 .


Dac ne punem problema alegerii celei mai adecvate funcii dintre parabol i dreapt (posibile
funcii sugerate de cronogram pentru modelarea tendinei) i dispunem de un soft de statistica pentru
efectuarea calculelor, este indicat a se utiliza criteriul minimizrii sumei p tratelor reziduurilor
SSR= ( yt Tt ) . Astfel:
2

se estimeaz parametrii dreptei Tt = 50.8 + 2.5t , apoi se determin suma ptratelor reziduurilor

SSR= ( yt (50.8 + 2.5t )) = (20 28.3) 2 + ... + (67 73.3) 2 =210.07


2

Variantele variabilei timp au fost considerate i aici t = 9, 7, K ,1,1, K 7, 9 ;


pentru parabol Tt = 55.86 + 2.49t 0.15t 2 se obine SSR = 11.25.
Conform acestui criteriu, parabola este mai indicat dect dreapta n modelarea tendinei.

Exemplul 7. Estimarea tendinei exponeniale

Previziunea populaiei unei ri, a schimbrilor n structura sa pe vrste, constituie componente


importante ale deciziilor pe termen lung privind sistemul asigurrilor sociale (n principal a pensiilor)
influennd i politica de imigrare. Populaia Romniei a crescut n perioada 1980-1988 ntr-un ritm
destul de accelerat, dup cum arat i datele de mai jos:
1980
22.20

An
Nr.
populaiei
(mil. loc.)

1981
22.35

1982
22.48

1983
22.55

1984
22.62

1985
22.72

1986
22.82

1987
22.94

1988
23.15

1. Datele confirm ipoteza modelrii tendinei printr-o funcie exponenial?


Un grafic al acestei serii conologice sugereaz urmtoarele funcii candidate pentru modelarea
tendinei:
a) dreapta: Tt = a + bt respectiv
b) funcia exponenial: Tt = a b t .
Pentru stabilirea func iei adecvate vom calcula coeficienii de variaie corespunztori diferenelor Y
respectiv ln Y :
yt
t / t 1
Y

X1 =
ln y t

22.20
-

22.35
0.15

22.48
0.13

22.55
0.07

22.62
0.07

22.72
0.1

22.82
0.1

22.94
0.12

23.15
0.21

3.100

3.107

3.109

3.116

3.119

3.123

3.128

3.133

3.142

0.007

0.002

0.007

0.003

0.004

0.005

0.005

0.009

X 2 = tln/ tY1

X1 =

0.15 + 0.13 + L + 0.21


0.007 + 0.002 + L + 0.009
= 0.1187 iar X 2 =
= 0.0052
8
8
(0.15 0.1187) 2 + L + (0.21 0.1187) 2
12 =
8
2
(0.007 0.0052) + L + (0.009 0.0052) 2
22 =
8
v1 =

12
X1

respectiv

= 0.388

v2 =

22
X2

= 0.384

min(v1 , v 2 ) = 0.384.
Valorile celor doi coeficieni de variaie sunt destul de apropiate, totui diferenele datelor logaritmate
prezint un grad mai mic de dispersie, exponeniala fiind deci mai indicat dect dreapta n modelarea
tendinei.
2. Estimarea tendinei exponentiale
Modelm tendina printr-o funcie exponenial, n modelul multiplicativ:
yt = a b t t
Logaritmarea ambilor membrii conduce la liniarizarea tendinei:
ln yt = ln a + t ln b + ln t ,
respectiv
z t = A + Bt + t ,
unde z t = ln yt , A = ln a, B = ln b, t = ln t .
t

z t = ln y t

1
3.100

2
3.107

3
3.109

4
3.116

5
3.119

6
3.123

7
3.128

8
3.133

9
3.142

B=

M (tZ ) M (t ) M (Z )
2

M (t 2 ) [M (t )]
A = M ( Z ) BM (t ).

3.100 + 3.107 + L + 3.142


= 3.119,
9
(1 3.100) + (2 3.107) + L + (9 3.142)
M (tZ ) =
9
M (Z ) =

Se obin pentru parametrii A respectiv B urmtoarele estimaii:


B = 0.005, A = 3.09 .
Parametrii tendinei exponeniale rezult n consecin:
a = e A = 22.11, b = e B = 1.005
Tt = 22.11 (1.005) t .
6.5. Estimarea componentelor deterministe n cazul seriilor sezoniere
Presupunem n acest paragraf c seria cronologic prezint tendin, sezonalitate i o component aleatoare.
Vom prezenta modul de estimare a tendinei respectiv a componentei sezoniere.

6.5.1. Modelul de descompunere. Perioada componentei sezoniere


Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei. Tabelul 6.2. ilustreaz
modul de obinere a doua serii, din date fictive, prin compunerea dintre o tendin liniar i o component sezonier. Pentru
claritate, s-a considerat ca seriile nu prezint variaie ciclic respectiv aleatoare, adic C = 0 i E = 0 n cazul
modelului aditiv respectiv C = 1 i E = 1 n caz multiplicativ.
Trim
I
II
III
IV
I
II
III
IV
I
II
III
IV

Tabelul 6.2. Modele de descompunere a seriilor cronologice


t
Model aditiv
Model multiplicativ
Tt
St
Yt = Tt + St
Tt
St
Yt = Tt * St
1
10
-3
7
10
0,75
7,5
2
12
4
16
20
1,25
25
3
14
6
20
30
1,5
45
4
16
-7
9
40
0,5
20
5
18
-3
15
50
0,75
37,5
6
20
4
24
60
1,25
81
7
22
6
28
70
1,5
105
8
24
-7
17
80
0,5
40
9
26
-3
23
90
0.75
67.5
10
28
4
32
100
1.25
125
11
30
6
36
110
1.5
165
12
32
-7
25
120
0.5
60

Cronograma celor dou serii este redat n figura 6.8. respectiv 6.9..
n general, este adecvat un model aditiv atunci cnd amplitudinea oscilaiilor este aproximativ
constant (vezi figura 6.8.) respectiv multiplicativ dac amplitudinea crete (figura 6.9.) sau scade n
timp. Frecvent n practic este mai adecvat modelul multiplicativ.
Perioada componentei sezoniere, notat cu p, reprezint numrul unitilor de timp din cadrul
unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata unui ciclu de un
an, p fiind egal cu 4 n cazul datelor trimestriale respectiv 12 n cazul datelor lunare. Prin extensie pot
fi studiate i fenomene cu durata unui ciclu mai mic de un an. Exemple n acest sens sunt prezentate
n tabelul 6.3.

Figura 6.8. Modelul aditiv T + S

Figura 6.9. Modelul multiplicativ TS

Tabelul 6.3. Exemple de serii cu component sezonier


Durata unui Date
ciclu
1 an
trimestriale
lunare

Perioada
p
4
12

Exemple

o sptmn

Zilnice

o zi

din or n or

ncasri din vnzarea buturilor


rcoritoare
vnzrile de jucrii
preul unor produse agricole
cifra de afaceri a societatilor din
transportul de calatori respectiv din
construcii
consum gaz, energie electric
pentru uz casnic.
volumul vnzrilor unui magazin
alimentar
ncasrile unui cinematograf
numarul de cltori ce folosesc
mijloacele de transport n comun
retragerile de la o banc

Cronograma seriei respectiv coninutul variabilei analizate sugereaz perioada p. Pentru descoperirea
unor oscilaii ascunse se apeleaz la metode specifice analizei spectrale (Tertico .a., 1985).

6.5.2. Eliminarea componentei sezoniere utiliznd mediile mobile

Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplic datelor o medie mobil de
ordin p egal cu perioada componentei sezoniere. n general, mediile mobile sunt transformri liniare f
utilizate n scopul desezonalizrii seriei respectiv al atenurii amplitudinii fluctuaiilor aleatoare:
eliminarea componentei sezoniere f ( St ) 0 ,
eliminarea componentei aleatoare f ( t ) 0 respectiv
conservarea tendinei i a componentei ciclice f (Tt ) Tt .
Mediile mobile de ordin p, notate n continuare MM(p), sunt definite de urmtoare relaii:
daca p este impar p = 2k + 1 , mediile mobile de ordin p sunt
y + y t k 1 + ... + yt + ... + yt + k
yt = t k
; t = k + 1, k + 2,..., n k ;
p
daca p este par p = 2k se definesc analog
y t k + 0,5 + yt k +1,5 + ... + yt 0,5 + y t + 0,5 + .... + y t + k + 0,5
yt =
,
p
t = k + 0,5; k + 1,5; ... ; n k + 0,5.
n cazul p impar se realizeaz o coresponden ntre valorile observate i cele netezite (transformate),
astfel:
y1
-

y2
-

...
...

yk
-

yk+1

...
...

y k +1

yt

yt

...
...

yn-k

yn-k-1
-

y nk

...
...

yn
-

Pentru p par avem:


y1
-

y2
-

...
...

yk
-

yk+1

y k + 0.5

...
...

yt

yt+1

y t + 0 .5

...
...

yn-k

y n k + 0.5

yn-k-1
-

...
...

yn
-

astfel c valorile netezite sunt atribuite unui t intermediar, mijlocul intervalului dintre dou observaii
succesive. n scopul efecturii unor comparaii ntre valorile observate i cele netezite este indicat
existent unei corespondene ntre acestea, motiv pentru care, n cazul p par, se introduc mediile
mobile centrate de ordin p definite prin:
y t 0,5 + y t +0,5 0,5 y t k + yt k +1 + ... + y t + ... + yt + k 1 + 0,5 y t + k
.
yt =
=
2
p
Astfel, y t corespunde valorii observate yt pentru t = k + 1, k + 2, .... n k . n continuare prin medie
mobil n cazul p par se va nelege medie mobil centrat.
n cazul particular p = 4, caz ntlnit frecvent n practic, mediile mobile centrate sunt date de relaiile:
0,5 y1 + y 2 + y3 + y 4 + 0,5 y 5
y3 =
,
4
0,5 y 2 + y3 + y 4 + y 5 + 0,5 y 6
y4 =
,
4
L
0,5 y n 4 + y n3 + y n 2 + y n 1 + 0,5 y n
y n 2 =
.
4
Proprieti ale mediilor mobile

Dac seria este periodic:


yt + p = y t , t

atunci prin aplicarea unei medii mobile de ordin p egal cu perioada, oscilaiile se elimin din
date, valorile netezite fiind constante y t = y t +1 . Astfel, pentru eliminarea unei componente
sezoniere de ordin p se va aplica seriei o medie mobil de ordin p.
Mediile mobile de tipul mediilor aritmetice, prezentate aici, las nedeviat funcia de gradul
nti yt = a + bt . Astfel, tendina liniar se conserv prin aplicarea acestor medii mobile. Teoria
permite construirea unor medii mobile ponderate ce conserv i polinoame de grad superior
[10].
Valorii observate yt i corespunde o valoare netezit y t calculat ca o medie aritmetic a
valorilor adiacente.
Seria valorilor netezite are mai puin cu p 1 respectiv cu p termeni dect seria ini ial, dup
cum p este impar sau par. Acest aspect constituie un dezavantaj al metodei.

Exemplul 8. Eliminarea componentei sezoniere utiliznd mediile mobile


Datele din tabelul de mai jos se refer la transportul feroviar de cltori. Parcursul pasagerilor,
exprimat n milioane kilometri, a evoluat lunar astfel:
Lun
An
1999
2000
2001

184
178
176

167
175
157

193
188
183

220
230
220

202
213
189

252
272
332

325
330
315

296
279
276

220
225
209

196
198
186

174
187
164

253
247
243

Graficul seriei din figura 6.10. sugereaz o component sezonier predominant, de perioad p = 12,
conform ateptrilor traficul fiind mai intens n lunile de var respectiv n perioada srbtorilor de
iarn. Pentru eliminarea sezonalitii aplicm datelor o medie mobil de ordin 12, egal cu perioada
componentei sezoniere. Graficul valorilor desezonalizate este prezentat n figura 6.10.
Mediile mobile de ordin p = 12 sunt calculate conform relaiei de definiie a mediilor mobile
centrate. Astfel, spre exemplu:
0.5 y1 + y 2 + y 3 + y 4 + y 5 + y 6 + y 7 + y 8 + y 9 + y10 + y11 + y12 + 0.5 y13
=
12
0.5 184 + 167 + 193 + 220 + 202 + 252 + 325 + 296 + 220 + 196 + 174 + 253 + 0.5 178 ...
=
=
12
= 223.3
0.5 y 24 + y 25 + y 26 + y 27 + y 28 + y 29 + y 30 + y 31 + y 32 + y 33 + y 34 + y 35 + 0.5 y 36
y 30 =
=
12
0.5 247 + 176 + 157 + 183 + 220 + 189 + 332 + 315 + 276 + 209 + 186 + 164 + 0.5 243
=
=
12
= 221.0
y7 =

Figura 6.10. ---- Parcurs pasageri; ----- MM(12)

Datele observate au fost indexate aici n ordine cronologic y1, y2, ..., y36 .
Tabelul 6.4 indic valorile mediilor mobile. Seria mediilor mobile prezentat grafic n figura 6.10.
indic absena componentei de tendin n evoluia traficului de cltori pe perioada considerat.
Tabelul 6.4. Mediile mobile de ordin 12
t

MM(12)

MM(12)

MM(12)

1
2
3
4
5
6
7
8
9
10
11
12

223.3
223.3
223.5
223.7
224.5
225.8

13
14
15
16
17
18
19
20
21
22
23
24

226.9
226.4
225.9
226.2
226.8
227.1
226.7
225.9
224.9
224.3
222.9
224.4

25
26
27
28
29
30
31
32
33
34
35
36

226.3
225.5
224.7
223.6
222.1
221.0
-

6.5.3. Estimarea tendinei seriilor sezoniere


n cazul seriilor sezoniere se ntlnesc preponderent n literatur doua modaliti de estimare a
tendinei:
desezonalizarea seriei iar apoi estimarea tendinei pornind de la valorile desezonalizate
(Florea .a., 1998);
modelarea tendinei pornind de la mediile anuale.
1. Estimarea tendinei pornind de la valorile desezonalizate
Conform proprietii mediilor mobile de anulare a componentelor periodice, pentru eliminarea
componentei sezoniere (desezonalizarea seriei) se va aplica datelor o medie mobil de ordin p, unde p
este perioada componentei sezoniere. Seria mediilor mobile y t rezultat, numit i seria valorilor
desezonalizate, nu conine componenta sezonier. Pentru modelarea tendinei seriei iniiale se va
estima deci componenta de tendin, conform celor prezentate n paragraful 6.4., pornind de la seria
desezonalizat yt . Exemplul 9 este revelator n acest sens.
2. Estimarea tendinei n baza mediilor aferente fiecrui an
Aceast modalitate de estimare presupune calculul valorii medii a variabilei Y pentru fiecare din
cei n ani supui observrii:
y i1 + yi 2 + ... + yip
yi =
, i = 1, 2,..., n .
p
Seria cronologica a mediilor corespunzatoare fiecrui an:
1 2 ... n
,
y i :
y 1 y 2 ... y i

nu conine component sezonier, estimarea tendinei realizndu-se aici n baza celor prezentate n
paragraful 6.4.
6.5.4. Estimarea componentei sezoniere

Vom expune aici modalitatea de estimare a componentei sezoniere prin intermediul coeficienilor
sezonalitii. Alte alternative de estimare a componentei sezoniere sunt:
introducerea ei ntr-un model de regresie multipl prin intermediul unor variabile
alternative(Gourieroux & all, 1990);
modelarea componentei prin intermediul funciilor trigonometrice (Tertico .a., 1985).

n vederea determinrii coeficienilor sezonalitii vom utiliza urmtoarele notaii:


i indice pentru an (n general pentru un ciclu sezonier), variind de la 1 la n;
j indice pentru sezon, variind de la 1 la p.
Modelul de descompunere a seriei are forma:
yij = Tij + S j + ij respectiv yij = Tij S j ij
Sezonalitatea se manifest sub forma unor abateri de la componentele evoluiei pe termen lung
(tendin i componenta ciclic). Indicii respectiv coeficienii sezonalit ii cuantific aceste abateri de
la tendin - ciclu, urmare a aciunii factorilor sezonieri. n funcie de ipoteza considerat privind
componenta tendin - ciclu n practic ntlnim n principal dou metode de calcul a acestora: metoda
comparrii cu mediile mobile respectiv metoda comparrii cu tendin a.
1. Metoda comparrii cu mediile mobile

Se consider, n acest context, c seria prezint component de tendin respectiv ciclic, dar nu
se emite o ipotez privind forma acestora. Componenta evoluiei pe termen lung tendin - ciclu este
privit ca o medie curent a seriei TC t = M (Yt ) , estimat prin mediile mobile y ij .
n cazul modelului multiplicativ
yij = Tij S j ij ,
metoda se ntlnete n literatur i sub denumire de metoda raport rii la mediile mobile i const n
urmtoarele:
calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere;

calculul rapoartelor S ij = yij / y ij ce cuantific abaterea datelor observate de la tendin. Dac


fixm indicele j (ne situm n sezonul j), aceste diferene constituie estima ii pentru S j ;

determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaiilor precedente:
1 n1
Ij =
Sij ; j = 1, 2,..., p ,
n 1 i =1
aceasta justificndu-se prin necesitatea eliminrii efectului aleator din S ij . Pentru a nu fi
afectai de valorile extreme, uneori nainte de calculul mediei, aceste valori se elimin, sau n
loc de medie se consider valoarea median a estimaiilor S ij ;

determinarea componentei sezoniere S j , etap ce const ntr-o corecie adus indicilor medii
I j astfel nct media lor s fie 1:

1 p
S j = I j / I i j = 1, 2,..., p .
p i =1
Aceast cerin impus indicilor sezonalitii este natural, variaiile sezoniere se compenseaz
n medie pe parcursul unui an.

Valorile rezultate S j se numesc indici ai sezonalitii i constituie componenta sezonier. n


sezoanele pentru care Sj *100 < 100 factorii sezonieri au condus la o diminuare a valorii observate fa
de valoarea corespunztoare de pe tendin n medie cu 100(Sj 1) procente, respectiv dac Sj > 1
valorile observate sunt mai mari dect cele de pe tendin n medie de Sj ori.
n cazul modelului aditiv
yij = Tij + S ij + ij

determinarea componentei sezoniere decurge analog, dar avnd n vedere forma aditiv de
descompunere, coeficienii ce intervin se determin astfel:
S ij = y ij y ij

1 n 1
S ij
n 1 i =1
iar ajustarea coeficienilor medii C j , pentru a obine componenta sezonier S j sau coeficienii
sezonalitii se face astfel nct media lor s fie zero:
1 p
C j = 0.
p j =1
Cj =

Exemplul 9. Estimarea componentelor deterministe n cazul seriilor sezoniere.


Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n perioada 19962001 sunt indicate n tabelul 6.5..

Tabelul 6.5. Evoluia trimestrial a produciei de bere, perioada 1996-2001


I
II
III
IV
An/Trim.
1996
124.1 263.2 252.4 124.5
1997
130.1 280.2 260.6 151.1
1998
157.5 301.2 353.3 185.0
1999
169.7 340.0 350.9 168.7
2000
177.5 407.6 417.2 224.1
a) Calculul mediilor mobile de ordin p=4
Graficul seriei (figura 6.11.) indic prezena unei componente sezoniere predominante, de
perioad p = 4. Punctul de pornire n estimarea componentelor deterministe l constituie seria
mediilor mobile (valorilor desezonalizate) prezentat n tabelul 6.6., iar grafic n figura 6.11..
Mediile mobile de ordin p = 4 sunt calculate conform relaiei de definiie a mediilor mobile
centrate. Astfel, spre exemplu:
0.5 y1 + y2 + y3 + y4 + 0.5 y5
=
4
0.5 124.1 + 263.2 + 252.4 + 124.5 + 0.5 130.1
=
= 191.8
4
y3 =

0.5 y 2 + y3 + y4 + y5 + 0.5 y6
=
4
0.5 263.2 + 252.4 + 124.5 + 130.1 + 0.5 280.2
=
= 194.7
4
L
y4 =

0.5 y 20 + y 21 + y22 + y23 + 0.5 y 24


=
4
0.5 224.1 + 202.9 + 385.3 + 425.6 + 0.5 196.6
=
= 306.0.
4
y 22 =

Datele observate au fost numerotate aici n ordine cronologic y1, y2, ..., y24.

Tabelul 6.6. Mediile mobile de ordinul 4


t

MM(4)

MM(4)

1
2
3
4
5
6
7
8
9
10
11
12

191.8
194.7
197.8
202.2
208.9
214.9
229.2
245.0
250.8
257.1

13
14
15
16
17
18
19
20
21
22
23
24

261.7
259.4
258.3
267.7
284.5
299.7
309.8
310.2
308.4
306.0
-

b) Estimarea tendinei pornind de la valorile desezonalizate


Seria mediilor mobile prezentat grafic n figura 6.11. relev o uoar tendin de cretere a
produciei de bere. Vom considera tendina liniar:
Tt = a + bt + t ,
originea de msurare a timpului trimestrul II al anului 1996, unitatea de msur un trimestru. Astfel,
pentru trimestrul III 1996 avem t = 1 .a.m.d:
t
Valori desezonalizate (Z)

1
191.8

2
194.7
b=

3
197.8

...
...

19
308.4

M (tZ ) M (t ) M ( Z )
2

M (t 2 ) [M (t ) ]
a = M ( Z ) bM (t ).

20
306.0

Calcule intermediare:
M (t ) = 10.5, M ( Z ) = 252.9, M (t 2 ) = 143.5, M (tZ ) = 2884.9,
b = 6.9, a = 180.44.
Tendina produciei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin:
Tt = 180.44 + 6.9 t .

Figura 6.11. ---- Producia de bere; -- -- MM(4); ---- Tendina


c) Estimarea componentei sezoniere prin metoda raport rii la mediile mobile
Cum amplitudinea oscilaiilor crete uor n timp, cronograma seriei sugereaz luarea n
considerare a unui model multiplicativ:

yij = Tij S j ij ; i = 1, 2,..., 6 iar j = 1, 2, 3, 4 .


Datele sunt disponibile pentru 6 ani i sunt prezente aici 4 sezoane. innd seama de notaiile
specifice paragrafului 6.5.4., yij reprezint nivelul produciei de bere n anul i trimestrul j. Astfel, spre

exemplu y13 = y1996;III = 252.4 sau y34 = y1998;IV = 185 .0 . Mediile mobile din tabelul 6.6
transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim.
1996
1997
1998
1999
2000
2001

Rapoartele S ij =

y ij
y ij

I
197.8
229.2
261.7
284.5
308.4

II
202.2
245.0
259.4
299.7
306.0

III
191.8
208.9
250.8
258.3
309.8
-

vor fi

IV
194.7
214.9
257.1
267.7
310.2
-

100 , respectiv mediile acestora pentru fiecare sezon sunt indicate n tabelul 6.7..

Tabelul 6.7. Calculul indicilor sezonalit ii


An/Trim.
1996
1997
1998
1999
2000
2001

Ij

I
65.8
68.7
64.8
62.4
65.8
65.5

II
138.6
122.9
131.1
136.0
125.9
130.9

III
131.6
124.7
140.9
135.8
134.7
133.5

IV
63.9
70.3
71.9
63.0
72.7
68.4

Media

99.6

Sj

65.6

131.4

134.0

68.8

Media

100

Explicaii privind calculele:


y
y
252.4
124.5
S13 = 13 100 =
100 = 131.6 , S14 = 14 100 =
100 = 63.9 ,
y13
191.8
y14
194.7
y
130.1
S 21 = 21 100 =
100 = 65.8 , .a.m.d.
y 21
197.8
Cum era de ateptat, aceste rapoarte ntre datele observate i mediile mobile sunt mai mici dect 1
pentru trimestrele I i IV, cnd nivelul produciei a fost sistematic mai mic (sub tendin).
S 21 + S 31 + S 41 + S 51
= 65.5, I 2 = 130.9,
4
S + S 23 + S 33 + S 43
I 3 = 13
= 133.5, I 4 = 68.4.
4
Valoarea medie a acestor indici este 99.6, astfel c este necesar o corecie astfel nct media s fie
100:
I
65.5
S1 = 1 100 =
100 = 65.6, S 2 = 131.4, S 3= 134.0, S 4 = 68.8 .
99.6
99.6
Urmare a caracterului sezonier specific produciei de bere, n trimestrul I producia a fost mai mic n
medie cu 34.4% dect valorile corespunztoare de pe tendin. n trimestrul II producia a fost n
medie mai mare de 1.314 ori dect valorile de pe tendin. Analog se interpreteaz S3 i S4.
Componenta sezonier este dat de vectorul format cu indicii sezonalitii:
S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688).
I1 =

Exemplul 10. Estimarea tendinei pornind de la mediile aferente fiec rui an


Vom considera aceleai date: evoluia trimestrial a produciei de bere din ara noastr (zeci mii
hl) n perioada 1996-2001, indicat n tabelul 6.5. Producia medie trimestrial determinat pentru
fiecare din cei 5 ani este:
An
Medie

1996
191.05

1997
205.5

1998
249.25

1999
257.32

2000
306.6

2001
302.6

124 .1 + 263.2 + 252 .4 + 124 .5


= 191 .05,
4
130.1 + 280.2 + 260.6 + 151.1
y1997 =
= 205.5.
4
Considerm 1995 anul origine de msurare a timpului, unitatea de msur un an, astfel c t
corespunztor anului 1996 este 1, .a.m.d:
y1996 =

t
yt

1
191.05

2
205.5

3
249.25

4
257.32

5
306.6

6
302.6

Tendina liniar aferent acestei serii este:


Tt = 157.07 + 28.3t .
Creterea medie anual a produciei este 28.3, iar creterea medie trimestrial se consider a fi 28.3/4
7.1. Valorile tendinei aferente perioadei observate sunt redate n tabelul de mai jos, avnd n vedere
creterea medie trimestrial de 7.1:
An/Trim.

II

III

IV

1996
1997
1998
1999
2000

174.7
203.1
231.5
259.9
288.3

181.8
210.2
238.6
267.0
295.4

188.9
217.3
245.7
274.1
302.5

196.0
224.4
252.8
281.2
309.6

Valoarea corespunztoare trimestrului I din 1996 se justific innd seama de urmtoarele:


n general pentru serii de intervale, valoarea indicatorului se atribuie mijlocului intervalului;
punctul de pe tendin M(1; 185.37) corespunde datei de 1 iulie 1996; mijlocului trimestrului I
din 1996 i corespunde valoarea 185.37 7.1 7.1/2 = 174.7.
6.6. Componenta ciclic (FACULTATIV)
6.7. Previziuni utiliznd modelul de descompunere. Msurarea acurateii previziunilor
1. Previziuni utiliznd modelul de descompunere
Previziunile privind evoluia variabilei analizate Y se obin prin compunerea previziunilor realizate pentru fiecare
component prezent n serie, innd seama de forma modelului:

Y = T + C + S respectiv Y = T C S .
previziunea realizat la momentul n, utiliznd datele y1 , y 2 ,...., y n , pentru un orizont de timp h.

Notm cu y n + h
Previziunea componentelor deterministe se realizeaz astfel:
tendina: se extrapoleaz tendina estimat printr-o funcie elementar. Spre exemplu n cazul tendinei liniare:

Tn+ h = a + b(n + h)
Se are n vedere aici i modul de definire a variantelor variabilei t;
componenta sezonier: se utilizeaz coeficientul sezonalitii aferent sezonului corespunztor momentului n+h,
sau o alt metod de modelare a acestei componente;
componenta ciclic: innd seama de seria indicilor de ciclicitate respectiv de opinia experilor privind punctele de
ntoarcere previzibile.
Spre exemplu, n cazul absenei ciclicitii, valoarea previzionat este:

y n+ h = Tn + h + S s respectiv y n+ h = Tn + h S s ,
dup cum modelul este aditiv sau multiplicativ.
Extrapolarea tendinei respectiv a celorlalte componente deterministe, conduc la previziuni adecvate n condiiile
n care:
- modelele estimate reuesc s surprind ceea ce este esenial, repetabil, n comportamentul trecut al fenomenului
respectiv
- comportamentul factorilor ce determin schimbrile n timp n nivelul nregistrat de variabila Y rmne i pe
viitor aproximativ acelai.
Extrapolarea este adecvat n principal pentru obinerea de previziuni pe termen scurt, elaborndu-se de regul dou
sau mai multe scenarii de evoluie.

Exemplu 9 (continuare). Previziunea produciei de bere


Tabelul urmtor conine previziunile, datele reale respectiv erorile de previziune privind nivelul produciei de bere.
An
2001
2002

Trim.

Tendin

Sezonalitate

Previziune

Producie

Eroare

III
IV
I

325.34
332.24
339.14

1.34
0.688
0.656

435.95
228.58
217.9

425.6
196.6
203.2

-10.35
-31.98
-14.7

Prezentm modul de obinere a rezultatelor anterioare pentru trim. III an 2001. Valorile tendinei respectiv a componentei
sezoniere sunt:

)
)
T (21) = 180.44 + 6.9 21 = 325.34 respectiv S 3 = 1.34.
Modelul de descompunere considerat a fost cel multiplicativ, astfel c valoarea previzionat este:

)
y = 325.34 1.34 = 435.95
iar eroarea de previziune aferent:

)
e = 425.6 435.95 = 10.35

Exemplu 5 (continuare). Previziunea indicelui lunar al preului produciei industriale.


Avnd n vedere tendina estimat privind evoluia acestui indicator:
Tt = 3.55 + 0.19t
previziunile respectiv erorile de previziune pentru perioada Iulie - Decembrie 2000 sunt indicate mai jos:

Luna
Indice y
)
Previziune y

Eroare e

I
7.40
7.16
0.24

A
7.66
7.35
0.31

S
7.96
7.54
0.42

O
8.26
7.73
0.53

N
8.47
7.92
0.55

D
8.65
8.11
0.54

Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinei conducnd la:
)
)
y19 = T19 =3.55 + 0.19 19 = 7.16
)
)
e19 = y19 - y19 = 0.24.

Exemplu 7 (continuare). Previziunea populaiei Romniei


Tendina evoluiei populaiei rii noastre estimat pentru perioada 1980 1988 n baza unui model de
cretere exponenial a fost:

Tt = 22.11 (1.005)t

O extrapolare a acestei tendine ( fr a se ine seama de condiiile n care previziunea prin extrapolare
conduce la valori adecvate) ar indica o populaie previzibil pentru anul 2000 de:
T20 = 22.11 (1.005)21 = 24.36 mil. locuitori,
valoarea real fiind de 22.43 mil. locuitori. Dup 1989 tendina s-a schimbat brusc ntr-una
descresctoare, mediul economic i social, cu influen direct asupra evoluiei populaiei unei ri,
schimbndu-se substanial fa de cel din perioada 1980 1988 (perioad utilizat n estimarea
tendinei).
2. M surarea acurateii previziunilor
Dac modelul elaborat conduce la previziunile y1 , y 2 ,..., y p corespunztoare datelor y1 , y 2 ,..., y p ,
pentru a msura calitatea acestuia de a genera previziuni adecvate se utilizeaz o serie de indicatori
sintetici ai erorilor de previziune, cei mai frecvent ntlnii fiind:
1 p
2
- eroarea medie ptratic:
MSE = ( y h y h )
p h =1

- eroarea medie absolut:

MAE =

1 p
y h y h
p h =1

- eroarea medie absolut exprimat procentual: MAPE =

1 p y h y h
y
p h=1
h

Frecvent, n practic se utilizeaz doar o parte din date n estimarea modelului, cele rmase (cele
mai recente), urmnd a fi comparate cu previziunile corespunztoare generate de model. Dintre mai
multe modele alternative de previziune este selectat cel ce conduce la erori medii de previziune mai
mici. Dup alegerea modelului, acesta poate fi reestimat lund n considerare toate datele disponibile.
O alt variant de lucru const n compararea previziunilor obinute din model cu cele generate
naiv. Conform modelului naiv de previziune (mers aleator) valoarea nregistrat de variabil n
urmtoarea perioad va fi cea nregistrat n prezent.
6.8. Descompunerea seriei pe componente

Odat determinate componentele deterministe, componenta aleatoare se obine prin eliminarea


acestora din datele observate:
y ij
n cazul modelului multiplicativ, respectiv
ij =
Tij C ij S j

ij = yij (Tij + C ij + S j ) n caz aditiv.


Seria cronologic cu datele iniiale poate fi descompus astfel pe componente.
Exemplul 9 (continuare). Descompunerea seriei pe componente
Pentru tendin a fost estimat modelul liniar:
t=1, 2, ....
Tt = 180.44 + 6.9t
originea de msurare a timpului fiind trimestrul II al anului 1996, unitatea de msur un trimestru.
Componenta sezonier const n indicii sezonalit ii:
S1 = 65.6, S 2 = 131.4, S 3= 134.0, S 4 = 68.8 .
Componenta ciclic s-a neglijat, iar componenta aleatoare (reziduu) se deduce inand seama de forma
multiplicativ a modelului:
Y
Comp. aleatoare (Reziduu) =
T S

Tabelul 6.8. Descompunerea seriei pe componente


An

Trim.

1996

I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

1997

1998

1999

2000

2001

Producie
Y
124.1
263.2
252.4
124.5
130.1
280.2
260.6
151.1
157.5
301.2
353.3
185.0
169.7
340.0
350.9
168.7
177.5
407.6
417.2
224.1
209.9
385.3
425.6
196.6

MM(4)
191.8
194.7
197.8
202.2
208.9
214.9
229.2
245.0
250.8
257.1
261.7
259.4
258.3
267.7
284.5
299.7
309.8
310.2
308.4
306.0
-

Tendin
T
187.34
194.24
201.14
208.40
214.94
221.84
228.74
235.64
242.54
249.44
256.34
263.24
270.14
277.04
283.94
290.84
297.74
304.64
311.54
318.44
325.34
332.24

Comp.
sezonier S
1.340
0.668
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688

Reziduu
1.005
0.959
0.986
1.023
0.905
1.020
1.049
0.973
1.087
1.078
1.009
0.983
0.969
0.885
0.953
1.066
1.046
1.069
1.027
0.856
0.976
0.860

Pentru modelarea i previziunea componentei aleatoare se pornete de la seria reziduurilor,


care este o serie staionar, i se elaboreaz un model de tip autoregresiv-medie mobil.
6.9. Tehnici de netezire
Atunci cnd cronograma seriei nu ofer indicii foarte clare privind prezena respectiv forma
tendinei, este indicat a se utiliza n prealabil o tehnic de netezire ce atenueaz amplitudinea
fluctuaiilor aleatoare din serie, scopul fiind evidenierea (estimarea) tendinei. Tehnicile de netezire
general utilizate sunt mediile mobile sau tehnicii netezirii exponeniale.
1. Mediile mobile
n practic, alegerea ordinului mediei mobile pentru eliminarea componentei aleatoare rmne n
sarcina analistului, fiind indicat un ordin p mai mare dac amplitudinea fluctuaiilor aleatoare este mai
mare. Oricum, oscilaiile din componenta aleatoare fiind neregulate, eliminarea acesteia se realizeaz
doar parial. Prin aplicarea unei medii mobile, indiferent de ordinul acesteia, amplitudinea fluctuaiilor
se reduce. Raportul dintre dispersia componentei aleatoare din seria netezit *2 i seria iniial
2 este aproximativ (Gourieroux & all, 1990):

*2 1
= .
p
Astfel, cu ct ordinul mediei mobile este mai mare cu att seria mediilor mobile este mai neted.
Exemplul 11. Reducerea amplitudinii componentei aleatoare utiliznd medii mobile
Evoluia cursului unei aciuni este dominat n principal de fluctuaii aleatoare. Evidenierea i
estimarea unor componente deterministe, n scopul efecturii de previziuni este uneori imposibil, cea
mai adecvat previziune pentru cursul din cotaia urmtoare fiind chiar cursul prezent (model de tip
mers aleator).
Pentru 16 zile succesive de cotaie redm grafic n figura 6.12. evoluia cursului unei aciuni. In
scopul evidenierii tendinei s-au utilizat mediile mobile de ordin p = 3, respectiv p = 7, rezultatele
fiind redate n tabelul de mai jos, iar grafic n figura 6.7:

Zi (t)
Curs (yt)
MM(3)

1
29.9
-

2
29.8
29.9

3
30.1
30.4

4
31.2
31.1

5
31.9
31.1

6
30.1
30.2

7
28.6
30.1

8
31.5
30.4

9
31.2
31.1

10
30.7
31.0

11
31.2
30.8

12
30.4
30.9

13
31.0
30.6

14
30.4
31.0

15
31.5
31.5

16
32.7
-

Mediile mobile de ordin p = 3 sunt:


y + y 2 + y 3 29.9 + 29.8 + 30.1
y2 = 1
=
= 29.9,
3
3
y + y 3 + y 4 29.8 + 30.1 + 31.2
y3 = 2
=
= 30.4,
3
3
celelalte fiind calculate ntr-o manier similar.
Observm c mediile mobile de ordin 3 nu conduc la rezultate satisfctoare. Prin creterea
ordinului la p = 7, gradul de netezire crete dar numrul termenilor seriei valorilor netezite se reduce
substan ial (la 10 termeni).

Figura 6.12 ---- Cursul aciunii , -- -- MM(3), ----- MM(7)

2. Tehnica netezirii exponeniale simple

Valorile netezite, notate S1 , S 2 ,..., S n , se determin conform formulei de recuren:


S t = cyt + (1 c) S t 1 ,
unde S1 = y1 iar c [0, 1] este constanta de netezire. Urmtoarea expresie echivalent,
t 1

S t = c (1 c) j y t j ; t = 2, 3,..., n ,
j =0

arat c valoarea netezit calculat la momentul t depinde de trecutul fenomenului yt , y t 1 ,..., y1 , dar
ponderea fiecrei observaii descrete. Viteza cu care se realizeaz aceasta depinde de constanta de
netezire c. Cnd c este apropiat de 1 atunci coeficientul (1 c) j descrete rapid spre zero, astfel ca
valoarea netezit S t depinde n mare msur de observaiile recente.
Alegerea unei valori optime pentru c depinde de caracteristicile seriei. Pentru serii fluctuante se va
utiliza o valoare mai apropiat de zero, iar acolo unde evoluia seriei este stabil se va considera o
valoare pentru c apropiat de unu. Un criteriu mai obiectiv de determinare a constantei poate fi studiat
n (Gourieroux & all, 1990).
Utilizat n scopul eliminrii componentei aleatoare, tehnica netezirii exponentiale simple
conduce n general la rezultate mai bune dect cele obinute utiliznd mediile mobile.
Exemplul 12. Reducerea amplitudinii componentei aleatoare prin tehnica netezirii exponeniale
Relum datele din exemplul referitor la evoluia cursului unei aciuni. Graficul 6.9. red seria
valorilor netezite obinute prin tehnica netezirii exponeniale simple pentru dou valori ale constantei
de netezire c = 0.1 respectiv c = 0.5.

Figura 6.9. -- Cursul aciunii; - - Valori netezite c = 0.5; ----- Valori netezite c = 0.1
Valorile netezite respectiv modul de calcul al acestora pentru c = 0.1 este redat n cele ce urmeaz:
T
yt
St

1
29.9
-

2
29.8
29.9

3
30.1
29.9

4
31.2
30.0

5
31.9
30.2

6
30.1
30.2

7
28.6
30.1

8
31.5
30.2

9
31.2
30.3

10
30.7
30.3

11
31.2
30.4

12
30.4
30.4

13
31.0
30.5

14
30.4
30.5

15
31.5
30.6

16
32.7
30.8

Valorile netezite s-au calculat din relaia de recuren:


S t = 0.1 y t + 0.9 S t 1 .

Astfel,

S 2 = 0.1y 2 + 0.9S1 = 0.1 29.8 + 0.9 29.9 = 29.9


S 3 = 0.1 y 3 + 0.9 S 2 = 0.1 30.1 + 0.9 29.9 = 29.9
celelalte valori fiind obinute analog.
Observm c o valoare apropiat de 0 pentru constanta de netezire conduce la un grad de netezire mai
pronunat.
6.10. Alte metode de previziune (FACULTATIV)

Capitolul 7
APLICAII
Problema 1

Considernd rata omajului ca mrime analizat notat cu Z se cere:


1. Expresia de calcul a mrimii Z n funcie de factorii de influen;
2. Avnd seriile cronologice relativ la numrul de omeri X i populaia activ notat cu Y n 10
luni consecutive respectiv:
- numrul de omeri
2
3
4
5
6
7
8
9
10
1

X :
330 420 370 480 520 550 600 580 630 635
- populaia activ

2
3
4
5
6
7
8
9
10
1

Y :
3882 4827 4302 5485 5843 6189 6593 6304 6702 6738
redai seria cronologic aferent ratei lunare a omajului;
3. Rata de omaj medie lunar;
4. De cte ori au crescut n medie de la o lun la alta numrul de omeri;
5. Exprimarea, calcularea i interpretarea urmtorilor indici:
I Z5 //1x ( F ) ; I Z5 //1y ( F ) ; I Z5 / 1 .
1) Z (rata omajului) este influenat de numrul de omeri direct proporional i de numrul
populaiei active invers proporional.
Z=

S
X
100 = 100
Pa
Y

2
3
4
5
6
7
8
9
10
1

2) Z :
8,5 8,7 8,6 8,75 8,90 8,90 9,1 9,2 9,4 9,42
3) Seria cronologic fiind de momente, nivelul mediu se determin dup urmtoarea relaie:
1
1
Z 1 + Z 2 + Z 3 + Z 4 + Z 5 + Z 6 + Z 7 + Z 8 + Z 9 + Z 10
2
Z= 2
=
10 1
1
1
8,5 + 8,7 + 8,6 + 8,75 + 8,90 + 8,90 + 9,1 + 9,2 + 9,4 + 9,42
2
2 = 8,945
=
9
Rata de omaj medie lunar din perioada analizat este de 8,945.
X (t 1) X (t ) =
4) I X =
[X (t 1)]2
=

330 420+ 420 370+ 370 480+ 480 520+ 520 550+ 550 600+ 600 580+ 580 630+ 630 635
3302 + 4202 + 3702 + 4802 + 5202 + 5502 + 6002 + 5802 + 6302

1386+1554+1776+ 2496+ 2860+ 3300+ 3490+ 3654+ 40005


= 1,056
1089+1764+1369+ 2304+ 2704+ 3025+ 3600+ 3364+ 3969

Numrul de omeri au crescut n medie de 1,056 ori de la o lun la alta.


5) I Z5 / 1 =

Z 5 8,9
=
= 1,047 , rata omajului a crescut de 1,047 n luna a 5-a fa de luna 1.
I 1 8,5

I Z5 //1x ( F ) = I Z5 //1x (L ) I Z5 //1x (P ) = 1,57 1,57 = 1,576


x5
y
520 3882
I Z5 //1x ( L ) = 1 =

= 1,576
x1 3882 330
y1

x5
y
I Z5 //1x (P ) = 5 = 1,576
x1
y5
- rata omajului ar fi crescut de 1,576 datorit modificrii numrului de omeri, populaia activ
rmnnd constant;

I Z5 //1y (F ) = I Z5 //1y (L ) I Z5 //1y (P ) = 0,664


x1
y
y
3882
I Z5 //1y (L ) = 5 = 1 =
= 0,664
x1
y 5 5843
y1
x5
y
y
I Z5 //1y (P ) = 5 = 1 = 0,664
x5
y5
y1

- rata omajului ar fi sczut de 0,664 datorit modificrii populaiei active, numrul de omeri
rmnnd constant;
I Z5 //1x I Z5 //1y = 1,57 0,66 = 1,0465 = I Z5 / 1

Problema 2

Din mulimea autoturismelor vndute prin licitaie s-a constituit un eantion de 30 de uniti,
rezultatele observrii n raport cu variabilele X vechimea autoturismelor exprimat n ani i y
preul la care s-au vndut (n milioana lei) sunt prezentate n tabelul urmtor:
Nr . crt.
1
2
3
4
5
6
7
8
9
10

X
4
1
9
13
15
8
13
19
6
0

Y
30
40
20
17
17
28
20
13
33
41

Nr. crt.
11
12
13
14
15
16
17
18
19
20

X
6
5
11
13
2
8
12
20
5
14

Y
32
33
24
19
38
22
20
10
35
17

Nr . crt.
21
22
23
24
25
26
27
28
29
30

X
7
10
5
8
10
12
3
9
14
7

Y
30
25
36
23
27
22
35
29
19
30

Se cere:
1. Elaborarea repartiiei bidimensionale tiind c numrul de intervale pentru variabila X = 4, iar
lungimea unui interval pentru Y, ly = 8 intervalele fiind egale.
2. Parametrii tendinei centrale n raport cu preul de vnzare i interpretarea acestora;
3. Studierea reprezentativitii funciilor de regresie, liniar i hiperbolic i alegerea celei mai
reprezentative;

4. Pentru funcia aleas la punctul precedent calculai parametrii.


1) lungime interval =
[0;5)
X :
5

X max X min
20 0
=
=5
numar intervale
4

[5;10) [10;15) [15;20)


12

10

[10;18) [18;26)
Y :
10
5

[26;34) [34;42)
9

6
X

Y
[10;18)
[18;26)
[26;34)
[34;42)
TOTAL

[0;5)

[5;10)

[10;15)

[15;20)

TOTAL

1
4
5

3
7
2
12

2
7
1
10

3
3

5
10
9
6
30

2) Media:
R

'

Ni

14 5 + 22 10 + 30 9 + 37,5 6 785
=
= 26,26
N
30
30
- preul mediu de vnzare al mainilor este de 26,26 mii lei
1
30
Mediana:
rMe = N =
= 15
2
2
5 + 10 = rMe = 15 Me [18;26 )
15 5
8 = 26
Me = 18 +
10
- jumtate din maini se vnd cu un pre mai mic de 26.000 mii lei, iar cealalt jumtate cu un pre mai
mare de 26.000.000 lei.
Y=

i =1

[10 26)

15

[26;41)

15

Modala:
max(5, 10, 9, 6) = 10 Mo [18;26)
Cele mai multe autoturisme se vnd cu un pre cuprins ntre 18.000 i 26.000 mii lei.
10 5
5
Mo = 18 +
8 = 18 +
8 = 24,66
(10 5) + (10 9)
5 +1
- cea mai mare parte a autoturismelor se vnd la un pre n jur de 24.666,666 mii lei.
3) Din tabelul de corelaie se observ c frecvenele diferite de zero sunt grupate, rezult c ntre cele
dou variabile exist legtur, ce poate fi modelat cu ajutorul funciei de regresie.
a. Dac funcia de regresie este o drept
Y ( X ) = a + bx
1
b. Dac funcia de regresie este o hiperbol Y ( X ) = a + b
x

Mai reprezentativ este funcia care are coeficientul de regresie mai mare. Ca urmare trebuie calculat
acest coeficient pentru cele dou cazuri.
M ( XY ) M ( X ) M (Y )
a. RYX =
X Y
M (Y ) = 26,26
2,5 5 + 7,5 12 + 12,5 10 + 17,5 3
M (X ) =
= 9,33
30
1
2
2
2
2
Y2 = (14 26,26) 5 + (22 26,26) 10+ (30 26,26) 9 + (38 26,26) 6 = 62,86
30
1
2
2
2
2
X2 = (2,5 9,33) 5 + (7,5 9,33) 12+ (12,5 9,33) 10+ (17,5 9,33) 3 =19,1389
30
1
M ( XY ) =
[2,5 30 1 + 2,5 38 4 + ... + 17,5 14 3] = 216
30
216 9,33 26,26
RYX =
= 0,836
62,86 19,1389

1
M Y M M (Y )
X
X
=
1 Y

b. RYX '

1 1
M = (0,4 5 + 0,13312+ 0,0810+ 0,057 3) = 0,152
X 30
1 1
2
2
2
2
(0,4 0,152) 5 + (0,133,0152) 12+ (0,08 0,152) 10+ (0,057 0,152) 3 =
X 30
= 0,013

2 =

1 1
M Y = [0,4 301+ 0,4 38 4 +...+ 0,05714 3] = 4,632
X 30
4,632 0,152 26,26
RYX ' =
= 0,7218
0,013 62,86
RYX > RYX ' , rezult c dreapta de regresie este mai reprezentativ.

4) Y ( X ) = a + bX

Folosind metoda celor mai mici ptrate, unde M Y Y ( X ) - min, rezult:


a + bM ( X ) = M (Y )

2
aM ( X ) + bM ( X ) = M ( XY )

a = M (Y ) bM ( X )
M ( XY ) M ( X ) M (Y ) M ( XY ) M ( X ) M (Y )
b=
=
2
X2
M ( X 2 ) [M ( X )]

M (X 2) =

1
(2,52 5 + 7,52 12 + 12,52 10 + 17,5 2 3) = 106,25
30

216 9,33 26,26


= 1,516
19,1389
a = 26,26 + 1,516 9,33 = 40,40

b=

Y ( X ) = 40,40 1,516 X

Problema 3

Preul unui produs a fost observat n 30 puncte de vnzare la un moment t dat. Valorile nregistrate
sunt urmtoarele: 21; 24; 26; 30; 25,9; 26; 20; 24,2; 27; 29; 25,6; 26,3; 27; 22; 24,5; 28; 25; 27,5;
22,5; 24,7; 26,6; 23,2; 25,1; 27,5; 23; 24,8; 23,7; 25; 22,8; 23.
Se cere:
1. elaborarea distribuiei statistice a punctelor de vnzare n raport cu preul;
2. analiza reprezentativitii preului mediu;
3. reprezentarea grafic a structurii repartiiei;
4. avnd seria cronologic ce red variaia preului produsului studiat n 6 luni consecutive ca fiind
urmtoarea:
2
3
4
5
6
1

Y :
25 25,7 26 26,5 26,8 28
Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.

1) elaborarea distribuiei statistice a punctelor de vnzare n raport cu preul:


30 20 10
- calculm lungimea intervalului: l X =
=
=2
5
5
[20 22)
X :
2

[22 24) [24 26) [26 28) [28 30)


7

10

- serie de repartiie unidimensional, avnd la baz o variabil atributiv, cantitativ continu i


frecvena absolut.
2) Analiza reprezentativit ii preului mediu:
21 2 + 23 7 + 25 10 + 27 8 + 29 3 42 + 161+ 250 + 216 + 87 756
=
=
= 25,2
30
30
30
- preul mediu este 25,2;
X=

analizm reprezentativitatea mediei cu ajutorul varianei i a coeficientului de variaie a lui


Pearson:

(X
V (X ) =

2
X

(X ) =
CV ( X ) =

2
X

'
i

Ni

i =1

N
= V (X )

X
100
X

- dac CV(X) 50% - media este nereprezentativ

X2 =

(21 25,2)2 2 + (23 25,2)2 7 + (25 25,2)2 10+ (27 25,2)2 8 + (29 25,2)2 3 = 4,63

30
- preul se abate n medie de la valoarea medie cu 2,15.

X = X2 = 4,63 = 2,15
CV ( X ) =

X
X

100 =

2,15
100 = 0,0853 100 = 8,53% < 30% media este reprezentativ.
25,2

3) Reprezentarea grafic a structurii repartiiei:


- reprezentarea grafic a structurii unei repartiii se face cu ajutorul diagramelor de structur;
fi =

Ni
100 frecvena relativ
N

2
100 = 0,0667 100 = 6,67%
30
7
=
100 = 0,2333 100 = 23,33%
30
10
=
100 = 0,3333 100 = 33,33%
30
8
=
100 = 0,2667 100 = 62,67%
30
8
=
100 = 0,1 100 = 10%
30

f1 =
f2
f3
f4
f5

i = f i 360 o

1 = 24,01o
2 = 83,99o
3 = 119,99o
4 = 96,01o
5 = 36 o
Titlu: Stuctura punctelor de vnzare n raport cu preul

10%

6,67%
23,33%

26,67%

1
2
3
4
5

33,33%

Legend:
1. 6,67% din punctele de vnzare au preuri cuprinse ntre 20 i 22;
2 . 23,33% din punctele de vnzare au preuri cuprinse n intervalul [22 - 24);
3 . 33,33% din punctele de vnzare au preuri cuprinse n intervalul [24 - 26);
4 . 26,67% din punctele de vnzare au preuri cuprinse n intervalul [26 - 28);
5 . 10% din punctele de vnzare au preuri cuprinse n intervalul [28 - 30);
2
3
4
5
6
1

4) Y :
25 25,7 26 26,5 26,8 28
Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.
1
1
+ 25,7 + 26 + 26,5 + 26,8 + 28
2
2 = 26,33
a) Y / luna =
5
- preul mediu lunar este de 26,33
25

b) R Y = I Y 1 = I Y 100% 100%
25,7 25+ 26 25,7 + 26,5 26 + 26,8 26,5 + 28 26,5
=
252 + 25,72 + 262 + 26,52 + 26,82
642,5 + 668,2 + 689+ 710,2 + 750,4
=
=
R Y = I Y 1 100 = 0,0231 100 = 2,31%
625+ 660,49 + 676+ 702,25+ 718,24
3460,3
=
=1,0231
3381,98
- preul a crescut n medie de la o lun la alta cu 2,31%.
IY =

Problema 4

Se consider un eantion de 100 gospodrii i variabilele X-numr de membrii i Y-cantitatea de pine


consumat zilnic de o gospodrie (Kg), rezultatele fiind prezentate n tabelul urmtor:
X

TOTAL

0,25
0,5
1
1,5
TOTAL

5
5
10

30
5
35

5
15
5
25

10
20
30

5
40
30
25
100

Se cere:
1. cantitatea medie, median i modal de pine consumat zilnic de o gospodrie (calcul i
interpretare);
2. n ce proporie cantitatea de pine depinde de numrul de membrii;
3. analiza numeric i caracterizarea intensitii legturii ntre cele dou variabile.
1)

0,25 0,5 1 1,5

Y :
40 30 25
5

Y - Media
0,25 5 + 0,5 40 + 1 30 + 1,5 25 1,25 + 20 + 30 + 37,5 88,75
Y=
=
= 0,89[kg ]
=
100
100
100
- 0,89 este cantitatea medie de pine consumat zilnic de o gospodrie.
Me Mediana
- variabila discret N=100

N
= 50
2

Y N + Y N

Y50 + Y51 1 + 1
=
=1
2
2
2
- jumtate din gospodrii consum zilnic pine ntre 0,25 i 1 kg, iar cealalt jumtate ntre 1 i 1,5 kg
de pine pe zi.
Me =

2 +1

Mo Modala
- variabila discret NMo = max(N1, N2, N3, N4) NMo = 40 Mo = 0,5
- cele mai multe gospodrii consum zilnic n jur de 0,5 kg de pine.
2) Se calculeaz: rxy2 =

VTOT (Y ) =

V EXP
VTOT

(2,25 0,89)2 5 + (0,5 0,89)2 40 + (1 0,89)2 30 + (1,5 0,89)2 25 = 0,18


100

(Y

VTOT =

Y N i.

i =1

N
J

(Y / x
VEXP =

N. j

j =1

Calculm mediile condiionate ale lui Y n func ie de X.


0,25 5 + 0,5 5
= 0,35
10
0,5 30 + 1 5
Y 2 = Y / x2 =
= 0,57
35
0,5 5 + 1 15 + 1,5 5
Y 3 = Y / x3 =
=1
25
1 10 + 1,5 20
Y 4 = Y / x4 =
= 1,33
30
Y 1 = Y / x1 =

VEXP(Y ) =
=

(0,35 0,89)2 10 + (0,57 0,89)2 35 + (1 0,89)2 25 + (1,33 0,89)2 30 =


100

2,9 + 3,5+,025+ 5,7 12,35


=
= 0,12
100
100
V
0,12
rxy2 = EXP =
= 0,66 66%
VTOT 0,18

- consumul zilnic de pine de gospodrie depinde de numrul de membrii al gospodriei n proporie


de 66%.
3) Analiza numeric i caracterizarea intensitii legturii ntre cele 2 variabile
- X, Y variabile cantitative
intensitatea legturii se studiaz cu ajutorul raportului de corelaie (rXY)
2
rXY = r XY
=

V EXP
[0;1]
VTOT

2
rXY = rXY
= 0,66 = 0,81 1 legtura intens ntre cele dou variabile.

Problema 5
Cunoscnd seriile cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu
studii medii (Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive,
respectiv:

mii persoane
Luna
X

Y
W

10

22,2
3
3,86
0,39
6

22,2
4
3,87
0,39
5

22,3
4
3,98
0,41
9

23,2
1
4,52
0,43
7

24,7

26,8
5
4,53
0,40
6

28,7

29,1

28,3

28,3

4,91
0,45
5

5,28
0,48
7

6,18
0,5

6,2
0,5

4,1
0,35
7

Se cere:
1. Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y, W;
2. Seria cronologic avnd la baz numrul total de omeri din judeul Cluj;
3. Numrul mediu lunar de omeri;
4. Indicele mediu i ritmul mediu al numrului total de omeri;
5. Diferena medie absolut a numrului total de omeri;
6. Primii 4 indici exprimnd variaia integral a numrului total de omeri, calculai cu baz fix;
7. Indicii factoriali de tip Paasche afereni fiecrui factor care influeneaz numrul total de omeri n
luna 4 fa de luna 1.

1. z(t) = x(t) + y(t) + w(t);

t = 1, 10

2.

Luna
z(t)

10

26,4
86

26,2
05

27,7
39

28,1
67

29,1
54

31,7
86

34,0
65

34,8
67

34,9
80

35,0
00

3. z(t) este o serie cronologic de momente


z(1)
z(10)
+ z(2) + z(3) + ..... + z(9) +
2 = 277 = 30,77
z= 2
9
9
Numrul mediu de omeri din Cluj n cele 10 luni este de 30,77 mii
4.
10

z (t ) z(t 1)
Iz =

i =1
10

[ z(t 1)]

=
2

i =1

26,505 26,486 + 26,739 26,505 + .... + 35 34,98


=
= 1,03
26,486 2 + 26,5052 + .... + 34,98 2
n primele 10 luni, numrul de omeri a crescut n medie de 1,03 ori de la o lun la alta.
R z = I z 1 = 1,03 1 = 0,03 = 3%
Numrul total de omeri a crescut n medie cu 3% de la o lun la alta.

z(10) z(1)
= 0,945
9
Numrul total de omeri a crescut n medie cu 0,954 mii persoane de la un an la altul.

5. z =

6. I 2z / 1 =

z(2) 26,505
=
= 1,007
z(1) 26,486

Numrul total de omeri din judeul Cluj a crescut de 1,007 ori n luna a doua fa de prima.
z(3) 26,739
=
= 1,0095
z(1) 26,486
z(4 ) 28,167
=
=
= 1,063
z(1) 26,486
z(5) 29,154
=
=
= 1,1
z(1) 26,486

I 3z / 1 =
I z4 / 1
I 5z / 1

7. Numrul total de omeri z(t) depinde de factorii de influen astfel:


z(t) = x(t) + y(t) + w(t)
x (4) + y(4) + w (4)
= 1,036
x(1) + y(4) + w (4)
Numrul total de omeri ar fi crescut de 1,036 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri muncitori.
I z4 // 1x (P ) =

I z4 // 1y (P ) =

x (4) + y(4) + w (4)


= 1,023
x (4) + y(1) + w (4)

Numrul total de omeri ar fi crescut de 1,023 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri cu studii medii.
I z4 // 1w (P ) =

x(4) + y(4) + w (4)


= 1,0014
x(1) + y(4) + w (1)

Numrul total de omeri ar fi crescut de 1,0014 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri cu studii superioare.

Problema 6
Evoluia numrului de contracte de vnzare ncheiate de o societate n zilele lucrtoare ntr-o
anumit perioad a fost urmtoarea:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23

Se cere:
1. Tendina mrimii analizate (dac se constat prezena factorilor sezonieri desezonalizai serie).
2. Previziunea mrimii pe urmtoarele 5 zile.

Rezolvare:
1. Pentru a determina tendina, trebuie s reprezentm cronograma n vederea stabilirii prezenei
factorilor sezonieri:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23

30
24

25

21

20

22

20

21

21

23

23

22

19

15

25 24

22
24

23

10
5
0
1

9 10 11 12 13 14 15

Dup cum se observ din grafic, exist factori sezonieri, tendina fiind cresctoare. Deci, variaia
numrului de contracte este de forma:
y(t) = T(t) + S(t) + (t)
unde: T(t) tendina
S(t) componenta sezonier
(t) factori neeseniali
Ne organizm datele astfel:
Ziua

II

III

IV

20
21
23

21
22
24

22
24
25

21
23
24

19
22
23

Spt.
1
2
3

Folosind procedeul mediilor mobile calculm seria desezonalizat dup relaia:


Y11 + Y12 + Y13 + Y14 + Y15
5
Y + Y13 + Y14 + Y15 + Y21
Y14' = 12
5
.
.
Y13' =

Y33' =

Y31 + Y32 + Y33 + Y34 + Y35


5

Ziua

II

III

IV

21,4
23,4

21,8
23,6

20,6
22,4
23,8

20,8
22,8
-

21
23,2
-

II

III

IV

0,98
0,98
0,98

1,01
1,02
1,015

1,07
1,07
1,05
1,063

1,01
1,01
1,01

0,90
0,95
0,925

Spt.
1
2
3

Calculm coeficienii de sezonalitate:


Ziua
Spt.
1
2
3
K
K ts =
KI =

KV =

Yts
Yts'
K 2 I + K 3I
2
.
.
.
.
K 1V + K 2V
2

2
3
4
5
6
7
8
9
10
11
1

Y('t ) :
20,6 20,8 21 21,4 21,8 22,4 22,8 23,2 23,4 23,6 23,8
25
24
23
22,8

22

23,6 23,8

22,4

21
20

23,2

23,4

21,4
20,6

21,8

20,8

19
1

10

Din grafic se observ c tendina cea mai probabil este o dreapt. Deci:

T(t) = a + bt
2

Punnd condiia ca: M[Y (t ) T(t )] =minim, obinem:


a = M [ y(t ] bM (t )
a + bM (t ) = M [ y (t )]

M [ y (t ) t ] M [ y (t )] M (t )

2
2
aM (t ) + bM (t ) = M [ y (t ) t ]
b =
M (t 2 ) [M (t )]

1 + 2 + ... + 11
=6
11
1 2 + 2 2 + ...112
M (t 2 ) =
= 4,61
11
20,6 + 20,8 + ... + 23,8
M ( y(t )) =
= 22,25
11
1 20,6 + 2 20,8 + ... + 11 23,8
M ( y(t ) t ) =
= 137,07
11
137,07 22,25 6
b=
= 0,357
46,1 36
a = 22,25 0,357 6 = 20,108
M (t ) =

T(t) = 20,108 + 0,357 t


2. Previziunea valorilor lui Y
Y4PI = T (14) K I = (20,108 + 0,357 14) 0,98 = 24,6 25
Y4PII = T (15) K II = (20,108 + 0,357 15) 1,015 = 25,8 26
Y4PIII = T (16) K III = (20,108 + 0,357 16) 1,063 = 27,44 27
Y4PIV = T (17) K IV = (20,108 + 0,357 17 ) 1,01 = 26,4 26
Y4PV = T (18) K V = (20,108 + 0,357 18) 1,925 = 24,54 25

Problema 7
O agenie imobiliar dorete s dispun de o funcie cu ajutorul creia s poat evalua rapid valoarea
de pia a apartamentelor. Pentru aceasta, are la dispoziie o baz de date cuprinznd 30 de
apartamente observate n raport cu variabilele:
Y = preul de vnzare n mii euro
X 1 = suprafaa n metri ptrai
X 2 = numrul de camere
X 3 = finisaj*nr.camere. Se calculeaz prin nmulirea gradului de finisare (0 pentru nefinisat, 1
pentru semifinisat i 2 pentru finisat) cu numrul de camere.

Nr.crt.

X1

X2

X3

15,3

22

42,0

74

13,0

21

20,0

32

25,8

52

4
5
6

46,6

88

24,7

48

18,9

35

41,5

78

10

47,5

80

24,0

45

22,3

39

33,5

68

11
12
13
14

20,7

42

15

49,5

92

16

26,6

50

17

16,0

26

32,7

60

38,1

64

15,1

28

15,6

30

22

39,8

83

23

27,0

44

24

35,0

71

17,3

28

25,5

49

25,0

46

14,5

22

29

39,5

65

30

41,5

69

18
19
20
21

25
26
27
28

Se cere:
1) Studiai grafic existena i forma legturii dintre pre i fiecare din variabilele dependente.
2) Calculai parametrii funciei liniare multiple dintre pre i toate variabilele explicative.
3) Este reprezentativ aceast funcie ?

4) S se fac cteva simulri ale valorii de pia a apartamentelor pentru diferite valori ale
variabilelor explicative.
5) Comparai reprezentativitatea funciei obinute cu a funciilor de regresie simple.

Rezolvare
1) Graficul care ne poate indica existena sau forma legturii este diferit n funcie de natura variabilei
explicative: discret sau continu .
a) Legtura dintre pre i suprafa. Deoarece suprafaa este o variabil continu , putem construi norul
de puncte.

50
45

pret (mii euro)

40
35
30
25
20
15
10
5
0
0

20

40
60
suprafata (mp)

80

100

Se observ c legtura exist i este liniar.


b) Legtura dintre pre i numrul de camere. Norul statistic se prezint astfel:

50
45
40

pret (mii euro)

35
30
25
20
15
10
5
0
0

2
numar camere

Dac forma legturii nu pare evident prin norul de puncte se poate utiliza i un grafic care folosete
mediile condiionate, din grupe.
Procednd analog i pentru variabila rmas, concluzionm c putem modela legturile dintre
pre i fiecare din variabile prin funcii liniare.
2) Funcia de regresie liniar multipl se scrie :
Y = a1 X 1 + a 2 X 2 + a 3 X 3 +
Prin aplicarea metodei celor mai mici patrate ajungem la ecuaia scris sub form implicit :
M 00 [Y M (Y )] + M 01 [X 1 M ( X 1 )] + M 02 [ X 2 M ( X 2 )] +
+ M 03 [X 3 M ( X 3 )] = 0
Scriem matricea de variaie i covariaie :

M ( 4)

m00

m01
m11

m02
m12
m22

m03

m13
m23

m33

m00 = Y2 = 121,55
m01 = M (YX 1 ) M (Y ) M ( X 1 ) = 227
m02 = M (YX 2 ) M (Y ) M ( X 2 ) = 11,196
m03 = M (YX 3 ) M (Y ) M ( X 3 ) = 16,229
m11 = X2 1 = 443

m12 = M ( X 1 X 2 ) M ( X 1 )M ( X 2 ) = 21,39
m13 = M ( X 1 X 3 ) M ( X 1 )M ( X 3 ) = 23,19
m22 = X2 2 = 1,143
m23 = M ( X 2 X 3 ) M ( X 2 ) M ( X 3 ) = 1,2767
m33 = X2 3 = 5,41

M (4)

121,55 227 11,196 16,229

443 21,39 23,19

=
1,143 1,2767

5,41

Calculm complemenii algebrici:


M 00 = 193,92
M 01 = 82,58
M 02 = 135,4
M 03 = 195,79

Ecuaia de regresie devine :


193,92[Y M (Y )] 82,58[ X 1 M ( X 1 )] 135,4[ X 2 M ( X 2 )]
195,79[ X 1 M ( X 3 )] = 0
Prin nlocuirea valorilor medii, avem:
193,92[Y 28,48] 82,58[ X 1 51,7 ] 135,4[ X 2 2,3]
195,79[ X 1 2,3] = 0
Dup efectuarea calculelor se obine ecuaia sub form explicit :
Y = 2,559 + 0,4258 X 1 + 0,698 X 2 + 1,01X 3 +
3) Reprezentativitatea funciei o apreciem prin coeficientul de corelaie liniar multipl:

RY , X1X 2 X 3 = 1

det M ( 4)
131,75
= 1
= 0,997
m00 M 00
121,55 193,92

deci funcia este foarte reprezentativ.


4) Pentru un apartament de 65mp, cu 3 camere, semifinisat :
X 1 = 66

X2 = 3

X3 = 3

Y (66,3,3) = 2,559 + 0,4258 66 + 0,698 3 + 1,01 3 = 35,8 mii euro


Rezultatul este foarte realist dac privim baza de date iniial.
5) Rezolvarea acestui punct rmne la latitudinea cititorului.

S-ar putea să vă placă și