Sunteți pe pagina 1din 202

Capitolul 1

CONCEPTE DE BAZĂ. OBIECTUL STATISTICII

1.1. Obiectul statisticii şi importanŃa acesteia în economie

Statistica este ştiinŃa care se ocupă cu descrierea şi analiza numerică a fenomenelor de masă,
dezvăluind particularităŃile lor de volum, structură, dinamică, conexiune, precum şi regularităŃile sau
legile ce le guvernează [Trebici, V., 1985].
Există un mare număr de definiŃii ale statisticii fapt care are mai multe explicaŃii; istorice –
statistica s-a constituit la confluenŃa mai multor orientări şi discipline, dar având la origine un caracter
social; metodologice – statistica încorporează o serie de metode în care predomină cele cantitative, cu
fundamentarea epistemologică corespunzătoare; aplicative – prin generalitatea metodelor sale,
statistica se aplică în cele mai variate domenii, de la astronomie la societate, de la microcosmos la
macrocosmos în natură şi societate, de la fizica statistică până la statistica socială [Trebici, V., 1985].
O definiŃie sau alta, stăruie fie asupra unei faze din demersul metodologic, fie asupra unui
domeniu restrâns, fie asupra unui grup de metode, asupra teoriei sau dimpotrivă a aplicaŃiilor.
În prezent statistica dispune de un corp de metode a căror putere de cunoaştere este verificată
în variate domenii şi de o teorie generală în continuă dezvoltare. Cultura statisticii devine tot mai mult
o componentă din cultura generală a omenirii contemporane, iar gândirea statisticii – o modalitate
ştiinŃifică indispensabilă pentru analiza şi interpretarea unor clase foarte largi de fenomene.
Rezultat al unui îndelungat proces, statistica se prezintă cu un corp comun de noŃiuni organizat
în jurul conceptului de probabilitate, de metode ştiinŃifice, cu fundamentare epistemologică explicită şi
cu o varietate de domenii de aplicare, acoperind practic natura şi societate.
Astăzi, statistica constituie un puternic instrument de cunoaştere a lumii înconjurătoare. Marea
majoritate a disciplinelor împrumută de la statistică modelele şi procedeele acesteia, indispensabile de
altfel îndeplinirii rolului acestora. Trebuie menŃionat însă marele pericol la care aceste discipline pot fi
supuse în cazul folosirii necorespunzătoare a metodelor şi procedeelor statistice.
Analiza şi cunoaşterea fenomenelor şi proceselor social economice se poate realiza numai ca
urmare a unei observări riguroase şi metodice, în cursul căreia ele pot fi măsurate. În cadrul operaŃiei
de modelare a fenomenelor şi proceselor are loc un proces de simbolizare şi abstractizare a lor în
vederea analizării sub aspect cantitativ. Analiza cantitativă constituie o fază premergătoare analizei
calitative. Testarea modelelor construite se realizează prin intermediul operaŃiei de simulare. Pe
parcursul tuturor fazelor de construire şi testare a modelelor, statistica este mereu prezentă în câmpul
cercetării ştiinŃifice fiind solicitată de a lua decizii pe baza metodelor şi procedeelor pe care le pune la
dispoziŃie. Modelul construit şi testat vine în ajutorul statisticii să aprofundeze cunoaşterea
fenomenelor şi proceselor.
Modelarea matematică a câştigat tot mai mult teren, dobândind o importanŃă deosebită, odată
cu intensificarea aplicării modelelor statistice. Culegerea şi organizarea datelor rezultate din observări
statistice constituie etapa premergătoare elaborării unui model. În acest mod, modelul realizat va
reprezenta o machetă a realităŃii, alcătuită pe baza datelor din observarea statistică. Pe bună dreptate,
modelarea este considerată o modalitate de cunoaştere a realităŃii înconjurătoare.
Organizarea culegerii, transmiterii şi recepŃionării informaŃiilor în cadrul unui sistem economic
constituie obiectivele esenŃiale ale unui sistem informaŃional. Un sistem informaŃional este alcătuit din
mai multe circuite informaŃionale, unde fiecare în parte trebuie să includă operaŃii de culegere,
transmitere neperturbată a datelor şi recepŃionării acestora în scopul folosirii lor. Trecerea de la
prelucrarea manuală la cea automatizată a tuturor fazelor din cadrul sistemului informaŃional,
adânceşte procesul de cunoaştere a realităŃii, permiŃând asimilarea sistemului informaŃional unui flux
tehnologic informaŃional, prin transformarea lui într-un sistem cibernetic. Organizarea circulaŃiei
informaŃiei într-un sistem în conformitate cu principiile sistemelor cibernetice, constituie un suport
ştiinŃific în abordarea gestiunii eficiente a acestuia. Având în vedere natura nedeterministă a majorităŃii
elementelor componente dintr-un sistem cibernetic, studierea stabilităŃii acestora se realizează apelând
tot la statistică. Studii de reglare şi echilibru într-un sistem cibernetic se pot aborda numai pe baza
unor observări statistice realizate metodic care ne permit să construim modelul matematic în
conformitate cu realitatea.
Informatica, prin aparatul său, se implică tot mai mult în toate fazele de vehiculare şi
prelucrare a informaŃiilor din cadrul sistemelor informaŃionale, conducând în acest mod la un salt
calitativ important, cu consecinŃe semnificative şi asupra statisticii. Calculatoarele electronice, prin
puterea lor de calcul, conduc la o nouă viziune cu privire la funcŃiile statistice, precum şi la
modalităŃile de realizare a acestor funcŃii. Realizarea automată şi în regim interactiv a tuturor
metodelor şi procedeelor algoritmizabile din statistică, cu ajutorul calculatorului nu afectează cu nimic
obiectul şi metoda statisticii. Calculatorul electronic nu constituie decât un instrument de calcul,
degajând statistica de volumul mare de calcule. În aplicaŃiile practice implementate cu ajutorul
calculatorului specialistul este absolvit în totalitate de manipularea datelor cât şi a operaŃiilor cu
acestea, concentrându-se în exclusivitate asupra interpretării rezultatelor intermediare şi finale.
Statistica informaŃională, care a fost denumită aşa de academicianul Octav Onicescu, şi-a găsit
aplicaŃii practice în diverse domenii. Studierea sistemelor în raport cu informaŃia conŃinută în acestea,
a permis o abordare sistemică şi mai bine fundamentată matematic a realităŃii. Teoria matematică a
informaŃiei formulează legile cele mai generale cu privire la comenzile, controlul şi comunicaŃiile
dintr-un sistem, stabilind în acelaşi timp principiile de codificare, prelucrare, păstrare şi transmitere a
informaŃiei de care statistica beneficiază din plin. IniŃiatorul teoriei matematice a informaŃiei a fost
Claude Shannon, care s-a bazat pe teoria probabilităŃilor. Teoria iniŃiată de Shannon a permis
reducerea perturbaŃiei care influenŃează transmiterea informaŃiei.
Fiind un proces complex de cunoaştere, judecată şi acŃiune, managementul se concretizează
prin operaŃii de informare, analiză şi control, punctul esenŃial constituindu-l momentul luării deciziei.
Toate aceste operaŃii folosesc metodele şi procedeele statisticii începând cu culegerea (observarea)
datelor şi încheind cu deducerea concluziilor necesare luării deciziilor. Aceasta a permis conturarea
unei discipline denumită teoria deciziei, având drept scop fundamentarea ştiinŃifică a procesului
decizional. Deoarece teoria deciziei face apel şi la modele deterministe, aceasta se integrează într-un
domeniu mai larg privind matematica aplicată şi anume în cercetarea operaŃională. Cercetarea
operaŃională este considerată un instrument de conducere naŃională a proceselor şi fenomenelor cu un
înalt grad de complexitate. Această disciplină integrează în cuprinsul său metode şi procedee statistice
cât şi o mulŃime de tehnici de natură ştiinŃifică, tehnică şi de culegere şi prelucrare a informaŃiei.
Decizii în situaŃii de risc constituie un alt domeniu în care statistica se aplică. Diversele
variante de dezvoltare a unui fenomen sau proces, fie social sau economic, presupune descompunerea
acestuia într-o mulŃime de evenimente care formează un câmp complet de evenimente. Anticiparea
celei mai plauzibile variante de dezvoltare a fenomenului presupune cunoaşterea distribuŃiei de
probabilitate asociată acestuia. Acest lucru nu este posibil fără o observare metodică a evoluŃiei
fenomenului în timp şi ca urmare o determinare a legii de probabilitate pe care o urmează. Aflarea
distribuŃiei de probabilitate, utilizând modele şi procedee statistice, permite a aprecia gradul de risc la
care este supusă o acŃiune sau alta.
În marketing statistica se regăseşte în S.S.D.M. (sistemul suport al deciziilor de marketing), ca
acesta fiind compus din „Banca statistică” şi „Banca de modele”. SSDM este un ansamblu coordonat
de date, sisteme, instrumente şi tehnici, înzestrat cu tehnologia necesară ce ajută o organizaŃie să
culeagă şi să interpreteze informaŃiile relevante referitoare la activitatea sa şi la mediul în care
operează făcând din acesta temelia acŃiunilor de marketing. [Kotler,Ph., 1997].
Pe baza celor prezentate se poate sublinia încă o dată rolul şi importanŃa cunoaşterii metodelor
şi procedeelor puse la dispoziŃie de statistică în procesul cunoaşterii. Nu este lipsit de importanŃă
aportul statisticii nici în domenii ca: medicină, biologie, fizică, chimie, ştiinŃe juridice etc. Frecvente
sunt cazurile în care studii întreprinse în aceste domenii trag concluzii care au la bază o mulŃime de
date rezultate în urma unor observări statistice, implicând nemijlocit modele ale inferenŃei statistice.
Ronald Fisher a remarcat: „Către statisticieni ne îndreptăm pentru a răspunde la problemele
cele mai serioase puse de marile aventuri ale epocii noastre. De fiecare dată când se întreprinde ceva
important, statisticienii sunt în culise. În toate cercetările ştiinŃifice de bază, ei sunt cei care elaborează
planurile de experienŃă sau observaŃii şi tot la ei se recurge pentru a analiza rezultatele pentru a evalua
constatările şi pentru a separa faptele clar demonstrate de cele ce mai cer confirmarea” [Trebici, V.,
1985].
Cercetările ştiinŃifice simt necesitatea unei „escorte statistice” în două momente fundamentale
ale cercetării: momentul de început legat de culegerea şi prelucrarea datelor şi în momentul aplicativ,
de verificarea teoriilor pe calea confruntării cu realitatea.
Multitudinea de domenii în care statistica se aplică i-a permis lui M.G. Kendall să spună că
„Statistica, în sensul cel mai larg, este matricea oricărei ştiinŃe experimentale”.

1.2. Istoricul statisticii

Statistica, în contextul celorlalte ştiinŃe, s-a confruntat ca disciplină de sine stătătoare, urmând
o traiectorie care leagă practica de teorie. Preocupări de natură statistică, prin abordări variate a
diverselor fenomene, se pierd în vechimea istoriei. Atât în Grecia antică, dar mai cu seamă în imperiul
roman, investigaŃiile arheologice au scos la iveală o serie de date care privesc inventarierea bunurilor,
a resurselor umane, descrierea geografică şi politică a diverselor state.
Toate aceste preocupări, indiferent de natura lor, au constituit o consecinŃă a necesităŃii
practice, executându-se în mod empiric şi fără respectarea unor criterii riguroase. Beneficiari ai acestor
date erau organele fiscale, militare şi cele administrative, direct interesate în evaluarea potenŃialului
uman şi material a diverselor forme de organizare teritorială sau statală. Aceste date serveau în
principal nevoilor practice de orientare.
Interesele de ordin ştiinŃific nu au întârziat prea mult să apară, obligând statistica să părăsească
stadiul de statistică practică. Începea să se impună cunoaşterea unor fenomene, referitor la care se
cereau o multitudine de date. Ca urmare, apare necesitatea cunoaşterii unor tehnici care să permită
desprinderea unor concluzii fundamentale pe baza datelor înregistrate. În faza incipientă de
confruntare a statisticii, aceasta se mărginea la descrierea statului, expunerea situaŃiei geografice,
economice şi politice. Acest mod de abordare a statisticii cunoscut sub numele de „descrierea
statului” a predominat până în sec. Al 17-lea şi al 18-lea când a atins punctul culminant, concordând
cu constituirea în Germania a unei şcoli, cunoscută sub denumirea de şcoala descriptivă germană.
În conformitate cu normele teoretice, care erau specifice universităŃilor germane, descrierea
statului s-a conturat ca o disciplină cu obiect propriu de predare. Ulterior, această disciplină născută
din practică, a primit numele de statistică, devenind un obiect de studiu favorit în Germania. Termenul
de statistică definit în spiritul şcolii din Göttingen, a fost preluat de mulŃi statisticieni recunoscuŃi ai
epocii respective.
ReprezentanŃii şcolii de statistică din Germania, s-au ridicat în oarecare măsură peste
orientarea pur descriptivă a înaintaşilor, studiile care aveau drept obiectiv, descrierea statului
înregistrând o nouă dimensiune şi anume cea numerică. În acest nou context, de îmbogăŃire prin
componenta numerică, statistica nu s-a schimbat din punct de vedere a conŃinutului, ea continuând să
rămână o disciplină orientată cu preponderenŃă spre descrierea fenomenelor şi nu spre căutarea unor
legi, rămânând o disciplină caracterizată de un mod de prezentare preponderent verbal. În acest
context au fost elaborate lucrări cu privire la descrierea statelor în diferite Ńări europene, constituind
astăzi valoroase surse de informaŃie.
În Moldova, cea mai de seamă lucrare este „Descrierea Moldovei” a lui Dimitrie Cantemir.
Această lucrare, cu un pronunŃat caracter monografic în plan geografic, politic, social şi cultural, s-a
impus în mod deosebit lumii europene din acea perioadă, desemnându-l pe autor în rândul fruntaşilor
statisticii descriptive europene.
În perioada de avânt a statisticii descriptive a statului, în Anglia şi în afara universităŃilor, apare
un curent statistic nou, cunoscut sub numele de aritmetica politică. Noul curent din statistică se
caracterizează prin analiza datelor de observaŃie prin procedee matematice, relevarea regularităŃilor în
fenomenele social-economice, formulări şi încercări de previzionare a unor fenomene.
Implicarea aparatului matematic în descoperirea legităŃilor care caracterizau fenomenele
constituia un real progres, anticipând apariŃia statisticii moderne.
ReprezentanŃii de seamă a noului curent în statistică au insistat în mod deosebit prin lucrări în
domeniul demografiei, deoarece vedeau în studiul populaŃiei izvorul bogăŃiei şi puterii Angliei. Merită
să amintim în acest sens pe John Graunt, William Petty şi Edmund Malley.
J. Graunt, analizând cu atenŃie registrele de naşteri şi decese din Londra, a încercat să găsească
legităŃile creşterii populaŃiei, a echilibrului numeric dintre sexe, a fertilităŃii, morŃii etc. Studiile lui
Graunt relevă, pentru prima oară, preponderenŃa naşterilor masculine în raport cu naşterile feminine
(107 băieşi la 100 fete), calculând primele rate de mortalitate pe grupe de vârstă, alcătuind şi o
rudimentară tabelă de mortalitate.
W. Petty, prin lucrările sale, foloseşte estimările cantitative în compararea potenŃialului uman
şi economic al diferitelor state.
E. Halley a fost un reprezentant de seamă a şcolii statistice din acea vreme din Anglia,
abordând în lucrările sale subiecte legate de estimarea populaŃiei câtorva state, bazându-se pe criterii
ceva mai raŃionale decât cele adoptate anterior, cât şi alcătuirea primei tabele complete de mortalitate.
La promovarea principiilor aritmeticii în investigarea fenomenelor economice s-au evidenŃiat
în mod deosebit alŃi doi reprezentanŃi ai şcolii engleze: Devanant şi King. Ultimul s-a dedicat în mod
special calculelor privind veniturile statului pe calea impozitelor, de asemenea încercând să stabilească
mărimea capitalurilor de care dispunea Anglia în sec. al 17-lea, pierderile suferite în urma războaielor,
incendiilor, epidemiilor.
InfluenŃa aritmeticii politice engleze s-a făcut simŃită şi în alte Ńări, conturându-se un curent al
aritmeticii politice europene. Aritmetica politică s-a impus în lupta cu şcoala statisticii descriptive din
Germania, prin intermediul lui J.P. Süssmlich. Lucrările sale se remarcă în special prin: căutarea
explicaŃiei fenomenelor vieŃii umane şi indicarea legilor ce le guvernează, corelarea fenomenelor
demografice şi economice, examinarea fenomenelor în dinamică, identificarea regularităŃilor în
volumul de date rezultate din observaŃii etc.
În consecinŃă, se poate afirma că la sfârşitul sec. al 18-lea, în statistică se prefigurau două
curente: primul curent corespunzător căruia statistica era înŃeleasă ca o descriere empirică şi verbală a
caracteristicilor statului (statistica descriptivă) şi al doilea curent conform căruia statistica trebuie să
se dedice analizei fenomenelor sociale, în căutarea de legităŃi întemeiate cu regularitate pe observaŃii şi
calcule numerice (aritmetica politică).
Statistica, prin curentele sale, câştigă teren tot mai mult, iar descrierile statistice devin
preocupări de bază în instituŃiile publice. Aritmetica politică, sub aspect conceptual, capătă o nouă
dimensiune odată cu inventarea calculului probabilităŃilor. Această nouă ramură a matematicii, avea să
îndeplinească misiunea fundamentării ştiinŃifice a preocupărilor statistice de până atunci. Bernoulli şi
Laplace aveau să fie primii care au utilizat modelele teoriei probabilităŃilor în studiul statistic al
fenomenelor economice şi sociale. Bernoulli formulează „legea numerelor mari”, deschizând drumul
aplicării calculului probabilităŃilor în economie. Laplace s-a preocupat de studierea fenomenelor
dependente de diverşi factori complexi de acŃiune, prefigurând utilitatea acestui calcul şi în abordarea
de ansamblu a fenomenelor sociale.
Un alt reprezentant de seamă al calculului probabilităŃilor a fost Gauss, care a definit legea de
repartiŃie normală. În aceeaşi perioadă, Fourier a publicat un număr de studii despre aplicarea
matematicii în investigaŃii demografice, iar Poisson descoperă legea de repartiŃie a evenimentelor rare.
Gândirea probabilistică avea să se consolideze în statistică în secolul al 19-leaa, asigurându-i
progresul şi renumele de care se bucură astăzi în întreaga lume. Un reprezentant de seamă din această
perioadă şi care a dominat gândirea statistică a acestui secol a fost matematicianul, astronomul şi
statisticianul belgian Adolphe Quételet. Conform teoriei acestui mare gânditor, diversele caractere
fizice, intelectuale şi morale ale oamenilor, observaŃi în masă, s-ar echilibra într-o fiinŃă fictivă, ideală,
dorită de natură, dar neizbutită. FiinŃele umane, conform teoriei „omului mediu”, s-ar distribui de-o
parte şi de alta a acestei fiinŃe ideale. Pentru a desprinde ce este general fiinŃei umane, A. Quételet
presupune debarasarea omului de caracterele individuale ale sale care nu sunt decât accidentale. Ideea
de „om mediu” a constituit izvorul de inspiraŃie privind o serie de noŃiuni şi concepte noi din statistică,
cum ar fi: repartiŃie, medie, dispersie, observare de masă, regularitate etc. În conformitate cu teoria lui
A. Quételet, regularităŃile deduse ca urmare a unei observări de masă derivă din legi care sunt urmate
de om atât în ordinea fizică cât şi în cea morală. Lui A. Quételet i se atribuie, pentru prima oară, o
teorie sintetică a statisticii bazată pe principii, tehnici şi procedee statistice. Acesta imprimă statisticii
noi direcŃii de cercetare: cercetarea variaŃiei şi a relaŃiilor cazuale în masa fenomenelor, sesizarea
regularităŃilor, abordarea cu prioritate a fenomenelor vieŃii umane etc. Conform teoriilor lui A.
Quételet, statistica deŃine metode unice necesare studierii fenomenelor bazate pe calculul
probabilităŃilor.
Considerat ca unul din fondatorii economiei matematice, A. Cournot considera statistica ca o
disciplină de bază în abordarea fenomenelor şi desprinderea cauzelor regulate ale acestora în
contextul acŃiunii cauzelor întâmplătoare.
În secolul al 19-lea se întâlnesc diverse preocupări în domeniul statisticii teoretice şi practice.
Unele dintre acestea admiteau includerea în sfera statisticii a tuturor fenomenelor cuantificabile
numeric, abstracŃie făcând natura lor, în timp ce alŃii considerau de domeniul statisticii doar studierea
fenomenelor sociale. Mai exista un grup restrâns, care restricŃiona câmpul de aplicare al statisticii la
fenomenele vieŃii umane.
ContribuŃii de seamă la progresul statisticii şi consolidării acesteia ca fiinŃă au adus şi alte şcoli
de statistică, în decursul sectorului al 19-lea.
Merită, cu prisosinŃă, să fie amintiŃi reprezentanŃii şcolii statistice ruse care s-au impus în
domeniul statisticii sociale, dar mai ales în aportul adus în dezvoltarea teoriei probabilităŃilor. În
concepŃia lui D.P. Juravski statistica trebuie să aibă ca obiect de studiu viaŃa socială cu multitudinea de
fenomene care îi aparŃine, considerând statistica ca o ştiinŃă metodologică. P.L. Cebâşev şi A.A.
Markov şi-au adus un aport substanŃial la dezvoltarea teoriei probabilităŃilor. Cebâşev demonstrează
printre altele, teorema centrală a teoriei probabilităŃilor şi a legii numerelor mari, iar Markov a pus
bazele teoriei moderne a proceselor stochastice şi a lanŃurilor care-i poartă numele.
În secolul trecut se conturează o nouă etapă în evoluŃia statisticii, cunoscută ca etapa
constituirii statisticii moderne. În aceasta nouă etapă statistica depăşeşte stadiul descriptiv, de
prezentare simplistă a fenomenelor, insistându-se pe interpretarea analitică a fenomenelor şi deducerea
de concluzii inductive având la bază datele din observări. Acest lucru nu era posibil decât printr-o
întrepătrundere a statisticii cu matematica pentru a permite găsirea celor mai corespunzătoare metode
în atingerea obiectivelor.
F. Galton şi K. Pearson reprezentanŃi ai şcolii statistice anglo-saxone, au elaborat o mare parte
din metodele şi procedeele specifice analizei statistice moderne, continuate apoi de R.A. Fisher şi alŃii.
K. Pearson transpune în limbaj matematic ideea de „variaŃie legată” a lui Galton, constituindu-se într-o
teorie, teoria corelaŃiei statistice, permiŃând stabilirea diverselor forme de legătură în aplicaŃii practice
din domeniul vieŃii sociale.
Prelungirea statisticii la rezolvarea următoarelor categorii de probleme: probleme de
specificaŃie, probleme de observaŃie şi probleme de distribuŃie se datorează lui R.A. Fisher. În noua
concepŃie despre statistică se porneşte de la ipoteze statistice cu privire la fenomenul de observat,
deducŃiile logice desprinse urmând a se compara cu datele avute la îndemână. Dacă acestea sunt în
concordanŃă, ipotezele avansate se consideră valide, cel puŃin până la noi observaŃii mai riguroase. Se
prefigurează tot mai frecvent ideea, conform căreia, preocupările de a trage concluzii de o valoare
generală trebuie să se bazeze pe datele observate din eşantion. Cercetarea prin sondaj începe să devină
o aplicaŃie curentă, observarea totală practicându-se din ce în ce mai rar şi numai în cazuri absolut
necesare. Caracterizarea unei populaŃii pornind de la datele de observare pe bază de eşantion,
presupune o anumită incertitudine, pe care specialistul caută să o reducă cât mai mult. Una din
problemele importante ale statisticii o constituie tocmai măsurarea gradului de incertitudine care
privesc concluziile inductive. În concordanŃă cu noile probleme ale vieŃii sociale şi economice,
statistica se implică în mod direct în determinarea riscurilor de eroare şi a pierderilor implicate de
deciziile întemeiate pe o informaŃie care, prin natura sa, nu poate fi exhaustivă.
În această perioadă, prin preocupările mai ales de ordin teoretic, statistica se conturează ca o
disciplină ştiinŃifică. Statistica înregistrează progrese remarcabile îndeosebi în domeniul teoriei
matematice, conducând la descoperirea de metode noi de investigare mai elaborate şi mai eficiente.
Din punct de vedere pragmatic, statistica pune stăpânire pe noi domenii de aplicaŃie, rezultatele
obŃinute constituind un imbold privind implicarea statisticii în cele mai variate sectoare ale lumii
sociale şi economice.
În multitudinea de definiŃii care s-au dat şi se mai dau statisticii, se pot deosebi două curente:
unul din acestea consideră statistica drept ştiinŃă, iar celălalt o admite ca metodă. Indiferent cărui
curent aparŃinem, statistica modernă prezintă două aspecte diferite, dar complementare: aspectul
descriptiv, înglobat în aşa numita statistică descriptivă, care permite fixarea informaŃiilor aşa cum au
rezultat din prelucrarea datelor din observare şi aspectul inductiv, înglobat în statistica inferenŃială,
care ne permite o tratare teoretică a datelor în vederea deducerii de concluzii logice, asociate
observaŃiilor efectuate. În cadrul unui demers statistic, cele două aspecte trebuie privite ca două
momente care aparŃin unuia şi aceluiaşi proces de cunoaştere.
Statistica se dovedeşte de neînlocuit, în studiul cunoaşterii fenomenelor social-economice,
generate de cauze multiple şi complexe. Aceste fenomene domină aproape întreaga activitate socială şi
economică. Complexitatea acestora ridică mari dificultăŃi în stabilirea legăturii fenomen-cauză supusă
analizei statistice. Pornind de la date de observare, pe baza calculelor statistice, se pot desprinde legi
statistice, care descriu relaŃii cauzale de natură statistică. Aceste legi sunt legi cu statut propriu, care
sunt la fel de obiective ca şi legile dinamice. Legile statistice sunt caracteristice numai fenomenelor
urmărite printr-un număr mare de cazuri, acolo unde întregul se manifestă prin intermediul unităŃii
sistemelor componente şi nu prin fiecare parte componentă luată separat. Legea statistică acŃionează ca
o tendinŃă de ansamblu, dedusă pe baza unui volum mare de observaŃii statistice. Legea statistică se
poate pune în evidenŃă numai dacă se consideră un număr suficient de mare de unităŃi statistice
elementare ale populaŃiei de studiat supuse observării.
Legea numerelor mari, care constituie o expresie a legăturii dintre necesitate şi întâmplare, se
verifică în colectivităŃi relativ mari şi cuprinzătoare. În conformitate cu această lege, acŃiunea
conjugată a unui număr mare de factori aleatori, în condiŃii bine determinate, conduce la rezultate
aproape independente de întâmplare, dând astfel posibilitatea ca necesitatea să se realizeze. Referindu-
ne la prima lege statistică descoperită ştim că la naştere numărul băieŃilor întrece pe cel al fetelor,
raportul iniŃial admis era de băieŃi 107; fete 100. Particularizând această lege statistică la distribuŃia pe
sexe a născuŃilor în sânul fiecărei familii în parte, ar fi imposibil să indicăm ce fel de raport există,
date fiind variaŃiile sale destul de numeroase şi în acelaşi timp importante pentru diferite familii. O
cercetare statistică care să prezinte rezultate semnificative în acest sens, trebuie întreprinsă pe mase
îndeajuns de mari de naşteri. Însuşi J. Bernoulli care a dat acestei legi o formă matematică, a Ńinut să
menŃioneze la vremea sa, că sporirea numărului observaŃiilor în scopul mărimii gradului de siguranŃă a
deciziei nu constituie ceva nou şi neobişnuit, deoarece omul indiferent de pregătirea sa ştie că sursa de
reuşită referitor la o acŃiune a sa este cu atât mai mare, cu cât mai multe observaŃii sunt luate în
considerare.

1.2.1. Scurt istoric privind evoluŃia statisticii în România

Despre un început de organizare statistică în Ńările româneşti nu poate fi vorba decât din
secolul al. XVIII-lea încoace. Prima scriere sau recensământ al locuitorilor pare să fi fost făcută de
Constantin Mavrocordat, cu ocazia reformelor sale în Muntenia şi Moldova. Regulamentul organic
(1831) introduce catagrafia sau recensământul sistematic şi periodic. Din 7 în 7 ani trebuia să se facă
categrafia populaŃiei, după norme bine stabilite, pentru a servi la „aşezarea birului şi la hotărârea
veniturilor Ńării”.
La 28 aprilie 1859, domnitorul Al. I. Cuza aprobă înfiinŃarea unui birou de statistică în łara
Românească, numind şef pe Dionisie Pop MarŃian, iar la 1 iulie 1859 aprobă înfiinŃarea DirecŃiei de
Statistică din Moldova, sub conducerea lui Ion Ionescu de la Brad.
La 4 august 1862 cele două organe de statistică se reunesc sub denumirea Oficiului Statistic
pentru Principatele Unite sub conducerea lui Dionisie Pop MarŃian.
Gândirea statistică românească s-a aliniat în contextul amplu al curentelor statistice existente în
Europa. ReprezentanŃii statisticii româneşti au păstrat un contact permanent cu preocupările statistice
din Ńările Europei, aducându-şi contribuŃii de seamă atât la promovarea statisticii teoretică şi practice,
cât şi al organizării ei instituŃionale. Cei mai de seamă reprezentaŃi ai statisticii româneşti din acea
perioadă au fost Ion Ionescu de la Brad şi Dionisie Pop MarŃian. Primul şi-a prezentat punctul de
vedere despre statistică în lucrarea întitulată „PovăŃuri pentru catagrafia Moldovei” (1859). Statistica,
în viziunea lui I. I. de la Brad trebuie să cuprindă două părŃi: o primă parte care să presupună culegerea
datelor de observare, iar a doua parte să implice aparatul matematic. Se regăseşte în aceste abordări
metodologice, în linii mari, însuşi demersul statistic modern, format din două etape: una descriptivă,
alta inductivă, inferenŃială..
În concepŃia lui D. P. MarŃian statistica trebuie să studieze fenomenele naturale şi sociale,
având drept scop descoperirea legilor care le guvernează. Se evidenŃiază apartenenŃa sa la curentul de
largă circulaŃie conform căruia obiectul de cercetare al statisticii trebuie să depăşească graniŃele sferei
fenomenelor sociale.
În spiritul statisticii descriptive europene şi la noi în Ńară s-au scris lucrări statistice, statistica
figurând ca obiect de studiu în învăŃământul românesc. Un curs de statistică a fost introdus în 1856 la
Facultatea Juridică de la Academia Mihăileană din Iaşi de către Al. Papiu Ilarian, care avea drept
obiect descrierea statelor componente ale Europei sub aspect economic şi social.
În 1860 apar Analele Statistice pentru cunoaşterea României, în care se publică lunar date
privind statistica agricolă, statistica vămilor, a mişcării populaŃiei precum şi studii cu caracter
economic.
În 1918 este creat Institutul Social Român, formă instituŃionalizată de cercetare sociologică.
Rezultatele au fost publicate sistematic în „Arhivele pentru ştiinŃă şi reformă socială”, apărând primele
cercetări statistice sub formă de monografii. [ Bogdan, V., 1995].
Un recensământ general al populaŃiei, clădirilor, întreprinderilor industriale şi comerciale are
loc în 1930. Debutul Anchetei Bugetelor de Familie are loc în 1950, care va deveni cercetare
permanentă între 1950-1994.
În 1964 are loc o reuniune ştiinŃifică cu tema „Anchetele selective”, când pentru prima dată în
România sunt formulate principiile proiectării şi utilizării unui eşantion „maître”.
Între 1972-1989 are loc o întrerupere dureroasă a aplicării sondajelor în studierea fenomenelor
economice datorită sistemului politic din acea vreme.
În prezent se organizează o multitudine de anchete, toate funcŃionând pe principiile eşantionării
aleatoare.
Cu atât mai mult astăzi, când viaŃa socială şi cea economică este stăpânită de fenomene şi
procese dintre cele mai complexe, statistica vine în sprijinul cercetătorului pentru a face lumină.
Descoperirea interdependenŃelor dintre diverse caracteristici care se întâlnesc în abordări de natură
social-economică constituie premiza consolidării poziŃiei omului în raport cu lumea înconjurătoare.
Statistica, prin multitudinea de metode şi procedee pe care le pune la dispoziŃia cercetătorului,
permite o abordare ştiinŃifică a diverselor probleme care ne stau în faŃă. Nu ar fi posibile incursiunile
în viitor, prin elaborarea de previziuni şi strategii de dezvoltare, fără aportul statisticii. Aceasta ne
îndreptăŃeşte, pe bună dreptate, să-i acordăm atenŃia cuvenită şi în studiul economiei.

1.3. Concepte de bază

1.3.1. PopulaŃia statistică

PopulaŃia statistică reprezintă mulŃimea elementelor simple sau complexe, de aceeaşi natură,
care au una sau mai multe însuşiri esenŃiale comune, proprii elementelor cât şi populaŃiei privită ca un
tot unitar. [Florea I.,1998]
O populaŃie este finită dacă include un număr determinat de elemente, dar ea poate fi
considerată drept reprezentativă a unei populaŃii teoretice infinite. Ca urmare apare necesitatea de a
delimita o populaŃie în: conŃinut, spaŃiu şi timp. Se mai denumeşte şi populaŃia univers.
Exemple de populaŃii statistice: mulŃimea persoanelor dintr-o anumită Ńară (localitate, zonă
etc.) în anul t, mulŃimea gospodăriilor din România, la momentul t, mulŃimea consumatorilor unui
produs, mulŃimea societăŃilor producătoare sau concurente ale unui produs, mulŃimea societăŃilor
distribuitoare, angajaŃii unei societăŃi etc.
Se notează cu majusculele de la începutul alfabetului: A, B, C etc.
Unitatea statistică constituie elementul component, al populaŃiei statistice, asupra căruia se va
efectua nemijlocit observarea.
Unitatea statistică este purtătorul originar de informaŃie sau subiectul logic al informaŃiei
statistice. Datorită varietăŃii aspectelor sub care se poate prezenta în fapt, unitatea statistică comportă o
definiŃie precisă, care să excludă prin posibilitate de interpretare diferită de către observatori şi astfel
orice eroare ce poate prejudicia valoarea investigaŃiei.
În exemplele citate mai sus, unităŃile statistice sunt: persoana, gospodăria, consumatorul,
societatea producătoare sau concurentă, societatea distribuitoare, angajatul etc.
Se notează cu minusculele corespunzătoare majusculei ce simbolizează populaŃia statistică,
respectiv ai, b i etc..
Volumul populaŃiei reprezintă numărul unităŃilor statistice care alcătuiesc populaŃia statistică.
Acesta poate fi finit sau infinit, în funcŃie de tipul populaŃiei care poate fi la fel finită sau infinită.
Se notează cu N, iar pentru o populaŃie A, avem:
A : {a1, a2, ..., aN}
Eşantion reprezintă o submulŃime a unei populaŃii statistice, constituită după criterii bine
stabilite. În raport cu procedeul de formare a eşantionului avem eşantioane aleatoare şi eşantioane
dirijate.
Eşantionul aleator este format din unităŃile statistice care rezultă printr-un procedeu aleator:
procedeul tragerii la sorŃi, tabelul cu numere întâmplătoare, procedeul extragerilor sistematice.
Eşantionul dirijat este constituit pe baza unor informaŃii auxiliare existente la nivelul populaŃiei
studiate sau lăsând liber pe anchetator să aleagă unităŃile respectând doar realizarea structurii
eşantionului în funcŃie de criteriile stabilite.
Se notează cu n.
Majoritatea studiilor au ca suport datele provenite de la nivel de eşantion, de aici importanŃa
constituirii acestuia şi implicit, apelarea la inferenŃa statistică, pentru a estima parametrii la nivelul
populaŃiei univers.

1.3.2. Variabila statistică

Variabila statistică reprezintă o însuşire sau o trăsătură comună tuturor unităŃilor unei populaŃii.
Nivelul înregistrat de o variabilă statistică la o unitate oarecare al populaŃiei se numeşte realizare sau
starea variabile. [Florea I., 1998].
În general se notează cu majusculele de la sfârşitul alfabetului, X, Y, Z etc. Dacă se notează cu
X o variabilă statistică oarecare, atunci cu x1, x2, ..., xN se vor nota stările variabilei respective.
Variabilele statistice se clasifică în raport cu natura, modul de exprimare şi modul de variaŃie.
a) După natura lor variabilele statistice pot fi atributive, de timp şi de spaŃiu.
• Variabila atributivă exprimă un atribut sau însuşire esenŃială (alta, decât timpul sau
spaŃiul) unităŃilor populaŃiei;
• Variabila de timp ne arată timpul în care au luat fiinŃă unităŃile populaŃiei sau perioada de
timp în care au existat (exista);
• Variabila de spaŃiu ne arată spaŃiul în care există sau au luat naştere unităŃile populaŃiei.

b) După modul de exprimare a stărilor deosebim:


• Variabilă cantitativă este variabila ale cărei stări se exprimă prin valori numerice. Se mai
numeşte şi variabilă metrică.
• Variabilă calitativă este variabila ale cărei stări se exprimă prin cuvinte sau coduri. Se
mai numeşte variabilă nominală (stările se exprimă prin cuvinte) sau variabilă ordinală
(stările se exprimă prin coduri).
c) după modul de variaŃie variabila cantitativă poate fi:
• Variabilă discretă este acea variabilă care, în intervalul său de definiŃie înregistrează cel
mult valori raŃionale, variaŃia are loc în salturi.
• Variabilă continuă este acea variabilă care poate lua orice valoare reală din intervalul său
de variaŃie.
Exemple de variabile statistice relativ la populaŃia formată din mulŃimea consumatorilor unui produs:
- vârsta: variabilă atributivă, cantitativă, continuă
X = { x1 = [15-20) [20-30) ... }
- frecvenŃa de cumpărare: variabilă atributivă calitativă
Y = { y1 - foarte rar; y2 – rar, ... }
- număr de sortimente cumpărate relativ la produsul analizat: variabilă atributivă, cantitativă,
discretă:
Z = { z1 = 1; z2 = 2, ... }
- localizarea magazinelor de unde cumpără: variabilă de spaŃiu, calitativă
S = { s1 – cartierul M sau s2 – strada P1, ... }
- data ultimei cumpărări a produsului analizat: variabilă de timp, cantitativă
T = { t1 = 27.01.2002; t2 = 24.02.2002, ... }

Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulŃimi finite
sau infinite, cu o anumită probabilitate, rezultată dintr-o funcŃie asociată variabilei, numită lege de
probabilitate.
Ca şi variabila statistică, variabila aleatoare în raport cu valorile sale poate fi discretă sau
continuă.
În timp ce o variabilă aleatoare înregistrează valori la întâmplare, variabila statistică constituie
o însuşire certă a unităŃilor statistice din populaŃie. Valorile unei variabile aleatoare sunt probabile şi în
strânsă legătură cu un anumit experiment. Stările unei variabile statistice nu sunt probabile, ele
cuantifică o trăsătură proprie fiecărei unităŃi din populaŃie.

1.3.3. Observarea statistică

Observarea statistică constă în identificarea unităŃilor populaŃiei şi înregistrarea stărilor


variabilelor în raport cu care este studiată. Ansamblul stărilor variabilelor rezultate prin observare se
numesc statistici.
După gradul de cuprindere a populaŃiei statistice, observarea statistică este de două feluri:
totală şi parŃială.
Observarea totală este acel tip de observare statistică în care are loc înregistrarea tuturor
unităŃilor care fac parte din populaŃie statistică supusă studiului. Recensământul populaŃiei României
este un exemplu de observare totală.
Observarea parŃială presupune observarea şi înregistrarea unui anumit număr de unităŃi din
populaŃie, alese după criterii bine definite.
În cercetarea statistică a unei populaŃii punctul de pornire îl poate constitui fie statistice exhaustive
rezultate prin observarea populaŃiei univers , fie statisticile rezultate din observarea parŃială a unui
eşantion  ⊆ A, în ambele cazuri scopul final fiind acelaşi – obŃinerea de informaŃii la nivelul
populaŃiei univers A.

1.3.4. Seria statistică

Seria statistică este o construcŃie care redă fie distribuŃia unei populaŃii în raport cu una sau mai
multe variabile, fie variaŃia unei mărimi în timp, în spaŃiu sau de la o categorie la alta.
Seriile statistice se clasifică în raport cu mai multe criterii, astfel:
1. În raport cu numărul variabilelor
• Serii statistice unidimensionale, au la bază o singură variabilă;
• Serii statistice multidimensionale, care au la bază două sau mai multe variabile.
2. După natura variabilelor deosebim:
• Serii atributive, care au la bază variabile atributive;
• Serii cronologice (de timp sau istorice), care au la bază variabile de timp;
• Serii de spaŃiu sau teritoriale, care au la bază o variabilă de spaŃiu.
3. După modul de exprimare a stărilor variabilei deosebim:
• Serii calitative, care au la bază variabile calitative;
• Serii cantitative, care au la bază variabile cantitative şi care după modul de variaŃie a
variabilei pot fi: discrete (când variabila este discretă) şi continue (când variabila este
continuă).
4. În raport cu natura indicatorului din care este alcătuită seria, avem:
• Serii de frecvenŃă sau serii de distribuŃie (repartiŃie);
• Serii de variaŃie.
Seria statistică redând distribuŃia populaŃiei în raport cu una sau mai multe variabile constituie
o descompunere a acesteia într-un număr R de clase. O astfel de serie este formată în exclusivitate din
frecvenŃe (absolute cumulate sau necumulate, relative cumulate sau necumulate) şi de aceea se numesc
serie de frecvenŃă, de distribuŃie sau de repartiŃie. Prescurtat se mai foloseşte şi denumirea de
repartiŃie statistică sau distribuŃie statistică.
Seria statistică ce redă variaŃia unei mărimi în timp, în spaŃiu sau de la o categorie la alta se
numeşte serie de variaŃie.

1.3.4.1. Seria statistică de repartiŃie

Conform definiŃiei de mai sus, prin această serie se distribuie unităŃile unei populaŃii statistice
în raport cu una sau mai multe variabile.
Fie o serie statistică unidimensională având la bază variabila X, respectiv:
x x 2 ... xi ... x R 
X :  1  (1.1)
 N 1 N 2 ... N i ... N R 
Ni este frecven Ńa absolută a clasei i, i = 1, R şi reprezintă numărul de unităŃ i ale populaŃiei din clasa
pentru care variabila X a înregistrat valoarea Xi ,
N1 + N2 + ... + NR = N.

Clasa (grupa) de unităŃi în raport cu o variabilă reuneşte acele unităŃi din cadrul populaŃiei care
înregistrează aceeaşi stare a variabilei sau stările variabilei aparŃinând unui anumit interval de variaŃ ie.
Ca urmare, în raport cu o variabilă statistică populaŃia poate fi structurată într-un anumit număr
de clase.
Exemplu
Fie A – populaŃia statistică reprezentând unităŃile de cazare turistică din România, în anul 1999
şi X – categoria de confort (este o variabilă statistică atributivă, cantitativă discretă). Distribu Ńia
acestor unităŃi în raport cu variabila X este următoarea (conform A.S. al României, 2000):
 0 1 2 3 4 5
X :  
 666 1108 1090 290 91 5 
- 0 – neclasificate;
- 1090 – ne arată numărul unităŃilor de cazare turistice având categoria de „2 stele”;
De asemenea, relativ la seria statistică unidimensională având la bază variabila X, poate fi
formată cu frecvenŃe relative, frecvenŃe cumulate absolute sau relative.
Fie seria X formată cu frecvenŃe relative:
 x x 2 ... xi ... x R 
X :  1  (1.2.)
 f 1 f 2 ... f i ... f R 

- fi - ne arată ponderea unităŃilor din populaŃie care au înregistrat pentru variabila X starea
xi:
N
fi = i i = 1, R
N
sau
Ni R
fi =
N
.100 i = 1, R ∑f
i =1
i =1 (100 %)

Exemplu:
 0 1 2 3 4 5 
X :  
 0,205 0,341 0,3355 0,089 0,028 0,0015
sau
 0 1 2 3 4 5 
X :  
 20,5% 34,1% 33,55% 8,9% 2,8% 0,15% 

33,55% reprezintă ponderea unităŃilor de cazare turistică având categoria de „2 stele”.


Pornind de la seria (1.1) se poate deduce seria formată cu frecvenŃe absolute cumulate,
respectiv:

 x x2 ... xi ... xR 
X: 1  (1.3)
 N(x1 ) N(x 2 ) ... N(x i ) ... N(x R )

unde: N(xi) reprezintă numărul de unităŃi din populaŃia studiată pentru care variabila înregistrează
valori ce nu depăşesc valoarea xi.

N(x1) = N1
N(x2) = N1 + N2
.........................
N(xi) = N1 + N2 + ... + Ni
.........................
N(xR) = N1 + N2 + ... + NR = N

Exemplu.

 0 1 2 3 4 5 
X :  
 666 1774 2864 3154 3245 3250

2864 - ne arată numărul unităŃilor de cazare turistică având cel mult două stele.

Pornind de la seria (1.1) sau (1.2) se poate deduce seria formată cu frecvenŃe relative
cumulate, respectiv:

 x1 x2 ... xi ... xR 
X :   (1.4)
 FN ( x1 ) FN ( x 2 ) ... FN ( xi ) ... FN ( x R ) 

unde: FN(xi) - exprimă ponderea unităŃii populaŃiei studiate pentru care variabila a înregistrat valori ce
nu depăşesc valoarea x i.

FN(xi) = f1 + f2 + ... + fi
sau
N ( xi )
FN ( x i ) = (.100) i = 1, R
N
Exemplu:
 0 1 2 3 4 5 
X :  
 20,5% 54,6% 88,15% 97,05% 99,85% 100% 

88,15 % - reprezintă ponderea unităŃilor de cazare turistice având cel mult „2 stele”.

Aşa cum se poate constata din definiŃia celor două mărimi de frecvenŃe cumulate, acestea se
pot calcula şi are sens elaborarea unor serii statistice doar în cazul în care la baza seriei se găseşte o
variabilă cantitativă.
Relativ la aceeaşi populaŃie statistică studiată A – mulŃime unităŃilor de cazare turistică din
România în anul 1999, din A.S. al României /2000, se pot extrage alte serii statistice de repartiŃie, ca
de exemplu:
- distribuŃia unităŃilor de cazare în raport cu forma de proprietate (cf. A.S. al României/2000, pg.518).

 majoritar de stat majoritar privat 


Y :  
 1290 1960 

Aceasta este o serie statistică de repartiŃie unidimensională având la bază o variabilă atributivă,
calitativă şi formată cu frecvenŃe absolute. În această situaŃie se poate elabora seria statistică formată
cu frecvenŃe relative, respectiv:

 majoritar de stat majoritar privat 


Y :  
 39,69% 60,31% 

- distribuŃia unităŃilor de cazare în raport cu tipul destinaŃiei turistice (cf. A.S. al României/2000,
pag.519)

 orase resedinta 
 Delta de judet alte 
litoral balnear montan
Z : Dunarii inclusiv localitati 
 Bucuresti 
 
 729 435 691 69 418 908 

Este o serie statistică de repartiŃie unidimensională având la bază o variabilă atributivă


calitativă şi formată cu frecvenŃe absolute. Se poate elabora seria formată cu frecvenŃe relative. De
asemenea, se pot elabora serii de repartiŃie unidimensionale în raport cu numărul de turişti cazaŃi, cu
gradul de utilizare a capacităŃii în funcŃiune, capacitatea existentă etc.
Seria statistică de repartiŃie bidimensională este o construcŃie ce redă distribuŃia unei populaŃii
în raport cu două variabile.
Astfel, fie populaŃia statistică A studiată în raport cu variabilele X şi Y, rezultatele observării se
pot grupa într-un tabel de forma următoare:
X x1 x2 ... xj ... xJ Total
Y
y1 N11 N12 ... N1j ... N1J N1.
y2 N21 N22 ... N2j ... N2J N2.
. - - - - - - -
.
yi Ni1 N i2 ... Nij ... NiJ Ni.
(1.5)
. - - - - - - -
.
yI NI1 NI2 ... NIj ... NIJ NI.

Total N.1 N.2 ... N.j ... N.J N

- Nij - reprezintă numărul de unităŃi pentru care, variabila X înregistrează starea xj şi variabila Y
înregistrează starea yi ;
- Ni. - numărul de unităŃi pentru care Y = yi, indiferent de nivelul înregistrat de variabila X;
- N.j - numărul de unităŃi pentru care X = xj, indiferent de nivelul înregistrat de variabila Y;
- N - numărul total de unităŃi analizate.

Din seria bidimensională se pot extrage serii unidimensionale de forma următoare:


 x1 x 2 ... x j ... x J 
X :  

 N . 1 N . 2 ... N . j ... N . J 

 y y2 ... y i ... y I 
Y :  1 
 N 1. N 2. ... N i. ... N I . 

denumite şi serii de repartiŃie marginale, în raport cu X şi Y

 y1 y2 ... y i ... y I 
Y / X = x j :   ∀j = 1, J
 N1 j N2 j ... N ij ... N Ij 

denumită serie de repartiŃie unidimensională în raport cu Y condiŃionată de


X = xj, numărul acestora fiind egal cu numărul de stări a variabilei X.

 x1 x2 ... xj ... xJ 
X / Y = y i :   ∀i = 1, I
 N i1 N i .2 ... N ij ... N iJ 

denumită serie de repartiŃie unidimensională în raport cu X condiŃionată de


Y = yi, numărul acestora fiind egal cu numărul de stări a variabilei Y.

De asemenea se poate elabora sau deduce seria de repartiŃie bidimensională formată cu frecvenŃe
relative, respectiv:
X x1 ... xj ... xJ Total
Y
Y1 f11 ... f1j ... f1J f1.
. - - - - - -
.
yi fi1 ... fij ... fiJ fi. (1.6)
. - - - - - -
.
yI fI1 ... fIj ... fIJ fI.
Total f.1 ... f.j ... f.J 1

N ij N i. N. j
f ij = f i. = f. j = i = 1, I j = 1, J
N N N

Exemple:
Relativ la populaŃia statistică A studiată, din A. S. al României/2000, se poate extrage o serie de
repartiŃie bidimensională, având la bază variabilele:
X - categoria de confort (număr de stele)
Y – tipul unităŃii de cazare turistică
de forma următoare:

X 0 1 2 3 4 5 Total
Y (neclasificate)
Hoteluri 57 259 388 91 14 2 811
Moteluri 12 50 53 5 - - 120
Hanuri turistice 22 - - - - - 22
Cabane turistice 83 59 19 4 - - 165
Campinguri 56 69 15 2 - - 142
Vile turistice şi bungalouri 257 482 212 122 69 3 1145
Tabere şcolare 176 - - - - - 176
Pensiuni turistice 3 77 191 44 7 - 322
Sate de vacanŃă - - 1 - - - 1
Pensiuni agroturistice - 110 210 21 - - 341
SpaŃii de cazare pe - 2 1 1 1 - 5
nave
Total 666 1108 1090 290 91 5 3250
Sursa: A.S. al României/2000, pag.515

21 - ne arată numărul de pensiuni agroturistice având categoria de confort de 3 stele.


Tabelul de mai sus este o repartiŃie statistică bidimensională având la bază o variabilă X
atributivă cantitativă discretă şi o variabilă Y atributivă calitativă, formată cu frecvenŃe absolute.
Se poate deduce seria de repartiŃie bidimensională formată cu frecvenŃe relative, respectiv:

X 0 1 2 3 4 5 Total
Y
Hoteluri 0,018 0,08 0,119 0,028 0,004 0,0006 0,25
Moteluri 0,004 0,015 0,016 0,002 - - 0,037
Hanuri turistice 0,007 - - - - - 0,007
Cabane turistice 0,026 0,018 0,006 0,001 - - 0,051
Campinguri 0,017 0,021 0,005 0,0006 - - 0,044
Vile turistice şi 0,079 0,148 0,065 0,038 0,021 0,0009 0,352
bungalouri
Tabere şcolare 0,054 - - - - - 0,054
Pensiuni 0,0009 0,024 0,059 0,014 0,002 - 0,099
turistice
Sate de vacanŃă - - 0,0003 - - - 0,0003
Pensiuni - 0,034 0,065 0,006 - - 0,105
agroturistice
SpaŃii de cazare - 0,0006 0,0003 0,0003 0,0003 - 0,002
pe nave
Total 0,205 0,341 0,335 0,089 0,028 0,002 1

0,6% - reprezintă ponderea pensiunilor agroturistice având categoria de confort de „3 stele”, din totalul
unităŃ ilor de cazare turistică.
De asemenea se pot extrage seriile unidimensionale marginale în raport cu X şi Y şi cele
condiŃionate, de exemplu:

 0 1 2 3 4 5
X :  
 666 1108 1090 290 91 5 

 y y 2 y3 y 4 y5 y6 y7 y8 y9 y10 y11 
Y :  1 
 811 120 22 165 142 1145 176 322 1 341 5 

0 1 2 3 4 5
X / Y = pensiuni tustice :  
 3 77 191 44 7 − 

 y y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 
Y / X = 3 :  1 
 91 5 − 4 2 122 − 44 − 21 1 

1.3.4.2. Seria statistică de variaŃie

Conform definiŃiei seria de variaŃie redă variaŃia unei mărimi, în timp, în spaŃiu sau de la o
categorie la alta. Ca urmare, în continuare vom vorbi de serii cronologice (au la bază o variabilă de
timp), serii de spaŃiu şi serii categoriale (au la bază variabile atributive). Cele mai des întâlnite sunt
seriile cronologice şi seriile de spaŃiu.
Seriile de variaŃie au la bază mărimi absolute şi relative. După unii autori din cadrul mărimilor
absolute fac parte indicatorul de nivel şi diferenŃa absolută a unei mărimi, iar din cadrul mărimilor
relative fac parte: indicatorul relativ de intensitate, indicele statistic şi diferenŃa relativă a unei mărimi.
Indicatorul de nivel (Y) este o mărime ce reflectă nivelul unui fenomen analizat. De exemplu:
producŃia diferitelor produse, veniturile populaŃiei, suprafaŃa cultivată cu principalele culturi,
transportul, exportul, importul etc.
DiferenŃa absolută a unei mărimi ( ∆ Y ) exprimă diferenŃa dintre nivelul cercetat şi nivelul
bază de comparaŃie al mărimii analizate. Se exprimă în aceeaşi unitate de măsură în care este
cuantificat fenomenul analizat şi ne arată cu cât s-a modificat acesta de la un nivel la altul.
Indicele statistic al unei mărimi ( I Y ) exprimă raportul dintre nivelul cercetat şi nivelul bază de
comparaŃie al mărimii analizate. Ne arată de câte ori se modifică acea mărime, de la un nivel la altul.
DiferenŃa relativă a unei mărimi ( RY ) exprimă raportul dintre diferenŃa absolută a mărimii
respective şi nivelul bază de comparaŃie al acesteia. Ne arată cu cât la sută se modifică mărimea de la
un nivel la altul.
Indicatorul relativ de intensitate (d) se defineşte ca raport între doi indicatori de nivel de
natură diferită şi arată gradul de răspândire a fenomenului cuantificat de indicatorul de la numărător în
raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producŃia diferitelor culturi
/ ha, densitatea populaŃiei, producŃia principalelor produse / locuitor, rata şomajului etc.
Greutatea specifică (g) reflectă structura fenomenului analizat în raport cu stările variabile X,
de la baza seriei.

Seriile cronologice
Seria cronologică reflectă evoluŃia în timp a unei mărimi.
Valorile variabilei ca funcŃie de timp pot fi fixate la un anumit moment de timp sau să se refere
la un interval de timp.
Seria cronologică de momente este o serie de observaŃii ordonate în timp, exprimând stocuri
[Trebici V., 1985]. De exemplu, volumul populaŃiei, număr de universităŃi, bănci, instituŃii, fonduri
fixe, numărul salariaŃilor, întreprinderile mici şi mijlocii din diferite domenii de activitate, unităŃile de
cazare turistică etc.Într-o astfel de serie însumarea mărimii analizate nu are sens din punct de vedere al
conŃinutului, aceasta fiind permisă din considerente de calcul, ajustări etc.
Seria cronologică de intervale este o serie de observaŃii ordonate în timp exprimând fluxuri. De
exemplu: născuŃii vii, divorŃurile, decesele, producŃia diferitelor culturi sau produse, venituri,
cheltuieli, producŃia industrială, agricolă, exportul, importul etc.Într-o astfel de serie are sens
însumarea mărimii analizate.
Fie o serie cronologică de momente sau de intervale ce reflectă evoluŃia în timp a nivelului unei
mărimi Y,
 0 1 2 ... t ... T 
Y :   (1.7)
 y 0 y1 y 2 ... yt ... yT 
Pornind de la această serie se pot deduce seriile formate cu diferenŃe absolute, indici şi
diferenŃe relative. În funcŃie de modul de raportare a stărilor variabilei timp t, mărimile de mai sus se
pot calcula cu bază fixă (t/t0) (baza de comparaŃie rămâne aceeaşi) sau cu bază în lanŃ (t/t-1) (baza de
comparaŃie se schimbă, fiind considerată cea precedentă nivelului comparat).
Fie seriile cronologice formate cu:
- diferenŃe absolute cu bază fixă:
0 1 2 ... t ... T 
∆ty/ t0 :   (1.8)
1/ 0
0 ∆ y ∆ y
2/0
... ∆ y ... ∆Ty/ 0 
t/0

∆t y/ 0 = y (t ) − y (0)

- diferenŃe absolute cu bază în lanŃ

0 1 2 ... t ... T 
∆ty/ t −1 :  1/ 0 2 /1 t / t −1 T / T −1

 (1.9)
− ∆ y ∆y ... ∆ y ... ∆ y 

∆t y/ t −1 = y (t ) − y (t − 1)
Între cele două tipuri de diferenŃe absolute cu baza fixă şi cu bază în lanŃ, există relaŃii de
legătură ce ne permit exprimarea unora în funcŃie de celelalte. În acest context, însumând diferenŃele
absolute cu baza în lanŃ se obŃin diferenŃele absolute cu baza fixă.

∆t y/ 0 = ∆1y/ 0 + ∆2y/ 1 + ∆3y/ 2 + ... + ∆t y/ t −1

Scăzând diferenŃele succesive cu bază fixă se obŃin diferenŃele cu bază în lanŃ.

∆t y/ 0 − ∆t y−1 / 0 = y(t ) − y( 0) − y (t − 1) + y (0) = y (t ) − y(t − 1) = ∆t y/ t −1

DiferenŃa absolută ne arată cu cât se modifică mărimea analizată de la un moment la altul. Se


exprimă în aceeaşi unitate de măsură în care este cuantificat fenomenul studiat. Dacă fenomenul
analizat se exprimă valoric, atunci diferenŃa absolută nu reflectă prea bine modificările ce intervin,
impunându-se utilizarea mărimilor relative respective, indicele statistic şi diferenŃa relativă.

Fie seriile cronologice formate cu:


- indici statistici cu bază fixă

0 1 2 ... t ... T 
I ty / t0 :   (1.10)
1/ 0
1 I y I 2/0
y ... I yt / 0 ... I Ty / 0 

y (t )
I yt / 0 = (×100%)
y (0 )

- indici statistici cu bază în lanŃ

0 1 2 ... t ... T 
I yt / t −1 :  1/ 0 2 /1 t / t −1 T / T −1

 (1.11)
− Iy I y ... I y ... I y 

y (t )
I yt / t −1 = (×100%)
y (t − 1)

Între cele două tipuri de indici există următoarele relaŃii de legătură:


• Făcând produsul indicilor cu bază în lanŃ până la o anumită stare a variabilei t, se obŃine
indicele cu bază fixă al clasei respective.
y(1) y (2) y (t ) y (t )
I 1y / 0 .I y2 / 1 . ... .I yt / t −1 = . . ... . = = I yt / 01
y(0) y (1) y (t − 1) y(0)
• ÎmpărŃind doi indici succesivi cu bază fixă se obŃine un indice cu bază în lanŃ:
y(t ) y(t − 1) y (t )
I ty / 0 : I yt −1 / 0 = : = = I yt / t −1
y(0) y (0) y (t − 1)
Indicele statistic ne arată de câte ori se modifică fenomenul analizat. Este mărimea cel mai des
folosită în caracterizarea evoluŃiei fenomenelor din economie.
Având ca bază de referinŃă o serie cronologică de forma (1.7) se pot elabora serii formate cu:
- diferenŃe relative cu bază fixă

0 1 2 ... t ... T 
R yt / t0 :   (1.12)
1/ 0
 0 Ry R 2/0
y ... R t /0
y ... R Ty / 0 
t /0
∆t y/ 0 y (t ) − y(0) y (t )
R y = = = − 1 = I ty / 0 − 1
y (0) y(0) y(0)

sau
R ty / 0 = I yt / 0 /1 × 100% − 100 %

- diferenŃe relative cu bază în lanŃ

0 1 2 ... t ... T 
R yt / t −1 :  1/ 0 2 /1 t / t −1 T / T −1

 (1.13)
 − Ry R y ... R y ... R y 

t / t −1
∆ty/ t −1
R y = = I ty / t −1 − 1
y(t − 1)
sau
R ty / t −1 = I yt / t −1 ×100% − 100%

DiferenŃa relativă ne arată cu cât la sută se modifică fenomenul de la un moment la altul.


Această mărime la fel ca şi indicele statistice, se foloseşte frecvent în caracterizarea fenomenelor din
economie.
Dacă seria cronologică analizată, de forma (1.7) este de intervale, se poate deduce seria
formată cu greutatea specifică:

 0 1 2 ... t ... T 
g y :   (1.14)
 g0 g1 g2 ... g t ... g T 

y (t )
g (t ) = T

∑ y (t )
t =1

Exemple:

1. Fie seria cronologică de intervale ce reflectă numărul de absolvenŃi de învăŃământ superior din
România în perioada (89/90 – 96/97), astfel:

 89 / 90(0) 90 / 91(1) 91/ 92(2) 92 / 93(3) 93 / 94(4) 94 / 95(5) 95 / 96(6) 96 / 97(7) 


Y :  
 28113 25927 29901 33366 34240 47837 57360 80991 
conform A.S. al României/1998

Analiza evoluŃiei acestui fenomen se realizează cu ajutorul diferenŃelor absolute, a indicilor,


diferenŃelor relative şi greutăŃii specifice.

Avem:
0 1 2 3 4 5 6 7 
∆ty/ t0 :  
 0 − 2186 1788 5253 6127 19724 29947 52878

5253 – ne arată cu cât au fost mai mulŃi absolvenŃi în anul universitar 92/93 faŃă de anul universitar
89/90.
0 1 2 3 4 5 6 7 
∆ty/ t −1 :  
 − − 2186 3974 3465 874 13597 9523 23631

3465 – ne arată cu cât au fost mai mulŃi absolvenŃi în anul universitar 92/93 faŃă de anul universitar
91/92.

0 1 2 3 4 5 6 7 
I yt / t0 :  
 1 0,922 1,064 1,187 1,218 1,702 2,04 2,88 

1,187 – ne arată de câte ori a crescut numărul de absolvenŃi de învăŃământ superior din anul 92/93 faŃă
de anul 89/90.

0 1 2 3 4 5 6 7 
I yt / t −1 :  
 − 0,922 1,153 1,116 1,026 1,397 1,199 1,412 

1,116 – ne arată de câte ori a crescut numărul de absolvenŃi de învăŃământ superior din anul 92/93 faŃă
de anul 91/92.

0 1 2 3 4 5 6 7 
R ty / t0 :  
 0 − 7,78% 6,4% 18,7% 21,8% 70,2% 104% 188% 

18,7% - ne arată cu cât la sută a crescut numărul de absolvenŃi de învăŃământ superior în anul 92/93
faŃă de anul 89/90.

0 1 2 3 4 5 6 7 
R ty / t −1 :  
 − − 7,78% 15,3% 11,6% 2,6% 39,7% 19,9% 41,2% 

11,6 % - ne arată cu cât la sută a crescut numărul de absolvenŃ i de învăŃământ superior în anul 92/93
faŃă de anul 91/92.

 0 1 2 3 4 5 6 7 
g y :  
 8,32% 7,68% 8,85% 9,88% 10,14% 14,16% 16,98% 23,98% 
9,88 – ne arată ponderea absolvenŃilor din anul universitar 92/93 din totalul absolvenŃilor perioadei
89/90 – 96/97.

2. Considerăm seria cronologică ce reflectă variaŃia numărului de studenŃi /10.000 locuitori (cf.
A.S. al României/2000, pg. 203).

 94 / 95 95 / 96 96 / 97 97 / 98 98 / 99 99 / 2000 
X :  
 112 148 157 160 181 202 

Aceasta este o serie cronologică de moment având la bază indicatorul relativ de intensitate. În mod
asemănător cu exemplul precedent se pot deduce seriile formate cu: ∆ X , I X , R X , cu bază fixă şi cu
bază în lanŃ.
Alte exemple de serii cronologice având la bază indicatorul relativ de intensitate:
- rata şomajului:
1995 1996 1997 1998 1999 
X 1 :  
 8,0 6,7 6,0 6,3 6,8 

- producŃia de grâu şi secară la hectar


 1994 1995 1996 1997 1998 1999 
X 2 :  
 2535 3082 1760 2964 2561 2776 

- rata generală de fertilitate:


1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 
X :  
 66,3 56,2 48,7 46,6 44,3 43,3 41,1 39,9 40,6 40,6 

Seria statistică de spaŃiu (teritorială)

Seria statistică de spaŃiu este o construcŃie statistică ce reflectă variaŃia în spaŃiu a unei mărimi.
Seria de spaŃiu prezintă o importanŃă din ce în ce mai mare, datorită dezvoltării sistemului
informaŃional, a necesităŃii comparaŃiilor internaŃionale şi a comparaŃiilor între regiunile unei Ńări.
În cadrul Anuarului Statistic al României există capitole distincte de „Statistică teritorială” şi
„Statistică internaŃională”. În capitolul de „Statistică teritorială” sunt cuprinse informaŃii privind:
populaŃia, forŃa de muncă, condiŃii de muncă, veniturile populaŃiei, cheltuielile şi consumul populaŃiei,
locuinŃe, asistenŃă socială, sănătate, învăŃământ, cultură, sport, conturi naŃionale, rezultate şi
performanŃe ale întreprinderilor, agricultură, silvicultură, industrie, transporturi, po ştă, telecomunicaŃii,
turism, finanŃe, justiŃie şi starea infracŃională, pe cele 7 regiuni şi Bucureşti.
La baza seriei de spaŃiu se găsesc atât mărimi absolute (indicator de nivel, diferenŃa absolută),
cât şi mărimi relative (indicator relativ de intensitate, indicele statistic, diferenŃa relativă).

Fie seria statistică Z, de forma următoare:

 s s1 s 2 ... s i ... s R 
Z :  0  (1.15)
 Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R) 
unde:
si – este o stare a variabilei ce exprimă spaŃiul, i = 1, R ;
Z(i) – exprimă o mărime (indicator de nivel sau relativ de intensitate).

Plecând de la seria de forma (1.15) se pot deduce seriile formate cu:


- diferenŃe absolute cu bază fixă:
s s1 s2 ... si ... sR 
∆sZ/ s0 :  0 s1 / s0 s2 / s0 si / s0
 (1.16)
s R / s0 
 0 ∆Z ∆Z ... ∆ Z ... ∆ Z 

∆sZi / s 0 = Z (i ) − Z (0)

- indicii statistici cu bază fixă


s s1 s2 ... si ... s R 
I Zs / s0 :  0  (1.17)
s1 / s0
 0 IZ
s2 / s0
IZ si / s0
... I Z ... I ZsR / s0 

Z (i )
I Zsi / s0 = (×100%)
Z (0 )
- diferenŃe relative cu bază fixă

s s1 s2 ... si ... sR 
RZs / s0 :  0  (1.18)
0 R s1 / s0
Z R s2 / s0
Z ... RZsi / s0 ... RZsR / s0 

∆sZi / s0
I Zsi / s0 = = I Zsi / s0 − 100%
Z (0)

Se deduc seriile formate cu mărimi absolute şi relative calculate doar cu bază fixă (se poate alege orice
stare a variabile ce exprimă spaŃiu).

Exemple:

1. Fie seria de spaŃiu ce reflectă variaŃ ia pe regiuni a „Produsului intern brut regional / locuitor”
(mil. lei), în anul 1998, cf. A.S. al României, pg. 718.

 Bucuresti R.Nord RSud R.Sud R.Sud R.Vest R.Nord R.Centru


 Est Est Vest Vest 
Z :  (s ) (s1 ) (s2 ) (s3 ) (s4 ) (s5 ) (s6 ) (s7 ) 
 0

 26,897 12,564 16,555 14,2 14,803 17,295 15,630 17,769 
Se pot deduce serii formate cu ∆Z, Iz, Rz calculate cu bază fixă
(s0 = Bucureşti), astfel:

 (s ) (s1 ) (s2 ) (s 3 ) (s 4 ) (s 5 ) (s 6 ) (s 7 ) 
∆sZ/ s0 :  0 
 0 -14,333 -10,342 -12,697 -12,096 - 9,602 -11,267 - 9,128
- 11,267, ne arată cu cât este mai mic PIBR/locuitor în regiunea Nord-Vest faŃă de Bucureşti.

s s1 s2 s3 s4 s5 s6 s7 
∆sZ/ s0 :  0 
1 0,467 0,615 0,528 0,550 0,643 0,581 0,661

0,581 – ne arată de câte ori este mai mic PIBR/locuitor în regiunea Nord-Vest faŃă de Bucureşti.

 (s ) (s1 ) (s 2 ) (s3 ) (s 4 ) (s5 ) (s6 ) (s7 ) 


RZs / s0 :  0 
 0 - 53,3% - 38,5% - 47,2% - 45% - 35,7% - 41,9% - 33,9%
-41,9 % - ne arată cu cât la sută este mai mic PIBR/locuitor în regiunea Nord-Vest faŃă de
Bucureşti.

3. Alte exemple, extrase din Anuarul Statistic al României din 2000:

- procentajul în PBN a cheltuielilor publice cu învăŃământul

 Austria Bulgaria Franta Polonia România Ungaria 


X 1 :  
 5,4 3,2 6,0 7,5 3,0 4,6 

- durata medie de viaŃă la naştere, în 1998 a persoanelor de sex masculin:

 Bulgaria Elvetia India Norvegia România Ungaria 


X 2 :  
 68 77 60 76 66 66 
- rata şomajului, în 1998:
 Austria Belgia Elvetia România Spania Turcia 
X 3 :  .
 7,2 12,4 3,9 10,4 18,8 6,2 

Probleme rezolvate

Problema 1.
Produsul intern brut (PIB) al unei Ńări a crescut în 2006 faŃă de 2005 cu 12% şi a scăzut în 2007 faŃă de
2006 cu 12%. Cu cât s-a modificat procentual PIB în 2007 faŃă de 2005?
06 / 05 06 / 05
RPIB = 12% ⇒ I PIB = 1,12
07 / 06 07 / 06
RPIB = −12% ⇒ I PIB = 0,88

07 / 05 06 / 05 07 / 06
I PIB = I PIB ⋅ I PIB = 1,12 ⋅ 0,88 = 0,9856
07 / 05
RPIB (
07 / 05
= I PIB )
− 1 ⋅ 100% = (0,9856 − 1) ⋅ 100% = −1,44%
⇒ PIB a scăzut în 2007 faŃă de 2005 cu 1,44%

Problema 2.
Produsul intern brut pe locuitor (PIB/loc) este de 32640$ în FranŃa şi de 26380$ în Spania.
DeterminaŃi:
a) cu cât la sută este mai mare PIB/loc în FranŃa faŃă de Spania?
b) cu cât la sută este mai mic PIB/loc în Spania decât în FranŃa?

 32640$ 
a) F/S
RPIB F /S
( )
/ loc = I PIB / loc − 1 ⋅ 100% =  − 1 ⋅ 100% = 23,73%
 26380$ 
⇒ PIB/loc este mai mare în FranŃa decât în Spania cu 23,73%

 26380$ 
b) S/F
RPIB S/F
( )
/ loc = I PIB / loc − 1 ⋅ 100% =  − 1 ⋅100% = −19,18%
 32640$ 
⇒ PIB/loc este mai mic în Spania decât în FranŃa cu 19,18%

Problema 3.
Salariul lui Vasile este de 1530 lei, cu 38,4% mai mic decât salariul lui Ilie. Care este salariul lui Ilie?
Vas / Ilie
Rsal = −38,4%
Vas / Ilie
Rsal = (I sal
Vas / Ilie
− 1) ⋅ 100%
Vas / Ilie
Vas / Ilie Rsal − 38,4%
⇒ I sal = +1 = + 1 = −0,384 + 1 = 0,616
100% 100%
Vas / Ilie salar (Vasile )
dar I sal = = 0,616
salar ( Ilie)
salar (Vasile ) salar (Vasile ) 1530
⇒ salar ( Ilie) = Vas / Ilie
= = = 2483,77lei
I sal 0,616 0,616

Capitolul 2

OBSERVAREA, SISTEMATIZAREA ŞI
PREZENTAREA SERIILOR STATISTICE

2.1. Observarea statistică

Observarea statistică constituie prima etapă în cadrul studierii fenomenelor sociale, economice
sau de altă natură, etapă în care se culeg datele statistice despre fenomenul supus cercetării. Cercetarea
fenomenelor respective presupune cunoaşterea populaŃiei statistice în vederea surprinderii acŃiunii
legilor care acŃionează la nivelul acesteia. De calitatea acestei etape, într-un proces de cercetare
statistică, depinde şi calitatea rezultatelor obŃinute în celelalte faze.
Observarea statistică presupune identificarea, urmărirea şi înregistrarea, după reguli unitare şi
precise, a nivelului atins de variabilele statistice studiate la unităŃile din care este formată populaŃia
luat în studiu[Florea I., 1998].
Pentru asigurarea unor date, rezultate din observare, valide şi pertinente se impun câteva
precizări. În primul rând, observarea statistică presupune urmărirea şi înregistrarea unui număr mare
de unităŃi statistice, ceea ce implică un volum mare de muncă. În al doilea rând, pentru ca cercetarea
populaŃiei să-şi atingă scopul, trebuie precizate care sunt variabilele în raport cu care este studiată
populaŃia. Variabilele statistice ce urmează să fie urmărite şi înregistrate la nivelul fiecărei unităŃi din
populaŃie, trebuie să fie esenŃiale şi să prezinte interes din punct de vedere al studiului întreprins. În al
treilea rând, trebuie stabilite criterii exacte pentru delimitarea corectă a unităŃilor statistice care
alcătuiesc populaŃia. Şi nu în ultimul rând, dacă observarea şi înregistrarea datelor este făcut de mai
multe persoane este necesar ca acestea să se alinieze unei metodologii unitare pentru a asigura
corectitudinea necesară datelor rezultate.
Observarea statistică, ca primă etapă într-un studiu de cercetare presupune: specificarea
unităŃ ilor statistice care trebuie să fie urmărite şi înregistrate, alegerea variabilelor statistice care
caracterizează cel mai bine populaŃia şi care răspund obiectivului urmărit, înregistrarea stărilor
variabilelor statistice considerate.
Atingerea scopului cercetării statistice presupune rezolvarea următoarelor probleme care să
asigure o pregătire ştiinŃifică a observării statistice:
- delimitarea populaŃiei supuse observării;
- definirea unităŃilor statistice de observat;
- timpul şi locul unde va avea loc observarea;
- programul observării;
- alegerea purtătorilor de informaŃie;
- pregătirea persoanelor ce urmează să facă observarea.
Fiecăreia din aceste probleme trebuie să i se acorde importanŃa cuvenită, fiindcă fiecare dintre
ele conduce la o pregătire cât mai completă a observării, de rezultatele căreia depinde corectitudinea
celorlalte etape a cercetării statistice.
Delimitarea populaŃiei supuse observării faŃă de alte populaŃii statistice cu care aceasta se află
în legătură se realizează prin evidenŃierea însuşirilor şi trăsăturilor comune ce caracterizează populaŃia
supusă studiului. În condiŃiile în care se impune cercetarea doar a unei părŃi din populaŃie, atunci
trebuie precizat care anume vor fi unităŃile ce vor fi supuse observării, după ce criterii se selectează
acestea din populaŃia iniŃială, astfel încât rezultatele cercetări să poată fi extinse la nivelul întregii
populaŃii.
Definirea unităŃilor statistice de observat presupune claritate şi precizie pentru a nu da loc
confuziilor. În momentul observării trebuie cunoscut exact care sunt unităŃile statistice ce trebuie
înregistrate în raport cu variabilele de studiat.
Stabilirea timpului şi a locului unde va avea loc observarea are importanŃă din punct de vedere
a comparabilităŃii datelor rezultate din observare. NoŃiunea de timp a observării are în statistică două
accepŃiuni:
- momentul sau perioada la care se referă datele înregistrate (timpul de referinŃă);
- durata observării.
Momentul sau perioada la care se referă datele înregistrate trebuie să fie în concordanŃă cu
natura fenomenelor cercetate . În cazul în care observarea presupune înregistrarea unui fenomen în
mod static trebuie precizat un moment critic. Stabilirea momentului critic are în vedere posibilele
repetări sau omisiuni în înregistrarea unităŃilor datorate evoluŃiei populaŃiei în timp. Dacă fenomenul
de studiat presupune o înregistrare continuă, atunci trebuie precizată perioada de timp în care are loc
observarea. De exemplu, recensământul populaŃiei României din anul 2002 a avut ca moment critic
ora „zero” dintre 17 şi 18 aprilie, iar timpul înregistrării a fost de 7 zile. În cazul indicatorilor care
cuantifică activitatea de producŃie, timpul la care se referă datele înregistrate poate fi luna, trimestrul
sau anul. Observarea statistică trebuie făcută într-un timp optim. Recensământul populaŃiei ar trebui să
se realizeze de obicei iarna când mişcarea populaŃiei este redusă în comparaŃie cu celelalte sezoane.
Alegerea momentului critic sau a perioadei de timp la care se referă datele obŃinute prin
înregistrarea unităŃilor, trebuie făcută de aşa manieră încât populaŃia să fie surprinsă în starea ei tipică
şi naturală.
Locul observării reprezintă punctul din spaŃiu în care se derulează procesul supus cercetării
(incinta unei întreprinderi, a unui magazin, o localitate în cazul în care populaŃia o reprezintă familiile
etc.).
În cadrul programului observării statistice trebuie stabilite variabilele statistice care urmează să
fie studiate în populaŃia de cercetat. Alegerea şi definirea variabilelor statistice trebuie să fie în
consens cu natura populaŃiei şi obiectivul cercetării statistice întreprinse. Variabilele statistice care fac
parte din programul cercetării trebuie să surprindă aspectele esenŃiale, să expliciteze fenomenul sau
procesul studiat, să permită prelucrarea şi generalizarea acestora la nivelul întregii populaŃii.
Programul observării trebuie să cuprindă un număr optim de variabile. Alegerea unui număr de
variabile prea mare sau prea mic poate dăuna calităŃii cercetării statistice efectuate asupra populaŃiei în
cauză. Stabilirea programului observării presupune o consultare reciprocă a statisticienilor, care
întreprind cercetarea şi a specialiştilor din domeniul considerat.
Alegerea purtătorilor de informaŃie se face în funcŃie de volumul datelor ce urmează a fi
înregistrate. Purtătorii de informaŃie reprezintă suporŃii materiali pe care se înregistrează datele din
observarea unităŃilor statistice.
Problema selectării şi pregătirii persoanelor care urmează să fie angrenate în etapa de
observare, se pune mai ales în cazul în care fenomenul sau procesul de studiat este de mare amploare.
Un asemenea fenomen îl constituie recensământul, care constituie o observare la scară naŃ ională cu un
mare consum de mijloace materiale şi financiare.
Observarea statistică se poate desfăşura în diverse forme în raport cu: natura proceselor social-
economice de studiat, obiectivul cercetării, formele de organizare cât şi posibilităŃile practice de
urmărire şi înregistrare a unităŃilor statistice din populaŃie.
După cum se ştie, în raport cu gradul de cuprindere a populaŃiei considerate avem: observarea
totală şi observarea parŃială. Observarea totală permite înregistrarea, în raport cu variabilele statistice
a tuturor unităŃilor statistice din populaŃie, implicând un volum mare de muncă, antrenează, de obicei,
un număr de persoane şi durează mult timp. Ca urmare se crează condiŃii pentru apariŃia de erori de
observare, ceea ce va conduce la micşorarea eficienŃei observării. Forma cea mai frecventă de
observare totală o constituie recensământul populaŃiei. Având în vedere anvergura unei asemenea
observări totale, recensământul presupune o pregătire prealabilă din punct de vedere uman, material ş i
financiar de reuşita căreia depinde în mare măsură eficacitatea lui. Cu prilejul fiecărui recensământ se
elaborează o metodologice corespunzătoare cerinŃelor perioadei considerate, constituind baza de
referinŃă a tuturor celor implicaŃi în această acŃiune. Observarea totală se practică şi în domeniul
controlului tehnice de calitate, în cazul produselor de înaltă tehnicitate , aşa cum ar fi: televizoare,
maşini de spălat, frigidere, automobile etc. Este necesară o observare totală în acest caz, deoarece
constatarea defecŃiunilor de către cumpărători ar implica cheltuieli mult mai mari cu remedierea
acestora în comparaŃie cu organizarea unei observări totale a loturilor de produse ce urmează a fi
scoase pe piaŃă.
În cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative,
este suficientă realizarea unor observări parŃiale prin care să se asigure că rebuturile nu depăşesc un
anumit procent admis. O astfel de observare, care include doar o parte din unităŃile populaŃiei supuse
studiului corespunde observării parŃiale. Observarea parŃială constituie o alternativă la observarea
totală în cazul populaŃiilor infinite sau chiar dacă sunt finite prin observare are loc distrugerea
acestora. Având la bază procedeul observării parŃiale se pot evalua rezervele de ŃiŃei, cărbune sau alte
minerale, se poate evalua masa de material lemnos din fondul silvic a unei zone sau la nivelul întregii
Ńări. În general, observarea parŃială se recomandă în toate cazurile în care se consideră mai avantajoasă
decât observarea totală. Avantajele acestui tip de observare se materializează de cele mai multe ori
într-un program de observare mai complex şi mai complet, cu cheltuieli de timp şi materiale mai
reduse şi nu de puŃine ori cu un grad de exactitate mai ridicat.
Eşantionul, ca rezultat al observării parŃiale, presupune respectarea cu stricteŃe a principiului
reprezentativităŃii, în conformitate cu care fiecare unitate statistică din populaŃie generală să aibă
aceeaşi şansă de a face parte din eşantion. Asigurarea respectării principiului reprezentativităŃii în
formarea eşantionului de observat permite acestora o structură foarte apropiată cu cea a populaŃiilor
din care sunt formate. Aceasta ne asigură, cu o anumită probabilitate dinainte fixată, că rezultatele
obŃinute la nivelul eşantionului pot fi extinse la nivelul întregii populaŃii. În raport cu legea de
probabilitate urmată de variabilele urmărite în populaŃia generală sunt două tipuri de eşantioane:
eşantioane de volum mare şi eşantioane de volum redus.
O formă de observare parŃială este observarea prin anchetă. În cadrul acestei forme de
observare, unităŃile supuse observării se aleg în funcŃie de scopul cercetării, iar înregistrarea lor se face
sub formă de răspunsuri scrise pe care persoanele desemnate în acest sens le dau întrebărilor dintr-un
chestionar. Persoanele ce urmează a fi chestionate primesc chestionarul respectiv răspunzând benevol
la întrebări.
Observarea statistică în raport cu procedeul folosit este de două feluri:
- observarea directă;
- observarea indirectă.
Observarea directă presupune o observare nemijlocită a unităŃilor din populaŃie, care sunt
prevăzute pentru cercetare. Acest mod de observare se realizează printr-un contact direct cu unităŃile
statistice, fie prin măsurare, fie prin interogare, dacă unităŃile sunt persoane. Acest procedeu permite
observatorului perceperea nemijlocită a fenomenelor luate în studiu în vederea măsurării nivelelor
înregistrate de variabilele considerate.
Observarea indirectă presupune un intermediar între unităŃile care urmează să fie supuse
observării şi observator. Intermediarul poate fi un document special conceput în vederea observării şi
atunci observarea este pe bază de document sau intermediarul poate fi o altă persoană decât
observatorul, caz în care avem observare prin interogare. Observarea prin interogare presupune că
persoana intermediară să fi participat la desfăşurarea fenomenului sau să fie în măsură să dea
informaŃiile despre nivelul variabilelor care prezintă interes pentru studiul întreprins. Observarea
indirectă neimplicând în mod direct observatorul, constituie o posibilă sursă de erori.
Suportul pentru culegerea datelor îl reprezintă chestionarul.

2.1.1. Elaborarea şi testarea chestionarului

Chestionarul este o listă de întrebări de diferite forme care sunt puse oral sau în scris în vederea
culegerii de informaŃii relativ la un subiect [Chirouze Y., 1985]. Redactarea chestionarului este o
problemă dificilă mai ales în cazul studiilor de piaŃă, pentru că nu există o formulă unică de elaborare
care să conducă la stabilirea unu chestionar foarte bun. De fapt un chestionar este bun, atunci când
furnizează răspunsuri precise, adevărate şi utilizabile. Conceperea unui chestionar se bazează foarte
mult pe experienŃă.
Problemele care intervin în elaborarea unui chestionar sunt numeroase şi complexe. Acestea nu
vor fi prezentate detaliat în acest studiu, ci vor fi abordate doar în linii mari. Pentru detalii se poate
consulta bibliografia aferentă [Javeau C., 1992; Lejeune M., 1994; Vracem P.V., 1989].
Elaborarea chestionarului depinde de obiectivul anchetei. Întrebările şi eventualele probleme
ce intervin în elaborarea lor sunt legate de obiectivele urmărite. Astfel dacă informaŃiile privesc
anumite fapte, evenimente petrecute, atunci întrebările sunt relativ uşor de formulat. Ceea ce ar putea
împiedica obŃinerea de informaŃii ar fi refuzul celor întrebaŃi de a da un răspuns exact la unele
întrebări, datorat unor motive personale sau imposibilităŃii furnizării unui răspuns total sau parŃial
aferent unor evenimente mai îndepărtate. Este evident că lungimea perioadei analizate depinde de
natura faptelor. Dacă evenimentele se produc curent atunci perioada este mai scurtă, iar dacă
evenimentele sunt rare, perioada analizată este mai lungă.
În schimb în cazul anchetelor asupra opiniilor, motivaŃiilor, intenŃiilor, elaborarea
chestionarului este mai dificilă, întrebările vor fi formulate şi studiate cu o foarte mai atenŃie. Ca de
exemplu în cazul anchetelor asupra opiniilor, întrebările privind exprimarea acestora sunt uşor de
formulat, în cea mai mare parte se primesc răspunsuri (fiecare îşi exprimă opinia). Ceea ce este dificil
în culegerea informaŃiilor privind opiniile îl reprezintă măsurarea intensităŃii de manifestare a acestora
[Fournis, 1985].
În situaŃii ca cele formulate mai sus trebuie să se evite întrebările care ar conduce la apariŃia de
erori în răspunsuri. Aceste erori pot să fie provocate voluntar, de către repondenŃi, datorită mascării
unei atitudini, opinii etc., sau pot fi involuntare datorate neînŃelegerii clare a problemei în cauză.
Pentru evitarea acestor inconveniente întrebările puse trebuie să răspundă la o serie de
caracteristici bine definite [Helfer, 1985]. Astfel ele trebuie să fie:
• uşor de înŃeles, adică să nu conŃină cuvinte ce nu pot fi înŃelese de orice repondent;
• stimulatoare, adică întrebările puse trebuie să incite la răspuns;
• precise, să antreneze răspunsuri uşoare şi să permită o bună prelucrare a datelor culese.
Înainte de a vedea în ce manieră se prezintă chestionarul trebuie rezolvate problemele legate de
conŃinutul întrebărilor, ca de exemplu: tipul şi forma întrebărilor, succesiunea lor şi codificarea.

Tipuri de întrebări

Pentru redactarea chestionarului este nevoie să se aleagă între diferitele tipuri de întrebări.
Alegerea nu este indiferentă, ci fiecare tip corespunde nevoilor specifice anchetei.
Mai mulŃi autori printre care sunt şi M. Lejeune, C. Javeau, clasifică întrebările în:
• întrebări închise;
• întrebări deschise;
• întrebări semi-deschise.
Întrebările închise sunt acele întrebări pentru care răspunsurile sunt fixate dinainte şi
repondenŃii trebuie să-şi aleagă din variantele de răspunsuri propuse. Acest tip necesită o precodificare
a răspunsurilor, ceea ce va permite prelucrarea imediată a acestor întrebări.
Întrebările închise sunt uşor de exploatat, aceasta determinând utilizarea frecventă a lor. Acest
tip de întrebare este eficientă atunci când ancheta se desfăşoară asupra faptelor, deoarece variantele de
răspuns pot fi uşor delimitate. În schimb în cazul anchetelor asupra opiniilor, motivaŃiilor, atitudinilor,
este dificilă să se asigure pertinenŃa, exclusivitatea şi exhaustivitatea prin variantele de răspuns
propuse.
Întrebările închise sunt de mai multe tipuri [Chirouze Y., 1985]:
- cu răspuns unic, unde repondentul trebuie să aleagă doar o variantă de răspuns. Acestea sunt
cel mai uşor de prelucrat din punct de vedere statistic.
- cu răspunsuri multiple, unde repondentul poate să aleagă mai multe variante de răspuns. Dacă
acest număr nu este limitat atunci codificarea şi prelucrarea datelor necesită o perioadă mai lungă,
motiv pentru care se recomandă limitarea numărului de răspunsuri.
- cu clasamente, unde repondentul clasează răspunsurile posibile într-o anumită ordine în
funcŃie de preferinŃele sale. Aceste tipuri de întrebări cer un efort mai mare din partea repondentului,
ca urmare ele devin obositoare. Astfel se impune limitarea variantelor de răspuns. De asemenea aceste
întrebări necesită o perioadă mai mare de pregătire a lor pentru prelucrare, iar exploatarea nu este
imediată.
- întrebări cu scale ale atitudinilor, permit nuanŃarea răspunsurilor binare pe o gradaŃie de tip
excelent – foarte rău. Aceasta se poate realiza explicitând fiecare variantă prin cuvinte de tipul
excelent, bun, mediu, rău, foarte rău, sau un sistem de note de exemplu, acordând note de la 1 la 5,
ştiind că 1 este pentru foarte rău iar 5 pentru excelent. Aceste întrebări permit măsurarea atitudinilor
folosind instrumente puse la punct de psihologi, iar ataşarea de note fiecărei trepte a scalei simplifică
prelucrarea şi dă posibilitatea efectuării unor calcule. În schimb dacă scala are prea multe trepte
alegerea unei sau alteia dintre ele devine dificilă, de aceea utilizarea unui număr de 5 trepte este cel
mai convenabil. Dacă treptele nu sunt bine diferenŃiate şi scala nu se schimbă de la o întrebare la alta
atunci repondentul poate avea tendinŃa de a rămâne mereu în aceeaşi zonă a scalei.
Claude Jeveau în „L’enquette par questionnaire” caracterizează întrebările închise astfel:
• sunt cele care se pretează cel mai bine la prelucrarea şi analiza statistică, răspunsurile
primite pot fi prelucrate imediat fără a necesita analize intermediare complicate;
• sunt uşor de înŃeles şi se poate răspunde repede;
• garantează un anumit anonimat;
• ele pot fi folosite ca întrebări filtru, servind la gruparea repondenŃilor;
• ele prezintă pericolul de a „dicta” răspunsul celui anchetat în măsura în care răspunsul la
care s-a gândit nu figurează printre cele posibile, el alegând unul care se apropie cel mai
mult de ceea ce s-a gândit;
• ele nu pot fi folosite pentru obŃinerea de informaŃii nuanŃate, corespunzătoare atitudinilor,
motivaŃiilor profunde, aplicarea lor se limitează doar la culegerea de informaŃii obiective.

Întrebările deschise
O întrebare deschisă este aceea care lasă pe cel interesat să răspundă cum vrea el, neexistând
nici o constrângere. Întrebările deschise pot fi prezentate astfel:
• complet nestructurate, sunt întrebările la care repondenŃii pot să răspundă cum doresc, de
tipul: ce părere aveŃi ... ?
• asociere de cuvinte, când se dau pe rând diferite cuvinte iar repondenŃilor li se cere să noteze
primul cuvânt care le vine în gând;
• completarea frazei, când repondenŃilor li se prezintă o frază incompletă, pe care trebuie să o
completeze;
• completarea unei povestiri, când repondenŃilor le este prezentată o povestire incompletă, pe
care trebuie să o continue, etc.
În chestionar trebuie rezervat spaŃiu suficient pentru completarea întregului răspuns.
Întrebările deschise pot fi caracterizate astfel:
• dacă sunt bine formulate atunci se pot obŃine informaŃii asupra oricărui subiect;
• ele sunt indispensabile în culegerea informaŃiilor privind problemele delicate, cum sunt cele
legate de măsurarea atitudinilor, nevoilor, motivaŃiilor;
• utilizarea lor este impusă în cazurile în care nu pot fi prevăzute toate răspunsurile posibile;
• formularea lor este foarte delicată, de aceea ele trebuie să fie cuprinzătoare, să nu comporte
ambiguităŃi şi contrasensuri;
• prelucrarea lor este foarte costisitoare şi anevoioasă.

Întrebările semi-deschise (mixte) sunt întrebări în care principalele răspunsuri posibile sunt
propuse ca în cazul întrebărilor închise, dar se lasă şi posibilitatea adăugării de răspunsuri libere în
afara celor propuse, cum sunt întrebările deschise [Javeau, 1992].
Această formă mixtă tinde să rezolve problemele de exhaustivitate a întrebărilor închise şi să
reducă costul de codificare al întrebărilor deschise. Întrebările mixte sunt avantajoase atunci când sunt
precodificate răspunsurile stabilite, care acoperă cea mai mare parte din aria răspunsurilor, rămânând
ca un număr destul de mic de răspunsuri, obŃinute pe parcursul anchetei, să fie codificat ulterior.
Aceste întrebări au următoarele caracteristici:
• ele contribuie la uşurarea prelucrării deoarece un număr mare de răspunsuri sunt prevăzute,
acestea fiind codificate;
• ele riscă să influenŃeze reacŃia repondenŃilor prin sugerarea posibilelor răspunsuri;
• variantele de răspuns sugerate în prima parte a întrebării trebuie să fie stabilite foarte
riguros, în general acestea se bazează pe o cercetare prealabilă, astfel încât să fie evitată
situaŃia ca cele mai importante şi cele mai multe răspunsuri să fie concentrate în partea
deschisă a întrebării. Într-o astfel de situaŃie întrebările mixte nu mai sunt avantajoase.

Redactarea chestionarului

După ce a fost definit conŃinutul chestionarului, respectiv diversele domenii ce trebuie regăsite
în întrebări, este necesar să se rezolve problemele legate de forma şi de structura chestionarului şi
anume acestea depind de următoarele aspecte [Javeau C., 1992]:
• modul de administrare a chestionarului, care influenŃează lungimea chestionarului, nivelul
de aplicare al întrebărilor;
• tipul de întrebări ce vor fi utilizate, acesta determinând modul de prelucrare, termenul
anchetei, mijloacele financiare;
• ce limbaj va fi utilizat, acesta depinzând de specificul anchetei, de pregătirea celor anchetaŃ i;
• modul de prelucrare ce va fi folosit, adică manual, sau pe calculator;
• cum pot fi evitate erorile involuntare realizate de repondenŃi prin intermediul răspunsurilor
date. Aceste erori pot fi provocate de frica de a nu fi judecat prost, de dorinŃa de a se
conforma normei sociale, de reacŃia la întrebările prea „delicate” sau personale, de
sugestibilitatea conŃinutului întrebărilor.
C. Javeau în „L’enquette par questionnaire” propune anumite principii de redactare ale unui
chestionar legate de:
a) Ordinea în care sunt puse întrebările
Ordinea de succesiune a întrebărilor depinde de tipul anchetei, de modul de administrare a
chestionarului, de lungimea sa, dar este dificil de propus un model adecvat pentru orice situaŃie.
b) Textele de introducere şi de legătură
Oricare ar fi modul de administrare a chestionarului este necesar să existe texte de introducere
şi texte de legătură între diferitele părŃi şi mai ales între diferitele teme abordate.
c) Prezentarea materială şi tipografică, prezentarea materială a chestionarului trebuie realizată
cu foarte mare atenŃie, mai ales în cazul administrării directe.
În concluzie, redactarea unui chestionar presupune munca în echipă, necesită multă atenŃie ş i
mai ales multă experienŃă deoarece chestionarul este suportul de culegere a datelor iar dacă acesta este
întocmit superficial, chiar dacă metodologia de sondaj şi tehnicile de prelucrare a datelor sunt foarte
avansate şi complexe, rezultatele obŃinute nu vor fi chiar cele mai bune.

Testarea chestionarului

Oricare ar fi experienŃa celor care redactează chestionarul sunt foarte rare situaŃiile când acesta
se prezintă într-o formă perfectă, care să nu necesite îmbunătăŃiri. De aceea este nevoie de testarea
chestionarului, respectiv verificarea modului de înŃelegere, de interpretare şi de acceptabilitate a
întrebărilor.
Testarea chestionarului este absolut necesară în orice situaŃie şi la orice tip de sondaj. Dacă cei
anchetaŃi sunt consumatorii, în general marele public, se ştie că există diferenŃă între nivelul de cultură
al celor ce redactează chestionarul, care sunt specialişti în domeniul respectiv, şi repondenŃii care nu
dispun de limbajul tehnic de specialitate. Astfel în întrebări s-ar putea regăsi cuvinte sau fraze strict de
specialitate şi care să nu fie înŃelese de majoritatea celor anchetaŃi.
Chestionarul este testat pe un număr reduse de persoane aparŃinând populaŃiei studiate,
respectiv în jur de 20, 30 persoane, acest eşantion trebuie să cuprindă persoane cât mai diferite.
În cursul acestei etape trebuie verificate următoarele aspecte: dacă termenii utilizaŃi sunt uşor
de înŃeles şi nu conduc la confuzii; dacă ordinea întrebărilor nu conduce la nici o reacŃie defavorabilă;
dacă forma întrebărilor permite culegerea de informaŃii dorite; dacă întrebările nu sunt prea lungi şi nu
produc dezinteres sau iritarea celor anchetaŃi; dacă anumite întrebări nu sunt utile; dacă textele de
introducere şi de legătură sunt suficiente şi eficiente; dacă variantele de răspuns a întrebărilor închise
sunt suficiente; dacă numărul întrebărilor deschise nu este prea mare ca să obosească pe cel anchetat.

2.1.2. ModalităŃi de administrare a chestionarului

Pentru colectarea datelor există mai multe modalităŃi, dar nu toate au aceleaşi avantaje şi nu pot
fi utilizate cu indiferenŃă. Alegerea uneia sau alteia depinde de o serie de factori.
Culegerea datelor se poate realiza cu ajutorul următoarelor tehnici [Antoine, 1981; Chirouze,
1985; Helfer, 1995]:
• ancheta prin interviu direct;
• ancheta prin corespondenŃă;
• ancheta prin telefon.

1) Ancheta prin interviu direct se caracterizează prin aceea că administrarea chestionarului se


face direct la domiciliu, la locul de muncă, în stradă, la diferite puncte de vânzare, la expoziŃii , etc.
Astfel, în cazul anchetei la domiciliu sau la locul de muncă se pot administra chestionare cu
multe întrebări şi se pot obŃine numeroase informaŃii. Calitatea răspunsurilor este asigurată datorită
prezenŃei anchetatorului al cărui rol este şi acela de a crea o atmosferă favorabilă, de a explica sau
reformula anumite întrebări care nu sunt foarte explicite, de a prezenta fotografii (mai ales în cazul
testării intenŃiilor privind produsele noi), chiar şi mostre de produse. Uneori anchetatorul poate oferi
produse celor anchetaŃi, el urmând să treacă după un timp si să preia chestionarul cu răspunsurile
completate privind calităŃile produselor testate.
Ancheta la domiciliu are şi unele inconveniente. Primul inconvenient este cel legat de prezenŃa
anchetatorului, care poate fi o sursă de erori, provenite din transcrierea unor răspunsuri sau din
formularea unor întrebări. De asemenea de multe ori prezenŃa anchetatorului îl determină pe cel
anchetat să se comporte altfel decât dacă ar fi singur, aceasta conduce la deformarea răspunsurilor, ele
nu mai sunt sincere, sunt date pentru a impresiona pe anchetator.
Un alt aspect ce trebuie adăugat la inconveniente este acela că persoanele din mediul urban
permit destul de greu pătrunderea persoanelor străine în casă, astfel rata non-răspunsurilor provenite
din mediul urban este mult mai mare decât din mediul rural.
Ancheta în stradă sau la expoziŃii, târguri, magazine, are avantajul că se poate realiza un
număr mare de interviuri, într-un timp scurt şi cu cheltuieli mici. Ancheta la magazine, târguri permite
culegerea de impresii la timp, recente, referitoare la produse, publicitate, promovare etc.
Anchetele în stradă au un câmp de acŃiune limitat şi pot fi folosite doar atunci când se doreşte
obŃinerea unor informaŃii ieftine şi rapide, calitatea şi complexitatea lor neinteresând foarte mult.

2) Ancheta prin corespondenŃă. Această tehnică presupune trimiterea chestionarului, prin


intermediul poştei sau a unor anchetatori, la destinatar. De regulă destinatarul este ales folosind un
procedeu aleator. În general chestionarul se trimite într-un plic care conŃine şi o scrisoare explicativă
prin care repondentul să înŃeleagă importanŃa sondajului, a răspunsurilor pe care este rugat să le dea.
De asemenea se trimite şi un plic pentru răspuns, iar uneori se specifică că în cazul furnizării
răspunsului repondentul va primi un mic cadou.
Această modalitate de administrare a chestionarului poate fi aplicată pentru orice populaŃie
studiată. Ca o diversificare a acestei modalităŃi a apărut administrarea chestionarului prin intermediul
faxului. Aceasta fiind folosită în cazul sondajelor în rândul întreprinderilor şi a diferitelor instituŃii.
Avantajele anchetei prin corespondenŃă sunt legate de cheltuielile poştale care sunt cu mult mai
mici decât cheltuielile ocazionate de ancheta la domiciliu. De asemenea dispersia geografică a
corespondenŃilor poate fi mare fără a afecta costul anchetei. În plus această tehnică oferă
repondentului un sentiment de libertate şi de anonimat, deoarece el nu vine în contact cu anchetatorul.
Acest anonimat este asigurat atîta timp cât nu trebuie să-şi scrie adresa pe plicul ce conŃine răspunsul.
Deoarece ancheta nu se desfăşoară într-un timp foarte limitat, chestionarul poate fi relativ lung.
Un inconvenient al acestei anchete îl reprezintă rata non-răspunsurilor care este destul de
ridicată, aceasta impunând trimiterea de noi chestionare altor persoane şi deci creşterea cheltuielilor
anchetei.
Ceea ce propunem este îmbinarea anchetei la domiciliu cu cea prin corespondenŃă, astfel s-ar
îmbunătăŃi calitatea datelor culese. Respectiv anchetatorul ar avea rolul de a duce chestionarul la
repondent, de a-i da câteva explicaŃii şi de a reveni după un anumit timp bine specificat pentru a prelua
răspunsurile. Repondentul va trebui să completeze singur chestionarul, asigurându-se astfel condiŃiile
ca răspunsurile să nu fie afectate de erori datorate anchetatorului. Rata răspunsurilor ar fi cu mult mai
mare decât în cazul anchetei prin corespondenŃă, dar în acelaşi timp şi cheltuielile vor fi mai mari, în
special cele de deplasare.
Acest tip de administrare este eficient în cazul populaŃiilor statistice puŃin dispersate din punct
de vedere geografic.

3) Ancheta prin telefon. Anchetatorul pune o serie de întrebări persoanelor din eşantion, prin
intermediul telefonului. Această modalitate de culegere a datelor permite obŃinerea de informaŃii rapid,
numerele de telefon fiind extrase din cartea de telefon, iar durata unei convorbiri este de 10-15 minute.
Această tehnică este mai economică decât ancheta la domiciliu, cheltuielile cuprind doar tarifele
telefonice. Ca o consecinŃă a cheltuielilor reduse, este faptul că ancheta este eficientă atunci când
eşantionul este dispersat geografic.
Printre avantajele anchetei prin telefon este şi acela că tele-anchetatorul poate telefona la
diferite ore din zi şi de mai multe ori, pentru a contacta persoanele ce fac parte din eşantion. Astfel rata
răspunsurilor este destul de mare.
Deoarece durata convorbirii telefonice este limitată, chestionarul este relativ scurt, întrebările
vor fi simple, ceea ce arată că această modalitate de culegere a datelor se aplică în cazul temelor mai
simple şi care sunt supuse schimbării într-un timp scurt.
Principalul inconvenient este acela că eşantionul de cele mai multe ori nu este reprezentativ.
Acesta pentru că nu toată populaŃia dispune de telefon, iar populaŃia din mediul rural este foarte greu
de contactat telefonic.
În concluzie alegerea unei tehnici sau a alteia depinde de obiectivele studiului, de
complexitatea informaŃiilor culese, de volumul eşantionului şi de dispersia geografică a acestuia, de
bugetul alocat şi de timpul acordat pentru sondaj.
Ceea ce se conturează în momentul de faŃă este apariŃia de noi modalităŃi de culegere a datelor,
mult mai eficiente decât cele aplicate în trecut, cum ar fi folosirea internetului.

2.1.3. Erori de observare

În cele mai multe cazuri observarea statistică presupune şi manipularea unui volum mare de
date. Ca atare intervin diferite tipuri de erori:
- eroare de eşantionare (de reprezentativitate);
- erori de observare;
- erori datorate non-răspunsurilor.
Eroarea de eşantionare există în toate anchetele prin sondaj, dar ea este nulă în cazul observării
totale (nu constituie obiectul acestei lucrări).
Erorile de observare Ńin de faptul că valoarea înregistrată poate fi o valoare yi* diferită de
valoarea adevărată yi corespunzătoare unităŃii i.
Din categoria erorilor de observare fac parte următoarele:
a) Erori datorate dificultăŃilor de vocabular, cum ar fi:
• utilizarea unui limbaj savant, prea tehnicist, când de regulă într-un chestionar nu trebuie să
fie folosite decât cuvinte uşor de înŃeles;
• folosirea unor cuvinte a căror sens este variabil de la un mediu la altul, sau de la un individ
la altul;
• folosirea unor cuvinte a cărui sens este vag sau sunt prea abstracte.
b) Erori datorate neînŃelegerii corecte a sensului întrebărilor, ca de exemplu:
• persoanele intervievate declară o altă situaŃie decât cea normală, cum ar fi cazul declarării
venitului (când cel în cauză declară venitul salarial şi nu venitul total realizat), declararea
unei vechi profesii în loc de cea actuală etc.;
• persoanele intervievate comit erori fie datorate nedefinirii perioadei de referinŃă (o perioadă
pentru care se solicită informaŃii) sau datorate lungimii prea mari, solicitându-se prea mult
memoria celor anchetaŃi;
• nedefinirea exactă a unităŃilor de observat, pentru că sunt întrebări ce se referă la o persoană,
iar altele la un grup, mai ales în cazul anchetelor organizate în gospodării;
• neînŃelegerea întrebărilor foarte lungi, foarte complexe şi care conŃin mai multe ideii în
acelaşi timp;
• folosirea unor întrebări vagi, abstracte, a căror implicaŃii nu sunt bine înŃelese;
• dificultatea alegerii unuia sau a mai multor răspunsuri dintr-o listă. Este important să se ştie
dacă răspunsurile se exclud sau nu, dacă poŃi alege doar unul sau mai multe. În general se
preferă o listă cu răspunsuri cât mai completă, dar să nu fie prea lungă.
c) Erori datorate solicitării memoriei, şi anume:
• erori cauzate de uitarea unor evenimente sau reŃinerea lor parŃială;
• erori cauzate de lungimea perioadei de referinŃă, mai ales atunci când ea este mare.
d) Erori datorate lipsei sincerităŃii în furnizarea informaŃiilor. Astfel de erori sunt mai
frecvente în cazul Ńărilor unde persoanele nu sunt obişnuite cu sondajele. În cadrul acestei categorii s-
ar include:
• erori datorate fricii de a declara o situaŃie aşa cum este ea, de exemplu în cazul venitului,
persoanele declară în general salariul, pensia sau ajutorul primit, veniturile suplimentare nu
sunt declarate mai ales de frica impozitelor fiscale;
• erori cauzate de dorinŃa impresionării anchetatorului, de exemplu subestimând consumul de
alcool, supraestimând activităŃile culturale etc.
e) Erori cauzate de anchetatori, şi anume:
• prin interpretarea unor întrebări sau „suflarea” unor răspunsuri, la cei intervievaŃi;
• în cazul organizării de sondaje probabiliste, atunci când o unitate este înlocuită cu alta, care
nu este trecută pe lista eşantionului, situaŃie întâlnită mai ales atunci când nu se obŃin
informaŃii de la unităŃile ce trebuie supuse observării.
Pentru reducerea acestor erori este necesară o selecŃie riguroasă a anchetatorilor, o bună
pregătire a acestora, şi o testare prealabilă a chestionarelor. De asemenea se recomandă efectuarea de
controale a anchetatorilor. Depistarea erorilor se poate realiza şi în faza de prelucrare a datelor, iar în
funcŃie de natura lor se pot lua diferite măsuri pentru eliminarea efectului acestora.
În concluzie, aşa cum spunea J. Desabie „atunci când o anchetă eşuează, cel mai frecvent se
datorează erorilor de observare decât erorii de eşantionare”. De aceea este iraŃional să consacri mari
eforturi pentru reducerea erorii de eşantionare atunci când erorile de observare sunt consistente. Dar în
general erorile de observare sunt mult mai mici în cazul anchetelor prin sondaje decât în cazul
recensămintelor, datorate faptului că anchetatorii au o pregătire mult mai bună decât agenŃii recenzori.
Erorile datorate non-răspunsurilor provin din absenŃa totală sau parŃială a datelor privind
unităŃ ile supuse observării.

2.2. Sistematizarea şi prezentarea datelor statistice

Sistematizarea constituie o etapă în cadrul prelucrării datelor statistice în vederea prezentării


acestora sub formă de serie statistică (tabel de frecvenŃe). Datele obŃinute ca urmare a procesului de
observare statistică, în forma lor brută, permit o caracterizare amănunŃită a fiecărei unităŃi din
populaŃia considerată. Deoarece, datele rezultate din observare se prezintă sub formă dezorganizată nu
permit o caracterizare a populaŃiei în ansamblu.
În vederea atingerii scopului cercetării statistice întreprinse şi anume acela de a da o
caracterizare de ansamblu a populaŃiei considerate este necesar ca datele rezultate din observare să fie
supuse unor operaŃii de sistematizare şi prezentare în vederea deducerii a ceea ce este esenŃ ial, tipic şi
general în legătură cu populaŃia.
Deoarece în prelucrarea statistică primul pas îl constituie prezentarea datelor observate sub
forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie să fie în
strânsă dependenŃă cu scopul cercetării şi cu natura fenomenului cercetat.
În raport cu una sau mai multe variabile din programul observării, se poate construi o serie
statistică, permiŃând astfel diverse ordonări (grupări) a datelor înregistrate. Orice cercetare statistică se
face cu un anumit scop bine precizat. În urma efectuării observării statistice, indiferent de numărul
variabilelor prevăzut în programul cercetării, prelucrarea datelor rezultate se face în raport cu acelea
care sunt strâns legate de scopul final.
Odată precizate variabilele de la baza seriei, se ştie care va fi conŃinutul primului şir de date şi
ca urmare este elucidat criteriul în raport cu care informaŃiile rezultate din observare vor fi ordonate,
necunoscându-se însă cum se face propriu-zis ordonarea şi cum se completează primul şir al seriei.
Completarea primului şir de date al unei serii statistice nu presupune doar o simplă aranjare în
ordine crescătoare sau descrescătoare a variabilelor numerice sau în ordine alfabetică a stărilor
variabilelor calitative. Definirea unei serii, referitor la primul şir de date se realizează în raport cu toate
stările variabilei stabilite.
În cazul unei variabile calitative sau cantitative discrete (şi care înregistrează un număr redus
de stări) ce stă la baza construirii unei serii, procedeul cel mai simplu de completare a primului şir îl
constituie ordonarea sau aranjarea stărilor variabilei respective într-o anumită ordine. Dacă variabila
care stă la baza seriei este de variaŃie continuă sau deşi discretă înregistrează un număr prea mare de
valori în cadrul populaŃiei de studiat, ordonarea valorilor acestei variabile va conduce la o fărâmiŃare
prea mare a populaŃiei, ceea ce nu permite evidenŃierea principalelor aspecte ale acesteia. Pentru
asemenea cazuri, completarea primului şir presupune în primul rând reunirea în clase distincte a acelor
unităŃ i din populaŃie pentru care variabila nu prezintă variaŃii esenŃ iale. Ca urmare, în vederea
definitivării primului şir de date al unei serii, se grupează datele în mod corespunzător, fiind necesar în
primul rând stabilirea claselor.
OperaŃia de stabilire a claselor presupune împărŃirea unităŃilor unei populaŃii în clase distincte
în raport cu una sau mai multe variabile şi aranjarea claselor rezultate într-o anumită ordine. În urma
unei asemenea operaŃii, fiecare unitate trebuie să se găsească în una şi numai una din clasele rezultate.
Această operaŃie nu trebuie să conducă la pierderi de unităŃi, regăsindu-se însă într-o altă ordine decât
cea după care s-a realizat observarea.
De modul cum se face operaŃia de grupare a unităŃilor populaŃiei depinde în mare măsură
sesizarea principalelor aspecte calitative care se pot contura în cadrul unei populaŃii cât şi calitatea
informaŃiilor rezultate în urma prelucrării datelor respective.
Omogenitatea constituie o proprietate de bază pe care trebuie să o aibă clasele. Se spune că o
clasă este omogenă dacă, pentru unităŃile care fac parte din ea, variabila de grupare înregistrează
variaŃ ii nesemnificative.
În cazul seriilor care au la bază o variabilă de grupare calitativă sau cantitativă discretă,
problema omogenităŃii nu se ridică deoarece, toate unităŃile pentru care variabila a înregistrat aceeaşi
stare constituie o clasă.
În cele ce urmează se va prezenta operaŃia de stabilire a claselor în cazul unei serii
unidimensionale.
Dacă la baza seriei avem o variabilă calitativă, atunci clasele se stabilesc în raport cu stările
acesteia. Pentru fiecare stare a variabilei se va construi o clasă. Ca urmare, în acest caz, într-o clasă vor
intra toate unităŃile care au înregistrat aceeaşi stare în timpul observării în raport cu variabila
considerată.
Pentru o variabilă cantitativă, care stă la baza construirii unei serii, stabilirea claselor se
realizează în mod diferit pentru o variabilă discretă şi pentru o variabilă continuă.
În cazul unei serii care are la bază o variabilă cantitativă discretă (numărul stărilor nu este
prea mare), clasele se stabilesc în mod asemănător ca şi la variabilele calitative, respectiv:
x x2 ... xR 
X :  1 
 N1 N 2 ,... N R 
În condiŃiile în care cercetarea populaŃiei presupune elaborarea unei serii care are la bază o
variabilă cantitativă continuă sau o variabilă cantitativă discretă, dar care în populaŃia considerată
înregistrează un număr prea mare de stări, clasele nu se mai pot stabili cu ajutorul stărilor variabilei.
Pentru asemenea cazuri, gruparea unităŃilor populaŃiei în clase se face cu ajutorul intervalelor de
grupare (variaŃie), fiecare interval cuprinzând un număr oarecare de valori ale variabilei. Ca urmare,
pentru o serie continuă, clasele se definesc cu ajutorul intervalelor de grupare.
Două probleme se pun în cazul elaborării unei serii care are la bază o variabilă cantitativă
continuă:
• determinarea lungimii intervalelor de variaŃie;
• stabilirea formei de scriere a intervalelor de variaŃie.
Determinarea lungimii intervalelor de variaŃie conduce la două situaŃii:
• serii construire cu intervale de lungime egală;
• serii construite cu intervale de lungime diferite.
Alegerea unuia din cazurile de mai sus (intervalele de lungime egală sau diferită) trebuie
precedată de o analiză atentă a modului de variaŃie a variabilei în cadrul populaŃiei. Stabilirea
numărului de intervale de variaŃie trebuie să asigure satisfacerea următoarelor condiŃii:
- informaŃia care se pierde în urma operaŃiei de grupare să nu fie prea mare, iar populaŃia să
nu fie prea fărâmiŃată în raport cu variabilele de grupare;
- media aritmetică a fiecărei grupe (în raport cu valorile înregistrate) să fie cât mai aproape
de centrul intervalului de variaŃie respectiv;
- să nu existe grupe vide;
- reprezentarea grafică a seriei rezultate să permită conturarea unei regularităŃ i a fenomenului
de studiat din cadrul populaŃiei. Trebuie remarcat că acest lucru nu este posibil nici în cazul
unui număr mic de intervale deoarece se pierd prea multe date, nici în cazul unui număr
prea mare de intervale, populaŃia fărâmiŃându-se prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul în care populaŃia în raport cu
variabila X este normală, următoarea expresie:

xmax − xmin
lx = (2.1)
1 + 3,322 lg N

(1+3,322 LgN, având semnificaŃia de „număr de intervale”), pentru celelalte cazuri rezultatul fiind
orientativ, servind la determinarea cu aproximaŃie a lungimii intervalelor de variaŃie în cazul în care
acestea vor fi de lungime egală. Se elaborează seria de intervale de lungime egală după cum urmează:

[x ; (x + l )) ... [xmin + (k −1)lx ; (xmin + klx )) ... [xmin + (R −1)lx ; (xmin + R lx ))
X :  min min x 
 N1 Nk NR 
dacă se presupune că au rezultat R intervale, unde Nk, k = 1, R reprezintă volumele claselor în care s-a
structurat populaŃia.
Nu întotdeauna împărŃirea domeniului de variaŃie a variabile în intervale de lungime egală este
relevantă din punct de vedere al scopului urmărit în ceea ce priveşte desprinderea tipurilor calitative
din cadrul populaŃiei cercetate. Numeroase sunt cazurile practice în care studiul unei populaŃii în
raport cu o variabilă sau mai multe presupune împărŃirea domeniilor de variaŃie ale acestora în
intervale de lungime neegală. În asemenea cazuri nu există o relaŃie de calcul în acest sens. Stabilirea
intervalelor de variaŃie se face în directă legătură cu variaŃia variabilelor şi distribuirea unităŃilor în
raport cu acestea.
Dacă la baza seriei în cauză stau două sau mai multe variabile calitative sau cantitative atunci
clasele se stabilesc în raport cu fiecare din variabilele considerate prin stările acestora (vezi seria 1.5,
cap. 1).
Nu este recomandat ca numărul variabilelor în raport cu care se studiază populaŃia să fie prea
mare, deoarece aceasta duce la o divizare exagerată a populaŃiei pierzându-se din vedere aspectele
principale.
După ce clasele au fost definite, are loc repartizarea unităŃilor populaŃiei în clasele respective,
folosind în acest scop un algoritm adecvat.
Pentru elaborarea şi prezentarea seriilor statistice se apelează la pachete de programe statistice
cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical
Analysis System), STATGRAPHICS, etc.
2 - 10 ani Mobifon Cu 100 impulsuri 50000 - 290000 2 nesatisfacatoare nu stiu 31 si 40 ani m
2 - 10 ani Mobifon Cu 100 impulsuri 50000 - 290000 3 satisfacatoare da 21 si 30 ani m
2 - 10 ani Nici una Cu 50 impulsuri 290001 - 530000 2 slaba da 21 si 30 ani f
peste 10 ani Nici una Abonament social 50000 - 290000 4 foarte buna da 21 si 30 ani f
peste 10 ani Orange Cu 100 impulsuri 50000 - 290000 4 satisfacatoare da sub 20 ani f
2 - 10 ani Orange Cu 100 impulsuri 290001 - 530000 4 satisfacatoare da sub 20 ani f
peste 10 ani Nici una Cu 0 impulsuri 1490001 - 1730000 2 buna nu stiu 31 si 40 ani f
6 luni - 2 ani Orange Cu 100 impulsuri 50000 - 290000 1 buna nu stiu 21 si 30 ani f
peste 10 ani Orange Cu 100 impulsuri peste 2000000 1 buna nu 21 si 30 ani m
peste 10 ani Orange Cu 100 impulsuri 50000 - 290000 5 foarte buna da 31 si 40 ani f
sub 6 luni Orange Cu 100 impulsuri 290001 - 530000 5 foarte buna da 21 si 30 ani f
2 - 10 ani Mobifon Cu 100 impulsuri 50000 - 290000 3 satisfacatoare da 21 si 30 ani m
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 4 buna da 31 si 40 ani f
sub 6 luni Nici una Cu 0 impulsuri 530001 - 770000 2 buna da 31 si 40 ani f
peste 10 ani Mobifon Cu 100 impulsuri 1490001 - 1730000 1 foarte buna nu stiu 41 si 50 ani f
2 - 10 ani Mobifon Cu 100 impulsuri 770001 - 1010000 2 buna nu stiu 31 si 40 ani f
peste 10 ani Nici una Cu 100 impulsuri 530001 - 770000 5 foarte buna da peste 60ani m
peste 10 ani Orange Cu 0 impulsuri 50000 - 290000 3 satisfacatoare nu stiu 21 si 30 ani f
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 3 buna nu stiu 51 si 60 ani f
peste 10 ani Mobifon Cu 50 impulsuri 290001 - 530000 1 nesatisfacatoare nu stiu 21 si 30 ani f
peste 10 ani Orange Cu 100 impulsuri 50000 - 290000 5 foarte buna nu stiu 21 si 30 ani f
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 5 foarte buna da 31 si 40 ani m
6 luni - 2 ani Orange Cu 100 impulsuri 50000 - 290000 5 buna da 21 si 30 ani m
2 - 10 ani Orange Cu 100 impulsuri 530001 - 770000 1 buna nu stiu 31 si 40 ani f
6 luni - 2 ani Nici una Cu 100 impulsuri 50000 - 290000 3 buna da 31 si 40 ani f
2 - 10 ani Nici una Cu 100 impulsuri 50000 - 290000 3 satisfacatoare da sub 20 ani m
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 5 satisfacatoare da 51 si 60 ani m
2 - 10 ani Orange Cu 100 impulsuri 530001-770000 1 slaba nu 41 si 50 ani f
peste 10 ani Nici una Cu 100 impulsuri 290001 - 530000 2 satisfacatoare nu stiu 51 si 60 ani f
peste 10 ani Mobifon Cu 0 impulsuri 1010001 - 1250000 3 satisfacatoare nu 31 si 40 ani m
6 luni - 2 ani Orange Cu 0 impulsuri 530001 - 770000 4 buna nu stiu 21 si 30 ani f
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 5 foarte buna da peste 60ani m
2 - 10 ani Nici una Cu 100 impulsuri 50000 - 290000 5 slaba nu stiu 21 si 30 ani m
peste 10 ani Nici una Cu 50 impulsuri 50000 - 290000 3 foarte buna da peste 60ani f
6 luni - 2 ani Orange Cu 100 impulsuri 290001 - 530000 3 buna da 21 si 30 ani f
peste 10 ani Mobifon Cu 100 impulsuri 290001 - 530000 3 buna da 31 si 40 ani m
6 luni - 2 ani Nici una Cu 100 impulsuri 50000 - 290000 5 foarte buna da 31 si 40 ani f
peste 10 ani Orange Cu 100 impulsuri 290001 - 530000 4 foarte buna nu stiu 31 si 40 ani f
peste 10 ani Nici una Cu 50 impulsuri 50000 - 290000 3 satisfacatoare nu stiu 21 si 30 ani m
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 3 satisfacatoare nu stiu peste 60ani m
peste 10 ani Nici una Cu 100 impulsuri 290001 - 530000 1 buna da 51 si 60 ani f
peste 10 ani Mobifon Cu 100 impulsuri 290001 - 530000 3 buna nu stiu 21 si 30 ani f
peste 10 ani Nici una Cu 100 impulsuri 530001 - 770000 2 satisfacatoare da sub 20 ani m
2 - 10 ani Mobifon Cu 0 impulsuri 1010001 - 1250000 4 satisfacatoare nu stiu 21 si 30 ani f
peste 10 ani Orange Cu 100 impulsuri 530001 - 770000 3 nesatisfacatoare nu stiu . m
2 - 10 ani Nici una Cu 100 impulsuri 50000 - 290000 4 buna nu stiu sub 20 ani f
peste 10 ani Mobifon Cu 100 impulsuri 50000 - 290000 4 buna nu stiu sub 20 ani f
6 luni - 2 ani Orange Cu 100 impulsuri 50000 - 290000 4 satisfacatoare nu stiu 21 si 30 ani f
peste 10 ani Orange Cu 50 impulsuri 50000 - 290000 3 nesatisfacatoare nu stiu 21 si 30 ani f
peste 10 ani Mobifon Cu 100 impulsuri 530001 - 770000 3 satisfacatoare nu stiu 21 si 30 ani f
2 - 10 ani Orange Cu 100 impulsuri 290001 - 530000 2 satisfacatoare nu stiu 21 si 30 ani m
peste 10 ani Mobifon Cu 100 impulsuri 530001 - 770000 2 satisfacatoare nu 21 si 30 ani m
peste 10 ani Orange Cu 100 impulsuri 530001 - 770000 2 satisfacatoare nu stiu 21 si 30 ani f
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 5 foarte buna da 31 si 40 ani m
6 luni - 2 ani Orange Cu 100 impulsuri 50000 - 290000 3 satisfacatoare da 31 si 40 ani f
peste 10 ani Orange Cu 100 impulsuri 50000 - 290000 2 satisfacatoare da 51 si 60 ani m
peste 10 ani Mobifon Abonament social 1730001 - 2000000 1 slaba nu 31 si 40 ani f
2 - 10 ani Orange Cu 0 impulsuri 770001 - 1010000 2 satisfacatoare nu stiu 21 si 30 ani f
2 - 10 ani Nici una Cu 0 impulsuri 50000 - 290000 1 buna da peste 60ani f
peste 10 ani Nici una Cu 50 impulsuri 50000 - 290000 1 buna da peste 60ani f
6 luni - 2 ani Nici una Cu 100 impulsuri 50000 - 290000 4 nesatisfacatoare nu stiu 31 si 40 ani m
2 - 10 ani Orange Cu 100 impulsuri 530001 - 770000 1 satisfacatoare nu 31 si 40 ani f
peste 10 ani Mobifon Cu 100 impulsuri 530001 - 770000 3 buna nu stiu sub 20 ani f
peste 10 ani Nici una Cu 100 impulsuri 50000 - 290000 2 satisfacatoare nu stiu 21 si 30 ani f
peste 10 ani Mobifon Cu 50 impulsuri 770001 - 1010000 2 satisfacatoare da 21 si 30 ani f
6 luni - 2 ani Mobifon Cu 100 impulsuri 50000 - 290000 3 satisfacatoare nu stiu 31 si 40 ani f
peste 10 ani Orange Cu 100 impulsuri 770001 - 1010000 4 buna nu stiu 31 si 40 ani m
2 - 10 ani Orange Cu 100 impulsuri 50000 - 290000 4 buna da 31 si 40 ani f
2 - 10 ani Orange Cu 50 impulsuri 770001 - 1010000 . satisfacatoare nu stiu peste 60ani m
2 - 10 ani Orange Cu 100 impulsuri 290001 - 530000 5 buna da 21 si 30 ani f
Exemple
Se consideră populaŃia statistică formată cu mulŃimea clienŃilor unei firme X, datele privind variabilele
statistice obsevate sunt redate în tabelul de mai sus.

Elaborarea seriilor statistice unidimensionale.


De cât timp sunteŃi client?
Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata relativa cumulata
sub 6 luni 2 2.9 2.9 2.9
6 luni – 2 ani 10 14.3 14.3 17.1
2 - 10 ani 19 27.1 27.1 44.3
peste 10 ani 39 55.7 55.7 100.0
Total 70 100.0 100.0

La care companie de telefonie mobilă sunteŃi abonat?


Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata Relative cumulata
Mobifon 17 24.3 24.3 24.3
Orange 27 38.6 38.6 62.9
Nici una 26 37.1 37.1 100.0
Total 70 100.0 100.0

Ce tip de abonament RTC folosiŃi?


Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata relativa cumulata
Cu 0 8 11.4 11.4 11.4
impulsuri
Cu 50 8 11.4 11.4 22.9
impulsuri
Cu 100 52 74.3 74.3 97.1
impulsuri
Abonament 2 2.9 2.9 100.0
social
Total 70 100.0 100.0

Note pentru raportul tarif/calitatea serviciilor


Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata relativa cumulate
1 11 15.7 15.9 15.9
2 14 20.0 20.3 36.2
3 19 27.1 27.5 63.8
4 13 18.6 18.8 82.6
5 12 17.1 17.4 100.0
Total 69 98.6 100.0
Nu raspund 1 1.4
Total 70 100.0

Care a fost valoarea ultimei facturi telefonice RTC achitate de dvs.?


Frecventa Frecventa Frecventa Frecventa
abso luta relativa Validate relativa cumulata
50000 - 290000 36 51.4 51.4 51.4
290001 - 530000 12 17.1 17.1 68.6
530001 - 770000 11 15.7 15.7 84.3
770001 - 1010000 5 7.1 7.1 91.4
1010001 - 1250000 2 2.9 2.9 94.3
1490001 - 1730000 2 2.9 2.9 97.1
1730001 - 2000000 1 1.4 1.4 98.6
peste 2000000 1 1.4 1.4 100.0
Total 70 100.0 100.0
Promptitudinea în deservirea clienŃilor
Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata relativa cumulata
slaba 4 5.7 5.7 5.7
nesatisfacatoare 5 7.1 7.1 12.9
satisfacatoare 26 37.1 37.1 50.0
buna 23 32.9 32.9 82.9
foarte buna 12 17.1 17.1 100.0
Total 70 100.0 100.0

IntenŃionati să rămâneŃi client RTC?


Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata relativa cumulata
da 31 44.3 44.3 44.3
nu 6 8.6 8.6 52.9
nu stiu 33 47.1 47.1 100.0
Total 70 100.0 100.0

Vârsta
Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata relativa cumulata
sub 20 ani 7 10.0 10.1 10.1
21 si 30 ani 27 38.6 39.1 49.3
31 si 40 ani 21 30.0 30.4 79.7
41 si 50 ani 2 2.9 2.9 82.6
51 si 60 ani 5 7.1 7.2 89.9
peste 60ani 7 10.0 10.1 100.0
Total 69 98.6 100.0
Nu raspund 1 1.4
Total 70 100.0

Sexul
Frecventa Frecventa Frecventa Frecventa
abso luta relativa validata relativa cumulata
f 46 65.7 65.7 65.7
m 24 34.3 34.3 100.0
Total 70 100.0 100.0

Serii de repartiŃii bidimensionale


La care companie de telefonie mobila sunteti abonat? * intentionati să rămâneŃi client RTC?
intentionati sa ramaneti client RTC? Total

da nu nu stiu
La care companie de Mobifon 4 3 10 17
telefonie mobila Orange 10 3 14 27
sunteti abonat? Nici una 17 9 26
Total 31 6 33 70
Vârsta * promptitudinea in deservirea clientilor
promptitudinea in deservirea clientilor Total

slaba nesatisfacatoare satisfacatoare buna foarte buna


Varsta sub 20 ani 4 3 7
21 si 30 ani 2 2 13 7 3 27
31 si 40 ani 1 2 4 9 5 21
41 si 50 ani 1 1 2
51 si 60 ani 3 2 5
peste 60ani 2 2 3 7
Total 4 4 26 23 12 69

Care a fost valoarea ultimei facturi telefonice RTC achitate de dvs.? * Ce tip de abonament RTC
folositi?
Ce tip de abonament RTC folositi? Total

Cu 0 Cu 50 Cu 100 Abonament
impulsuri impulsuri impulsuri social
Care a fost valoarea 50 - 290 2 4 29 1 36
ultimei facturi 290 - 530 2 10 12
telefonice RTC 530 - 770 2 9 11
achitate de dvs.? 770 - 1010 1 2 2 5
(mii lei) 1010 - 1250 2 2
1490 - 1730 1 1 2
1730 - 2000 1 1
peste 2000 1 1

Total 8 8 52 2 70

2.3. Reprezentări grafice

Reprezentarea grafică a unei serii ne dă o imagine geometrică (în plan sau spaŃiu) cu privire la
forma statică sau evoluŃia dinamică a fenomenului cuantificat de seria respectivă.
Graficul asociat unei serii constituie o imagine spaŃială a fenomenului de cercetat, permiŃând
evidenŃ ierea rapidă a structurii, dinamicii şi tendinŃei de dezvoltare a acestuia. Reprezentările grafice
sunt folosite atât în scopul cunoaşterii populaŃiei în cauză, cât şi pentru popularizarea unor rezultate
din diverse domenii de activitate.
Elaborarea completă şi corectă în acelaşi timp a unui grafic presupune elucidarea următoarelor
elemente: titlul graficului, scara de reprezentare, reŃeaua graficului, semnele convenŃionale şi notele.
Titlul graficului trebuie să fie scurt, clar şi semnificativ pentru conŃinutul fenomenului reliefat
prin seria considerată.
În cele mai frecvente cazuri un grafic se trasează într-un sistem de axe rectangulare xOy. Pe
fiecare din cele două axe se reprezintă valorile variabilelor X, respectiv Y. Un astfel de punct marcat se
mai numeşte punct cotat. Scara de reprezentare reuneşte mulŃimea tuturor punctelor cotate. În cazul în
care variabila înregistrează valori mici, gradarea scării începe în principiu de la zero, dacă variabila
înregistrează valori mari se consideră o altă origine stabilită cu aproximaŃie. Pentru a nu încărca prea
mult desenul, se recomandă reprezentarea pe scară doar a valorilor dispuse la un anumit interval
convenabil ales. DistanŃele dintre două puncte cotate consecutive se numeşte intervalul graficului.
Când intervalele sunt egale atunci avem scări uniforme, în caz contrar avem scări neuniforme.
Scara aritmetică este o scară uniformă în timp ce scara logaritmică sau cea binomială constituie
exemple de scări neuniforme.
ReŃeaua graficului permite identificarea cu uşurinŃă în plan sau în spaŃiu a punctelor
corespunzătoare valorilor înregistrate de variabilele în cauză. Sistemul axelor rectangulare (în plan sau
spaŃiu) constituie cele mai uzuale reŃele în reprezentarea grafică a seriilor statistice.
Semnele convenŃionale se pot materializa într-o reprezentare grafică prin inscripŃii, fie printr-o
legendă.
InscripŃia trebuie să fie scurtă şi semnificativă şi plasată cât mai bine în raport cu elementul
din grafic pe care îl explicitează.
Legenda se foloseşte pentru a explicita folosirea semnelor, culorilor sau diverselor haşuri
folosite în graficul în cauză. Legenda se plasează înafara graficului, în colŃul din stânga sau dreapta
jos.
În cazul graficelor complexe, pentru o înŃelegere mai bună, sunt necesare unele explicaŃii, care
se dau sub formă de note. Notele generale privesc în ansamblu graficul şi se plasează chiar sub titlul
graficului. Notele speciale privesc porŃiuni din grafic şi sunt legate de acestea prin diverse semne de
trimitere. Notele se plasează în partea de jos a diagramei, în colŃul din stânga sub reŃea.
În continuare se vor prezenta principalele tehnici de construire a graficelor utilizate în
reprezentarea seriilor statistice ce descriu fenomenele social-economice.

Histograma

Graficul specific seriilor care au la bază o variabilă continuă (de intervale) este histograma.
Aceasta se construieşte într-un sistem de axe rectangulare după cum urmează: pe abscisă se trec
intervalele de variaŃie, iar pe ordonată se trasează scara frecvenŃelor. Scara frecvenŃelor se construieşte
în conformitate cu respectarea principiului proporŃionalităŃii între frecvenŃe şi segmentele delimitate pe
scara ordonatelor. Pentru fiecare interval de variaŃie a seriei (xi-1 – xi) se construieşte un dreptunghi a
cărui bază este chiar lungimea intervalului, iar cealaltă latură se determină din condiŃia
proporŃionalităŃii ariei dreptunghiului cu mărimea indicatorului în clasa respectivă.
Latura necunoscută a dreptunghiului, notată cu Li se determină din următoarea relaŃie:

Li . li = k . Ni (2.2)
unde:
li = latura cunoscută a dreptunghiului corespunzător intervalului (xi-1 - xi);
Li = latura necunoscută a dreptunghiului corespunzător intervalului (xi-1 - xi);
Ni = frecvenŃa absolută a clasei „i”;
k = un coeficient de proporŃionalitate care se alege în raport cu scara de reprezentare.
Din relaŃia (2.2) se deduce Li:
N
Li = k i , i = 1, R
li
unde: li = xi - xi-1, adică diferenŃa dintre limita superioară şi cea inferioară a intervalului de variaŃie.
MulŃimea tuturor dreptunghiurilor astfel determinate, formează histograma ataşată seriei.

Poligonul frecvenŃelor

Este o reprezentare grafică a seriilor statistice având la bază o variabilă atributivă cantitativă
continuă şi formată cu frecvenŃe absolute sau relative, simple sau cumulate. Trasarea acesteia
presupune realizarea în prealabil a histogramei. Poligonul frecvenŃelor se obŃine unind prin segmente
de dreaptă mijloacele laturilor superioare ale dreptunghiurilor, din care este alcătuită histograma.
Poligonul frecvenŃelor poate fi construit şi direct, fără intermediul histogramei. Aceasta
presupune ridicarea de perpendiculare din mijlocul fiecărui interval de variaŃie, a căror
lungimi(inaltimi) sunt proporŃionale cu frecvenŃele intervalelor corespondente. Unind prin segmente
de dreaptă vârfurile acestor perpendiculare, se obŃine graficul dorit. Graficul produce o imagine a
funcŃiei densitate de probabilitate empirice (în cazul utilizării frecvenŃelor simple), sau a funcŃiei de
repartiŃie empirică (în cazul utilizării frecvenŃelor cumulate). Poligonul frecvenŃelor este un grafic
important pentru aproximarea formei distribuŃiei populaŃiei studiate, cât şi pentru compararea a două
distribuŃii pe aceeaşi diagramă.
Exemplu şi figura

Din Anuarul Statistic al României din anul 2000, am extras o serie de repartiŃie reprezentând populaŃia
României sub 40 de ani pe grupe de vârstă.

Grupa PopulaŃia
de vârstă (ani)
0–4 1147065
5–9 1330733
10 – 14 1737153
15 – 19 1701881
20 – 24 1978835
25 – 29 1792822
30 – 34 1698268
35 – 39 1335039

Figura 2.1 Histograma si poligonul frecventelor


Distributia populatiei Romaniei sub 40 ani pe grupe de varsta
populatia

0–4 5–9 10 – 14 15 – 19 20 – 24 25 – 29 30 – 34 35 – 39
grupa de varsta (ani)

Diagramele de structură
Punerea în evidenŃă sub formă grafică a structurii unei populaŃii statistice este posibilă apelând
la diagramele de structură. În acest sens se prezintă: dreptunghiul, pătratul, cercul şi semicercul de
structură. Aceste tipuri de grafice permit reprezentarea grafică a seriilor unidimensionale construite cu
mărimi de structură( frecvenŃe relative, greutate specifică). Cel mai des folosit este cercul de structură
denumit şi diagrama sectorială (piechart).

Cercul de structură
Se construieşte un cerc de rază oarecare a cărei suprafaŃă se consideră că reprezintă volumul
întregii populaŃii în cauză (exprimat în frecvenŃe absolute sau relative). Fiecare clasă în care este
divizată populaŃia supusă studiului este reprezentată printr-un sector de cerc de arie direct
proporŃională cu volumul clasei. Trasarea sectorului de cerc presupune determinarea măsurii în grade a
unghiurilor la centru a fiecărui sector. Unghiul la centru de 360o corespunde volumului întregii
populaŃii. Unghiurile sectoarelor de cerc care reprezintă clase din populaŃie trebuie să fie proporŃionale
cu volumul acestora (exprimat în frecvenŃe absolute sau relative). Unui procent îi corespunde 3,6o cu
procentul corespunzător clasei respective.
360o
µ i = f i (%). (2.3)
100%

Exemplu
Din Anuarul Statistic al României din anul 2000 am extras seria care urmează, redând distribuŃia
voturilor electoratului pentru Senat (după redistribuire) la alegerile din 3 noiembrie 1996:

FormaŃiunea
Politică CDR PDSR USD UDMR PRM PUNR
Voturi
ObŃinute (%) 37,0 28,7 16,1 7,7 5,6 4,9

Figura 2.2 Cercul de structură


Rezultatele alegerilor parlamentare pentru Senat din 3 nov 1996

4,90%
5,60%

7,70%

37% CDR
PDSR
USD
16,10% UDMR
PRM
PUNR

28,70%

Semicercul de structură
ConstrucŃia acestuia este asemănătoare cu a cercului de structură, cu a cercului de structură, cu
deosebirea că volumul populaŃiei cercetate este reprezentat printr-un semicerc de 180o, cu respectarea
aceluiaşi principiu conform căruia unghiurile la centru corespunzătoare sectorului prin care se
reprezintă clasele trebuie să fie proporŃionale cu indicatorii care le reprezintă. În acest caz, unui
procent îi corespunde 1,8o, unghiurile la centru corespunzătoare sectoarelor se vor determina înmulŃind
1,8o cu procentele corespunzătoare claselor respective.

Diagramele prin benzi (barchart)


Acest tip de grafic utilizează benzile (barele), pentru a reprezenta distribuŃia unei populaŃii în
raport cu o variabilă cantitativă discretă sau calitativă. Benzile au aceeaşi lăŃime (bază), iar lungimea
(înălŃimea) lor este direct proporŃională cu frecvenŃa clasei reprezentate. Numărul benzilor este egal cu
numărul claselor în care este împărŃită populaŃia studiată. De asemenea se pot lua în considerare o
variabilă sau două. În reprezentări se utilizează benzi simple sau benzi grupate. PoziŃia benzilor poate
fi orizontală sau verticală.

Exemplu
Din Anuarul Statistic al României din anul 2000 am extras seria care urmează, redând nivelul PNB/loc
în $ calculat pe baza puterii de cumpărare în România şi alte Ńări est-europene, în 1998

łara Bulgaria Cehia Polonia România Slovacia Ungaria


PNB/loc ($) 4683 12197 7543 6153 9624 9832
Figura 2.3 Diagramă prin benzi simple
PNB/loc ($) in 1998

14000
12197
12000

9624 9832
10000

8000 7543

6153
6000
4683

4000

2000

0
Bulgaria Cehia Polonia România Slovacia Ungaria

Cronograma (historiograma)
O categorie foarte importantă de serii o constituie seriile cronologice, a căror reprezentare
grafică se realizează prin cronograme. Trasarea unei cronograme se realizează într-un sistem de axe
rectangulare. Se consideră seria cronologică de forma (1.7):
 0 1 2 ... t ... T 
Y :  
 y0 y1 y2 ... yt ... yT 
unde: t = 0,T , reprezintă momentele (sau perioadele) de timp care se reprezintă pe axa absciselor, iar
mărimile yt se reprezintă pe axa ordonatelor. Fiecărei perechi de valori (t, yt), t = 0,T îi corespunde un
punct în planul axelor rectangulare. Unind prin segmente de dreaptă punctele consecutive, astfel
determinate, se obŃine ceea ce se numeşte cronogramă. La construirea cronogramei trebuie avut în
vedere dacă seria cronologică este de momente sau de intervale. Când se reprezintă o serie cronologică
de momente, caz în care indicatorii seriei nu se pot însuma, momentul t se trece în dreptul gradaŃiei
respective. În cazul reprezentării unei serii cronologice de intervale, unde indicatorii se pot însuma,
perioadele se trec în dreptul segmentelor ce reprezintă perioada respectivă.
În acelaşi sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care pot fi
exprimate în aceeaşi unitate de măsură sau în unităŃi de măsură diferite. În cazul în care indicatorii cu
care sunt construite seriile sunt exprimaŃi în aceeaşi unitate de măsură, atunci pe axa ordonatelor se
construieşte o singură scară, iar dacă indicatorii seriilor sunt exprimaŃi în unităŃi de măsură diferite,
atunci se construiesc scări de reprezentare corespunzătoare pe axa ordonatelor. Cronogramele asociate
unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii şi sesizarea
perioadelor critice în evoluŃia acestora.

Exemplu: Din Anuarul Statistic al României (2000) am extras seria care urmează, redând numărul
total de autoturisme înscrise în circulaŃie la sfârşitul anului în România în perioada 1994-1999.
Anul Autoturisme
Înmatriculate
1994 2020017
1995 2197477
1996 2391869
1997 2605465
1998 2822254
1999 2980014
Figura 2.4 Cronograma
Evolutia numarului de autoturisme inscrise in circulatie
in perioada 1994-1999

3500000
numar autoturisme in circulatie

3000000

2500000

2000000

1500000

1000000

500000

0
1993 1994 1995 1996 1997 1998 1999 2000
anul

Cartograma şi cartodiagrama
Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafică a seriilor statistice de
spaŃiu. Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaŃiului (sub formă
de hartă) în interiorul căruia se manifestă fenomenul care este cuantificat de seria de reprezentat. În
interiorul hărŃii astfel realizată, prin diverse culori sau nuanŃe ale aceleiaşi culori, prin haşuri sau prin
diferite diagrame, este evidenŃiată intensitatea dezvoltării fenomenului cercetat precum şi mărimea
indicatorilor seriei.
Cartograma în culori sau nuanŃe ale aceleiaşi culori se utilizează pentru redarea intensităŃii
manifestării unui fenomen. Acest tip de grafic este recomandat în special atunci când intensitatea
fenomenului surprins de seria de spaŃiu nu prezintă o variaŃie prea mare pentru a nu apela la prea multe
culori sau nuanŃe ale acestora, care să îngreuneze citirea graficului.
Când realizarea unei cartograme în culori este prea costisitoare sau culorile şi nuanŃele sunt
greu de reprodus este utilizată cartograma prin haşuri. Şi în acest caz densitatea haşurilor trebuie să
redea diferenŃe de intensitate a fenomenului în spaŃiu surprins de seria de reprezentat. După ce harta a
fost desenată şi împărŃită în conformitate cu stările variabilei de spaŃiu ce stă la baza seriei, în
interiorul fiecărei subdiviziuni se utilizează haşuri a căror intensitate să fie proporŃională cu
intensitatea fenomenului cuantificat de indicatorul cu care s-a construit seria.
Cartodiagrama constituie o modalitate de reprezentare grafică a seriilor de spaŃiu, realizându-se
ca o îmbinare între cartogramă şi diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi,
cerc, pătrat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de spaŃiu ce exprimă volumul
investiŃ iilor străine pe judeŃe, la noi în Ńară, se procedează astfel: în primul rând se desenează harta
României, delimitându-se judeŃele; în cadrul fiecărui judeŃ se desenează o figură geometrică oarecare
convenabil aleasă, a cărei arie sau mărime să fie direct proporŃională cu volumul investiŃiilor străine
din judeŃul respectiv.
Şi acest tip de reprezentare grafică îşi are o largă aplicabilitate în special în urmărirea acelor
fenomene de natură economică sau socială care sunt urmărite în spaŃiu.

Norul statistic
Norul statistic constituie o modalitate de reprezentare grafică a seriilor atributive de repartiŃie
bidimensionale. Se consideră o serie bidimensională de repartiŃie în raport cu variabilele discrete X şi
Y. În sistemul de axe rectangulare xOy se marchează toate punctele de coordonate (xj, yi );
i = 1, I; j = 1, J pentru care frecvenŃele Nij ≠ 0. Mărimea acestor frecvenŃe se poate marca pe grafic în
două moduri:
-
dacă frecvenŃele sunt mici, atunci pentru fiecare punct de pe grafic
(xj, yi ); i = 1, I; j = 1, J pentru care Nij ≠ 0, se marchează atâtea puncte de câte ori se repetă
perechea respectivă.
- dacă însă frecvenŃele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame
areale prin cercuri ale căror arii trebuie să fie proporŃionale cu rădăcina pătrată a frecvenŃelor
pe care le reprezintă.
În cazul în care cele două variabile X şi Y sunt continue, întrucât la intersecŃ ia a două intervale se
formează o rubrică (căsuŃă), frecvenŃele diferite de zero se reprezintă în interiorul acestei rubrici, fie
prin puncte, fie prin diagrame areale cu respectarea unuia din cele două moduri de elaborare mai sus
amintite. PorŃiunea sau fâşia în care sunt cuprinse punctele norului statistic se numeşte corelogramă şi
serveşte în principal legăturii dintre variabile.

Exemplu
Un produs a fost lansat simultan pe 13 pieŃe. Pe aceste pieŃe, produsul a fost propus la preŃuri diferite
(P), veniturile consumatorilor (V) fiind şi ele diferite. Pentru fiecare piată s-a înregistrat un anumit
nivel al cererii (C), rezultatele fiind sintetizate în tabelul următor:
Nr. crt. Cerere (C) PreŃ (P) Venit (V)
1 15,4 1,4 620
2 3,2 5,1 530
3 4,9 2,5 490
4 10,5 1,7 800
5 8,0 1,8 630
6 5,1 3,4 410
7 7,6 2,1 670
8 11,3 1,6 920
9 14,0 3,6 990
10 6,4 3,5 320
11 13,2 1,9 520
12 8,8 1,8 700
13 12,1 1,9 730

Figura 2.5 Norul de puncte în raport cu Pret şi Cerere

18

16

14

12
cerere

10

0
0 1 2 3 4 5 6
pret
CAPITOLUL 3

PARAMETRII REPARTIłIILOR
EMPIRICE UNIDIMENSIONALE

Organizarea datelor rezultate din observarea statistică sub formă de serie de frecvenŃe,
constituie o primă etapă a prelucrării acestora. O serie statistică redă sub formă rezumativă (sintetică)
o primă imagine asupra populaŃiei de studiat în raport cu variabila de la baza seriei.
Pornind de la repartiŃia statistică, ca formă sintetică de prezentare a rezultatelor observării, se
pot deduce o serie de caracteristici specifice populaŃiei considerate, cum ar fi:
- nivelul mediu al variabilei;
- structura populaŃiei în raport cu variabila considerată;
- variaŃia variabilei în raport cu nivelul mediu al acesteia;
- forma după care se dispun unităŃile populaŃiei în jurul valorii medii.
Caracterizarea numerică a acestor aspecte poate fi realizată prin următorii parametri
(caracteristici):
- parametrii tendinŃei centrale;
- parametrii de structură;
- parametrii variaŃiei;
- parametrii concentrării;
- parametrii formei.
Se prezintă, în cele ce urmează, aspecte legate de definirea, semnificaŃia şi modalităŃi de calcul
pentru fiecare parametru.

3.1. Parametrii tendinŃei centrale

Parametrii din această grupă au menirea de a evidenŃ ia poziŃia în jurul căreia se grupează
ansamblul valorilor unei variabile de la baza unei serii. Această poziŃie exprimată printr-un număr se
numeşte poziŃie centrală. Ea poate fi evidenŃiată prin:
- valoarea medie X ; ( )
- valoarea mediană (M e ( X )) ;
- valoarea modală (M o ( X )) .

A. Valoarea medie

Valoarea medie reprezintă principalul parametru care caracterizează tendinŃa centrală a unei
repartiŃii statistice.
În vederea definirii parametrului valoarea medie se consideră o populaŃie statistică studiată în
raport cu variabila cantitativă X şi o funcŃ ie G(x1,x2,…,xR) unde xi, i = 1, R , reprezintă stările variabilei
X. FuncŃia G exprimă o anumită însuşire esenŃială, un atribut al populaŃiei în raport cu variabila X.
Această funcŃie se numeşte funcŃie determinantă.
Prin definiŃie, valoarea medie X a variabilei X este parametrul care lasă invariantă funcŃia
determinantă, adică:
( )
G ( x1 , x 2 ,..., x R ) = G X , X ,..., X . (3.0)
Această egalitate se întâlneşte sub denumirea de relaŃia lui BOIARSKI-KISINI. În funcŃie de
forma analitică a funcŃiei G, din relaŃia (3.0) se deduce expresia analitică (indicatorul) de calcul a
valorii medii X .
Determinarea, pe această cale, a valorii medii X , este destul de anevoioasă. Utilizarea acesteia
presupune stabilirea conŃinutului (semnificaŃ iei) şi a formei analitice a funcŃ iei determinante G, pentru
fiecare caz în parte. Dar, valoarea medie X poate fi definită ca un raport a două mărimi din care se
deduce aceeaşi expresie pentru X ca şi din (3.0).
Există, aşadar, două modalităŃi echivalente de definire a valorii medii, criteriul relaŃiei
determinante a lui Boiarski-Kisini şi criteriul raportului, ultima fiind mai accesibilă. Criteriul
raportului presupune raportarea volumului fenomenului cercetat la volumul populaŃiei. Acesta
presupune cuantificarea volumului fenomenului în funcŃie de natura lui.
Pentru a exemplifica cele prezentate mai sus, se consideră populaŃia familiilor dintr-o
localitate, cercetat ă în raport cu numărul de copii. Datele rezultate din observare se prezintă ca o serie
de repartiŃie de forma:
 xi 
X :  
 N i  i =.1, R
În acest caz, funcŃia determinantă are următoarea formă:
R
G (x1 , x2 ,..., x R ) = ∑ xi N i
i =1
semnificând numărul total de copii din localitatea respectivă. Pentru a găsi numărul mediu de copii pe
familie se particularizează relaŃia (3.0) după cum urmează:
R R

∑x ⋅ N = ∑X ⋅ N
i =1
i i
i =1
i

de unde rezultă:
R

∑x
i =1
i ⋅ Ni
X = R

∑N i =1
i

La acelaşi rezultat se putea ajunge pornind de la faptul că numărul mediu de copii pe familie se poate

exprima ca un raport între numărul total de copii şi numărul de familii din localitatea respectivă, adică:

Nr. ⋅ total ⋅ de ⋅ copii


X= (3.1)
Nr. ⋅ de ⋅ familii
În acest exemplu, fenomenul fiind de matură demografică, volumul acestuia se cuantifică prin numărul
total de copii la nivelul populaŃiei statistice considerate. Aceasta este în direct concordanŃă cu natura şi
semnificaŃia variabilei în raport cu care se face cercetarea statistică.
Cunoaşterea “naturii” parametrului valoare medie, conduce la o definiŃie mai completă şi plină
de semnificaŃie.
Pentru a înŃelege semnificaŃ ia valorii medii X , trebuie subliniat faptul că, în general, variaŃia
unui fenomen, de orice natură, şi în particular variaŃia unei variabile X în raport cu care este cercetată o
populaŃie, este determinată de acŃiunea simultană a două categorii de factori: factori esenŃiali şi factori
neesenŃiali.
În categoria factorilor esenŃiali intră acei factori care acŃionează asupra tuturor unităŃilor
populaŃiei în mod continuu şi în acelaşi sens, determinând, în principal, nivelul de dezvoltare a
variabilei pentru fiecare unitate componentă din populaŃie.
Factorii esenŃiali se conjugă în acŃiunea lor cu factorii neesenŃiali, care, în general, au un
caracter aleator, sunt numeroşi şi neuniform răspândiŃi printre unităŃile populaŃiei.
Fiecare din factorii consideraŃi neesenŃiali acŃionează numai asupra unui anumit număr de
unităŃ i din populaŃie. Ca urmare, aceştia pot contribui fie la creşterea nivelului variabilei (pentru unele
unităŃ i din populaŃie), fie la scăderea nivelului variabilei (pentru alte unităŃi din populaŃie).
La rândul lor factorii esenŃiali nu acŃionează cu aceeaşi intensitate asupra tuturor unităŃilor din
cadrul populaŃie considerate, determinând, în acest fel, variaŃia neuniformă a variabilei respective în
cadrul populaŃiei.
În consens cu cele subliniate mai sus, se poate afirma că parametrul valoarea medie a unei serii
statistice care are la bază variabila X, constituie acel nivel pe care l-ar putea înregistra variabila în
cadrul populaŃiei cercetate în condiŃiile în care factorii neesenŃiali nu s-ar fi manifestat, iar factorii
esenŃiali ar fi acŃionat asupra unităŃilor din populaŃie cu aceeaşi intensitate.
Parametrul valoarea medie, calculat pentru o serie statistică, pune în evidenŃă ceea ce este
comun, general şi esenŃial sub aspectul nivelului de dezvoltare al variabilei, în raport cu care este
studiată o populaŃie.
În raport cu natura variabilei ce stă la baza seriei, cât şi a formei de prezentare a indicatorilor
cu care aceasta este construită, există mai multe posibilităŃi de calcul a valorii medii.
FuncŃia determinată G, sub forma sa cea mai generală, are următoarea expresie analitică:
1
 R K K
G( x1 , x 2 ,..., x R ) =  ∑ xi ⋅ f i  (3.2)
 i =1 

Pornind de la respectare condiŃiei (3.0) se determină expresia de calcul a valorii medii.


Pentru diverse valori ale lui k, în strictă concordanŃă cu conŃinutul şi semnificaŃia funcŃiei G, se
întâlnesc mai multe tipuri de medii:
- media armonică (k = -1);
- media aritmetică (k = 1);
- media patratică (k = 2);
- media cubică (k = 3);
- media de ordinul k în general.
În caz concret, valoarea medie reală X este aceea care se obŃine prin indicatorul (mediu)
rezultat fie prin aplicarea criteriului relaŃiei determinante, fie criteriului raportului.

ModalităŃi de calcul a valorii medii

1. Media aritmetică
Acesta este indicatorul cel mai utilizat în calculul parametrului valoarea medie a unei serii
statistice, aşa cum rezultă din practica statistică.
Se consideră acum două serii statistice de repartiŃie, una formată din frecvenŃe absolute, iar
cealaltă din frecvenŃe relative:
 xi 
X :   (3.4)
 N i  i =.1, R
de unde rezultă:
 xi 
X :   (3.5)
 f i  i =.1, R

Având în vedere respectarea relaŃiei (3.0) se găsesc următoarele expresii de calcul pentru media

aritmetică:

- în cazul seriilor de forma (3.4) se obŃine:


R R

∑ xi ⋅ N i = ∑ X ⋅ N i
i =1 i =1
de unde rezultă:
R

∑x
i =1
i ⋅ Ni
X = R
(3.6)
∑N i =1
i

- în cazul seriilor de forma (3.5) se obŃine:

R R

∑x
i =1
i ⋅ fi = ∑ X ⋅ fi
i =1
de unde rezultă, prin definiŃie, media aritmetică ponderată, exprimată cu ajutorul frecvenŃelor
relative, respectiv:
R

∑x i ⋅ fi R
X= i =1
R
= ∑ xi ⋅ f i (3.7)
∑f
i =1
i
i =1

Expresia (3.6) reprezintă, prin definiŃie, expresia de calcul a mediei aritmetice ponderate pentru o serie
discretă, unde ponderile sunt însăşi frecvenŃele absolute N1, N2,…NR.

Pentru cazul particular în care frecvenŃele absolute sunt egale între ele, adică:

N1 = N2 = … = NR = C

RelaŃia de calcul (3.6) devine:


R R R

∑ xi ⋅ C
i =1
C ⋅ ∑ xi
i =1
∑x
i =1
i
X = R
= = (3.8)
C⋅R R
∑C i =1

reprezentând media aritmetică simplă a unei repartiŃ ii discrete.


Fie o serie de repartiŃie, care are la bază o variabilă continuă X, respectiv:

 xi −1 − xi 
X :   (3.9)
 f i i =.1, R

Dacă s-ar cunoaşte densitatea f(x) a variabilei X, atunci, prin definiŃie, media aritmetică teoretică
(speranŃa matematică) a acesteia, notată cu E(X), ar fi:

+∞
E ( X ) = ∫ xf ( x)dx (3.9’)
−∞

Cum densitatea sa de probabilitate f(x) nu se cunoaşte, aceasta se aproximează în fiecare interval de


variaŃ ie (clasă), prin raportul dintre frecvenŃa intervalului şi lungimea sa, respectiv prin:
f1 f2 fR
, ,....,
x1 − x 0 x 2 − x1 x R − x R −1

Aplicând relaŃia de calcul (3.9’) se deduce expresia de calcul a mediei aritmetice, după cum urmează:
XR R xi
fi
E( X ) = M ( X ) = X1 = X = ∫ xf ( x)dx ≈ ∑ ∫
X0 i =1 xi −1
x
xi − xi −1
⋅ dx =

x
R
fi i R
fi x2 R
fi x 2 − xi2−1
=∑ ⋅ ∫ x ⋅ dx = ∑ ⋅ / xxii −1 = ∑ ⋅ i =
i =1 xi − xi −1 xi −1 i =1 xi − xi −1 2 i =1 xi − xi −1 2
R
fi R
x + xi −1
=∑ ⋅ (xi + xi −1 ) = ∑ i ⋅ fi
i =1 2 i =1 2
x +x
Folosind notaŃiile: i i −1 = xi' , X 1 = M ( X ) = E ( X )
2
'
unde x i reprezintă mijlocul intervalului “i”, ob Ńinem relaŃia:

R
X = ∑ xi' ⋅ f i (3.10)
i =1

RelaŃia (3.10) ne arată că media aritmetică a unei serii de intervale se reduce la media aritmetică a unei

serii discrete în care clasele sunt reprezentate prin mijloacele intervalelor de variaŃie.

Pentru cazul particular de serie care are la bază o variabilă alternativă de forma:
 0 1 
X :  
 N1 N 2 
calculând media aritmetică, obŃinem:
R

∑x
i =1
i ⋅ Ni
0 ⋅ N 1 + 1⋅ N 2 N 2
X = R
= = = f2 (3.11)
N1 + N 2 N
∑Ni =1
i

Ca urmare, media aritmetică a unei serii care are la bază o variabilă alternativă coincide cu frecvenŃa
relativă a stării notată cu 1.
În vederea înŃelegerii mai profunde a celor prezentate mai sus, se consideră, în cele ce urmează,
dou ă exemple concludente în acest sens.

Exemplu
AngajaŃii unei societăŃi comerciale se distribuie după salariul lunar cuvenit conform următoarei serii
de reparaŃie continu ă:

1,6 − 2,0 2,0 − 2,4 2,4 − 2,8 2,8 − 3,2 3,2 − 3,6 3,6 − 4,0 
X :  
 7 13 18 6 4 2 

unde variabila X este exprimată în milioane lei. Pentru determinarea salariului mediu pe angajat, se
recurge la transformarea seriei de intervale într-o serie discretă, după cum urmează:
1,8 2,2 2,6 3,0 3,4 3,8 
X :  
 7 13 18 6 4 2 

Salariul mediu se determină astfel:


6

∑ x ⋅N '
i i
1,8 ⋅ 7 + 2,2 ⋅ 13 + 2,6 ⋅ 18 + 3,0 ⋅ 6 + 3,4 ⋅ 4 + 3,8 ⋅ 2 12 ,72
X = i =1
6
= = = 2,544 mil.lei
50 5
∑N i =1
i

Presupunem că este necesară determinarea ponderii agenŃilor economici,


dintr-un anumit judeŃ care au înregistrat pierderi în anul calendaristic încheiat. Datele înregistrate de la
institu Ńiile competente se aranjează într-o serie alternativă de forma:

 0 1 
X :   .
 850 150 

unde starea 1 pentru variabila X corespunde acelor agenŃi care au înregistrat pierderi în anul
considerat. Media (ponderea) agenŃilor cu capital de stat care au înregistrat pierderi se determină
astfel:
6

∑x ⋅ N '
i i
0 ⋅ 850 + 1 ⋅ 150 150
X = i =1
6
= = = 0,15 (15%).
1000 1000
∑N i =1
i

În judeŃul considerat, 15% din agenŃii economici cu capital de stat au înregistrat pierderi în anul
calendaristic considerat.

ProprietăŃi ale mediei aritmetice

Prezentarea celor mai reprezentative proprietăŃi ale mediei aritmetice prezintă importanŃă din punct de
vedere al aplicaŃiilor practice, ilustrând, în acest fel, şi posibilităŃile de calcul simplificat al acestui
indicator. În acest sens, prezentăm următoarele proprietăŃi:

1º Media aritmetică a unei constante este egală cu constanta respectivă, adică, dacă la baza
unei serii se află o variabilă care a înregistrat o singură stare, X = C, atunci aplicând relaŃia de calcul a
valorii medii se obŃine:

M ( X ) = M (C ) = C = C (3.12)

2º Media produsului dintre o variabilă X şi o constantă k este egală cu produsul dintre media
variabilei X şi constanta respectivă:

R R
M ( k ⋅ X ) = ∑ k ⋅ xi ⋅ fi = k ⋅ ∑ xi ⋅ f i = k ⋅ X = k ⋅ M ( X ) (3.13)
i =1 i =1
unde, am considerat o serie discretă formată cu frecvenŃe relative. În acelaşi mod se procedează şi
în cazul unei serii de frecvenŃe absolute.

3º Media aritmetică a sumei a dou ă sau mai multe variabile este egală cu suma mediilor acestora:

M(X1 + X2 + … + Xr) = M(X1) + M(X2) + … + M(Xr) (3.14)

Pentru a nu îngreuna scrierea şi pentru a înŃelege mai bine, se demonstrează această proprietate pentru
cazul a dou ă variabile X, Y. Se consideră o populaŃie cercetată în raport cu cele dou ă variabile X şi Y
pentru care se cunoaşte X şi Y şi se intenŃionează calcularea mediei M(X + Y). Rezultatele cercetării
se dau sub forma tabelului 1:

Tabelul.1
X
x1 x2 …. xi …. xn TOTAL
Y
ym N1m N2m …. Nim …. Nnm N.m
. .
. ----------------------------------------------- .
. .
yj N1j N2j …. Nij .… Nnj N.j

. .
. .
-----------------------------------------------
. .

y2 N12 N22 …. Ni2 …. Nn2 N.2


y1 N11 N21 …. Ni1 …. Nn1 N.1

TOTAL N1. N2. …. Ni. …. Nn. N

n n

∑ xi ⋅ Ni. ∑x ⋅N i i.
M (X ) = i =1
n
= i =1
;
N
∑N
i =1
i.

m m

∑y
j =1
j ⋅ N. j ∑y
j =1
j ⋅ N. j
M (Y ) = m
= .
N
∑Nj =1
.j
m m m

∑ (x
j =1
1 + y j )N1 j +... + ∑ (xi + y j )N ij + ... + ∑ (xn + y j )N nj
j =1 j =1
M (X +Y ) = n m
=
∑∑ N
i =1 j =1
ij

1 m m m n n n 
=  x1 ⋅ ∑ N ij + ... +xi ⋅ ∑ N ij + ... +xn ⋅ ∑ N nj + ... + y1 ⋅ ∑ N i1 + ... + y j ⋅ ∑ N ij + ... + ym ⋅ ∑ N im  =
N j =1 j =1 j =1 i =1 i =1 i =1 

1
= (x1 ⋅ N1. + ... + xi ⋅ Ni. + ... + xn ⋅ N n. + ... + y1 ⋅ N.1 + ... + y j ⋅ N. j + ... + ym ⋅ N.m ) =
N

x1 ⋅ N1. + ... + xi ⋅ N i. + ... + xn ⋅ N n. y1 ⋅ N .1 + ... + y j ⋅ N. j + ... + ym ⋅ N. m


= + =
N N

= M(X) + M(Y) (3.15)

4º Media produsului a r variabile dou ă câte dou ă independente este egală cu produsul mediilor
acestora:

M(X1 · X2 … XR) = M(X1) · M(X2) … M(Xr) (3.16)

Din aceleaşi motive ca şi în cazul proprietătii anterioare, se va demonstra această proprietate pentru
cazul particular, când r = 2. Vom nota cele dou ă variabile cu X şi Y. Pornind de la seria
bidimensională dată sub formă tabelară (vezi tabelul nr.1), rezultă:
n m

∑∑ x
i =1 j =1
i ⋅ y j ⋅ N ij
M (X ⋅ Y ) = n m
; (3.17)
∑∑N
i =1 j =1
ij

Din ipoteză, X şi Y sunt independente, deci putem scrie:


P(X = xi şi Y = yj) = P(X = xi) · P(Y = yj)
i = 1, n; j = 1, m
relaŃ ie care tradusă în limbajul frecvenŃelor devine:
Nij = Ni. · N.j i = 1, n; j = 1, m (3.18)
Înlocuind relaŃia (3.18) în (3.17) avem:
n m n m

∑∑ xi ⋅ y j ⋅ Ni. ⋅ N. j
i =1 j =1
∑ xi ⋅ Ni. ⋅ ∑ y j ⋅ N. j
i =1 j =1
M (X ⋅Y ) = n m
= n m
=
∑∑ N
i =1 j =1
i ⋅Nj ∑ N ⋅ ∑⋅ N
i =1
i.
j =1
.j

n m

∑ xi ⋅ Ni. ∑y
j =1
j ⋅ N. j
i =1
= n
⋅ m
= M ( X ) ⋅ M (Y ).
∑N i =1
i. ∑⋅ N
j =1
.j

Pornind de la cele patru proprietăŃi ale mediei aritmetice se pot deduce o serie de consecinŃe ale
acestora, frecvent întâlnite în calcule statistice privind media. Prezentăm în acest sens următoarele
consecinŃe:
a) Făcând media sumei dintre o variabilă X şi o constantă C se obŃine suma dintre media variabilei
şi constanta respectivă:

M(X + C) = M(X) + C (3.19)

Această proprietate se ob Ńine ca o particularizare a proprietăŃii 3°, pentru r = 2 şi X2 = C. Dacă


constanta C are semnul negativ, atunci relaŃ ia (3.19) devine:
M(X – C) = M(X) – C

De unde rezultă:

M(X) = M(X – C) + C (3.20)

Această ultimă relaŃie, 3.20, conduce la concluzia conform căreia, dacă stările unei variabile
cantitative cresc sau descresc cu o constantă C, atunci şi media noii variabile obŃinute creşte sau
descreşte cu acea constantă.

b) Dacă valorile unei variabile X sunt simplificate cu o constantă, atunci media variabilei X
descreşte de acel număr de ori.
Dacă în proprietatea 2°, constanta este de forma 1/k, atunci, relaŃia (3.13) devine:

X 1
M   = ⋅ M (X )
k  k
de unde rezultă:
X
M (X ) = k ⋅ M   (3.21)
k 
c) Primele două consecinŃe conduc la relaŃia de calcul simplificat a indicatorului media
aritmetică. În acest sens, se face următoarea transformare asupra variabilei X:

X −C
Z= (3.22)
k

unde C şi K sunt două constante, iar Z numele variabilei rezultate.


Aplicând operatorul medie asupra relaŃiei (3.22) se obŃine:

M(k · Z) = M(X) – C

M(X) = M(Z) · k + C

 X −C
M (X ) = M  ⋅k +C (3.23)
 k 

Această ultimă relaŃie (3.23), constituie formula de calcul simplificat a mediei aritmetice.
Avantajul maxim privind aplicarea acestei relaŃii se obŃine alegând pentru constanta C starea de
mijloc a seriei care are la bază variabila X, iar pentru k valoarea care reprezinta cel mai mare
divizor comun al tuturor diferenŃelor X-C.
Formula (3.23) se particularizează după cum seria, care are la bază variabila X, este o serie
construită cu frecvenŃe absolute sau cu frecvenŃe relative:
- în cazul unei serii construită cu frecvenŃe absolute, de forma:
x 
X :  i 
 N i  i =1, R
se ob Ńine:
 R  xi − C  
 ∑  k N i 
X =  i =1  R  ⋅k + C (3.24)
 
 ∑ Ni 
 i =1 
- în cazul unei serii construite cu frecvenŃe relative, de forma:
x 
X :  i 
 f i  i =1, R
se obŃine:
 R  x −C 
X = ∑  i  f i  ⋅ k + C. (3.25)
 i =1  k  
Formulele (3.24) şi (3.25) se aplică în mod frecvent, sub denumirea de formula de calcul
simplificat, pentru determinarea mediei aritmetice, în cazul seriilor construite cu indicatorii
frecvenŃă absolută şi relativă.
d) Proprietatea de adiŃiune a mediei aritmetice.

Se presupune o populaŃie care este structurată în raport cu un criteriu C cantitativ sau


calitativ, în P clase, C1, C2, …, Cp. Atunci media aritmetică a variabilei X, în raport cu care este
studiată populaŃia, se poate ob Ńine ca o medie a mediilor variabilei din cele P clase.
În vederea demonstrării afirmaŃiei făcută mai sus, se consideră populaŃia dată, structurată în
raport cu criteriul C în următorul tabel cu două intrări:

Tabelul nr.2
C
C1 C2 …. CP TOTAL
X
xR N1R N2R …. NPR N.R
. .
. .
-------------------------------
. .

x2 N12 N22 …. NP2 N.2


x1 N11 N21 …. NP1 N.1

TOTAL N1. N2. …. NP. N

Media aritmetică a variabilei X, X , se calculează conform relaŃiei:


1 R
X= ⋅ ∑ x i ⋅ N .i
N i =1
În fiecare din cele P clase, se calculează mediile aritmetice respective:
1 R
X1 = ⋅ ∑ xi ⋅ N1i
N1. i =1
1 R
X2 = ⋅ ∑ xi ⋅ N 2i
N 2. i =1
................................
1 R
XP = ⋅ ∑ xi ⋅ N Pi .
N P. i =1

Făcând media acestor medii şi notând-o cu X / C rezultă:


1 P 1
X /C = (
∑ X i ⋅ Ni. = N X 1 ⋅ N1. + X 2 ⋅ N 2. + .... + X P ⋅ N P. =
N i =1
)
1
= [(x1 ⋅ N11 + x2 ⋅ N12 + ... + xR ⋅ N1R + ) + ( x1 ⋅ N 21 + x2 ⋅ N 22 + ... + xR ⋅ N 2 R + ) +
N
+ ... + ( x1 ⋅ N P1 + x 2 ⋅ N P 2 + ... + x R ⋅ N PR )] =
1
= [ x1 ( N11 + N 21 + ... + N P1 ) + ... + x2 ( N12 + N 22 + ... + N P 2 ) + ... + xR (N1R + N 2 R + ... + N PR )] =
N
1 1 R
= (x1 ⋅ N.1 + x2 ⋅ N.2 + ... + xR ⋅ N. R ) = ∑ xi ⋅ N.i = X .
N N i =1

Ca urmare a celor de mai sus, rezultă:


X = X / C.
Următoarele trei proprietăŃi ale mediei aritmetice nu sunt lipsite de importanŃă atât pentru uşurinŃa
calculelor cât şi pentru capitolele care urmează.

5° Dacă frecvenŃele absolute cu care s-a construit o serie, se simplifică cu o constantă, atunci media
aritmetică a seriei respective nu se modifică.
Se consideră seria de forma:
 xi 
X :  
 N i  i =1, R
Ni
Se notează cu N i' = , unde d reprezintă o valoare cu care se divid toate frecvenŃele absolute. Se
d
formează o nouă serie cu aceste frecvenŃe:
x 
X ' :  i ' 
 N i =1, R
a cărei medie aritmetică este:
R R
Ni R

'
∑ xi ⋅ N i'
i =1
∑ xi ⋅
i =1 d
∑x
i =1
i ⋅ Ni
X = = = =X
R R
Ni R

∑N i =1
i
'
∑ i =1 d
∑N i =1
i

Pentru a se obŃine un maxim de eficienŃă din punct de vedere a volumului calculelor mediei
aritmetice, este nevoie ca d să fie ales drept cel mai mare divizor comun a tuturor frecvenŃelor
absolute cu care a fost construită seria.

6° Media aritmetică a unei serii este cuprinsă între valoarea minimă şi valoarea maximă pe care o
înregistreză variabila X, care stă la baza seriei.
x min ≤ X ≤ x max
Această dublă inegalitate rezultă din următorul şir de inegalităŃi:

R R R

∑ x min ⋅ N i
i =1
∑ xi ⋅ N i
i =1
∑x
i =1
max ⋅ Ni
x min = R
≤ R
=X≤ R
= x max .
∑N
i =1
i ∑N i =1
i ∑N
i =1
i

7° Suma abaterilor liniare ale valorilor unei variabile de la media aritmetică este nulă.
Pornind de la o serie, care are la bază o variabilă cantitativă X, de forma:
x 
X :  i 
 f i  i =1, R
printr-o transformare adecvată rezultă următoarea serie:

(X − X ):  x i −X

f i  i =1, R
(3.26)

Calculând media aritmetică a seriei (3.26) se ob Ńine:
R
( ) ( ) ( ) ( )
M X − X = ∑ x i − X ⋅ f i = x i − X ⋅ f 1 + x 2 − X ⋅ f 2 + ... + x R − X ⋅ f R = ( )
i =1

= x1 ⋅ f 1 + x 2 ⋅ f 2 + ... + x R ⋅ f R − X ( f 1 + f 2 + ... + f R ) = X − X = 0
tocmai ceea ce s-a afirmat în enunŃul acestei proprietăŃi.

8° Proprietatea de minim a mediei aritmetice, se formulează astfel:


M ( X − X ) 2 ≤ M ( X − x0 ) 2
unde x0 este un număr real oarecare.
Într-adevăr, din:
ϕ (x 0 ) = M ( X − x 0 ) 2
rezultă:
ϕ ' ( x 0 ) = −2 M ( X − x 0 ) = 0
de unde:
x0 = M(X) c.c.t.d.
Deci, valoarea medie a unei serii calculată cu media aritmetică, în sensul metricii folosite, e cea mai
apropiată de ansamblul valorilor variabilei X.

Exemplu
Reconsiderăm exemplul cu privire la distribuŃia angajaŃilor unei societăŃi comerciale în raport cu
salariul lunar:
1,6 − 2,0 2,0 − 2,4 2,4 − 2,8 2,8 − 3,2 3,2 − 3,6 3,6 − 4,0 
X :  
 7 13 18 6 4 2 
unde valorile variabilei X sunt exprimate în milioane lei.
Aplicând relaŃia de calcul simplificat (3.24), unde C=260, iar k=40, se obŃine:

 R  xi − C  
 ∑  k N i 
X =  i =1  R  ⋅k +C =
 
 ∑ Ni 
 i =1 
 1,80 − 2,60   2,20 − 2,60   2,60 − 2,60   3,00 − 2,60   3,40 − 2,60 
 ⋅7 +   ⋅13 +   ⋅18 +   ⋅6 +  ⋅4
 40   40   40   40   40 
= ⋅ 40 +
50
 3,80 − 2,60 
 ⋅2
40  ⋅ 40 + 2,60 =  − 0,14 − 0,13 + 0,06 + 0,08 + 0,06  ⋅ 40 + 2,60 = − 0,28 + 2,60 =
+  
50 50 5
= 2,544 .. mil.lei

2. Media armonică

Se consideră o serie de forma:


 xi 
X :   (3.27)
 N i  i =1, R

În cazul unei serii discrete de forma (3.27), media armonică notată cu X −1 se defineşte prin:
R

∑N
i =1
i
X −1 = (3.28)
R
1

i =1 x i
⋅ Ni

numită şi formula mediei armonice ponderate.


Dacă ponderile sunt egale între ele, adică N1=N2=…=NR=N*, atunci relaŃia (3.28) devine:
R

∑N
i =1
*

R
X −1 = R
= R
(3.29)
1 1

i =1 xi
⋅N* ∑
i =1 xi
care reprezint ă formula mediei armonice simple.
În cazul unei serii care are la bază o variabilă continuă X, respectiv,
x − x 
X :  i −1 i 
 N i i =1, R
procedând ca la media aritmetică, pentru media armonică rezultă:
R

∑N
i =1
i
X −1 = (3.30)
R
1
∑ '
i =1 x i
⋅ Ni

unde xi’ reprezintă mijlocul intervalului “i”, i = 1, R .


Şi în acest caz, dacă ponderile sunt egale, se obŃine relaŃia de calcul a mediei armonice simple, de
forma:
R
X −1 = R
(3.31)
1
∑ i =1 x i'
ProprietăŃi ale mediei armonice

Câteva proprietăŃi ale acestui indicator sunt absolut necesare în vederea simplificării volumului de
calcule necesare pentru obŃinerea valorii medii.
1˚ Media armonică este cuprinsă între cea mai mică şi cea mai mare valoare a variabilei X,
înregistrată în populaŃia cercetată
x min ≤ X −1 ≤ x max
Dubla inegalitate este rezultată din:
R R R

∑ Ni
i =1
∑ Ni
i =1
∑N
i =1
i
x min = R
≤ X −1 = R
≤ R
= x max
1 1 1
∑x
i =1
⋅ Ni ∑
i =1 x i
⋅ Ni ∑x
i =1
⋅ Ni
min max

2˚ Dacă valoarea medie a unei serii având la bază variabila X, a fost calculată cu indicatorul media
armonică, atunci, trebuie să fie verificată următoarea relaŃ ie:
R
1 R
1
∑x
i =1
⋅ Ni = ∑
i =1 X −1
⋅ Ni
i

respectiv, relaŃia determinantă Boiarski-Kisini.

3˚ Media armonică a unei serii nu se modifică dacă ponderile ce intervin în calculul acestui
indicator se simplifică cu aceeaşi constantă. Efectul maxim privind simplificarea volumului de
calcule, se ob Ńine dacă se alege cel mai mare divizor comun al tuturor ponderilor, cu care urmează a
se simplifica acestea.
4˚ Pentru dou ă serii, care au la bază aceeaşi variabilă X de forma:
x  x 
X :  i  ; X :  i 
 N i  i =1, R  mi  i =1, R
între care există următoarea relaŃie de legătură:
m i = k ⋅ x i ⋅ N i ; i = 1, R (3.32)
media armonică apare ca oa formă transformată a mediei aritmetice.
Următoarele egalit ăŃi sunt relevante în acest sens:
R R R

∑ mi
i =1
∑ k ⋅ xi ⋅ N i
i =1
∑x
i =1
i ⋅ Ni
X −1 = = = =X
R
1 R
1 R

∑i =1 xi
⋅ mi ∑
i =1 x i
⋅ k ⋅ xi ⋅ N i ∑N i =1
i

Ca urmare, dacă între cele două sisteme de ponderi mi şi Ni există o relaŃie de forma (3.32), media
armonică este identică cu media aritmetică.
Exemplu
Se consideră o întreprindere industrială formată din 5 secŃii unde se cunosc productivităŃile medii în
fiecare secŃie la nivel de muncitor cât şi a realizărilor totale la nivelul fiecărei secŃii. Datele din
tabelul 3 redau acest lucru:
Tabelul nr.3
SecŃia Productivitatea medie pe muncitor TOTAL REALIZĂRI
1 300 300.000
2 400 450.000
3 350 400.000
4 380 420.000
5 420 500.000

şi sunt exprimate în mii lei.

Pornind de la acest tabel, se construieşte următoarea serie:

 300 400 350 380 420 


X :   .
 300.000 450.000 400.000 420.000 500.000 

unde se respectă relaŃia mi = xi Ni, Ni reprezentând numărul de muncitori din secŃie i, i = 1,5 . Ca
urmare, valoarea medie a acestei serii se poate determina folosind media armonică, dup ă cum
urmează:
R

∑m
i =1
i
X −1 = R
=
1

i =1 xi
⋅ mi

300.000 + 450.000 + 400.000 + 420.000 + 500.000


= =
1 1 1 1 1
⋅ 300.000 + ⋅ 450.000 + ⋅ 400.000 + ⋅ 420.000 + ⋅ 500.000
300 400 350 380 420

2.070.000
= = 372.168 [lei / muncitor ]
5562
Valoarea medie, astfel obŃinută, reprezintă productivitatea medie pe muncitor la nivel de
întreprindere, într-o perioadă considerată.

Exemplu
a) Se cunosc următoarele date pentru un grup de Ńări din Europa Centrală:
Ungaria România Austria Cehia Slovacia
di 107 93 97 129 110
Ni 9.981.334 22.303.522 8.150.835 10.241.138 5.414.937
unde: di – densitatea medie a populaŃiei Ńării “i” (loc/km2);
Ni – numărul locuitorilor din Ńara “i” (loc).
Să se calculeze densitatea medie a populaŃiei pe ansamblul Ńărilor supuse observării.
Dacă considerăm densitatea medie a grupului de Ńări ca o medie aritmetică ponderată, ponderile fiind
numărul de locuitori ai Ńării respective, obŃinem:
∑i d i ⋅ N i
d = = 104 loc/km2
∑ ii
N
b) Se cunosc următoarele date pentru un grup de Ńări din Europa Centrală:
Ungaria România Austria Cehia Slovacia
di 107 93 97 129 110
Si 93.030 238.392 83.871 78.866 48.845
unde: di – densitatea medie a populaŃiei Ńării “i” (loc/km2);
Si – suprafaŃa Ńării “i” (km2).
Să se calculeze densitatea medie a populaŃiei pe ansamblul Ńărilor supuse observării.
Dacă considerăm densitatea medie a grupului de Ńări ca o medie aritmetică ponderată, ponderile fiind
suprafeŃele Ńărilor respective, ob Ńinem:
∑i d i ⋅ S i
d = = 102 loc/km2
∑ i S
i
La punctele a) şi b) se obŃin rezultate diferite. Se pune problema care dintre cele dou ă relaŃii de calcul
este corectă.

Conform criteriului raportului, valoarea medie trebuie să fie un raport just, logic, între dou ă mărimi. În
cazul nostru densitatea medie este egală cu numărul de locuitori pe ansamblul Ńarilor considerate
raportat la suma suprafeŃelor Ńărilor respective. Ob Ńinem astfel în cele dou ă cazuri:

a) Dacă avem la dispoziŃie date cu privire la di şi Ni :


N total ∑N i
i ∑N
i
i
d= = =
S totala ∑S i
i
∑d
1
Ni
i i
b) Dacă avem la dispoziŃie date cu privire la di şi Si :

N total ∑N i
i ∑d ⋅ S
i
i i
d= = =
S totala ∑S i
i ∑S i
i

Ca urmare, calculul densităŃii medii ca o medie aritmetică ponderată, ponderile fiind numărul de
locuitori ai Ńărilor respective este incorect. Dacă vrem să folosim numărul de locuitori ca ponderi,
vom putea doar printr-o medie armonică ponderată.

3. Media geometrică
Pentru o serie care are la bază variabila discretă X, formată cu frecvenŃe absolute, media geometrică
notată cu X g (sau X o ) este definită prin expresia:

X g = N x1N 1 ⋅ x2N 2 ...xRN R (3.33)


Din (3.33), pentru media geometrică ponderată exprimată cu frecvenŃe relative se deduce:
1/ N
N1 N2 NR  R N R
Ni / N
R
f
Xg = N
x
1
⋅ x 2 ... x R =  ∏ x i i 
 i =1 
= ∏ xi
i =1
= ∏ xi i
i =1
(3.34)

Dacă variabila X, de la baza seriei este de variaŃie continuă, atunci relaŃiile de calcul pentru
diversele variante de medie geometrică, rămân variabile cu singura modificare că valorile xi,
i = 1, R , se înlocuiesc cu mijloacele intervalelor de variaŃie, calculate conform formulei:
xi −1 + xi
xi' = , i = 1, R (3.35)
2
4. Media de ordin superior (k>1)
În practica statistică, privind calculul valorii medii a unei serii atributive unidimensionale, cei mai
frecvent utilizaŃi indicatori sunt media aritmetică şi media armonică. Există totuşi situaŃii când seria
statistică are la bază o variabilă ale cărei stări sunt puteri superioare lui 1 (xik ) . Valoarea medie, a
unor astfel de serii, se determină cu ajutorul momentului de ordin corespunzător la care sunt
ridicate stările variabilei. Indicatorul media pătratică, notat cu X 2 , corespunde cazului particular
când valorile variabilei X sunt la puterea 2, (k=2). RelaŃia de calcul pentru media pătratică este
următoarea:
R

∑x
i =1
2
i ⋅ Ni
X2 = R
(3.36)
∑N
i =1
i

Formula de calcul (3.36) corespunde cazului când seria are la bază o variabilă X şi este construită
cu frecvenŃe absolute. În cazul în care seria este construită cu frecvenŃe relative, relaŃia de calcul
pentru media pătratică este:
R
X2 = ∑xi =1
i
2
⋅ fi (3.37)

În general, indicatorul media de ordinul k, notat cu X k , se determină după cum urmează:


- pentru serii formate cu frecvenŃe absolute:
R

∑x i
k
⋅ Ni
Xk = k i =1
R
(3.38)
∑N
i =1
i

- pentru serii formate cu frecvenŃe relative:


R
Xk = k ∑x
i =1
k
i ⋅ fi (3.39)

Indicatorul media de ordinul k constituie forma cea mai generală, de la ea putându-se ajunge la
ceilalŃ i indicatori de calcul pentru diferite valori particulare date lui k. Pornind de la relaŃia (3.39),
pentru diverse valori ale lui k se obŃine:
−1
 R 
k = -1 X −1 =  ∑ x i−1 ⋅ f i  - media armonică
 i =1 
R
k=1 X 1 = ∑ xi ⋅ fi - media aritmetică
i =1

1/ 2
 R 
k=2 X 2 =  ∑ x i2 ⋅ f i  - media pătratică
 i =1 
1/3
 R 
k=3 X 3 =  ∑ x i3 ⋅ f i  - media cubică
 i =1 
B. Valoarea mediană
Valoarea mediană, notată cu M e este acea valoare a variabilei cantitative X care împarte repartiŃia în
două părŃi egale, respectiv:
N
FN (Me ) = 1 / 2 sau N (M e ) = (3.41)
2
Calculul valorii mediane se face diferenŃiat, după cum seria are la bază o variabilă discretă sau
continuă.
Pentru o repartiŃie discretă, calculul medianei nu implică probleme deosebite şi nici un volum
mare de calcule.
Se consideră o repartiŃie cu frecvenŃe absolute:
 x x2 ... xi ... xR 
X :  1 . (3.42)
 N1 N 2 ... N i ... N R 
În calculul valorii mediane a unei serii discrete, pot apărea două situaŃii:
a) volumul N al populaŃiei este un număr impar;
b) volumul N al populaŃiei este un număr par.
În ambele cazuri, calculul medianei presupune, în prima fază, determinarea rangului medianei,
notat cu rM e , conform următoarei relaŃ ii:

1 R
rM e = ⋅ ∑ Ni = N (M e ) (3.43)
2 i =1
a) Dacă volumul populaŃiei N este un număr impar, rangul medianei este un număr zecimal a cărui
N 
parte întreagă   indică numărul de unităŃi din populaŃie pentru care variabila X a înregistrat
2
valori mai mici ca mediana. Ca urmare, M e trebuie să fie valoarea imediat următoare celei de rang
N 
 2  adică:
 

M e = x  N   (3.44)
   +1 
 2  

b) Dacă volumul populaŃiei este un număr par, rangul medianei este un număr întreg şi ca urmare la
mijlocul seriei nu se mai află o valoare a variabilei X cu care să coincidă mediana ci se găsesc două
valori, mediana calculându-se în acest caz ca media aritmetică a acestora. RelaŃia de calcul a
medianei, în acest caz, este:
x N  + x  N  
2
    2  +1
   
Me = (3.45)
2
Pentru o repartiŃie continuă, calculul valorii mediane presupune verificarea egalităŃii (3.41) şi ca
urmare, trebuie cunoscută densitatea de repartiŃie f(x). Determinarea funcŃiei f(x) implică un volum
mare de calcule şi deci, din acest motiv, în activitatea practică f(x) este aproximat. Acest lucru va
conduce la o expresie aproximativă de calcul a valorii mediane, care necesită un volum redus de
calcule.
Pentru acesta se consideră o repartiŃie continuă în raport cu variabila X, şi anume:
 x − x1 x1 − x 2 ... x i −1 − x i ... x R −1 − x R 
X :  0 . (3.46)
 N1 N2 ... Ni ... N R 

unde intervalele xi-1-xi, i = 1, R pot fi de lungime egală sau neegală. Calcularea rangului medianei
va permite stabilirea intervalului în care se află valoarea mediană, interval numit şi interval median.
Se cumulează frecvenŃele absolute din aproape în aproape până ce este îndeplinită inegalitatea:
1
N 1 + N 2 + ... + N i ≥ N
2
Ultima frecvenŃă Ni cumulată, ne permite să indicăm intervalul median [x i −1 − x i ) . Ca urmare,
M e ∈ [xi-1-xi), şi deci se poate scrie:
M e = xi −1 + ∆ x (3.47)
unde ∆ x este distanŃa de la limita inferioară a intervalului median (xi-1) până la mediană. Pentru
determinarea medianei mai trebuie cunoscută această distanŃă ∆ x .
Determinarea distanŃei ∆ x , de la limita inferioară a intervalului median până la mediană se poate
face în ipoteza că în intervalul median frecvenŃa absolută se distribuie proporŃional cu lungimea
intervalului, de unde rezultă:
N ( M e ) − N ( xi −1 ) Ni
= (3.48)
∆x xi − xi −1
unde:
N ( M e ) - reprezintă frecvenŃa absolută cumulată până la mediană (rangul medianei);

N ( x i −1 ) - reprezintă frecvenŃa absolută cumulată până la limita inferioară a intervalului median care
se mai numeşte şi suma frecvenŃelor intervalelor premergătoare intervalului median.
Valoarea necunoscută ∆ x rezultă din egalitatea (3.48):
N ( M e ) − N ( xi −1 )
∆x = ⋅ ( xi − xi −1 )
Ni
care înlocuită în (3.47), permite găsirea formulei aproximative de calcul a medianei:
N ( M e ) − N ( xi −1 )
M e = xi −1 + ⋅ ( xi − xi −1 ) (3.49)
Ni
Introducându-se următoarele notaŃii mai sugestive:
xi −1 = xM e - limita inferioară a intervalului median;

Ni = N M e - frecvenŃa absolută a intervalului median;

xi − xi −1 = lM e - lungimea intervalului median,


formula aproximativă de calcul a medianei devine:
N ( M e ) − N ( xM e )
M e = xM e + ⋅ lM e (3.50)
NM e
Aceeaşi expresie de calcul a medianei este folosit ă şi în cazul în care seria continuă este formată din
frecvenŃele relative, cu următoarele precizări:
1 R 1
rM e = FN (M e ) = ⋅ ∑ fi =
2 i −1 2
FN (M e ) - reprezintă suma frecvenŃelor relative ale intervalelor premergătoare intervalului
median;
f M e - notaŃie sinonimă pentru N M e reprezentând frecvenŃa relativă a intervalului median.

Cu aceste notaŃii relaŃia (3.50) devine:


FN ( M e ) − FN ( xM e )
M e = xM e + ⋅ lM e
FM e

Pe lângă procedeul expus anterior, mai există şi un procedeu grafic de calcul a valorii medianei.
Acest procedeu poate conduce la rezultate cel puŃin la fel de bune, mai ales în cazul seriilor care au
la bază o variabilă continuă, deoarece, nu mai este necesară persupunerea repartizării proporŃionale
a frecvenŃei în intervalul median, cu condiŃia ca reprezentarea grafică a seriei să se facă cât mai
exact posibil. În acest sens, se construieşte poligonul cumulativ crescător al seriei şi se duce o
paralelă la axa Ox prin punctul de ordonată 1/2·N. Abscisa punctului de intersecŃie a acestei paralele
cu poligonul cumulativ crescător va fi valoarea mediană a seriei respective.

Exemplu
Următorul exemplu, privind calculul medianei unei serii, va permite evidenŃierea tehnicii de calcul
a acestui parametru cât şi semnificaŃia lui. RepartiŃia angajaŃ ilor într-o societate comercială, în
raport cu salariul lunar, este caracterizată prin următoarea serie:
160 − 200 200 − 240 240 − 280 280 − 320 320 − 360 360 − 400 
X :  
 7 13 18 6 4 2 
unde valorile variabilei X sunt exprimate în dolari.
Prima etapă în calculul medianei îl constituie calculul rangului, după cum urmează:
1 R 1 50
rM e = ⋅ ∑ N i = (7 + 13 + 18 + 6 + 4 + 2 ) = = 25
2 i =1 2 2
Însumând frecvenŃele succesiv până ce valoarea obŃinută depăşeşte rangul, rezultă că intervalul care
va conŃine mediana este [240-280). Fiind vorba de o serie care are la bază o variabilă continuă,
mediana se determină conform relaŃiei(3.50).
N ( M e ) − N ( xM e ) 25 − 20 100
M e = xM e + ⋅ lM e = 240 + ⋅ 40 = 240 + = 251,111$
NM e 18 9

Ca urmare, jumătate din angajaŃ ii societăŃii respective câştigă cel mult 251,111$ şi cealaltă jumătate
câştigă cel puŃin 251,111$ în perioada în care s-a făcut observarea. Relevantă, în acest sens, pare a
fi următoarea serie construită, având în vedere mediana:
160,000 − 251,111 521,111 − 400,000 
 
 50% 50% 
care constituie repartiŃia celor două jumătăŃi din populaŃia angajaŃilor societăŃii respective.
C. Valoare modală
Valoarea modală Mo(X) a unei repartiŃii reprezintă aceea valoare a variabilei X căreia în corespunde
frecvenŃa cea mai mare. Acest parametru se mai numeşte modul, valoare dominantă, sau modă şi se
notează cu Mo.

Mod de calcul:
a) Pentru o serie de repartiŃie discretă, dată sub forma:
 x x ... x i ... x R 
X :  1 2 . (3.51)
 f 1 f 2 ... f i ... f R 
valoarea modală se citeşte direct din serie, nefiind nevoie de nici o tehnică sau formulă de calcul. În
cazul acestui tip de serie, valoarea modală va fi acea valoare a variabilei X pentru care frecvenŃa
este cea mai mare.
b) Pentru serii de repartiŃie continue, respectiv:
 x − x1 x1 − x 2 ... x i − 2 − x i −1 x i −1 − x i x i − x i +1 ... x R −1 − x R 
X :  0  (3.52)
 f1 f2 ... f i −1 fi f i +1 ... fR 
modala nu poate fi determinată direct. Intervalul căruia îi corespunde frecvenŃa cea mai mare, se
numeşte intervalul modal şi va conŃine modala. Să presupunem că intervalul modal este xi-1-xi.
Se vor prezenta două modalităŃi de calcul a modalei, una care se bazează pe aproximarea densităŃii
de probabilitate f(x) de-a lungul a trei intervale de variaŃie (intervalul modal şi cele două intervale
cu care se învecinează), iar cealaltă metodă permite găsirea unei formule de calcul aproximativ, a
cărei deducŃie se bazează pe principiul repartizării uniforme a frecvenŃei de-a lungul intervalului
modal.
Prima metodă de calcul a modalei presupune estimată densitatea de probabilitate f(x). Odată găsită
f(x), valoarea modală va fi acea valoare a lui x pentru care f(x) înregistrează valoarea maximă.
Această metodă se bazează pe posibilitatea aproximării densităŃii f(x) de-a lungul celor 3 intervale
precizate cu un arc de parabolă de forma:
f(x) = ax2 + bx + c
unde, a, b, c sunt trei parametri ce trebuie determinaŃi. Se reprezintă grafic seria, doar pentru cele
trei intervale, (printr-o histogramă) după cum urmează:
Estimarea celor trei parametrii a,b şi c se face utilizând metoda ariilor, conform căreia suprafaŃa
mărginită de acrcul de parabolă, axa Ox şi cele două perpendiculare ridicate în punctele de abcisă xi-
2 şi xi+1 şi suprafaŃa celor trei dreptunghiuri care formează histograma seriei de-a lungul celor trei
intervale, să fie egale. Respectarea acestei condiŃii conduce la următorul sistem de ecuaŃii:
 x i −1 2
(
 ∫ ax + bx + c dx = f i −1)
 xi − 2


 xi
(
 ∫ ax + bx + c dx = f i
2
) (3.53)
 x i −1


 x i +1 2
( )
 ∫ ax + bx + c dx = f i +1
 xi
dacă seria este de intervale egale. Un calcul elementar de integrale definite printr-o funcŃie
polinomială, transformă egalităŃile (3.53) într-un sistem liniar de ecuaŃii în necunoscutele a, b, c.
Rezolvând acest sistem, se află estimaŃiile pentru cei trei parametri [5].
Determinarea modalei implică găsirea punctului pentru care f(x) îşi atinge maximul. Acest punct va
fi chiar modala şi se calculează din condiŃia:
f’(x) = 0 (3.54)
Rezolvând ecuaŃia (3.54), soluŃia acesteia x = Mo reprezintă valoarea modală dacă mai are loc şi
următoarea condiŃie:
f’’(Mo) < 0 (3.55)
A doua metodă de calcul a modalei se bazează pe repartizarea uniformă a frecvenŃei de-a lungul
intervalului modal. Presupunând că intervalul xi-1-xi este intervalul modal, următoarea schemă
grafică:
∆x

xi-1 Mo xi

ne permite să scriem:
Mo = xi-1 + ∆ x (3.56)
unde s-a notat cu ∆ x distanŃa necunoscută de la limita inferioară a intervalului modal până la
modală. Găsirea necunoscutei ∆ x se face din următoarea egalitate de rapoarte:
f i − f i −1 f i − f i +1
= (3.57)
∆x (x i − x i −1 ) − ∆ x
care semnifică repartizarea uniformă a frecvenŃelor de-a lungul intervalului modal. Pentru
simplitatea expresiilor se introduc următoarele notaŃii:
f i − f i −1 = ∆ −1
f i − f i +1 = ∆ 1
x i − x i −1 = l M o
care înlocuite în (3.57) conduc la:
∆ −1 ∆1
= (3.58)
∆ x lMo − ∆ x

Printr-un calcul simplu, din (3.58), rezultă următoarea expresie de calcul pentru ∆ x :
∆ −1
∆x = ⋅ lMo
∆ −1 + ∆ 1
care înlocuită în (3.56), conduce la formula de calcul aproximativă a modalei:
∆ −1
M o = x i −1 + ⋅lMo (3.59)
∆ −1 + ∆ 1
Dacă se face notaŃia xMo=xi-1, atunci relaŃia (3.59) devine:
∆ −1
M o (x ) = x M o + ⋅lMo (3.60)
∆ −1 + ∆ 1
unde:
Mo - reprezintă valoarea modală;
xMo - reprezintă limita inferioară a intervalului modal;
∆ −1 - reprezintă diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului
precedent;
∆ 1 - reprezintă diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului
următor;
lMo - reprezintă lungimea intervalului modal.

O serie poate avea o singură valoare modală, caz în care seria se numeşte unimodală. Dacă o serie
are mai multe valori modale, atunci se numeşte plurimodală. O serie plurimodală evidenŃiază faptul
că populaŃia în cauză este neomogenă. Calculul valorii modale, în asemenea cazuri, presupune o
delimitare mai riguroasă a obiectului observării cât şi a populaŃiei care urmează să fie studiată. O
altă cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a două câte
două sau trei câte trei intervale etc., până se ajunge la o serie unimodală.
În cazul unei serii simetrice valoarea modală coincide cu valoarea medie şi cu mediana. Pentru serii
uşor asimetrice, K. Pearson a stabilit următoarea relaŃie între cei trei parametri:
(
Mo = X − 3 X − Me )
unde X este media aritmetică a variabilei X.
Calculul valorii modale reprezintă un deosebit interes pentru activitatea practică. Având în vedere
că semnificaŃia acestui parametru – indică acea valoare a variabilei înregistrată de cele mai multe
unităŃi din populaŃie – se poate afla: ora la care sunt solicitate cele mai multe convorbiri telefonice,
ora de vârf privind transportul în comun, mărimea cea mai solicitată la încălŃăminte etc.
Dacă valoarea modală este identică cu valoarea medie, atunci se poate afirma că valoarea medie se
bucură de o mai mare reprezentativitate. Dacă, în plus, avem M e = M o = X , Ńinând seama că
valoarea mediană nu este influenŃată de valorile extreme ale variabilei, se poate afirma că mediana
reprezintă un grad de reprezentativitate mai mare decât valoarea medie.
Exemplu:
Reconsiderăm exemplul privind distribuŃia angajaŃilor unei societăŃi comerciale în raport cu salariul
lunar:
160 − 200 200 − 240 240 − 280 280 − 320 320 − 360 360 − 400 
X :  
 7 13 18 6 4 2 
unde variabila X este exprimată în dolari. Calculul valorii modale presupune în primul rând găsirea
intervalului modal. FrecvenŃa cea mai mare este 18 şi ca urmare, intervalul modal este 240-280.
Intervalul modal fiind găsit, se poate aplica relaŃia (3.60) de calcul a valorii modale:
∆ −1 5 200
M o = xM o + ⋅ l M o = 240 + ⋅ 40 = 240 + = 251,764$
∆ −1 + ∆ 1 5 + 12 17
În concluzie, putem afirma că cei mai mulŃi anagajaŃi ai societăŃii comerciale respective au un salar
lunar în jur de 251,764 $.

3.2. Parametrii de structură


Frecvente sunt cazurile când este necesară studierea structurii unei populaŃii în raport cu o variabilă
sau alta. Parametrii statistici, în forma cea mai generală, folosiŃi în caracterizarea structurii unei
populaŃii poartă denumirea de valori quantile. Valorile quantile ale unei serii de repartiŃie
unidimensionale sunt acele mărimi înregistrate de variabila X, care împart seria în n părŃi egale (mai
precis împarte populaŃia în n părŃi egale). În acest caz se vor calcula p quantile (p = n-1 ). Pentru o
serie continuă, a cărei densitate de probabilitate f(x) este cunoscută, următoarea egalitate este
satisfăcută de cele p quantile:
q1 q2 xR
1
∫ f ( x)dx = ∫ f ( x)dx = ... = ∫
x1 q1 q n −1
f ( x)dx =
n
(3.61)

unde cele n-1 quantile s-au notat cu q1, q 2, …, q n-1.


RelaŃia (3.61) se particularizează pentru cazul seriilor discrete, după cum seria este construită cu
frecvenŃe relative:
q1 q2 xR
1
∑ f =∑ f
x1
i
q1
i = ... = ∑ f i =
q n −1 n
(3.62)

sau cu frecvenŃe absolute:


q1 q2 xR
N
∑ N i = ∑ N i = ... = ∑ N i =
x1 q1 q n −1 n
(3.63)

unde fiecare însumare din relaŃiile (3.62) şi (3.63) reprezintă cumularea absolută sau relativă a
unităŃilor statistice cuprinse între limitele de însumare.
Pentru o serie oarecare, quantila de ordinul p poate fi definită astfel:
1 N
FN (q p ) = p ⋅ sau N ( q p ) = p ⋅ , ∀ p = 1, n - 1
n n
Modul de calcul a valorilor quantile diferă în raport cu tipul seriei.
Fie o serie de repartiŃie, care are la bază o variabilă X discretă, de următoarea formă:
 x x2 ... xi ... xR 
X :  1 . (3.64)
 N1 N 2 ... N i ... N R 
Pentru calculul valorii quantile de ordinul p ( p = 1, n − 1) , în prima etapă trebuie determinat rangul
acesteia:
N
rq p = N ( q p ) = p ⋅ (3.65)
n
Se disting două cazuri:
a) dacă p·N se divide cu n atunci quantila de ordin p se calculează ca o medie aritmetică simplă a
valorilor variabilei X, de ordinul rangului şi al rangului majorat cu o unitate, după cum urmează:
x rq p + x ( rq p +1)
qp = (3.66)
2
b) dacă p·N nu se divide cu n atunci quantila de ordin p este egală cu acea valoare a variabilei X
corespunzătoare parŃi întregi a rangului majorat cu o unitate:
q p = x [ rq +1] (3.67)
p

În cazul seriilor care au la bază o variabilă continuă, conform definiŃiei, cele n-1 quantile trebuie
să satisfacă relaŃia (3.61). Determinarea quantilelor din asemenea egalităŃi ar presupune cunoaşterea
densităŃii de probabilitate f(x). Ori în activitatea practică f(x) se aproximează prin diverse procedee,
implicând un volum exagerat de calcule. În vederea găsirii unor formule aproximative de calcul a
quantilei de ordin p ( p = 1, n − 1) se consideră o serie de variaŃie continuă, ale cărei intervale de
variaŃie nu trebuie să fie neapărat egale ca lungime:
 x − x1 x1 − x 2 ... x i −1 − x i ... x R −1 − x R 
X :  0 . (3.68)
 N1 N2 ... Ni ... N R 

În prima etapă se determină rangul quantilei de ordinul p ( p = 1, n − 1) conform următoarei relaŃii:


1 R
rq p = N ( q p ) = p ⋅ ⋅ ∑ N i (3.69)
n i =1
Cunoscând rangul, se poate identifica intervalul în care se află quantila de ordinul p, numit şi
intervalul quantilei de ordinul p ( p = 1, n − 1) . Cumulând frecvenŃele pe clase până la egalarea s-au
depăşirea rangului, conform inegalităŃii:
1 R
N 1 + N 2 + ... + N i ≥ p ⋅ ⋅ ∑ N i (3.69’)
n i =1

ultima frecvenŃă adunată va corespunde intervalului quantilei de ordinul p ( p = 1, n − 1) . Prin


urmare, quantila de ordinul p, qp, se calculează conform relaŃiei:
q p = x i −1 + ∆ x (3.70)

unde am presupus intervalul xi-1-xi ca intervalul quantilei de ordinul p, iar ∆x reprezintă distanŃa,
necunoscută încă, între limita inferioară a intervalului quantilei de ordinul p şi valoarea din acest
interval cu care coincide quantila de ordin p.
DistanŃa necunoscută ∆x se poate obŃine folosind principiul repartizării proporŃionale a frecvenŃei
pe toată lungimea intervalului quantilei, în conformitate cu următoarea egalitate de rapoarte:
N (q p ) − N ( x i −1 ) Ni
=
∆x x i − x i −1
de unde se deduce ∆x,
N (q p ) − N ( x i −1 )
∆x = ⋅ ( x i − x i −1 )
Ni
Înlocuind expresia lui ∆x în relaŃia (3.70) se obŃine:

N (q p ) − N ( x i −1 )
q p = x i −1 + ⋅ ( x i − x i −1 ) (3.71)
Ni
se introduc următoarele notaŃii:
x q p = x i −1 reprezentând limita inferioară a intervalului quantilei de ordinul p;

l q p = x i − x i −1 - reprezintă lungimea intervalului quantilei de ordinul p;

N q p = N i - reprezintă frecvenŃa absolută a intervalului quantilei qp, care înlocuite în (3.71) conduc
la formula de calcul:
N (q p ) − N ( x q p )
q p = xqp + ⋅ lqp (3.72)
Nq p

pentru p = 1, n − 1 .

Procedeul de determinare a quantilei de ordinul p = 1, n − 1 este acelaşi şi în cazul în care seria


(3.68) este formată din frecvenŃe relative. Caracterizarea structurii unei serii se poate face utilizând
diverse cazuri particulare de valori quantile.
Valoarea mediană (Me) este şi un parametru de structură obŃinându-se ca un caz particular de
quantilă, când n=2. Dacă pentru o serie se cunoaşte Me (quantila de ordinul 2), atunci structura
populaŃiei poate fi redată astfel:
 X − Me M e − xmax 
X :  min  (3.73)
 50% 50% 
semnificând faptul că jumătate din populaŃia supusă studiului a înregistrat pentru variabila X valori
cuprinse între valoarea minimă a lui X şi mediană, iar cealaltă jumătate din populaŃie a înregistrat
pentru X valori cuprinse între mediană şi valoarea maximă a lui X. Formula de calcul a Me se poate
găsi ca un caz particular, n=2, a relaŃiei (3.72).
Valorile quartile reprezintă acel caz particular al valorilor quantile pentru care n=4. Cele trei
quartile, care se obŃin, notate: Q1, Q2 şi Q3 sunt acei parametri de structură care împart populaŃia în
patru părŃi egale.
În raport cu mediana, quartila întâi Q1, se numeşte quantila mică (inferioară), quartila a doua Q2
coincide cu mediana şi se numeşte quartila mijlocie, iar quartila a treia Q3 se numeşte quartila
mare (superioară). Cunoscându-se cele trei quartile, rezultă următoarea structură a populaŃiei în
raport cu variabila X:
 x − Q1 Q1 − Q 2 Q 2 − Q3 Q3 − X max 
X :  min  (3.74)
 25% 25% 25% 25% 
ceea ce semnifică o structurare a populaŃiei supusă studiului în patru parŃi egale. Aceasta înseamnă
că 25% din unităŃile popupaŃiei înregistrează valori pentru variabila X mai mici decât quartila mică,
25% din unităŃile populaŃiei înregistrează valori, în raport cu aceeaşi variabilă X, cuprinse între
quartila mică şi cea mijlocie, 25% vor avea valori cuprinse între quartila mijlocie şi quartila mare,
iar restul 25% din unităŃile populaŃiei vor avea valorile pentru variabila X cuprinse între quartila
mare şi valoarea maximă a lui X.
RelaŃiile de calcul pentru quartile sunt cazuri particulare ale relaŃiilor de calcul pentru quantilele de
ordin p ( p = 1, n − 1 . Etapele sunt aceleaşi, presupunându-se mai întâi calculul rangurilor celor 3
quartile, apoi determinarea efectivă a acestora. Valorile efective pentru cele 3 quartile se determină
în mod diferit, după cum seria este discretă sau continuă. În continuare se va detalia modul de
calcul al quartilelor în mod separat pentru fiecare tip de serie în parte. Pentru cazul seriilor discrete
calculul rangurilor pentru cele trei quartile se face conform formulelor:
1 R 1 R
rq1 = 1 ⋅ ⋅ ∑ N i = ⋅ ∑ N i (3.75)
4 i −1 4 i =1
1 R 1 R
rq 2 = 2 ⋅ ⋅ ∑ N i = ⋅ ∑ N i (3.76)
4 i =1 2 i =1
1 R
rq 3 = 3 ⋅ ⋅ ∑ N i (3.77)
4 i =1
Expresiile de calcul pentru cele trei quartile sunt diferite, după cum valorile rangurilor
corespunzătoare lor sunt întregi sau nu. Determinarea quartilelor presupune stabilirea acelor valori
pentru variabila X care corespund rangurilor acestora şi valorilor lui X corespunzătoare rangurilor
majorate cu o unitate. În cazul în care rangurile sunt valori întregi, quartilele se calculează ca media
aritmetică simplă a valorilor lui X corespunzătoare rangului şi rangului majorat cu o unitate.
R
Dacă p ⋅ ∑ N i , ( p = 1,3) , se divide cu 4 atunci relaŃiile de calcul pentru quartile sunt:
i =1

x rQ + x ( rQ +1)
Q1 = 1 1
(3.78)
2
x rQ + x ( rQ +1)
Q2 = 2 2
(3.79)
2
x rQ + x ( rQ +1)
Q3 = 3 3
(3.80)
2
R
iar dacă p ⋅ ∑ N i , ( p = 1,3) , nu se divide cu 4 atunci relaŃiile de calcul pentru quartile sunt:
i =1

Q1 = x [ rQ1 +1] (3.81)

Q2 = x[ rQ +1] (3.82)
2

Q3 = x[ rQ +1] (3.83)
3

În cazul seriilor de variaŃie continuă etapele privind determinarea celor 3 quartile sunt aceleaşi. Mai
întâi se calculează rangul corespunzător pentru fiecare din cele trei quartile, urmând ca pe baza
acestora să se calculeze efectiv quartilele. Rangul quartilei întâi se determină conform relaŃiei:
1 R
rQ1 = ⋅∑ Ni (3.84)
4 i =1
iar primul interval care satisface inegalitatea:
1 R
N i + N 2 + ... + N i ≥ ⋅∑ Ni
4 i =1
va reprezenta intervalul quartilei mici. Acest interval fiind găsit, quartila mică se determină
conform relaŃiei:
N (Q1 ) − N ( x Q1 )
Q1 = x Q1 + ⋅ l Q1 (3.85)
N Q1

Pentru quartila mijlocie, Q2, calculele se pot face în conformitate cu procedeul dat pentru mediană.
În cazul quartilei mari, Q3, rangul se calculează astfel:
1 R
rQ3 = 3 ⋅ ⋅ ∑ N i (3.86)
4 i =1
iar primul interval care satisface inegalitatea:
1 R
N1 + N 2 + ... + N i ≥ 3 ⋅ ⋅ ∑ N i
4 i =1
va constitui intervalul quantilei mari. Calculul efectiv al quartilei mari se face conform relaŃiei:
N (Q3 ) − N ( x Q3 )
Q3 = x Q3 + ⋅ l Q3 (3.87)
N Q3

SemnificaŃia simbolurilor folosite în relaŃiile de calcul pentru cale 3 quantile derivă imediat din
cazul general prezentat pentru quantile.

Valorile decile constituie acel caz particular al valorilor quantile pentru care n=10. Valorile decile
reprezintă acei indicatori de structură care împart populaŃia supusă studiului în 10 părŃi egale.
Urmând acelaşi procedeu, relaŃiile de calcul pentru valorile decile se deduc din cazul general ca şi
pentru cazul medianei şi al quartilelor. Pentru cazul seriilor de variaŃie discretă în prima fază se
calculează rangurile în conformitate cu următoarea formulă de calcul:
R
1
rD p = p ⋅
10
⋅ ∑N ;
i =1
i p = 1,9 (3.88)

R
Dacă valoarea expresiei p ⋅ ∑N
i =1
i se divide cu 10, atunci relaŃiile de calcul pentru cele 9 decile

sunt:
x rD p + x (rD p +1)
Dp = ; p = 1,9 (3.89)
2
R
iar dacă valoarea expresiei p ⋅ ∑N i =1
i nu se divide cu 10, atunci relaŃiile de calcul pentru valorile

decile sunt:
D p = x[ rD p +1] ; p = 1,9 (3.90)

În cazul seriilor de variaŃie continuă, prima fază constă în calcularea rangurilor:


R
1
rD p = p ⋅
10
⋅ ∑N ;
i =1
i p = 1,9
Pentru fiecare decilă Dp, p = 1,9 , se determină intervalul decil corespunzător, conform inegalităŃii:
1 R
N1 + N 2 + ... + N i ≥ p ⋅ ⋅ ∑ N i ; p = 1,9
10 i =1
după care se calculează decila corespunzătoare conform relaŃiei:
N (D p ) − N ( x Dp )
D p = x Dp + ⋅ l Dp
N Dp

Pentru cazul particular, n=100, quantilele de ordinul p = 1,99 se numesc procentile şi reprezintă
acele valori ale variabilei X care împart seria respectivă în 100 de părŃi egale.

3.3. Parametrii variaŃiei


Studiul unor populaŃii statistice prezintă importanŃă numai din punct de vedere al unor mărimi care
variază de la o unitatea la alta sau de la un grup de unităŃi la altul. Valorile înregistrate de o
variabilă cantitativă, în raport cu care este studiată o populaŃie, de datoresc acŃiunii diferiŃilor factori
esenŃiali şi neesenŃiali. Intensitatea diferită cu care se pot manifesta factorii esenŃiali cât şi sensul
contrar cu care pot acŃiona factorii neesenŃiali în raport cu fiecare unitate, provoacă nivele diferite
înregistrate de variabile în raport cu care este studiată populaŃia. Problema măsurării variaŃiei unei
variabile cantitative este importantă pentru a vedea în ce măsură valoarea medie a acesteia poate
reprezenta întrega populaŃie. Dacă abaterile de la valoarea medie sunt neesenŃiale atunci se poate
afirma că populaŃia este omogenă şi că acest parametru poate reprezenta tendinŃa centrală, iar dacă
aceste abateri sunt mari atunci populaŃia este eterogenă şi valoarea medie nu are capacitatea de a
reprezenta populaŃia. Pentru unele serii, valoarea medie nu se poate calcula. În asemenea cazuri,
parametrul valoarea mediană poate să-i ia locul. Aceeaşi problemă se pune şi în acest caz, de a
vedea în ce măsură valoarea mediană este sau nu reprezentativă pentru populaŃia în cauză. O altă
problemă care nu se poate rezolva fără a studia şi măsura variaŃia înregistrată de o variabilă în
raport cu care este studiată o populaŃie, o constituie verificarea de ipoteze. În activitatea practică, de
multe ori pornind de la valorile unor parametrii calculaŃi pe baza datelor culese relativ la un număr
mic de unităŃi, este necesar a fi extinşi la nivelul întregii populaŃii sau de a se verifica anumite
ipoteze statistice. Parametrii variaŃiei se pot calcula atât sub formă absolută cât şi relativă, şi
măsoară împrăştierea valorilor unei variabile cantitative faŃă de valoarea medie sau valoarea
mediană.
Ca urmare, în funcŃie de elementul de referinŃă folosit în măsurarea variaŃiei, deosebim:
- parametrii variaŃiei în raport cu valoarea medie;
- parametrii variaŃiei în raport cu valoarea mediană.

3.3.1. Parametrii variaŃiei în raport ca valoarea medie


Din această grupă fac parte:
- amplitudinea sau variaŃia maximă;
- variaŃia maximă şi variaŃia minimă faŃă de valoarea medie;
- abaterea medie liniară;
- abaterea medie pătratică.

Amplitudinea (variaŃia maximă) - (facultativ)


VariaŃia maximă şi variaŃia minimă de la valoarea medie - (facultativ)
Abaterea medie liniară - (facultativ)
Abaterea medie pătratică
Acest indicator este utilizat atât pentru caracterizarea gradului de reprezentativitate a valorii medii
cât şi în scopul estimării unor parametri necunoscuŃi. Abaterea medie pătratică, notată cu σx , se
defineşte ca fiind media pătratică a abaterilor valorilor variabilei X, de la valoarea medie X , adică:

σ x = M (X − X )2 (3.97)
Valoarea lui ne arată cu cât se abat în medie valorile variabilei în raport cu media.
Un calcul intermediar în aflarea acestui parametru, îl constituie calcularea pătratului abaterii medii
pătratice, care se numeşte dispersie sau varianŃă şi are următoarea expresie de calcul:
σ x2 = M ( X − X ) 2 = V ( X ) (3.98)
V(x) reprezintă o altă notaŃie pentru varianŃă, pe lângă σ2x . VarianŃa fiind un calcul intermediar în
aflarea abaterii medii pătratice, în cele ce urmează se va prezenta modul de calcul al acesteia.
RelaŃia de calcul a varianŃei (3.98) se particularizează în raport cu tipul seriei. În cazul unei
serii care are la bază o variabilă X discretă, conform definiŃiei, varianŃa are expresia:
R

∑ (x i − X )2 ⋅ Ni
σ x2 = i =1
R
(3.99)
∑N i =1
i

dacă seria este formată cu frecvenŃe absolute sau:


R
σ x2 = ∑ ( x i − X ) 2 ⋅ f i (3.100)
i =1

dacă seria este formată cu frecvenŃe relative.


Pentru serii cu fercvenŃe (absolute sau relative) egale, printr-un calcul simplu se ajunge la
următoarea expresie de calcul a varianŃei:
R

2
∑(x
i =1
i − X )2
σ = x
R
RepartiŃia Bernoulli (alternativă), frecvent utilizată în aplicaŃiile practice de estimare a parametrilor,
de forma:
 1 0
X :  
 p q
are X = p, iar varianŃa pq după cum rezultă din următorul calcul:
2
σ x2 = ∑ ( xi − X ) 2 ⋅ f i = (1 − p )2 ⋅ p + (0 − p )2 ⋅ q = q 2 ⋅ p + p 2 ⋅ q =
i =1

= pq (q + p ) = pq = p (1 − p )
Dacă varianŃa seriei alternative de mai sus este văzută ca o funcŃie de variabila p, adică:
σ x2 ( p ) = p (1 − p )

atunci se poate găsi p astfel încât σ x2 ( p ) să fie maximă. Punând condiŃia (σ x2 ( p ) ) = 0 rezultă:
'
(σ 2
x )
'
( p ) = 1 ⋅ (1 − p ) + p ( −1) = 0
1
1− 2 p = 0 ⇒ p =
2
1 1 1 1
σ x2   = ⋅ = = 0, 25
2 2 2 4
1
Ca urmare, dacă p = , atunci varianŃa maximă a unei serii alternative de medie p este 0,25,
2
rezultat utilizat în estimarea unor parametrii necunoscuŃi cu privire la studierea diferitelor populaŃii.
În cazul unei serii care are la bază o variabilă X continuă, varianŃa se calculează conform
următoarei relaŃii:
xR

∫ (x − X )
2 2
σ =
x ⋅ f ( x) ⋅ dx (3.101)
x1

a cărei aplicare presupune cunoaşterea densităŃii de repartiŃie f(x). Aproximând densitatea f(x) cu
densitatea empirică, după cum urmează:
fi
f ( x) ≈ ; x ∈ [ x i −1 , x i ); i = 1, R
x i − x i −1

se ajunge la aceleaşi relaŃii de calcul (3.99) şi (3.100) unde în loc de xi se pune x i' reprezentând
mijlocul intervalului “i” calculat conform relaŃiei:
x i −1 + x i
x i' = , i = 1, R .
2
Pentru o serie dată, varianŃa calculată nu are interpretare, dar dacă se extrage rădăcina pătrată din
acesta se obŃine un număr care se exprimă în aceleaşi unităŃi de măsură ca şi variabila de la baza
seriei. Acest număr (valoare) reprezintă abaterea medie pătratică, simbolizând cu cât se abate în
medie în plus sau minus orice valoare xi a variabilei X de la valoarea medie X .
Parametrul abaterea medie pătratică se poate exprima şi sub formă relativă, caz în care se numeşte
coeficientul de variaŃie a lui Pearson, şi se notează cu Vx. Expresia de calcul este:
σx
Vx = ⋅100% (3.102)
X
şi arată cu câte procente se abat în medie valorile variabilei faŃă de medie. Coeficientul de variaŃie a
lui Pearson calculat pentru două sau mai multe serii, poate fi folosit în aprecieri comparative
privind gradul de reprezentativitate a valorii medii calculate. Deoarece gradul de reprezentativitate
a valorii medii este în raport invers cu mărimea coeficientului de variaŃie a lui Pearson, se poate
afirma, în cazul mai multor serii, că este mai reprezentativă valoarea medie a acelei serii pentru care
Vx este mai mic. În concluzie, trebuie reŃinut că parametrul abaterea medie pătratică sub formă
absolută σx şi sub formă relativă Vx sunt indicatori fundamentali utilizaŃi în măsurarea variaŃiei unei
variabile.
Atât abaterea medie liniară, cât şi abaterea medie pătratică constituie o măsură a variaŃiei medii,
primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x ≤ σ x ) .
Deoarece calcularea abaterii medii pătratice şi implicit a varianŃei necesită un volum mare de
calcule, prezentarea unor proprietăŃi ale varianŃei în vederea reducerii volumului de muncă este
inevitabilă.
Proprietă ti ale varianŃei

1. VarianŃa unei constante este egală cu zero.


Luându-se X = C şi aplicând relaŃia de calcul a varianŃei se obŃine:

V(X) = V(C) = M[(C-C)2] = M(0) = 0 (3.103)

2. VarianŃa unei variabile X este independentă de schimbarea originii.


Fie o serie care are la bază variabila X, a cărei origine este zero. Pornindu-se de la aceasta se
construieşte o nouă serie care are la bază variabila Y=X-x0, a cărei origine este x0 . Demonstrarea
acestei proprietăŃi presupune de arătat că:
V(X) = V(Y)
łinând cont de definiŃia varianŃei avem:
V (Y ) = M (Y − Y ) 2 = M [( X − x 0 ) − M ( X − x 0 )] 2 =
= M ( X − x0 − X + x0 ) 2 = M ( X − X ) 2 = V ( X )
ceea ce demonstrează afirmaŃ ia mai sus enunŃată. Această proprietate îşi găseşte aplicate în calculul
varianŃei pentru acele serii a căror variabile înregistrează valori mari. În scopul reducerii volumului
de calcule se vor micşora toate valorile variabilei cu o constantă x0, convenabil aleasă, încât noua
serie obŃinută să înregistreze valori mici pentru variabilă.
Dacă între două variabile Y şi X există următoarea relaŃie liniară:
Y = a·X+b
atunci are loc următoarea egalitate:
V(Y) = a2 · V(X)
Conform definiŃiei varianŃei, se poate scrie:
V (Y ) = M (Y − Y ) 2 (3.104)
Valoarea medie a varibilei Y este:
M (Y ) = Y = M ( a ⋅ X + b) = a ⋅ M ( X ) + b
care înlocuită în (3.104) ne conduce la:

(
V (Y ) = M Y − Y )2 2
= M (a ⋅ X + b − a ⋅ M ( x) − b ) =
= M ( a ( x − M ( x)) 2 = a 2 M ( X − X ) 2 = a 2 ⋅V ( X )
ceea ce trebuia demonstrat.

4. VarianŃa unei variabile, fiind un moment centrat de ordinul doi, se poate exprima cu ajutorul
diferenŃei dinter momentul de ordinul doi şi pătratul momentului de ordinul întâi al variabilei,
adică:
V ( X ) = M (X 2 ) − (M ( X ))
2
(3.105)
Următorul calcul simplu ne conduce la egalitatea de mai sus:
(
V (X ) = M X − X )
2 2
= M (X 2 − 2X ⋅ X + X ) = M (X 2) − 2 ⋅ X ⋅ M (X ) + X
2

2 2 2
= M ( X 2 ) − 2 X + X = M ( X 2 ) − X = M ( X 2 ) − ( M ( X ))2
Pornind de la relaŃia (3.105) se poate deduce o nouă formulă de calcul pentru varianŃă, după cum
urmează:
2
R
 R 
∑ x i2 ⋅ N i  ∑ xi ⋅ N i 
( ) −  i =1 R  =
2
V ( X ) = M X 2 − (M ( X )) = i =1
R  
∑N
i =1
i  ∑ Ni
 i =1


2
 R 
2  ∑ xi ⋅ N i 
R
 R
 R
 i =1 
∑ x i2 ⋅ N i  ∑ x i ⋅ N i  ∑ x i2 ⋅ N i −
N
= i =1 −  i =1  = i =1
N  N  N
 
 
dacă seria este formată din frecvenŃe absolute, sau:
2
R
 R 
V ( X ) = ∑ x ⋅ f i −  ∑ xi ⋅ f i 
2
i (3.106)
i =1  i =1 
dacă seria este formată din frecvenŃe relative.
Această proprietate este frecvent utilizată în caracterizarea seriilor multidimensionale.

5. VarianŃa sumei a două variabile X şi Y este egală cu suma varianŃelor acestor variabile, dacă cele
două variabile sunt independente.
Conform relaŃiei 4. Avem:
2
V ( X + Y ) = M ( X + Y ) − (M ( X + Y )) = M X 2 + 2 XY + Y 2 −
2
( )
2 2 2 2
− (M ( X ) + M (Y )) = M ( X ) + 2 M ( X ⋅ Y ) + M (Y ) − (M ( X )) −
(3.107)
2
− 2 M ( X ) ⋅ M (Y ) − (M (Y )) = M ( X ) + (M ( X )) + M Y 2 −
2 2
( )
(M (Y ))2 + +2M ( X ) ⋅ M (Y ) − 2M ( X ) ⋅ M (Y ) = V ( X ) + V (Y )

Această proprietate se poate generaliza cu uşurinŃă, pentru n variabile independente două câte două:

V ( X 1 + X 2 + ... + X n ) = V ( X 1 ) + V ( X 2 ) + ... + V ( X n ) (3.108)

6. VarianŃa unei variabile X faŃă de o constantă x0 este mai mare decât varianŃa acestei variabile faŃă
de media sa cu p ătratul diferenŃei dintre valoarea medie şi constanta respectivă. Demonstrarea
acestei proprietăŃi se bazează pe următorul calcul:
2
(( ) ( )) =
M ( X − x0 ) = M X − X + X − x0
2

= M  (X − X ) + 2(X − X )(X − x ) + (X − x )  =
2 2
0 0
 
= M (X − X ) + 2(X − x )⋅ M (X − X ) + (X − x ) = M (X − X ) + (X − x )
2 2 2 2
0 0 0
( )
deoarece M X − X = 0 . Ca urmare, se poate scrie:

( X ) = M (X − X ) = M ( X − x ) − (X − x )
2 2 2
V 0 0

ceea ce constituie într-o formă simbolică enunŃul de mai sus.

7. VarianŃa produsului dintre o constantă şi o variabilă este egală cu produsul dintre


constanta la pătrat şi varianŃă:
V (a ⋅ X ) = a 2 ⋅ V ( X ) (3.109)
DemonstraŃia acestei proprietăŃi constituie un caz particular al proprietăŃii 3., unde se ia b=0.

8. VarianŃa diferenŃei dintre dou ă variabile independente este egală cu suma varianŃelor
acelor variabile:
V ( X − Y ) = V ( X ) + V (Y ) (3.110)
Această proprietate rezultă imediat făcând un calcul simplu pornind de la definiŃ ia varianŃei, Ńinând
cont şi de proprietatea 7.

9. VarianŃa sumei a două variabile dependente este egală cu suma varianŃelor celor dou ă variabile
plus covarianŃa dintre cele dou ă variabile:
V ( X + Y ) = V ( X ) + V (Y ) + 2 M X − X Y − Y (( )( )) (3.111)
Următorul calcul este concludent în acest sens:

V ( X + Y ) = M (( X + Y ) − M ( X + Y )) = M X + Y − X − Y
2
( )
2
=

= M  X 2 + Y 2 + X + Y + 2 XY − 2 X ⋅ X − 2 X ⋅ Y − 2Y X − 2Y ⋅ Y + 2 X ⋅ Y  =
2 2

 
( ) ( ) 2 2
(
= M X 2 + M Y 2 + X + Y + 2 M X ⋅ Y − X ⋅ Y − Y ⋅ X + X ⋅ Y − 2 X − 2Y ) 2 2

= M (X ) − (X ) + M (Y ) (( )( ))
2 2 2 2
− Y + 2M X − X Y − Y =
= V ( X ) + V (Y ) + 2 ⋅ M ((X − X )(Y − Y ))

Media M ((X − X )(Y − Y )) se numeşte covarianŃă sau varianŃa legată şi este utilă în studiul
legăturilor dintre variabile.
1
Dacă în egalitatea (3.109) se ia a = , k fiind un număr real mai mare decât 1, se ob Ńine:
k
1  1
V  ⋅ X  = 2 ⋅V ( X )
k  k
de unde:
1 
V ( X ) = k 2 ⋅V  ⋅ X  (3.112)
k 
Potrivit relaŃiei (3.112) se poate afirma că dacă stările unei variabile cantitative de la baza unei serii
se simplifică cu k, atunci varianŃa acelei variabile se micşorează de k2 ori. Pornind de la relaŃia:
2
(
V (X ) = M (X − x0 ) − X − x 0 )
2
care constituie însăşi proprietatea 6., Ńinând cont de egalitatea (3.112) se poate scrie:
  X − x0  2  2
V ( X ) = M    ⋅ k − X − x0 ( )2
(3.113)
  k  
În aplicaŃiile practice, pe motive de reducere a volumului de muncă, constanta x0 se alege mijlocul
seriei, iar mărimea k egală cu cel mai mare divizor comun al diferenŃelor X-x0.
RelaŃia (3.113) se numeşte formulă de calcul simplificat al varianŃei, concretizându-se în
funcŃie de natura seriei. Dacă seria are la bază variabila X şi este construită cu frecvenŃe absolute,
atunci relaŃia (3.113) devine:
2
R
 xi − x0 
∑ 
i =1  k 
 ⋅ Ni
V (X ) = r
(
⋅ k 2 − X − x0 )
2
(3.114)
∑N
i =1
i

iar dacă seria este formată cu frecvenŃe relative relaŃia amintită devine:
 R  xi − x0  2 
V ( X ) = ∑   ⋅ f i  ⋅ k 2 − X − x0 ( )
2
(3.115)
 i =1  k  
În cazul seriilor continue, calculul simplificat al varianŃei se efectuează tot după una din cele dou ă
relaŃ ii de mai sus cu deosebirea că în loc de xi se iau în calcul xi’, adică mijloacele intervalelor de
variaŃie.

10. VarianŃa mediei aritmetice a n variabile independente care urmează aceeaşi lege de distribu Ńie
este egală cu varianŃa uneia dintre variabile împărŃită la numărul variabilelor considerate. Fie X1,
X2, …, Xn cele n variabile pentru care:
V ( X i ) = V ( X ), i = 1, n
unde V(X) reprezintă dispersia comună a celor n variabile. Din faptul că:
 X + X 2 + ... + X n  1 1
V 1  = 2 (V ( X 1 ) + V ( X 2 ) + ... + V ( X n )) = ⋅V ( X )
 n  n n
şi notând:
n

∑X
i =1
i
X =
n
rezultă:
V (X )
( )
V X =
n
(3.116)

În mod analog pentru n variabile independente, abaterea medie pătratică se exprimă astfel:

σ X2
σX = (3.117)
n
expresie care mai poartă denumirea de eroarea mediei de selecŃie, numai dacă X1, X2, …, Xn sunt
variabile de eşantionare.
11. VarianŃa unor variabile normate este unu, iar media este zero. Pentru o variabilă X oarecare,
variabila normată ataşată este:
X −X
Z=
σX
de medie:
X−X  1
M (Z ) = M  =
 σ ⋅ M (X − X ) = 0
 σX  X

şi varianŃă:
2
X−X  1 σ X2
σ = M 
2
Z
 = 2 mX−X
 σ ( )2
=
σ X2
=1
 σX  X

12. Regula de adunare a varianŃelor. Se consideră o serie de repartiŃie, care are la bază variabila X,
iar populaŃia respectivă de volum N este împărŃită în R clase în raport cu un criteriu C. Se
demonstrează că varinŃa în întrega populaŃie, care măsoară variaŃia totală în raport cu X, este egală
cu suma a două varianŃe din care una măsoară variaŃia în cadrul grupelor, iar cealaltă variaŃia dintre
grupe. Pentru demonstrarea acestei proprietăŃi se consideră o serie de următoarea formă:

{
 x , x ,..., x1N1
X :  11 12
} ... {x , x
i1 i2 ,..., xiN i } ... {x R1 }
, xR 2 ,..., xRN R 

 N1 ... Ni ... NR 
unde s-a notat cu {xi1, xi2, … ,xiNi} mulŃimea valorilor înregistrate de uniŃăŃile din clasa “i”, aceasta
fiind întotdeauna posibil având în vedere numărul finit de elemente care pot aparŃine unei clase.
VariaŃia lui X în cadrul populaŃiei cercetate se compune din variaŃia în cadrul celor R
grupe datorată acŃiunii factorilor neesenŃiali şi variaŃia de la o grup ă la alta datorată acŃiunii
factorilor esenŃiali care nu acŃionează cu aceeaşi intensitate asupra unităŃilor din populaŃie.
Notând cu:
σ x2 - varianŃa variabilei X în grupa “i” care măsoară împrăştierea în această grupă provocată de
i

factori neesenŃiali;
σ X2 - varianŃa dintre grupe, care măsoară împrăştierea de la o grupă la alta;
i

σ x2 - media varianŃelor grupelor, care măsoară variaŃia medie în cadrul celor R grupe;
i

X i - media din grupa “i”;

proprietatea enunŃată mai sus se rezumă la următoarea egalitate:

σ x2 = σ X2 + σ X2 i
(3.118)
i

Demonstrarea egalităŃ ii (3.118) porneşte de la expresia varianŃei totale care pentru seria de mai sus
poate fi scrisă astfel:
R Ni R Ni

∑∑ (x ) ∑∑ (x )
2 2
ij −X ij − Xi + Xi − X
i =1 j =1 i =1 j =1
σ x2 = R Ni
= R Ni
=
∑∑ N
i =1 j =1
ij ∑∑ N
i =1 j =1
ij

R Ni

∑∑ ((x ) ( )) 2
ij − Xi + Xi − X
i =1 j =1
= R Ni
=
∑∑ N
i =1 j =1
ij

R Ni R Ni R Ni

∑∑ (x ) +∑∑ (X ) +2 ⋅ ∑∑ (x )( )
2 2
ij −X i −X ij − X Xi − X
i =1 j =1 i =1 j =1 i =1 j =1
= R Ni
=
∑∑ N
i =1 j =1
ij

R Ni R Ni R Ni
(x −X ) ⋅N
2

∑∑ (x ) ∑∑ (X ) ∑∑
2 2 ij
ij −X i −X i
i =1 j =1 i =1 j =1 i =1 j =1 Ni
= R Ni
+ R Ni
= R
+
∑∑ N ij ∑∑ N ij ∑N
i =1
i
i =1 j =1 i =1 j =1
R R R

∑ (X ) ∑ (X )
2 2
i − X ⋅ Ni ∑σ x2 ⋅ Ni i i − X ⋅ Ni
+ i =1
R
= i =1
R
+ i =1
R
= σ x2i + σ X2
∑N ∑N ∑N
i

i i i
i =1 i =1 i =1

deoarece:
Ni Ni

∑∑ (x )
R R
(
2∑∑ xij − X i X i − X )( ) ij ⋅ X i − xij ⋅ X − X i2 + X i ⋅ X
i =1 j =1 i =1 j =1
R Ni
= 2⋅ R Ni
=
∑∑ Ni =1 j =1
ij ∑∑ N
i =1 j =1
ij

 R Ni R Ni R Ni R Ni

 ∑∑ xij ⋅ X i −∑∑ xij ⋅ X −∑∑ X i2 +∑∑ X i ⋅ X 
 
= 2 ⋅  i =1 j =1 i =1 j =1
R
i =1 j =1 i =1 j =1
=

 ∑ Ni 

 i =1 

 Ni Ni

 R

∑ x ij R ∑ xij R R


 ∑ X i ⋅ N ⋅ Ni − X ⋅ ∑ ⋅ N ⋅ Ni − ∑ X i ⋅ Ni + X ⋅ ∑ X i ⋅ Ni 
j =1 j =1 2

= 2 ⋅  i =1 i i =1 i
R
i =1 i =1
=
 
 ∑
i =1
Ni

 
 
 R R R R

 ∑ X i2 ⋅ N i − X ⋅ ∑ X i ⋅ N i − ∑ X i2 ⋅ Ni + X ⋅ ∑ X i ⋅ Ni 
= 2 ⋅  i =1 i =1 i =1 i =1 =0
 R




i =1
Ni 

Prin urmare, dacă o populaŃie este împ ărŃită în R clase în raport cu un criteriu C, atunci variaŃia
variabilei X în cadrul fiercărei clase poate fi consecinŃa acŃiunii unor factori neesenŃiali. Calculând
valoarea medie X i în fircare clasă se elimină cota parte din nivelul atins de variabilă în clasa “i” ca
urmare a acŃiunii factorilor reziduali, iar varianŃa în clasa “i” măsoară împrăştierea în interiorul
clasei provocată de aceşti factori.

Componenta de dispersie σ x2i , reprezentând media dispersiilor claselor, măsoară variaŃia


medie la nivel de populaŃie, cauzată de factorii reziduali. În general, factorii esenŃiali se manifestă
cu o intensitate diferită de la o unitate la alta cât şi de la o clasă la alta conducând la diferenŃe între
mediile claselor şi media în populaŃia considerată. Aceste abateri sunt măsurate de componenta de
dispersie σ X2 , numită varianŃ a dintre grupe.
i

Dacă relaŃia (3.118) se împarte cu σ2x şi se înmulŃeşte cu 100% se ob Ńine:


σ X2 σ X2
100% = 2
i
⋅100% + i
⋅100%
σ x σ x2
relaŃ ie care ne arată procentual cota parte din variaŃia unei variabile provocată de acŃiunea factorilor
esenŃiali şi respectiv de acŃiunea factorilor neesenŃiali.
Regula de adunare a variantelor, permite evaluarea influenŃei fiecărei categorii de factori
(esenŃiali sau neesenŃiali) asupra variaŃiei totale a unei variabile în raport cu care este studiată
populaŃia.
Cunoscând varianŃa unei variabile, extrăgându-se răd ăcina pătrată se obŃine abaterea
medie pătrată, parametru de bază utilizat în măsurarea variaŃiei medii a unei variabile X:

σ X = σ X2 (3.119)

Mărimea parametrului abaterea medie p ătratică permite, printre altele, o apreciere cu privire
la gradul de reprezentativitate a valorii medii. Aceasta deoarece există serii pentru care, în raport cu
variabila considerată, deşi σx înregistrează valori mici este posibil ca unele dintre valorile lui X să se
abată în realitate foarte mult de la valoarea medie.

Exemplu:
Următorul exemplu constituie un model de calcul al varianŃei şi abaterii medii pătratice utilizând
atât definiŃia cât şi relaŃia de calcul simplificat. În acest sens se consideră distribuŃia agenŃilor
economici care au realizat profit la sfârşitul anului trecut. Se consideră populaŃia agenŃilor
economici în cauză care îşi desfăşoară activitatea într-o anumită zonă geografică. Seria de repartiŃie
a celor 1160 de agenŃi economici, care au realizat profit este:
 0 − 50 50 − 100 100 − 150 150 − 200 200 − 250 
X :  
 170 250 350 260 130 
unde variabila profit X are valorile exprimate în milioane lei.
Profitul mediu X este:
25 ⋅17 + 75 ⋅ 25 + 125 ⋅ 35 + 175 ⋅ 26 + 225 ⋅13 14,100
X = = = 121,55 mil.lei
116 116
VarianŃa calculată conform definiŃiei este:
5

∑ (x ) ⋅N
' 2
i −X i
σ X2 = i =1
5
=
∑N i =1
i

2 2 2
=
(25 − 121,55) ⋅ 17 + (75 − 121,55) ⋅ 25 + (125 − 121,55) ⋅ 35
+
116
(175 − 121.55) .26 + (225 − 121.55) 2 .13
2
+ =
116
2 2 2 2 2
=
(96,55) ⋅ 17 + (46,55) ⋅ 25 + (3,45) ⋅ 35 + (53,45) ⋅ 26 + (103,45) ⋅ 13
=
116
426.465,68
= = 3676,428
116
de unde:

σ X = σ X2 = 3676 ,428 = 60,63 mil .lei


Valoarea obŃinută pentru σx de 60,63 mil. lei reprezintă cu cât se abate în medie profitul fiecărui
agent economic de la profitul mediu considerat de 121,55 mil. Lei. Utilizând relaŃia de calcul
simplificat se obŃine aproximativ (din cauza rotunjirilor) aceeaşi abatere medie pătratică:
2
5
 xi' − x0 
∑ 
k
 ⋅ Ni
σ X2 =  5  ( )
i =1 2
⋅ k 2 − X − x0 =
∑ Ni
i =1

  25 −1252  75 −125
2
 175−125
2
 225−125
2

  ⋅17 +   ⋅ 25 +   ⋅ 26 +   ⋅13 + 
50   50   50   50 
=  ⋅
 116 
 
 

502 − (121,55 −125) =


2 (− 2)2 ⋅17 + (−1)2 ⋅ 25+ 12 ⋅ 26 + 22 ⋅13 ⋅ 502 −
116
−11,903 = 3685,345−11,903 = 3673,442

de unde σx = 60,61 mil. lei. În relaŃia de calcul simplificat s-a luat x0 = 125, adică mijlocul seriei,
iar k = 50, fiind cel mai mare divizor al tuturor diferenŃelor xi' − x0 , i = 1,5 . ( )
Abaterea medie p ătratică exprimată sub formă relativă, prin intermediul coeficientului de
variaŃie Pearson este:
σX 60,61
VX = ⋅100% = ⋅ 100% ≈ 49,86%
X 121,55
reprezentând abaterea medie în procente a profiturilor înregistrate de cei 1160 de agenŃi economici
de la profitul mediu.
3.3.2. Parametri variaŃiei în raport cu valoarea mediană - (facultativ)
3.4. Parametrii concentrării - - (facultativ)

3.5. Parametrii formei


Parametrii prezentaŃi în acest capitol, până acum, au scos în evidenŃă diferite aspecte
esenŃiale ale populaŃiei statistice. Conform celor prezentate, parametrul valoare medie pune în
evidenŃă ceea ce este tipic, general şi esenŃial în populaŃia considerată în raport cu variabila X.
Parametrii de structură au menirea de a permite studierea şi caracterizarea structurii unei populaŃii
în raport cu aceeaşi variabilă. Parametrii variaŃiei sunt utili în studierea împrăştierii (dispersării)
unităŃilor unei populaŃii faŃă de valoarea medie sau valoarea mediană, în raport cu o variabilă
oarecare.
Din aplicaŃiile practice, precum şi din alte surse, s-au constatat că graficele pot avea diverse
forme, dintre care: formă de coplot, formă de U, J, L sau alte forme. Ceea ce prezintă importanŃă,
nefiind surprins de nici un parametru prezentat, îl constituie modul de repartizare a valorilor
variabilei de o parte şi de alta a valorii medii, considerată şi centrul de greutate a seriei. Acest lucru
nu înseamnă altceva decât evidenŃierea acelei curbe care aproximează cel mai bine conturul
poligonal al seriei respective şi în acelaşi timp o imagine mai clară asupra gradului de
reprezentativitate a valorii medii.
În marea majoritate a cazurilor, distribu Ńia unităŃilor unei populaŃii se face dup ă un clopot
(după legea normală a lui Gauss). Dar unitătile nu se distribuie uniform în jurul valorii medii, ceea
ce poate conduce la înclinaŃii într-o direcŃie sau alta a valorii medii. Această distribuire neuniformă
poate conduce la cazul când diferite serii (diferit distribuite în jurul valorii medii) să aib ă aceeaşi
medie, acelaşi σ şi totu şi o curbă să fie mai aplatizată decât cealaltă, simetrică sau mai pu Ńin
simetrică. EvidenŃierea acestor diferenŃe poate fi realizată cu ajutorul parametrilor formei.
Parametrii formei unei serii de repartiŃie, dup ă conŃinut, se clasifică în dou ă grupe:
- parametrii asimetriei;
- parametrii boltirii.

3.5.1. Parametrii asimetriei


Asimetria unei serii se defineşte în raport cu dispunerea unităŃilor într-o parte sau alta a valorii
medii. În acest sens, o serie de repartiŃie este simetrică în raport cu media sa dacă frecvenŃele
valorilor variabilei X egal dep ărtate de valoarea medie sunt egale între ele, adică:
( ) (
f X −δ = f X +δ ) oricare ar fi δ astfel încât X − δ şi X + δ să se afle printre
valorile lui X.
O serie este asimetrică în raport cu valoarea sa medie dacă există cel pu Ńin o pereche de valori ale
variabilei X egal depărtate de X pentru care frecvenŃele corespunzătoare să nu fie egale, adică:
( ) (
f X −δ ≠ f X +δ )
pentru o valoare δ astfel încât X − δ şi X + δ să se afle printre valorile lui X. Caracterizarea
numerică a gradului de asimetrie a unei serii se realizează cu ajutorul următorilor parametrii:
- coeficientul de asimetrie al lui Pearson;
- coeficientrul de asimetrie a lui Fisher.

Coeficientul de asimetrie al lui Fisher


Acest parametru se notează cu α3, iar expresia sa de calcul este:

α3 =
(
M X−X )
3

(3.128)
σ X3
sau într-o formă echivalentă:

α3 =
( )
M X −X
3

3
 M (X − X ) 2

 
Calculând valoarea acestui parametru, în funcŃie de semnul ei, avem următoarele cazuri:

( )3
1. α 3 = 0, ceea ce înseamnă că M X − X = 0, adică suma tuturor abaterilor cu semnul
minus este egală cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare în
acest caz se poate spune că seria este simetrică.

( ) 3
2. α 3 > 0, ceea ce înseamnă că M X − X > 0. Aceasta este echivalent cu faptul că pe
total suma abaterilor cu semnul plus de la valoarea medie este mai mare decât suma abaterilor cu
semnul minus şi ca urmare seria prezintă o asimetrie pozitivă.

( )3
3. α 3 < 0, deci M X − X < 0. Aceasta înseamnă că pe total, suma abaterilor cu semnul
minus este mai mare decât suma abaterilor cu semnul plus de la valoarea medie. O astfel de serie se
spune că reprezintă o asimetrie negativă. Deoarece coeficientul de asimetrie a lui Fisher se
calculează cu ajutorul momentului centrat de ordinul al treilea, acesta este mult mai sensibil decât
coeficientul lui Pearson. Dacă pentru o serie rolul valorii medii îl joacă valoarea mediană atunci
pentru caracterizarea gradului de asimetrie se foloseşte coeficientul:

α' =
(Q3 − M e ) − (M e − Q1 ) (3.129)
(Q3 − M e ) + (M e − Q1 )
care reprezintă raportul dintre diferenŃa abaterilor quantile şi suma lor. α’ este un coeficient numeric
cuprins între –1 şi +1. Dacă α’ = 0 se spune că seria este simetrică, dacă α’ > 0 seria prezintă o
asimetrie pozitivă, iar dacă α’ < 0 seria prezintă o asimetrie negativă.
Şi acest parametru α’ oferă o imagine mai puŃin semnificativă asupra gradului de asimetrie al unei
serii.
3.5.2. Parametrii boltirii
Aprecierea boltirii unei serii este utilă în caracterizarea gradului de reprezentativitate a
valorii medii cât şi pentru compararea reprezentativităŃii a două sau mai multe valori medii ce
( )
4
reprezintă serii diferite. Parametrul M X − X d ă o caracterizare numerică sub formă absolută a
gradului de boltire a unei serii. Sub formă relativă, gradul de boltire se măsoară cu parametrul:

B4 =
(
M X −X )
4

(3.130)
σ X4
Pentru a înŃelege semnificaŃia boltirii unei serii, se consideră două serii statistice care au la bază
variabilele X şi Y, iar
X = Y; σ X = σY
Mai presupunem, în plus, că cele două distribu Ńii au formă de clopot pentru care α 3X = α 3Y , adică
ambele sunt simetrice. Deşi s-ar părea că cele două serii nu au nimic care să le deosebească, totuşi
reprezentându-le grafic rezultă dou ă curbe de forma:

X =Y σ X = σY

unde graficul lui X este mai înalt, iar al celeilalte mai plat. Ca urmate, se observă că cele dou ă serii
nu sunt caracterizate de aceeaşi boltire. Boltirea unei serii este utilă pentru a da o caracetrizare mai
exactă reprezentativităŃii valorii medii. În cazul exemplului prezentat mai sus, atât mediile cât şi
abaterile medii p ătratice sunt egale şi ca urmare, coeficientul de variaŃie al lui Pearson este acelaşi
pentru cele două serii. Deci rezultă că ambele valori medii prezintă acelaşi grad de
reprezentativitate. Cu toate acestea, graficele celor două serii contrazic concluzia dedusă în urma
comparării celor doi coeficienŃi de variaŃie. Valoarea medie cea mai reprezentativă în seria în care
cele mai multe unităŃi ale populaŃiei cercetate au înregistrat valori, mai apropiate de valoarea medie.
Pentru o astfel de serie, împrăştierea faŃă de valoarea medie fiind mică, graficul are o formă mai
ascu Ńită în cazul seriei X şi mai plată în cazul seriei Y.
Nivelul boltirii pentru o serie oarecare dată se măsoară cu ajutorul parametrului B4, a cărui
expresie de calcul este dată de relaŃia (3.130). Valoarea lui B4 pentru o distribu Ńie normală este
egală cu 3. Pentru orice altă curbă corespunzătoare unei serii date şi aproximată cu un clopot,
raportul între momentul centrat de ordinul patru şi pătratul momentului centrat de ordinul al doilea,
este un număr diferit de 3, curba respectivă fiind mai ascuŃită sau mai plată decât curba normală a
lui Gauss.
Comparând gradul de boltire al unei serii oarecare şi gradul de boltire al clopotului lui
Gauss, Fisher a stabilit următoarea expresie de calcul al coeficientului boltirii, notat cu B4’:
'
B =
(
M X −X )
4

−3 (3.131)
4
σ X4
sau:
B4’ = B4-3
expresie cunoscută în literatura de specialitate sub denumirea de exces al seriei.
Următoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dacă B4’ =0 (adică B4 = 3) atunci seria în cauză prezintă aceeaşi boltire cu a curbei normale (excesul
este nul);
- dacă B4’ > 0 (adică B4 > 3) atunci boltirea corespunzătoare curbei respective este mai înaltă şi mai
ascuŃită decât curba normală (serie leptokurtică);
- dacă B4’ < 0 (adică B4 < 3) atunci boltirea corespunzătoare curbei respective este mai plată (mai
joasă şi mai largă) decât curba normală (serie platikurtică).
Asimetria şi boltirea joacă un rol însemnat în caracterizarea formei unei serii atributive de
repartiŃie. Cu ajutorul parametrilor prezentaŃi poate fi formată o imagine mai clară asupra unei serii
deja construite, asupra măsurii în care seria respectivă poate fi reprezentată de valoarea sa medie.
3.6. Probleme

Problema 1
Având în vedere populaŃia societăŃilor comerciale supusă observării concretizată în tabelul următor:
Nr Marcă Jud. unde Ramura Capital Cifra de %
îşi are unde îşi social afaceri
profit
sediul
desf. activ.
1. 994 Cluj industrie 8.083.365 2.309.871 0 49 %
2. 1006 Cluj industrie 9.611.744 10.761.787 419.175 49 %
3. 3588 Bucureşti industrie 10.116.125 7.694.483 467.496 49 %
4. 3685 Bucureşti industrie 8.053.025 11.561.823 969 49 %
5. 2994 Timiş industrie 2.121.925 2.317.951 80.880 60 %
6. 928 Cluj agricultură 4.678.625 271.610 0 60 %
7. 929 Cluj agricultură 888.490 159.351 0 60 %
8. 932 Cluj agricultură 1.566.623 5.747.524 1.097 60 %
9. 3382 Bucureşti servicii 1.076.050 5.377.189 17.363 60 %
10. 12 Alba transporturi 2.152.325 4.400.044 8.681 60 %
11. 25 Alba transporturi 2.990.126 871.025 0 60 %
12. 53 Alba servicii 510.285 773.886 38.935 60 %
13. 991 Cluj transporturi 507.277 330.839 0 60 %
14. 1004 Cluj transporturi 4.845.214 5.359.855 12.436 60 %
15. 3096 Timiş transporturi 5.963.750 9.931.327 90.223 60 %
16. 3043 Timiş transporturi 3.410.000 5.387.876 13.238 60 %
17. 47 Alba construcŃii 6.270.418 541.334 0 49 %
18. 32 Alba construcŃii 2.007.911 91.896 976 60 %
19. 3322 Vâlcea construcŃii 3.354.625 6.855.127 145.649 60 %
20. 966 Cluj construcŃii 7.546.425 9.345.803 225.865 60 %
21. 972 Cluj construcŃii 4.116.425 3.720.863 375.052 60 %
22. 1005 Cluj construcŃii 4.629.025 8.000.906 400.575 60 %
23. 9 Alba agricultură 6.848.825 176.728 1.960 60 %
24. 26 Alba agricultură 9.709.000 3.864.087 1.087 49 %
25. 2956 Timiş agricultură 520.686 542.748 0 60 %
26. 2959 Timiş agricultură 2.086.534 37.793 0 60 %
27. 3264 Vâlcea agricultură 1.891.958 988.769 62.668 60 %
28. 3290 Vâlcea agricultură 3.114.550 2.812.349 78.300 60 %
29. 3296 Vâlcea servicii 5.389.225 12.456.122 390.659 49 %
30. 964 Cluj servicii 5.874.950 6.240.445 23.583 60 %

X1 – judeŃul (localitatea) unde îşi are sediul principal;


X2 – ramura (subramura) în care îşi desfăşoară activitatea;
X3 – capital social;
X4 – cifra de afaceri;
X5 – profitul;
X6 – procent din capitalul social care se vinde cu titlul gratuit.
Se cere:
1. să caracterizaŃi seria ce red ă repartiŃia unităŃilor din populaŃie după variabilele X3 sau X4;
2. determinaŃi şi interpretaŃi parametrii tendinŃei centrale pentru această serie: valoarea medie,
valoarea modală şi cea mediană;
3. analiza statistică a reprezentativităŃii valorii medii (sub forma absolută şi relativă);
4. analiza statistică a reprezentativităŃii valorii mediane (sub forma absolută şi relativă);
5. analiza statistică a structurii populaŃiei, în raport cu aceeaşi variabilă (utilizând valoarea mediană,
valorile quartile şi un grafic de structură);
6. analiza comparativă a gradului de concentrare a unităŃilor din populaŃie, în raport cu cele două
variabile alese de noi;
7. analiza statistică a asimetriei şi boltirii repartiŃiei;
8. calculul valorii medii, respectiv a dispersiei, utilizând formule de calcul simplificat.

1.

 [0,5 − 2,1) [2,1 − 3,7) [3,7 − 5,3) [5,3 − 6,9) [6,9 − 8,5) [8,5 − 10,1)
X 3 :  
 9 6 4 5 3 3 
Această serie unidimensională, ce red ă repartiŃia unităŃilor din populaŃie după variabila X3 – capital
social, este o serie atributivă cantitativă continu ă şi are la bază indicatorul frecvenŃă absolută.

2. Parametrii tendinŃei centrale:


Valoarea medie:

capitalul social total 1,3 ⋅ 9 + 2,9 ⋅ 6 + 4,5 ⋅ 4 + 6,1⋅ 5 + 7,7 ⋅ 3 + 9,3 ⋅ 3


X3 = = =
volumul populatiei 30
= 4,286 mld.lei
Deci, dacă toate societăŃile comerciale din eşantion ar avea acest capital social mediu, suma
capitalurilor sociale ce aparŃin celor 30 de societăŃi comerciale ar rămâne neschimbată.
Valoarea mediană:
n = 30 (număr par)
Calculăm rangul medianei:
n
rM e =   = 15 ⇒ M e ∈ [2,1 − 3,7 ) intervalul median
 2
Me = 2,1 + ∆
Presupunem că frecvenŃa unităŃilor care înregistrează variante într-un interval este proporŃională cu
lungimea intervalului.

1,6 mld. lei ……………….. 6 soc. com. ⇒ ∆ = 1,6 mld. Lei

⇒ Me = 2,1 + 1,6 = 3,7 mld. lei.


Deci, jumătate din societăŃile comerciale au capital social mai mic de 3,7 mld. lei şi cealaltă jumătate
din aceste societăŃ i îl au mai mare de 3,7 mld. lei.

 [0,5 − 3,7 ) [3,7 − 10,1)


X 3 :  
 50% 50% 

Valoarea modală:
ni
Calculăm rapoartele ⇒
xi − xi −1

n1 9 n4 5
= = 5,6 = = 3,1
x1 − x0 2,1 − 0,5 x4 − x3 6,9 − 5,3
n2 6 n5 3
= = 3,8 = = 1,9
x2 − x1 3,7 − 2,1 x5 − x4 8,5 − 6,9
n3 4 n6 3
= = 2,5 = = 1,9
x3 − x2 5,3 − 3,7 x6 − x5 10,1 − 8,5

max {5,6; 3,8; 2,5; 3,1; 1,9; 1,9} = 5,6

⇒ M0 ∈ [x0, x1), deci M0 ∈ [0,5-2,1) intervalul modal

∆0 / −1
M 0 = xM 0 + ⋅ lM 0
∆0 / −1 + ∆0 / 1
9−0
M 0 = 0,5 + ⋅ 1,6 = 1,7 mld .lei
(9 − 0) + (9 − 6)

Deci, cele mai multe societăŃi comerciale au capital social în jur de 1,7 mld.lei (dar nu mai mult de
9 sociatăŃi).

3. Analiza statistică a reprezentativităŃii valorii medii

Indicatori:
varianŃa:
6

∑ (x − X ) ⋅ n
' 2
i 3 i
σ X2 = i =1
3
n
unde:
xi + xi −1
xi' = mijlocul unui interval
2
2 2 3 2 2
9 ⋅ (1,3 − 4,3) + 6 ⋅ (2,9 − 4,3) + 4 ⋅ (4,5 − 4,3) + 5 ⋅ (6,1 − 4,3) + 3 ⋅ (7,7 − 4,3)
σ X2 = +
3
30
2
3 ⋅ (9,3 − 4,3)
+ = 7,293mld.lei
30
Deoarece dispersia este destul de mare, însemnă că valoarea medie nu este prea reprezentativă
(adică nu foarte multe variante sunt apropiate de ea).

• abaterea medie pă tratică

σ X = σ X2 = 7,3 = 2,7 mld.lei


3 3

Capitalul social al fiecărei societăti comerciale se abate în medie de la capitalul social mediu de

4,3 mld.lei cu 2,7 mld.lei.

• coeficientul de variaŃie al lui Pearson


σX
V X 3 = 3 ⋅100%
X3
2,7
VX3 = ⋅100% = 62,8%
4,3
Deoarece VX 3 = 62,8% >30%, rezultă că populaŃia este destul de eterogenă, iar valoarea medie în
această situaŃie nu este prea reprezentativă.

4. Caracetrizarea reprezentativităŃii valorii mediane

Avem nevoie de 2 coeficienŃi:

Q3 − Q1
-absolut: =?
2
Q − Q1
-relativ: 3 =?
2⋅ Me

Me = 3,7 mld.lei

Calculăm cuartilele Q1 şi Q3:


Q1 = ?
1  1 
rQ1 =  ⋅ n  =  ⋅ 30 = 7 ⇒ Q1 ∈ [0,5 − 2,1)
4  4 

Q1 = xQ1 +
N (Q1 ) − N xQ1 ( )
⋅ lQ1
N Q1
unde:
xQ1 - marginea inferioară a intervalului în care se află Q1;
N (Q1 ) - frecvenŃa cumulată până la Q1;
N (X Q ) - frecvenŃa cumulată până la xQ1 ;
!

N Q1 - frecvenŃa intervalelor în care se află Q1.


7,5 − 0
Q1 = 0,5 + ⋅ 1,6 = 1,83 mld.lei
9
⇒ 25% din societăŃile comerciale cu capitalul social ≤ 1,83 mld.lei
iar 75% din societăŃile comerciale cu capitalul social >1,83 mld.lei

Q3 = ?

3  3 
rQ3 =  ⋅ n  =  ⋅ 30 = 22 ⇒ Q3 ∈ [5,3 − 6,9)
4  4 

Q3 = xQ3 +
( )⋅l
N (Q3 ) − N xQ3
Q3
N Q3

22,5 − 19
Q3 = 5,3 + ⋅1,6 = 6,42 mld.lei
5

⇒ 75% din societăŃile comerciale cu capitalul social ≤ 6,42 mld.lei


iar 25% din societăŃile comerciale cu capitalul social >6,42 mld.lei

Abaterile intercuartile vor fi:

 Q3 − Q1 6,42 − 1,83
 2 = = 2,3 mld .lei
2
Q − Q
 3 1
⋅100 ≈ 62%
 2 ⋅ M e

⇒ Abaterea variantelor pentru capitalul social dintre Q1 şi Q3 de la valoarea mediană, deci pentru 50%
din populaŃie, este de 2,3 mld.lei. Mediana nu este prea reprezentativă.

Pentru măsurarea abaterii de la valoarea mediană pentru 80% din populaŃie, vom folosi abaterile
interdicile:
D − D1
-absolut: 9 =?
2
D − D1
-relativ: 9 =?
2⋅ Me

Me = 3,7 mld.lei

Calculăm cuartilele D1 şi D9:

D1 = ?
1  1 
rD1 =  ⋅ n  =  ⋅ 30 = 3 ⇒ D1 ∈ [0,5 − 2,1)
10  10 
D1 = xD1 +
( )⋅l
N ( D1 ) − N xD1
D1
ND
3−0
D1 = 0,5 + ⋅1,6 ≈ 1 mld.lei
9
⇒ 10% din populaŃie are capitalul social ≤ 1 mld.lei
iar 90% din populaŃie are capitalul social >1 mld.lei

D9 = ?
N ( D9 ) − N ( xD9 )
rD9 = xD9 + ⋅ l D9
N D9
27 − 24
D9 = 6,9 + ⋅1,6 = 8,5 mld.lei
3
⇒ 90% din societăŃile comerciale cu capitalul social ≤ 8,5 mld.lei
iar 10% din societăŃile comerciale cu capitalul social >8,5 mld.lei

Abaterile interdecile vor fi:

 D9 − D1 8,5 − 1
 2 = = 3,75 mld .lei
2
D − D 8,5 − 1
 9 1
⋅100 = ⋅100 ≈ 101,4%
 2 ⋅ M e 2 ⋅ 3,7
⇒ Abaterea variantelor pentru capitalul social dintre D1 şi D9 de la valoarea mediană, deci pentru 80%
din populaŃie, este de 3,75 mld.lei (mediana nu este prea reprezentativă pentru ele).

5. Analiza statistică a structurii populaŃiei

graficul de structură : vom construi seria statistică ce are la bază indicatorul frecvenŃă relativă:

 [0,5 − 2,1) [2,1 − 3,7 ) [3,7 − 5,3) [5,3 − 6,9 ) [6,9 − 8,5) [8,5 − 10,1)
X 3 :  
 30% 20% 13% 17% 10% 10% 
360˚ …………………….. 100 %
a1 ……………………….. 30% a1 = 108˚

360˚ …………………….. 100 %


a2 ……………………….. 20% a2 = 72˚

360˚ …………………….. 100 %


a3 ……………………….. 13% a3 = 46,8˚

360˚ …………………….. 100 %


a4 ……………………….. 17% a4 = 61,2˚

360˚ …………………….. 100 %


a5 ……………………….. 10% a5 = 36˚

360˚ …………………….. 100 %


a6 ……………………….. 10% a6 = 36˚
Structura societăŃilor din eşantion, după capitalul social

Parametrii de structură :

Legenda: Capitalul social (mld.lei)

10%
1-[0,5-2,1)
10% 30%
2-[2,1-3,7)
3-[3,7-5,3)
17% 4-[5,3-6,9)
5-[6,9-8,5)
20% 6-[8,5-10,1)
13%

• mediana: Me = 3,7 mld.lei

 [0,5 − 3,7 ) [3,7 − 10,1)


X :  
 50% 50% 
• cuartilele: Q1 = 1,83 mld.lei
Q2 = Me = 3,7 mld.lei
Q3 = 6,42 mld. Lei

 [0,5 − 1,83) [1,83 − 3,7 ) [3,7 − 6,42) [6,42 − 10,1)


X :  
 25% 25% 25% 25% 

6. Parametrii concentrării:

 ind . agr. serv. transp. constr.


X 2 :  
 5 9 4 6 6 

5
1 
Energia informaŃională: E X 2 = ∑ f i 2 ; E X 2 ∈  ;1
i =1 5 

25 + 81 + 16 + 36 + 36
EX 2 = ≈ 0,22 (concentrare destul de mică)
900
1
E−
E0 = k
1
1−
k
1
EX 2 −
EoX 2 = 5 = 0,22 − 0,2 = 0,025 (concentrare mică)
1 0,8
1−
5
 [0,5 − 2,1) [2,1 − 3,7) [3,7 − 5,3) [5,3 − 6,9) [6,9 − 8,5) [8,5 − 10,1)
X3 :  
 9 6 4 5 3 3 

1 
E X 3 ∈  ;1
6 

81 + 36 + 16 + 25 + 9 + 9
EX 3 = ≈ 0,195 (concentrare destul de mică)
900
1
EX 3 −
EoX 3 = 6 = 0,195 − 0,16 = 0,042 (concentrare mică)
1 0,84
1−
6

PopulaŃia prezintă o concentrare mai mare în raport cu variabilele X3 (capital social), faŃă de variabila
X2 (ramura de activitate).

7. Asimetria:

α3 =
(
M X3 − X3 )
3

coeficientul de asimetrie a lui Pearson


σX 3

σ X 3 = 2,7 mld.lei
X 3 = 4,3 mld.lei

3  (− 3) 53 
3
(X )
(− 1,4)3 0,23 1,83 3,43

3 − X3 : 
 9 6 4 5 3 3 

− 27 ⋅ 9 + −2,7 ⋅ 6 + 0,008 ⋅ 4 + 5,8 ⋅ 5 + 39,3 ⋅ 3 + 125 ⋅ 3


(
M X3 − X3 = )3

30
≈ 8,76

8,76 8,76
α3 = 3
= = 0,45 ⇒ repartiŃia este asimetrică pozitiv faŃă de valoarea medie deoarece α 3>0.
2,7 19,683

Boltirea:

β3 =
(
M X3 − X3 )4

−3
σ X4 3

 (− 3) 4
(− 1,4)4 0,2 4 1,84 3,4 4 54 
(X 3 − X ) : 3
9
4

6 4 5 3

3 

81⋅ 9 + 3,78⋅ 6 + 0,0016⋅ 4 + 10,44 ⋅ 5 + 133,62⋅ 3 + 625⋅ 3


(
M X3 − X 3 = )3

30
= 102,65
102,65 102,65
β4 = 4
−3 = − 3 = 1,93 − 3, = −1,07 ⇒ repartiŃia aceasta este mai puŃin boltită decât
2,7 53,14
repartiŃia de la legea normală, deoarece β4 < 0.

8. Calculul simplificat al valorii medii:

X 3 = 4,286 mld.lei
Construim seria cu ajutorul mijloacelor intervalelor:

1,3 2,9 4,5 6,1 7,7 9,3


X 3 :  
9 6 4 5 3 3 

Y3 − c
alegem c = 6,1 şi d = 1,61 ⇒ Y =
d

X 3 − 6,1  − 3 − 2 − 1 0 1 2 
Y= :  
1,6  9 6 4 5 3 3 

− 3 ⋅ 9 − 2 ⋅ 6 − 4 + 3 + 6 − 27 − 12 − 4 + 9
Y = = = −1,133
30 30

X 3 = Y ⋅1,6 + 6,1 = −1,133 ⋅1,6 + 6,1 = 6,1 − 1,8128 = 4,287 mld.lei

Problema 2
Un număr de 32 de cadre didactice au efectuat într-o lună, fiecare cel mult două norme. Distribu Ńia
acestora în raport cu salarul de încadrare şi numărul normelor efectuate este:

N 1 2 Total
S
6,2 - 6,6 4 4 8
5,8 - 6,2 4 4 8
5,4 - 5,8 4 4 8
5 - 5,4 4 4 8
Total 16 16 32

S-a notat cu N numărul normelor şi S salarul exprimat în milioane lei. Folosind proprietatea
“media produsului a două variabile este egală cu produsul mediilor” să se calculeze venitul mediu
obŃinut de un cadru didactic în luna respectivă. Pentru a folosi proprietatea mai sus enunŃată este
necesar ca cele dou ă variabile implicate S şi N să fie independente. Acesta rezultă imediat din
distribuŃia bidimensională dată.
Trebuie arătat că: M(S) · M(N) = M(S·N)
16 ⋅1 + 16 ⋅ 2
M (N ) = = 1,5
32
5,2 ⋅ 8 + 5,6 ⋅ 8 + 6 ⋅ 8 + 6,4 ⋅ 8 185,6
M (S ) = = = 5,8
32 32
4 ⋅ (5,2 + 5,6 + 6 + 6,4) + 8 ⋅ (5,2 + 5,6 + 6 + 6,4 ) 4 ⋅ 23,2 + 8 ⋅ 23,2
M (S ⋅ N ) = = =
32 32
278,4
= = 8,7 mil.lei
32
M(S) · M(N) = 1,5 · 5,8 = 8,7 mil.lei.

Un cadru didactic a primit în medie pe luna respectivă 8,7 mil.lei.

Problema 3
Cunoaştem următoarea distribu Ńie a 52 de societăŃi comerciale cu acelaşi profil de activitate, în
raport cu variabilele X – cheltuielile cu publicitatea (mil. lei) şi Y - volumul vânzărilor (mil. lei).

X
[3;5] (5;7] (7;9] Total
Y
( 60 ; 80 ] 2 7 8 17
( 40 ; 60 ] 3 10 5 18
[ 20 ; 40 ] 14 2 1 17
Total 19 19 14 52

Se cere:
1) Să se verifice regula de adunare a varianŃelor
2) În ce proporŃie volumul vânzărilor depinde de cheltuielile cu publicitatea ?

Rezolvare:

30 ⋅ 17 + 50 ⋅ 18 + 70 ⋅ 17 2600
1) Y = = = 50
17 + 18 + 17 52

VTOT = σ Y2 =
(30 − 50)2 ⋅ 17 + (50 − 50)2 ⋅18 + (70 − 50)2 ⋅ 17 = 13600 = 261,54
17 + 18 + 17 52

Y 30 ⋅ 14 + 50 ⋅ 3 + 70 ⋅ 2 710
= = = 37,37
X ∈ [3;5] 14 + 3 + 2 19

Y 30 ⋅ 2 + 50 ⋅ 10 + 70 ⋅ 7 1050
= = = 55,26
X ∈ (5;7] 2 + 10 + 7 19

Y 30 ⋅ 1 + 50 ⋅ 5 + 70 ⋅ 8 840
= = = 60
X ∈ (7;9] 1+ 5 + 8 14

VEXP =
(37,37 − Y ) 2
⋅ 19 + (55,26 − Y ) ⋅ 19 + (60 − Y ) ⋅14
2 2

=
19 + 19 + 14
2 2 2
=
(37,37 − 50) ⋅ 19 + (55,26 − 50 ) ⋅ 19 + (60 − 50) ⋅ 14
= 95,32
52
σ Y2 =
(30 − 37,37)2 ⋅ 14 + (50 − 37,37)2 ⋅ 3 + (70 − 37,37)2 ⋅ 2 = 177,28
X ∈[3;5 ] 14 + 3 + 2

σ Y2 =
(30 − 55,26)2 ⋅ 2 + (50 − 55,26)2 ⋅ 10 + (70 − 55,26)2 ⋅ 7 = 161,77
X ∈(5; 7 ] 2 + 10 + 7

σ Y2 =
(30 − 60)2 ⋅ 1 + (50 − 60)2 ⋅ 5 + (70 − 60)2 ⋅ 8 = 157,14
X ∈( 7 ;9 ] 1+ 5 + 8

σ Y2 ⋅ 19 + σ Y2 ⋅ 19 + σ Y2 ⋅ 14
X ∈[3; 5 ] X ∈( 5;7 ] X ∈( 7 ;9 ]
VREZ = σ Y2 = =
X 19 + 19 + 14
177,28 ⋅ 19 + 161,77 ⋅ 19 + 157,14 ⋅ 14
= = 166,19
52
Se observă că:
σ Y2 ≅ σ Y2 / X + σ Y2 / X
261,54 ≅ 95,32 + 166,19

σ2
VEXP Y 95,32
2) ⋅ 100% = 2X ⋅ 100% = ⋅ 100% = 36,4%
VTOT σY 261,54
Volumul vânzărilor depinde în proporŃie de 36,4% de cheltuielile cu publicitatea şi în proporŃie de
63,6% de alŃi factori.

Problema 4

Un produs a fost lansat simultan pe 13 pieŃe. Pe aceste pieŃe produsul a fost propus la preŃuri diferite
(P), veniturile consumatorilor (V) fiind şi ele diferite. Pe fiecare piaŃă s-a înregistrat un anumit nivel al
cererii (C), rezultatele fiind sintetizate în tabelul următor:

Nr. crt. Cerere (C) PreŃ (P) Venit (V)


1 15,4 1,4 620
2 3,2 5,1 530
3 4,9 2,5 490
4 10,5 1,7 800
5 8,0 1,8 630
6 5,1 3,4 410
7 7,6 2,1 670
8 11,3 1,6 920
9 14,0 3,6 990
10 6,4 3,5 320
11 13,2 1,9 520
12 8,8 1,8 700
13 12,1 1,9 730
DeterminaŃi:
a) cererea medie;
b) varianŃa pentru variabila “cerere”;
c) cu cât se abate în medie cererea de la o piaŃă la alta;
d) cu cât la sută se abate în medie cererea de la o piaŃă la alta.
Obs. Rezolvarea decurge în mod analog pentru celelalte variabile.

a) Cererea medie C este:


15,4 + 3,2 + 4,9 + ... + 8,8 + 12,1 120,5
C = = = 9,27 u.m.
13 13
b) VarianŃa σ C2 se calculează conform definiŃiei:
13

∑ (x − X ) ⋅ Ni
2
i
σ C2 = i =1
13

∑N i =1
i

( )
Întrucât seria prezintă frecvenŃe absolute egale N i = 1, i = 1,13 , se utilizează următoarea expresie de
calcul a varianŃei:
13

∑(x − X ) (15,4 − 9,27) + (3,2 − 9,27)


2
2 2 2
i
+ ... + (12,1 − 9,27) 175,2277
σ C2 = i =1
= = = 13,48
13 13 13
2
c) σ C = σ C = 13,48 = 3,67 u.m. ⇒ cererea se abate în medie de la o piaŃă la alta cu 3,67 u.m.

d) Abaterea medie pătratică exprimată sub formă relativă, prin intermediul coeficientului de variaŃie
Pearson este:
σ 3,67
CV (C ) = C ⋅ 100% = ⋅ 100% = 39,59%
C 9,27
⇒ cererea se abate în medie cu 39,59% de la o piaŃă la alta

Problema 5
RepartiŃia angajaŃilor într-o societate comercială, în raport cu salariul lunar (exprimat în lei), este
caracterizată prin următoarea serie:
 560 − 700 700 − 840 840 − 980 980 − 1120 1120− 1260 1260− 1400
X :  
 75 143 196 68 43 25 
Să se determine:
a) valoarea mediană;
b) valoarea modală;
c) valorile quartile, valorile decile (vom calcula ca exemplu D1, D3, D7) şi valorile centile (vom calcula
ca exemplu C58, C76).

Rezolvare:
a) Prima etapă în calculul medianei o constituie calculul rangului, după cum urmează:
1 R 1 550
rMe = ⋅ ∑ N i = ⋅ (75 + 143 + 196 + 68 + 43 + 25) = = 275
2 i =1 2 2
Următoarea etapă constă în determinarea intervalului median. Însumând frecvenŃele succesiv, până ce
valoarea obŃinută depăşeşte rangul, rezultă că intervalul care va conŃine mediana este [840-980).
N 1 + N 2 + ... + N i > rM e
75 + 143 + 196 = 414 > 275 ⇒ M e ∈ [840 − 980)
În fine, ultima etapă este cea în care se determină valoarea mediană. Fiind vorba de o serie care are la
bază o variabilă continuă, mediana se obŃine conform relaŃiei:
M e = xM e +
( )
N (M e ) − N x M e
⋅ l M e , unde
N Me
x M e - limita inferioară a intervalului median;
N (M e ) - frecvenŃa absolută cumulată până la mediană (rangul medianei);
( )
N xM e - frecvenŃa absolută cumulată până la intervalul median;
N M e - frecvenŃa absolută a intervalului median;
l M e - lungimea intervalului median.
275 − 218
M e = 840 + ⋅ (980 − 840) = 880,71 lei
196
Aşadar, jumătate dintre angajaŃii societăŃii respective câştigă cel mult 880,71 lei, iar cealaltă jumătate
câştigă cel puŃin 880,71 lei în perioada în care s-a făcut observarea.
Relevantă în acest sens este următoarea serie, construită având în vedere mediana, şi care
constituie repartiŃia celor două jumătăŃi din populaŃia angajaŃilor:

 560 − 880,71 880,71 − 1400 


Y :  
 50% 50% 

b) Calculul valorii modale presupune în primul rând găsirea intervalului modal (a intervalului căruia îi
corespunde frecvenŃa cea mai mare). FrecvenŃa cea mai mare este 196 şi ca urmare, intervalul modal
este [840-980).
În continuare se aplică relaŃia de calcul a valorii modale:
∆ −1
M o = xM o + ⋅ l , unde
∆ −1 + ∆1 M o
x M o - limita inferioară a intervalului modal;
∆ −1 - diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului precedent;
∆ 1 - diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului următor;
l M o - lungimea intervalului modal.
196 − 143 53
M o = 840 + ⋅ (980 − 840) = 840 + ⋅140 ≅ 881 lei
(196 − 143) + (196 − 68) 53 + 128
Putem afirma că cei mai mulŃi angajaŃi ai societăŃii comerciale respective au un salar lunar în jur de
881 lei.

c) Pentru calculul valorilor quartile se determină mai întâi rangul fiecărei quartile.
1 R N 550
rQ1 = 1 ⋅ ⋅ ∑ N i = ⇒ rQ1 = = 137,5
4 i =1 4 4
1 R N 550
rQ2 = 2 ⋅ ⋅ ∑ N i = 2 ⋅ ⇒ rQ2 = 2 ⋅ = 275
4 i =1 4 4
1 R N 550
rQ3 = 3 ⋅ ⋅ ∑ N i = 3 ⋅ ⇒ rQ3 = 3 ⋅ = 412,5
4 i =1 4 4

În continuare se determină intervalele quartile:


1 R
- primul interval care satisface inegalitatea: N 1 + N 2 + ... + N i ≥ ⋅ ∑ N i este [700-840) şi reprezintă
4 i=1
intervalul quartilei mici Q1;
75 + 143 = 218 > 137,5 ⇒ Q1 ∈ [700 − 840)
- pentru quartila mijlocie Q2, intervalul căutat este chiar intervalul median [840-980);
1 R
N 1 + N 2 + ... + N i ≥ 2 ⋅ ⋅ ∑ N i
4 i =1
75 + 143 + 196 = 414 > 275 ⇒ Q2 = M e ∈ [840 − 980)
1 R
- primul interval care satisface inegalitatea N 1 + N 2 + ... + N i ≥ 3 ⋅ ⋅ ∑ N i este [840-980) şi reprezintă
4 i =1
intervalul quartilei mari Q3;
75 + 143 + 196 = 414 > 412,5 ⇒ Q3 ∈ [840 − 980)
Etapa finală constă în calculul valorilor quartile după următoarea relaŃie:

Q p = xQ p +
( )
N (Q p ) − N xQ p
⋅ lQ p , p = 1,3 , unde
N Qp
xQ p - limita inferioară a intervalului quartilei Qp;
N (Q p ) - rangul quartilei Qp;
( )
N xQ p - frecvenŃa absolută cumulată până la intervalul quartilei Qp;
N Q p - frecvenŃa absolută a intervalului quartilei Qp;
lQ p - lungimea intervalului quartilei Qp.
137,5 − 75
Q1 = 700 + ⋅ (840 − 700) = 761,19 lei, ceea ce înseamnă că 25% dintre angajaŃii
143
societăŃii câştigă cel mult 761,19 lei
275 − 218
Q2 = 840 + ⋅ (980 − 840) = 880,71 lei
196
⇒ 25% dintre angajaŃii societăŃii au un salar cuprins între 761,19 lei şi 880,71 lei

412,5 − 218
Q3 = 840 + ⋅ (980 − 840) = 978,93 lei
196
⇒ 25% dintre angajaŃii societăŃii au un salar cuprins între 880,71 lei şi 978,93 lei. Mai putem
spune şi că 25% dintre angajaŃii societăŃii câştigă cel puŃin 978,93 lei.
Relevantă în acest sens este următoarea serie, construită având în vedere valorile quartile:

 560 − 761,19 761,19 − 880,71 880,71 − 978,93 978,93 − 1400


Z :  
 25% 25% 25% 25% 
Calculul decilelor:
Într-o primă fază se calculează rangul conform relaŃiei:
1 R N
rD p = p ⋅ ⋅ ∑ N i = p ⋅ , p = 1,9
10 i =1 10
550 550 550
ObŃinem: rD1 = 1 ⋅ = 55 ; rD3 = 3 ⋅ = 165 ; rD7 = 7 ⋅ = 385
10 10 10
Pentru fiecare decilă Dp, p = 1,9 , se determină intervalul decil corespunzător, conform inegalităŃii:
1 R
N 1 + N 2 + ... + N i ≥ p ⋅ ⋅ ∑ N i , p = 1,9
10 i =1
75 > 55 ⇒ D1 ∈ [560 − 700)
75 + 143 = 218 > 165 ⇒ D3 ∈ [700 − 840)
75 + 143 + 196 = 414 > 385 ⇒ D7 ∈ [840 − 980)
În final se calculează decila corespunzătoare, după relaŃia:

D p = xDp +
( )
N (D p ) − N x D p
⋅ l D p , p = 1,9 , unde
N Dp
x Dp - limita inferioară a intervalului decilei Dp;
N (D p ) - rangul decilei Dp;
( )
N x D p - frecvenŃa absolută cumulată până la intervalul decilei Dp;
N D p - frecvenŃa absolută a intervalului decilei Dp;
l D p - lungimea intervalului decilei Dp.

55 − 0
D1 = 560 + ⋅ (700 − 560) = 662,67 lei
75
⇒ 10% dintre angajaŃ i câştigă cel mult 662,67 lei, respectiv 90% dintre angajaŃi câştigă cel puŃin
662,67 lei
165 − 75
D3 = 700 + ⋅ (840 − 700) = 788,11 lei
143
⇒ 30% dintre angajaŃ i câştigă cel mult 788,11 lei, respectiv 70% dintre angajaŃi câştigă cel puŃin
788,11 lei
385 − 218
D7 = 840 + ⋅ (980 − 840) = 959,29 lei
196
⇒ 70% dintre angajaŃ i câştigă cel mult 959,29 lei, respectiv 30% dintre angajaŃi câştigă cel puŃin
959,29 lei

Calculul centilelor:
Se calculează rangul după relaŃia:
1 R N
rC p = p ⋅ ⋅ ∑ Ni = p ⋅ , p = 1,99
100 i=1 100
550 550
ObŃinem: rC58 = 58 ⋅ = 319 ; rC76 = 76 ⋅ = 418
100 100
Se determină intervalul corespunzător, conform inegalităŃii:
1 R
N 1 + N 2 + ... + N i ≥ p ⋅ ⋅ ∑ N i , p = 1,99
100 i =1
75 + 143 + 196 = 414 > 319 ⇒ C58 ∈ [840 − 980)
75 + 143 + 196 + 68 = 482 > 418 ⇒ C 76 ∈ [980 − 1120)
În final se calculează centila corespunzătoare, după relaŃia:

C p = xC p +
( )
N (C p ) − N xC p
⋅ l C p , p = 1,99
N Cp
319 − 218
C 58 = 840 + ⋅ (980 − 840) = 912,14 lei
196
⇒ 58% dintre angajaŃii societăŃii câştigă cel mult 912,14 lei, respectiv 42% dintre angajaŃi câştigă
cel puŃin 912,14 lei

418 − 414
C 76 = 980 + ⋅ (1120 − 980) = 988, 24 lei
68
⇒ 76% dintre angajaŃii societăŃii câştigă cel mult 988,24 lei, respectiv 24% dintre angajaŃi câştigă
cel puŃin 988,24 lei.

Probleme propuse:

1. În vederea studierii situaŃiei actuale pe piaŃa acŃiunilor, s-a format un eşantion reprezentativ de
volum 40, a cărui repartiŃie în raport cu preŃul (în mii lei) este:

10 − 16 16 − 22 22 − 28 28 − 34 34 − 40 
X :  
 4 5 15 10 6 
Se cere:
a) preŃul mediu;
b) preŃul înregistrat de cele mai multe acŃiuni din eşantion;
c) acel preŃ care divide eşantionul în două părŃi egale;
d) reprezentativitatea preŃului mediu;
e) să se calculeze cu cât se abate în mediu preŃul unei acŃiuni din eşantion de la preŃul mediu;
f) folosind valorile cuartile să se studieze structura acŃiunilor în raport cu preŃul.

2. Într-o firmă s-au realizat 40 de produse în cadrul unui trimestru. Acestea au fost propuse
prelucrării în mod secvenŃial în două secŃii de producŃie. RepartiŃia produselor realizate în raport
cu costurile (mii lei) din cele două secŃii a fost:

C2
100 - 108 108 - 116 116 - 124 124 - 132
C1
62 – 66 - 2 1 1
58 – 62 3 5 3 -
54 – 58 1 10 5 1
50 – 58 1 3 1 3
Folosind proprietatea conform căreia “media sumei a două variabile este egală cu suma mediilor
acestora”, calculaŃi costul mediu pe produs.

3. DistribuŃia a 100 de angajaŃi din trei ramuri de activitate diferite, în raport cu salarul primit este:
R
R1 R2 R3
S
8,0 – 8,5 6 8 7
7,5 – 8,0 6 7 8
7,0 – 7,5 7 10 5
6,5 – 7,0 11 5
6 – 6,5 10 10
Total 40 30 30
Folosind proprietatea de aditiune a mediei aritmetice să se calculeze salarul mediu pe angajat.
Capitolul 4

ANALIZA LEGĂTURILOR DINTRE VARIABILELE


UNEI REPARTIłII MULTIDIMENSIONALE

În capitolul precedent au fost prezentate metode statistice de analiză ale seriilor


unidimensionale. În capitolul de faŃă ne propunem abordarea unor metode statistice caracteristice
studiului seriilor multidimensionale. Scopul acestora este de a identifica şi utiliza eventualele legături
care se pot manifesta între două sau mai multe variabile. Ne pot interesa: existenŃa legăturii,
intensitatea acesteia, forma funcŃională a legăturii, parametrii şi reprezentativitatea ei privind
fenomenul cercetat. Problematica legăturilor dintre variabile este foarte curent întâlnită în economie.
Spunem că salariul unui angajat este în funcŃie de productivitatea muncii sale, vechimea în muncă,
responsabilitatea activităŃii sale, etc ; sau cererea dintr-un produs este în funcŃie de preŃul produsului,
venitul consumatorilor, etc. De fiecare dată, atât în teoria economică, cât şi în aplicaŃ ii se întâlneşte
expresia “fie funcŃia cererii…”. În realitatea economică însă, această funcŃie nu se dă, nu se cunoaşte,
ci trebuie estimată pornind de la o bază de date. Această problemă de estimare a unei funcŃii şi alte
probleme colaterale ei fac obiectul acestui capitol.
Pentru a putea aborda studiul legăturilor dintre variabile trebuie să ştim în primul rând dacă
există sau nu o legătură între variabilele studiate (sau între fenomenele pe care acestea le reprezintă) şi
care este natura acestora. Putem clasifica legăturile dinte variabile astfel :
1. Legă tura nulă. Semnifică lipsa oricărei legături între două sau mai multe fenomene sau
variabile care cuantifică fenomenele. De exemplu, o legătură nulă se manifestă între înălŃimea unui
angajat şi salariul acestuia sau între produsul intern brut al unei Ńări şi vârsta primului ministru. Din
punct de vedere statistic, spunem că între două variabile X şi Y există o legătură nulă, sau nu există
legătură, dacă cov( x, y ) = 0 .
2. Legătura deterministă . Spunem că între variabilele X şi Y există o legătură deterministă
dacă unei valori a lui X îi corespunde o singură valoare a lui Y. Astfel de legături se întâlnesc în special
în fizică, unde de exemplu viteza este egală cu distanŃa împărŃită la timp: v = d / t , sau forŃa este egală
cu masa înmulŃită cu acceleraŃia: F = m ⋅ a . Astfel de exemple există şi în economie, unde rata
profitului este egală cu profitul împărŃit la cifra de afaceri: rπ = π / C . A. ⋅ 100% . Legătura este
deterministă pentru că variabila rπ este perfect determinată de celelalte două: π şi C.A. Adică pentru
o anumită valoare a profitului şi o anumită valoare a cifrei de afaceri nu putem avea decât o singură
valoare a ratei profitului.
3. Legă tura statistică. Se mai numeşte şi stocastică sau probabilistă. Este tipul de legătură cel
mai des întâlnită în ştiinŃele sociale, deci şi în economie. Fiecărei valori xi a variabilei X îi corespunde
o distribuŃie de valori ale variabilei Y. Matematic, o astfel de legătură se exprimă sub forma
y = f ( x) + ε , unde am notat prin ε componenta aleatoare reziduală, datorată acŃiunii asupra lui Y a
celorlalŃ i factori decât X. Deşi s-ar putea spune că prin luarea în considerare a tuturor factorilor care
influenŃează variabila Y, legătura este intrinsec deterministă, în ştiinŃele economice vom întâlni
aproape întotdeauna un număr foarte mare de factori, care nu pot fi identificaŃ i şi cuantificaŃi în
totalitatea lor. Asfel, funcŃia care îl explicitează pe Y are două componente: una determnistă,
f ( x1 , x2 ,..., xn ) , cuprinzând variabilele cuantificabile de care depinde Y, şi una aleatoare, ε ,
cuprinzând variabilele ce nu au putut fi cuantificate.
Sudiul legăturilor dintre variabile s-a dezvoltat într-o disciplină aparte, numită econometrie. În
capitolul de faŃă nu ne propunem deci decât o introducere în această problematică, fără a aborda
elemente de inferenŃă statistică specifice acestor legături. În cele ce urmează vom prezenta câteva
aspecte legate de variabile şi fenomenele reprezentate de acestea, probleme atât de natura aparatului
statistic utilizat, cât şi de aplicabilitatea lui în contextul economic.
1. Natura probabilistă a legăturilor. Această natură are ca urmare un anume grad de
nedeterminare ceea ce duce la o dificilă identificare a corelaŃiilor dintre variabile. Nedeterminarea
parŃială se datorează multitudinii factorilor care determină un anumit fenomen. Mecanismul proceselor
economice este adeseori deosebit de complex, presupunând existenŃa unui număr foarte mare de
factori de luat în considerare. Structurile cauzale se pot dovedi a fi complicate, cauza unui fenomen
depinzând la rândul ei de o altă cauză. De asemenea legăturile pot fi atât univoce cât şi biunivoce,
două variabile putând fi în acelaşi timp cauză şi efect. De multe ori chiar teoria economică poate
clarifica situaŃia, mecanismul formării cererii de exemplu fiind explicat prin preŃ şi venit. În alte cazuri
însă, din lipsa unei teorii pertinente într-un anumit domeniu se poate începe prin instrumentul statistic,
iar dacă anumite ipoteze formulate se adeveresc prin efectuarea observaŃiilor, se încearcă o justificare
economică a rezultatului găsit. Această din urmă cale poate fi totuşi periculoasă dacă explicaŃia
economică nu este găsită, deoarece din punt de vedere statistic se poate identifica o corelaŃie puternică
între două variabile aparent fără nici o legătură între ele, deoarece se realizează prin intermediul unei a
treia variabile, care poate fi cauza comună a celorlalte două.
Toată această argumentaŃie mai sus expusă nu este făcută cu scopul de a încurca şi mai mult
cititorul, ci pentru a atrage atenŃia atât asupra coplexităŃ ii problematicii acestui capitol, cât şi a
modului de utilizare a aparatului statistic ce urmează a fi expus, nu într-un mod mecanic, după o
anumită reŃetă, ci în strânsă legătură cu teoria economică.
2. Variabilele endogene, exogene şi reziduale. În studiul legăturilor dintre fenomene intervin
mai multe tipuri de variabile, după rolul jucat de ele în funcŃia care explicitează legătura. Variabila
efect, cea pe care dorim să o explicăm prin intermediul altor factori se numeşte variabilă endogenă
(sau explicată sau dependentă ) şi obişnium să o notăm cu Y. Factorii de influenŃă (cei cuantificabili),
variabilele prin care explicităm fenomenul, se numesc variabile exogene (sau explicative sau
factoriale). Obişnuim să le notăm cu X 1 , X 2 ,..., X n . Variabilele care au influenŃă asupra fenomenului
cercetata, a variabilei endogene, dar care nu pot fi identificate sau cuantificate, se grupează sub forma
unei variabile reziduale, notată cu ε .
Identificarea variabilelor explicative în scopul studierii influenŃei lor asupra celei dependente
se bazează pe cunoştinŃele şi experienŃa specialistului în domeniul cercetat, dar şi pe metode statistice
specifice. În economie majoritatea legăturilor între variabile sunt cunoscute pornind de la teoria
economică. Totuşi, fiecare situaŃie economică concretă poate presupune o altă intensitatea a legăturii,
o altă influenŃă a fiecărui factor asupra variabilei enndogene. În alte cazuri însă, dependenŃele teoretice
nu se cunosc, ci trebuie identificate pe baza observării fenomenelor studiate. Aceste fenomene vor
trebui însă urmărite în timp pentru a verifica dacă legătura este una conjuncturală sau Ńine de un
anumit mecanism economic.
În funcŃie de situaŃia concretă în fiecare domeniu sau caz, în alegerea variabilelor explicative se
poate proceda în două moduri:
a) Introducerea succesivă a variabilelor în model (funcŃie). Pentru început se aleg variabilele
presupuse a fi cele mai semnificative. Dacă fenomenul cercetat nu este suficient de bine
explicat de acestea, se mai introduc variabile până la obŃinerea unei funcŃii satisfăcătoare.
b) Eliminarea succesivă a variabilelor din model. Dacă funcŃia care conŃine toate variabilele
explicative (sau potenŃial explicative) este prea “încărcată”, se poate renunŃa la o parte din
ele, care se dovedesc neesenŃiale, adică explică o prea mică parte din fenomenul cercetat.
Alegerea uneia sau alteia din metode poate depinde şi de scopul cercetării. Scopul studiului trebuie
să ne indice precis variabila de explicat şi ne poate sugera unele variabile explicative. Alegerea
acestora însă, poate să fie condiŃionată de bugetul alocat care să nu permită o extindere prea mare a
numărului lor. În acelaşi timp un număr mare de variabile explicative explică mai bine un
fenomen, dar face modelul mai complicat, mai dificil de înŃeles şi utilizat. Scopul este deci
identificarea unui model căt mai simplu, dar care să cuantifice cât mai mult variaŃia explicită.
3. Multicoliniaritatea. Aşa cum am mai precizat, un model cuprinde o variabilă de explicat Y
şi câteva variabile explicative X 1 , X 2 ,..., X n . Acestea din urmă trebuie să fie independente între
ele, dar corelate cu variabila dependentă. În cazul în care condiŃia nu este îndeplinită, apare
fenomenul de multicoliniaritate. Neluarea în considerare a acestuia duce la erori de estimare şi
dificultăŃi de utilizare a modelului. De exemplu, nu putem şti cum se modifică Y la o modificare a
unei variabile factoriale oarecare X i , în condiŃiile în care celelalte rămân constante. CorelaŃia
dintre ele nu permite modificarea uneia fără modificarea celorlalte. În acest fel, nu putem simula
prin funcŃie o anumită situaŃie prin modificarea valorilor variabilelor factoriale şi studiul
impactului acestor modificări asupra celei endogene.
Eliminarea multicoliniarităŃii se face prin renunŃarea la unele variabile între care există
corelaŃii. Putem proceda astfel, deoarece nu se pierde toată informaŃia conŃinută în ele, ea existând
de asemenea în mare parte în variabilele rămase. Nu trebuie exagerată totuşi eliminarea, deoarece
duce la o mai proastă specificare a varianŃei explicate.
4. Mă surarea variabilelor. Variabilele din model trebuie exprimate în aşa fel încât să
permită o cât mai uşoară şi corectă prelucrare, estimare şi utilizare. Este vorba atât de unitatea de
măsură, cât şi de indicatorul în care sunt exprimate. Nu sunt rare situaŃiile în care este preferată
utilizarea diferenŃelor relative şi absolute, a indicilor, logaritmilor, exponenŃilor, etc.
5. Modelul matematic. Este o etapă care urmează în mod firesc după stabilirea variabilelor
din model. Si aici în majoritatea cazurilor teoria economică este cea care ne furnizează şi forma
legăturii. În multe situaŃii ni se pare normal ca relaŃia dintre factori trebuie să fie aditivă,
multiplicativă, exponenŃială, etc, sau după o funcŃie compusă. Enumerăm aici cu titlu de exemplu
funcŃiile Cob-Douglas, Tornquist, Philips. În cazul în care tipul relaŃiei matematice nu este
precizat, acest rol revine instrumentului statistic. Cea mai simplă metodă o constituie utilizarea
unui grafic adecvat punerii în evidenŃă a formei legăturii. Totuşi, concluziile obŃinute pe baza
metodelor statistico-matematice trebuie corelate cu teoria economocă, pentru că putem trage
adeseori concluzii pripite, datorate unor valori conjuncturale ale variabilelor, cu un rol foarte mare
al factorilor reziduali.
6. Calitatea datelor. Datele ce se află la dispoziŃia utilizatorului au de asemenea o mare
importanŃă. Calitatea proastă a acestora poate deteriora rezultatele modelului, chiar în urma
parcurgerii reuşite a etapelor construirii acestuia.
Un aspect al calităŃii datelor îl reprezintă numărul de observaŃii, acurateŃea şi corectitudinea
culegerii şi înregistrării lor. O funcŃie va fi cu atât mai bună cu cât se bazează pe o bază de date
mai importantă. Ne putem uşor imagina ce concluzii eronate am putea să trgem dintr-o funcŃie care
explică intenŃiile de vot pentru un candidat sau partid în funcŃie de diverse variabile proprii
electorului ca vârsta, profesia, venitul, etc, dacă studiul are loc pe folosind date cu privire la trei
persoane.
Un alt aspect îl reprezintă omogenitatea populaŃiei supuse studiului. Cu cât populaŃia este
mai omogenă, cu atât se măreşte ponderea varianŃei explicate pe baza aceloraşi variabile. Pentru
populaŃii foarte eterogene se poate dovedi benefică o împărŃire a acestora în clase şi construirea
unui model în fiecare clasă.
În cazul (şi este cel mai des întâlnit) în care datele provin dintr-un eşantion este necesară
urmărirea reprezentativităŃii eşantionului pentru populaŃia din care a fost extras. Altfel, rezultatele
modelului nu pot fi extinse pentru întreaga populaŃie. Luând acelaşi exemplu de mai sus, ne putem
imagina ce concluzii am putea trage la nivelul întregului electorat dacă datele disponibile s-ar
referi numai la un singur segment de vârstă sau venit.
Analiza legăturii dintre variabilele unei repartiŃii multidimensionale presupune abordarea
următoarelor probleme, care se pot constitui şi în etape ce trebuie parcurse în demersul statistic
necesar:
1. Organizarea rezultatelor observării populaŃiei sau eşantionului în raport cu variabilele
cercetate
2. Analiza statistică a existenŃei legăturii
3. Analiza statistică a intensităŃii legăturii sau a gradului de asociere dintre variabilele
observate
4. Formularea unor ipoteze cu privire la forma matematică a legăturii
5. Estimarea parametrilor funcŃiei de regresie
6. Analiza reprezentativităŃii funcŃiei de regresie
Aceste etape pot fi parcurse integral sau parŃial, în funcŃie de natura variabilelor. Pentru variabilele
calitative nu vor fi parcurse (în statistica descriptivă) decât primele trei, deoarece posibilităŃile de
prelucrare sunt mai reduse. În schimb, toate cele şase etape pot fi parcurse în cazul variabilelor
cantitative.

4.1. Organizarea rezultatelor observă rii populaŃiei sau eşantionului în raport cu variabilele
cercetate

În scopul utilizării facile a informaŃiei culese la nivelul populaŃiei sau eşantionului, rezultatele
observării vor fi sistematizate într-o formă convenabilă prelucrării lor. Se preferă de obicei o formă
tabelară a prezentării, care poate sugera unele idei de lucru pentru etapele următoare, prin unele
remarci cu privire la valorile pe care le-au înregistrat variabilele.

Tabelul 4.1
Nr. crt. Y X1 X2 … Xn
1 y1 x11 x21 … xn1
2 y2 x12 x22 … xn 2
… … ... .... ... ...
… … ... ... … …
… … … … … …
N yN x1N x2 N … xnN
Această formă de prezentare este una primară. Evident, dacă necesităŃile oricăreia din etapele
următoare o cer, datele pot fi prezentate şi sub alte forme tabelare sau grafice convenabil alese.

4.2. Analiza statistică a existenŃei legă turii

În studiul analizei existenŃei legăturii vom folosi atât elemente de statistică deja abordate în
capitolele anterioare, cum ar fi tabelele şi graficele, cât şi parametri (coeficienŃ i) specifici acestui
capitol. Deoarece prezintă particularităŃi distincte, vom aborda separat problematica subcapitolului
în funcŃie de tipul variabilelor.

4.2.1. Analiza statistică a existenŃei legăturii pentru variabile calitative


Un prim instrument ce ne stă la îndemână este tabelul de corelaŃie, un tabel cu două intrări,
reprezentând o repartiŃie bidimensională. Modul de construcŃie al unui astfel de tabel se cunoaşte
de la seriile statistice.

Tabelul 4.2

X x1 x2 … xi … xI Total

Y
yJ N1 J N2J . N iJ . N IJ N •J
… . . . . . . .
yj N1 j N2 j . N ij . N Ij N• j
… . . . . . . .
y2 N12 N 22 . N i2 . NI2 N •2
y1 N11 N 21 . N i1 . N I1 N •1

Total N1• N 2• . N i• . N I• N
O primă ipoteză asupra existenŃei sau inexistenŃei legăturii ne este furnizată de metode pur
descriptive, ca studiul tabelului de corelaŃie sau a norului de puncte asociat. Urmărim dacă
frecvenŃele absolute N ij iau valori apropiate în tot tabelul, caz în care nu există legătură între
variabilele X şi Y, iar norul de puncte asociat prezintă o repartizare omogenă a punctelor pe
domeniul de valori al variabilelor. Dacă frecvenŃele se repartizează după una din diagonale sau o
curbă oarecare sugerând existenŃa unei legături, norul de puncte asociat prezintă o grupare a
punctelor după o anumită formă (o dreaptă sau o curbă). Cu cât norul de puncte este mai grupat, cu
atât ne putem aştepta mai mult la existenŃa unei legături.
Metodele descriptive amintite anterior sunt imediate şi uşor de utilizat, dar nu pot stabili clar
existenŃa sau inexistenŃa unei legături. Pentru aceasta, ne vom folosi de metode cantitative, din
care cea mai utilizată este χ 2 . După cum vom vedea, aceasta utilizează doar frecvenŃele ca
informaŃie numerică. Evident, pentru variabilele cantitative, existenŃa stărilor numerice permite
folosirea unor metode care să Ńină cont de acestea.
Metoda constă în esenŃă în a compara frecvenŃele absolute observate cu cele teoretice
corespunzătoare cazului în care nu există legătură. FrecvenŃele teoretice se vor calcula făcând apel
la teoria probabilităŃilor. Asociem tabelului o urnă cu N bile, reproducând structura populaŃiei în
raport cu variabilele X şi Y. Considerăm N ij bile cu inscripŃia (i, j ) . Dacă evenimentele X = xi şi
Y = y i sunt independente, putem scrie:
N i• N • j
P( X = xi ; Y = yi ) = P( X = xi ) ⋅ P(Y = yi ) =
⋅ = Pij∗
N N
notând cu Pij∗ produsul probabilităŃilor celor două evenimente. Putem astfel calcula toate
frecvenŃele teoretice. Suma lor fiind egală cu 1, ele vor fi comparabile cu frecvenŃele relative
empirice. Pentru a le putea compara cu frecvenŃele absolute, le vom înmulŃi cu N. Astfel:
N N• j N i• ⋅ N • j
N ij∗ = Pij∗ ⋅ N = i• ⋅ ⋅N =
N N N
unde N ij sunt frecvenŃe absolute teoretice. ObŃinem deci două tabele, unul cu frecvenŃele absolute

reale, observate şi altul cu frecvenŃele absolute teoretice corespunzătoare cazului în care nu există
legătură între variabile. Dacă între acestea nu există nici o diferenŃă, concluzionăm că nu există
legătură între variabile. Va trebui însă să ne bazăm în aprecieri pe o măsură globală a distanŃei
dintre cele două tabele, respectiv ale frecvenŃelor teoretice şi empirice. Această măsură o definim
astfel:
I J ( N − N ∗ )2
χ 2 = ∑∑ ij ∗ ij
i =1 j =1 N ij
Observăm că dacă N ij = N ij∗ , ∀ i = 1,..., I j = 1,..., J nu există legătură, iar χ 2 = 0 . Dimpotrivă, cu
cât frecvenŃele empirice diferă mai mult de cele teoretice, cu atât χ 2 ia valori mai mari.
Ca o concluzie, distingem cele două cazuri:
1) Dacă χ 2 = 0 nu există legătură între variabile
2) Dacă χ 2 >> 0 există legătură între variabile
În statistica descriptivă ne limităm doar la a judeca egalitatea sau nonegalitatea cu zero. În
realitate însă, pentru a garanta cu o anumită probabilitate existenŃa legăturii, χ 2 trebuie să
depăşească un anumit prag. Acesta ne este dat de statistica inferenŃială prin legea de probabilitate
χ 2 . Astfel,
I J ( N − N ∗ )2
χ = ∑∑ ij ∗ ij
2

i =1 j =1 N ij
este o variabilă χ 2 cu v = ( I − 1)( J − 1) grade de libertate. Vom compara deci valoarea calculată a
lui χ 2 cu valorile tabelate.
Dacă χ 2 > χ tab
2
( v , p ) putem afirma cu un risc de eroare p că exist ă legătură între variabilele X şi

Y. Valoarea tabelată o privim ca pe un prag peste care trebuie să treacă valoarea calculată a lui χ 2
pentru a accepta cu o anumită probabilitate existenŃa legăturii. Cu cât riscul de eroare dorit este
2
mai mic, cu atât “pragul” va fi mai exigent, adică χ tab ( v , p ) va avea o valoare mai mare.

Procedeul prezentat anterior ne permite identificarea existenŃei legăturii dintre două variabile,
dar nu şi a intensităŃii acesteia. Totuşi, pornind de la el se pot construi coeficienŃi care să ne
permită şi aprecierea intensităŃii legăturii, aşa cum se va vedea în secŃiunile următoare.

Exemplu

Dintre societăŃile comerciale cotate la Bursa de Balori Bucureşti am extras un eşantion de 34 societăŃi.
Să se studieze existenŃa şi intensitatea legăturii dintre variabilele în raport cu care s-a făcut observarea:
X – domeniul de activitate al firmei şi Y – riscul acŃiunilor societăŃii.

X Industrie Financiar- Alte Total


Y Bancar Domenii
Mic 3 1 7 11
Mediu 10 2 4 16
Mare 2 5 - 7
Total 15 8 11 34

Avem astfel distribuŃia empirică (observată) a societăŃ ilor în raport cu cele două variabile. Indicatorul
de la baza seriei este frecvenŃa absolută:
N 11 = 3 N12 = 1 N13 = 7
N 21 = 10 N 22 = 2 N 23 = 4
N 31 = 2 N 32 = 5 N 33 = 0

Deducem frecvenŃele absolute teoretice, corespunzătoare cazului în care nu există legătură între
variabile:

11 ⋅15 11 ⋅ 8 11 ⋅11
N 11* = = 4,85 N12* = = 2,59 N 13* = = 3,56
34 34 34
* 16 ⋅ 15 * 16 ⋅ 8 * 16 ⋅11
N 21 = = 7,06 N 22 = = 3,76 N 23 = = 5,18
34 34 34
* 7 ⋅15 * 7⋅8 * 7 ⋅ 11
N 31 = = 3,09 N 32 = = 1,54 N 33 = 2,26
34 34 34

Scriem şi sub formă tabelară această repartiŃie teoretică:

X Industrie Financiar- Alte Total


Y Bancar Domenii
Mic 4,85 2,59 3,56 10
Mediu 7,06 3,76 5,18 16
Mare 3,09 1,65 2,26 7
Total 15 8 11 34

Calculăm distanŃa dintre cele două tabele:


I J ( N ij − N ij∗ ) 2
χ = ∑∑
2

i =1 j =1 N ij∗
(3 − 4,85) 2 (1 − 2,59) 2 (7 − 3,56) 2
χ2 = + + +
4,85 2,59 3,56
(10 − 7,06)2 (2 − 3,76)2 (4 − 5,18) 2
+ + + +
7,06 3,76 5,18
(2 − 3,09) 2 (5 − 1,65)2 (0 − 2,26) 2
+ + + = 16,77
3,09 1,65 2,26
χ 2 >> 0 deci există legătură între variabile la nivel de eşantion

Pentru a verifica dacă legătura există şi la nivel de populaŃie, facem apel la valorile tabelate ale
distribuŃiei de probabilitate χ 2 .
I = 3 , J = 3 , v = (3 − 1)(3 − 1) = 4
2
- pentru p = 5% , χ tab = 9,49
χ 2 > χ tab
2
deci cu un risc de eroare de 5% acceptăm existenŃa legăturii între cele două
variabile
2
- pentru p = 1% , χ tab = 13,28
χ 2 > χ tab
2
deci cu un risc de eroare de 1% acceptăm existenŃa legăturii între cele două
variabile

4.2.2. Analiza statistică a existenŃei legăturii pentru variabile cantitative

Testul χ 2 prezentat în secŃiunea precedentă poate fi utilizat şi pentru studiul existenŃei


legăturii dintre variabilele cantitative. Totuşi, acesta nu utilizează ca informaŃie numerică decât
frecvenŃele. În cazul variabilelor cantitative, beneficiem ca informaŃie numerică atât de frecvenŃe
cât şi de stările variabilelor.
Aşa cum s-a văzut în capitolul anterior, dacă dispunem de o repartiŃie bidimensională, putem
descompune varianŃa totală a variabilei de explicat Y ca sumă a varianŃelor datorate variabilei
explicative X şi respectiv celorlalŃi factori, adică:
σ Y2 = σ Y2 / X + σ Y2 / X
Dacă nu există legătură, adică X nu are nici o influenŃă asupra lui Y, mediile condiŃionate Y / X
vor fi identice, iar dispersia lor va fi nulă: σ Y2 / X = 0 .
Putem reŃine deci ca regulă de decizie în statistica descriptivă:
1) Dacă σ Y2 / X = 0 nu există legătură între variabile
2) Dacă σ Y2 / X >> 0 există legătură între variabile
În statistica inferenŃială, la fel ca în cazul utilizării χ 2 va trebui să facem apel la legile de
probabilitate, pentru a stabili o valoare care trebuie depăşită pentru a garanta cu o anumită
probabilitate existenŃa legăturii.

4.3. Analiza statistică a intensităŃii legă turii sau a gradului de asociere dintre variabilele
observate

Ca şi în cazul existenŃei legăturii, o primă apreciere a intensităŃii se poate face pe baza tabelului de
corelaŃie şi a norului de puncte. Cu cât frecvenŃele mai mari sunt mai grupate în jurul uneia din
diagonalele tabelului de exemplu sau punctele norului sunt mai grupate în jurul unei linii, cu atât
legătura este mai intensă. În ceea ce priveşte metodele cantitative de apreciere, ele sunt mult mai
precise şi ne pot oferi valori numerice ale intensităŃii sau gradului de asociere. Aceste metode sunt
însă diferite în funcŃie de tipul variabilelor şi de aceea le vom aborda separat.

4.3.1. Gradul de asociere sau intensitatea legăturii dintre variabilele calitative

Pentru variabilele calitative preferăm să folosim noŃiunea de grad de asociere deoarece coeficienŃii
utilizează modul de asociere a stărilor variabilelor şi frecvenŃele, nu stările variabilelor ca în cazul
variabilelor numerice.

Coeficientul de asociere (contingenŃă ) al lui Pearson

Acest coeficient se bazează pe metoda χ 2 utilizată la existenŃa legăturii, folosind frecvenŃele


absolute din tabelul de corelaŃie. Se poate utiliza ca o metodă rapidă (această facilitate există chiar
şi în soft-urile de birotică cum ar fi Microsoft Excel) şi pentru variabilele cantitative, dar se pierde
o parte din informaŃie prin neutilizarea stărilor numerice ale acestora.
RelaŃia de calcul a coeficientului este:
χ2
C=
N + χ2
unde N este volumul populaŃiei. Ne interesează care sunt limitele acestui coeficient, pentru a-i
putea aprecia valorile numerice pe care le ia. Reamintim că χ 2 este o măsură globală a distanŃei
dintre două repartiŃii: cea observată şi cea teoretică corespunzătoare cazului în care nu există
legătură între variabile.

- dacă χ 2 = 0 atunci C = 0
- dacă χ 2 → ∞ atunci C → 1
Ca urmare, χ 2 ∈ [ 0 ; 1 )
Interpretarea gradului de asociere (intensităŃii legăturii) pe baza coeficientului este următoarea:
- dacă C = 0 legătura este nulă (lipsa legăturii)
- dacă C ∈ ( 0 ; 0,3 ) legătura este de intensitate slabă
- dacă C ∈ [ 0,3 ; 0,7 ) legătura este de intensitate medie
- dacă C ∈[ 0,7 ; 1 ) legătura este de intensitate puternică
Desigur aceste limite nu trebuie interpretate într-o manieră foarte rigidă. O legătură este tot medie
atât la 0,35 cât şi la 0,68. Prezintă mai mult interes compararea intensităŃii legăturii dintre aceleaşi
două variabile pentru aceeaşi populaŃie în momente de timp diferite sau pentru populaŃii similare.

Exemplu
Utilizăm acelaşi exemplu de la existenŃa legăturii.
Intensitatea legăturii:
- coeficientul de asociere al lui Pearson
χ2
C=
N +χ2
16,77
C= = 0,57
34 + 16,77
legătura dintre cele două variabile este de intensitate medie
- coeficientul de asociere al lui Ciuprov
χ2 χ2
T= =
max χ 2 N ( I − 1)( J − 1)
16,77
T= = 0,50
34 (3 − 1)(3 − 1)
conform şi acestui coeficient legătura dintre domeniul de activitate şi riscul acŃiunilor este de
intensitate medie.

4.3.2. Gradul de asociere sau intensitatea legăturii dintre variabilele ordinale

Variabilele ordinale sunt tot variabile calitative, dar ale căror stări sunt ierarhizabile. Ca exemplu
putem da inteligenŃa sau performanŃele fizice ale indivizilor, atractivitatea unei firme sau a unei
Ńări din punctul de vedere al investitorilor, renumele firmei, etc. Un grup de firme se poate ordona
în raport cu renumele, dar pentru această variabilă nu există o unitate de măsură foarte obiectivă,
astfel încât să putem spune că o firmă este de 2,7 ori mai renumită decât alta. Ordonarea unităŃ ilor
populaŃiei în raport cu stările variabilei aduce un plus de informaŃie faŃă de variabilele calitative
neordinale, informaŃie ce poate fi valorificată prin construirea unor coeficienŃi specifici lor care să
aprecieze intensitatea legăturii, mai bine fundamentaŃi decât cei anteriori.

Coeficientul de corelaŃie a rangurilor al lui Kendall


Pentru a putea utiliza acest indicator toate unităŃile populaŃiei trebuie să poată fi ordonate în raport
cu variabilele pentru care cercetăm intensitatea legăturii. Presupunem o populaŃie de volum n
observată în raport cu m variabile. UnităŃilor statistice li se atribuie ranguri în raport cu fiecare
variabilă după următoarea schemă redată în tabelul următor.

Tabelul 4.3
unitatea
stat. A1 A2 … Ai … An
variabila
X1 r11 r12 … r1i … r1n
X2 r21 r22 … r2i … r2 n
… … … … … … …
Xj r j1 rj 2 … r ji … r jn
… … … … … … …

Xm rm1 rm 2 … rmi … rmn

Vom numi rang al unităŃii statistice Ai în raport cu variabila X j numărul natural r ji care indică
locul ocupat de valoarea variabilei X j înregistrată la unitatea Ai în şirul ordonat al valorilor
variabilei X j înregistrate la cele n unităŃi considerate. Astfel, pentru fiecare variabilă, rangurile
vor fi primele n numere naturale.
Legătura dintre cele m variabile va fi considerată de intensitate maximă dacă dacă o unitate
oarecare Ai are acelaşi rang în raport cu toate variabilele. O astfel de situaŃie este redată în tabelul
următor.
Tabelul 4.4
unitatea
stat. A1 A2 … Ai … An
Variabila
X1 1 2 … i … n
X2 1 2 … i … n
… … … … … … …
Xj 1 2 … i … N
… … … … … … …

Xm 1 2 … i … N

Cu cât situaŃia reală se va apropia mai mult de situaŃia prezentată în tabel, respectiv rangurile se
vor dispune cam în aceeaşi ordine, cu atât legătura va fi mai intensă şi invers, cu cât rangurile vor
diferi mai mult în raport cu diversele variabile, cu atât legătura va fi mai slabă.
Vom începe prezentarea corelaŃiei simple, între două variabile X şi Y. Legătura va fi directă şi de
intensitate maximă dacă tabelul construit pe seama rangurilor arată astfel:

Tabelul 4.5
unitatea
stat. A1 A2 … Ai … An
variabila
X 1 2 … i … n
Y 1 2 … i … n

În situaŃia contrară, în care legătura este inversă şi de intensitate maximă tabelul va arăta astfel:

Tabelul 4.6
unitatea
stat. A1 A2 … Ai … An
variabila
X 1 2 … i … n
Y n n-1 … n-I+1 … 1

În toate celelalte cazuri de dispunere posibilă a rangurilor, legătura va fi de intensitate mai


slabă sau nulă. Coeficientul de corelaŃie construit de Kendall va lua valoarea 1 pentru legătura
directă de intensitate maximă şi –1 pentru legătura inversă de intensitate maximă.
Pentru a putea construi coeficientul, vom defini mai întâi indicatorul de concordanŃă (P) şi
respectiv indicatorul de discordanŃă (Q). În raport cu variabila X se ordonează crescător rangurile
unităŃilor, iar în raport cu variabila Y păstrăm ordinea unităŃilor şi deci o succesiune oarecare
(rezultată din ordonarea în raport cu X) a rangurilor. O astfel de situaŃie este redată în tabelul de
mai jos:

Tabelul 4.7
unitatea
stat. A1 A2 … Ai … An
variabila
X 1 2 … I … N
Y r1 r2 … ri … rn
unde ri , i = 1,..., n reprezintă unul şi numai unul din numerele naturale de la 1 la n.
Pentru fiecare rang ri , i = 1,..., n , se determină numărul rangurilor mai mari decât ri
situate la dreapta, număr pe care îl notăm cu Pi . Însumând toate numerele Pi , i = 1,..., n se obŃine
un număr notat cu P pe care îl numim indicator de concordanŃă.
În mod asemănător, pentru fiecare rang ri , i = 1,..., n , se determină numărul rangurilor
mai mici decât ri situate la dreapta, număr pe care îl notăm cu Qi . Însumând toate numerele Qi ,
i = 1,..., n se obŃine un număr notat cu Q pe care îl numim indicator de discordanŃă. Relativ la
aceşti doi indicatori se verifică relaŃia:
n( n − 1)
P+Q =
2
Pe baza indicatorilor de concordanŃă şi discordanŃă construim coeficientul de corelaŃie simplă a
rangurilor al lui Kendall, definit astfel:
P −Q P−Q
τ= =
P + Q n( n − 1)
2
În cazul unei legături directe de intensitate maximă, P va lua valoare sa maximă, iar Q pe cea
n( n − 1)
minimă, adică: P = iar Q = 0 , deci τ = 1 .
2
În cazul unei legături inverse de intensitate maximă, P va lua valoare sa minimă, iar Q pe
n (n − 1)
cea maximă, adică: P = 0 iar, Q = deci τ = −1 .
2
În cazul lipsei legăturii, P = Q , iar τ = 0 .
Putem determina astfel intervalul în care va fi cuprins τ , respectiv τ ∈ [-1 ; 1] . Interpretarea
intensităŃii legăturii pe baza acestui coeficient se va face astfel:
- dacă τ > 0 legătura este directă
- dacă τ = 0 legătura este nulă
- dacă τ < 0 legătura este inversă
- dacă τ ∈ [0 ; 0,3) legătura este de intensitate slabă
- dacă τ ∈ [0,3 ; 0,7) legătura este de intensitate medie
- dacă τ ∈ [0,7 ; 1] legătura este de intensitate puternică

Exemplu
Vom lua ca exemplu 10 firme dintr-un anumit domeniu în raport cu variabilele X=renumele firmei
(cât este de cunoscută în rândul consumatorilor) şi Y=încrederea în produsele firmei. Rezultă după
observare următorul tabel al rangurilor:

Tabelul 4.8
unitatea
stat. A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
Variabila
X 1 2 3 4 5 6 7 8 9 10
Y 2 3 1 5 6 4 7 9 8 10

Calculăm indicatorii de concordanŃă şi discordanŃă:


P = 8 + 7 + 7 + 5 + 4 + 4 + 3 + 1 + 1 = 40
Q = 1+1 + 0 +1 +1+ 0 + 0 +1 + 0 = 5
De unde rezultă coeficientul de corelaŃie a rangurilor al lui Kendall:
P − Q 40 − 5
τ= = = 0,78
P + Q 40 + 5
deci între renumele firmei şi încrederea în produsele sale există o legătură directă foarte puternică.

Coeficientul de concordanŃă multiplă a rangurilor al lui Kendall


Trecem acum la cazul mai general, cu m variabile, pentru o populaŃie de volum n. Legătura va fi
de intensitate maximă dacă dacă fiecare unitate a populaŃiei are acelaşi rang în raport cu toate
variabilele. Deoarece între două variabile poate exista o legătură directă, între altele două o
legătură inverşa, nu putem aprecia pe ansamblu un sens al legăturii. De aceea, coeficientul va fi
unul de cuncordanŃă şi nu de corelaŃie. El se defineşte tot pe baza tabelului rangurilor, considerând
următorul sistem de numere:
S = {S1 , S 2 ,..., S k ,..., S n }
unde S k , k = 1,..., n este suma rangurilor pentru cele m variabile în raport cu unitatea Ak . Dacă
legătura este directă de intensitate maximă, avem:
S = {m , 2 m , ... , nm}
Dacă nu există legătura (rangurile sunt perfect amestecate) avem:
S1 = S 2 = ... = S k = ... = S n
iar dispersia lor va fi nulă.
Calculăm dispersia în cazul legăturii de intensitate maximă:

m + 2 m + ... + nm m( n + 1)
M (S ) = =
n 2
2 2 2
m + ( 2 m ) + ... + ( nm ) m 2 (n + 1)(2n + 1)
M (S 2 ) = =
n 6
2 2
m (n − 1)
σ S2 = M ( S 2 ) − [ M ( S )]2 =
12
Considerând că dispersia efectivă a sistemului S este proporŃională cu concordanŃa dintre
cele m variabile, coeficientul de concordanŃă multiplă a rangurilor al lui Kendall se defineşte
astfel:
σ 2 (efectiva ) σ S2 (efectiva)
k = S2 =
σ S (maxima) m 2 (n 2 − 1)
12
Deoarece ne arată doar intensitatea, nu şi sensul legăturii, k ∈ [0 ; 1] . Interpretarea intensităŃii
legăturii pe baza acestui coeficient se va face astfel:
- dacă k = 0 legătura este nulă
- dacă k ∈ [0 ; 0,3) legătura este de intensitate slabă
- dacă k ∈ [0,3 ; 0,7) legătura este de intensitate medie
- dacă k ∈ [0,7 ; 1] legătura este de intensitate puternică
Exemplu
Ca exemplu, luăm aceleaşi 10 fime, dar pe lângă variabilele X=renumele firmei (cât este de
cunoscută în rândul consumatorilor) şi Y=încrederea în produsele firmei vom lua în calcul şi
Z=performanŃele economice (poate fi cifra de afaceri, profitul, mărimea dividendelor, etc).

Tabelul 4.9
unitatea
stat. A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
Variabila
X 1 2 3 4 5 6 7 8 9 10
Y 2 3 1 5 6 4 7 9 8 10
Z 2 4 1 5 3 7 8 6 10 9
S 5 9 5 14 14 17 22 23 27 29

5 + 9 + 5 + 14 + 14 + 17 + 22 + 23 + 27 + 29
M (S ) = = 16,5
10
52 + 9 2 + 5 2 + 14 2 + 14 2 + 17 2 + 222 + 232 + 27 2 + 292
M (S 2 ) = = 339,5
10
σ S2 (efectiva ) = M (S 2 ) − [M ( S )]2 = 339,5 − 16,52 = 67,25
m 2 (n 2 − 1) 32 (102 − 1)
σ S2 (maxima) = = = 74,25
12 12
σ 2 (efectiva ) 67,25
k = S2 = = 0,91
σ S (maxima) 74,25
Există deci o legătură de intensitate foarte mare între renumele firmei, încrederea în produsele ei şi
performanŃele sale economice.

Coeficientul de corelaŃie a rangurilor al lui Spearman


Ca şi coeficientul similar propus de Kendall, şi acesta se calculează pornind de la tabelul de
concordanŃă a rangurilor. Ne vom folosi de diferenŃele d i dintre ranguri pentru aceeaşi unitate a
populaŃiei relativ la cele două variabile. Coeficientul are următoarea expresie:
n
6∑ d i2
i =1
η = 1−
n(n 2 − 1)
Vom lua ca exemplu numeric aceeaşi populaŃie şi variabile ca şi în cazul coeficientului similar al
lui Kendall. Limitele celor doi coeficienŃi sunt aceleaşi, la fel şi interpretările valorilor numerice.

Tabelul 4.10
unitatea
stat. A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
variabila
X 1 2 3 4 5 6 7 8 9 10
Y 2 3 1 5 6 4 7 9 8 10
di -1 -1 2 -1 -1 2 0 -1 1 0

6(1 + 1 + 4 + 1 + 1 + 4 + 0 + 1 + 1 + 0)
η = 1− = 0,92
10(10 2 − 1)
Există deci o legătură puternică între cele două variabile. Valoarea numerică este diferită faŃă de
cea a coeficientului lui Kendall. Nu trebuie privite însă într-un mod foarte rigid valorile obŃinute.
Nu este importantă alegerea unuia sau altuia din coeficienŃ i, ci folosirea aceluiaşi coeficient pentru
aceeaşi populaŃie la momente diferite de timp sau populaŃii perechi.

Exemplu
Coeficientul de corelaŃie a rangurilor al lui Spearman – cazul în care două sau mai multe ranguri sunt
identice. Se consideră 10 mărci de automobile în raport cu variabilele X – gradul de apreciere şi de
încredere al utilizatorilor şi Y – nivelul de siguranŃă (poate fi reprezentat de punctajul obŃinut la testele
de specialitate sau de elementele de siguranŃă activă şi pasivă din dotare). Se cere să se caracterizeze
legătura dintre cele două variabile, dacă aceasta există.

Avem următorul tabel al rangurilor:


unit. statistică A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
variabila
X 1 2 3 4 5 6 7 8 9 10
Y 2 1 2 4 7 5 8 6 8 10
di -1 1 1 0 -2 1 -1 2 1 0
Se poate observa că în cazul variabilei Y există unităŃi statistice care au acelaşi rang (deci au aceeaşi
valoare a variabilei), şi anume: A1 şi A3 au rangul 2, respectiv A7 şi A9 au ambele rangul 8. Alte
asemenea situaŃii sunt frecvent întâlnite în întrecerile sportive (fotbal, gimnastică, etc.), în analiza
competiŃională (care vizează alcătuirea topului firmelor de pe o anumită piaŃă), dar şi în alte domenii.
Coeficientul de corelaŃie a rangurilor al lui Spearman are expresia:
n
6 ⋅ ∑ d i2
i =1
η = 1−
( 2
n ⋅ n −1)
6 ⋅ (1 + 1 + 1 + 0 + 4 + 1 + 1 + 4 + 1 + 0 ) 6 ⋅ 14 84
Deci: η = 1 − = 1− = 1− = 0,92
10 ⋅ (10 − 1)
2
10 ⋅ 99 990
Există deci o legătură directă foarte puternică între cele dou ă variabile considerate.

4.3.3. Intensitatea legă turii dintre variabilele cantitative

În cazul variabilelor calitative şi ordinale am construit coeficienŃi care să măsoare


intensitatea legăturii bazându-ne doar pe frecvenŃe sau ranguri. Variabilele cantitative dispun de
stări numerice pe care le vom utiliza în construirea unor indicatori specifici.

Raportul de corelaŃie
Folosind regula de adunare a varianŃelor descompunem varianŃa totală a variabilei de explicat Y ca
sumă a varianŃelor datorate variabilei explicative X şi respectiv celorlalŃi factori, adică:
σ Y2 = σ Y2 / X + σ Y2 / X
VarianŃa explicită σ Y2 / X este cu atât mai mare cu cât mediile condiŃionate Y / X sunt mai diferite
între ele. Ceea ce le face să difere este numai influenŃa lui X, deoarece am împărŃit populaŃia în
grupe având ca unic criteriu valorile lui X. Este firesc deci să folosim varianŃa explicită ca o
mărime absolută a intensităŃii legăturii dintre X şi Y şi ponderea varianŃei explicite în varianŃa
totală ca o mărime relativă. Raportul de corelaŃie are expresia:
Vexp V
RYX = = 1 − rez
Vtot Vtot
sau sub forma ei matematică:
σ Y2 / X σ Y2 / X
RYX = = 1 −
σ Y2 σ Y2
Pentru a-i găsi limitele ne raportăm la cele dou ă situaŃii extreme:
- dacă nu există legătură între X şi Y, mediile condiŃionate Y / X sunt egale între ele, deci
σ Y2 / X = 0 şi RYX = 0
- dacă legătura este de intensitate maximă, nu există influenŃe ale altor factori decât X asupra
lui Y, nu există variaŃie în cadrul grupelor, deci σ Y2 / X = 0 şi RYX = 1 .
În consecinŃă, raportul de corelaŃie aparŃine intervalului RYX ∈ [0 ; 1] . Interpretarea intensităŃii
legăturii pe baza acestui coeficient se va face astfel:
- dacă RYX = 0 legătura este nulă
- dacă RYX ∈ [0 ; 0,3) legătura este de intensitate slabă
- dacă RYX ∈ [0,3 ; 0,7) legătura este de intensitate medie
- dacă RYX ∈ [0,7 ; 1] legătura este de intensitate puternică.

Exemplu
Cunoaştem următoarea distribuŃie a 52 de societăŃi comerciale cu acelaşi profil de activitate, în raport
cu variabilele X – cheltuielile cu publicitatea (mil. lei) şi Y - volumul vânzărilor (mil. lei).
X [3 ;5 ] (5 ;7 ] (7 ;9 ] Total
Y
( 60 ; 80 ] 2 7 8 17
( 40 ; 60 ] 3 10 5 18
[ 20 ; 40 ] 14 2 1 17
Total 19 19 14 52
Să se aprecieze intensitatea legăturii dintre cheltuielile cu publicitatea şi volumul vânzărilor.
Folosim raportul de corelaŃie:
V EXP σ Y2 X
R XY = =
VTOT σ Y2
95,32
RXY = = 0,3645
261,54
R XY = 0,604

Legătura dintre cele dou ă variabile este de intensitate medie. Din dispunera frecvenŃelor în tabelul de
corelaŃie şi calculul mediilor condiŃionate ne d ăm seama că legătura este directă.

4.4. Formularea unor ipoteze cu privire la forma matematică a legăturii

Dacă între dou ă variabile (ambele cantitative !) se constată existenŃa unei legături de o anumită
intensitate, ne punem problema posibilităŃii modelării legăturii printr-un model matematic. O primă
etapă în acest demers este formularea unei ipoteze cât mai verosimile cu privire la forma legăturii. În
acest scop, pe baza tabelului de corelaŃie construim norul statistic şi linia poligonală a mediilor
condiŃionate ale variabilei dependente.
Y

Y / x4

Y / x3

Y / x2

Y / x1

x1 x2 x3 x4 X

În funcŃ ie de forma liniei frânte obŃinute şi a poziŃiei punctelor norului faŃă de ea se formulează o
ipoteză cu privire la forma funcŃ iei de regresie. Dacă dorim să studiem o legătură multiplă, respectiv
dependenŃa lui Y faŃă de variabilele factoriale X 1 , X 2 ,..., X n atunci pentru fiecare pereche (Y , X 1 ) ,
(Y , X 2 ) , (Y , X n ) desenăm câte un nor statistic. Forma generală a variabilei Y în funcŃie de variabilele
factoriale X 1 , X 2 ,..., X n se scrie:
Y = f ( X 1 , X 2 ,..., X n ) + ε
unde f ( X 1 , X 2 ,..., X n ) reprezintă funcŃia de regresie care aproximează cel mai bine forma legăturii,
iar ε o variabilă aleatoare numită reziduală, care însumează efectul altor factori decât cei luaŃi în
calcul. Aceşti factori nu sunt specificaŃi din diferite motive: fie nu au fost identificaŃi, fie nu pot fi
măsuraŃi, fie efectul lor este nesemnificativ pentru explicarea variabilei de explicat, etc. Obişnuim să
mai notăm funcŃia de regresie f ( X 1 , X 2 ,..., X n ) cu Y ( X 1 , X 2 ,..., X n ) deoarece reprezintă o valoare
medie a lui Y condiŃ ionată de valorile pe care le iau variabilele X 1 , X 2 ,..., X n . FuncŃia de regresie
poate avea diferite expresii matematice. Vom da în cele ce urmează câteva exemple, însoŃite de forme
posibile ale norurilor de puncte corespunzătoare.

1) FuncŃie liniară: Y = Y ( X ) + ε = a + bX + ε

X
2) FuncŃie parabolică: Y = Y ( X ) + ε = a + bX + cX 2 + ε
Y

X
1
3) FuncŃie hiperbolică: Y = Y ( X ) + ε = a + b ⋅ + ε
X

X
X
4) FuncŃie exponenŃială: Y = Y ( X ) + ε = a ⋅ b + ε

Am prezentat doar câteva din formele uzuale ale funcŃiilor de regresie, dar mai pot exista şi altele, sau
combinaŃii ale lor (funcŃii complexe). Pentru regresia multiplă, forma cea mai simplă o constituie
regresia liniară multiplă care arată astfel:
Y = Y ( X 1 , X 2 ,..., X n ) + ε = a0 + a1 X 1 + ... + a n X n + ε
Pentru un astfel de model, reprezentarea grafică nu mai este posibilă, deoarece nu mai este
vorba de o curb ă în plan, ci de o hipersuprafaŃă într-un hiperspaŃiu cu n+1 dimensiuni.
4.5. Estimarea parametrilor funcŃiei de regresie

Este o etap ă care se succede firesc alegerii formei funcŃiei. În estimarea parametrilor va trebui
să Ńinem cont de abaterea punctelor norului faŃă de modelul matematic ales Y ( X 1 , X 2 ,..., X n ) , datorat
altor factori decât X 1 , X 2 ,..., X n , consideraŃi neesenŃiali, cuantificaŃi prin variabila reziduală ε .

Y (X ) Y

X
Principiul de la care se porneşte în estimarea parametrilor este cel al patratelor minime.
Minimizăm suma patratelor abaterilor valorilor observate ale lui Y de la nivelul calculat prin
Y ( X 1 , X 2 ,..., X n ) . CondiŃia de minim a sumei este echivalentă cu condiŃia de minim a mediei:
M [Y − Y ( X 1 , X 2 ,..., X n )] = M (ε 2 ) minimă
2

EcuaŃia Y ( X 1 , X 2 ,..., X n ) care descrie legătura dintre Y şi factorii de influenŃă X 1 , X 2 ,..., X n se


numeşte ecuaŃia de regresie. Metoda regresiei constă în modelarea legăturilor statistice prin ecuaŃia de
regresie. Deoarece problema de minim se poate rezolva doar cunoscând forma particulară a funcŃiei,
vom aborda estimarea parametrilor seprat, pe tipuri de funcŃii.

Regresia liniară
În ipoteza în care legătura dintre Y şi factorii săi de influenŃă X 1 , X 2 ,..., X n este liniară, ecuaŃia de
regresie va fi de forma:
Y ( X 1 , X 2 ,..., X n ) = a0 + a1 X 1 + a 2 X 2 + a n X n
CoeficienŃii a0 , a1 , a 2 ,..., an se numesc parametrii modelului şi vor rezulta din minimizarea următoarei
funcŃii cu (n+1) necunoscute:
G (a0 , a1 ,..., an ) = M [Y − (a0 + a1 X 1 + ... + a n X n )]
2

CondiŃiile de minim constau în anularea celor (n+1) derivate parŃiale ale funcŃiei G (a0 , a1 ,.., a n ) în
raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la următorul sistem de ecuaŃii:

 ∂G (a0 , a1 ,..., a n )
 = −2M [Y − (a0 + a1 X 1 + ... + a n X n )] = 0
 ∂a0

 ∂G (a0 , a1 ,..., a n ) = −2M [Y − (a0 + a1 X 1 + ... + a n X n )] ⋅ X j = 0
 ∂a j
∀j = 1, n
sau într-o formă echivalentă:

M (a0 + a1 X 1 + ... + a n X n ) = M (Y )
 ∀j = 1, n
M (a0 + a1 X 1 + ... + a n X n ) ⋅ X n = M (Y ) ⋅ X j
de unde rezultă:
a0 + a1M ( X 1 ) + ... + a n M ( X n ) = M (Y )
 ∀j = 1, n
a0 + a1M ( X 1 X j ) + ... + an M ( X n X j ) = M (YX j )

Prin rezolvarea acestui sistem liniar de ecuaŃii în raport cu necunoscutele a0 , a1 ,..., a n , se obŃin
valorile parametrilor ecuaŃiei de regresie. Astfel, legătura statistică dintre Y şi X 1 , X 2 ,..., X n este
modelată prin aproximare cu o legătură funcŃională. Pentru cazul cu doi factori X 1 şi X 2 , ecuaŃia de
regresie se scrie:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2

iar sistemul de ecuaŃii devine:


a0 + a1 M ( X 1 ) + a 2 M ( X 2 ) = M (Y )
 2
a0 M ( X 1 ) + a1M ( X 1 ) + a 2 M ( X 1 X 2 ) = M (YX 1 )
 2
a0 M ( X 2 ) + a1M ( X 1 X 2 ) + a2 M ( X 2 ) = M (YX 2 )

Prin substituŃia lui a 0 din prima ecuaŃie şi înlocuirea lui în celelalte, obŃinem:
[ ]
a1 M ( X12 ) −[M ( X1 )]2 + a2 [M ( X1 X 2 ) − M ( X1 )M ( X 2 )] = M (YX1) − M (Y )M ( X1 )

[ ]
a1[M ( X1 X 2 ) − M ( X1 )M ( X 2 )] + a2 M ( X 22 ) −[M ( X 2 )]2 = M (YX2 ) − M (Y )M ( X 2 )

Dacă pentru a aduce la o formă mai simplă notăm cu:


[ ]
mij = M [ X i − M ( X i )]⋅ [ X j − M ( X j )] = M ( X i X j ) − M ( X i )M ( X j )

care reprezintă covariaŃia dintre variabilele X i şi X j , obŃinem:


a1m11 + a 2 m12 = m01

a1m12 + a 2 m22 = m02

de unde putem obŃine valorile parametrilor:


m m − m12 m02
a1 = 01 22
m11m22 − m122
m m − m12 m01
a 2 = 11 02
m11m22 − m122

De aici îl vom deduce şi pe a 0 , care a fost substituit în prima ecuaŃie. Astfel, a0 , a1 , a 2 sunt
valorile parametrilor modelului liniar cu trei variabile. Înlocuind valorile parametrilor în ecuaŃia de
regresie se obŃine:
m11 m12 m m12
⋅ (Y ( X 1 , X 2 ) − M (Y )) − 10 ⋅ ( X 1 − M ( X 1 )) +
m21 m22 m20 m22
m10 m11
+ ⋅ (X 2 − M ( X 2 )) = 0
m20 m21
Pentru a face relaŃia mai accesibilă, introducem matricea de variaŃie şi covariaŃie:
 m00 m01 m02 
( 3)
 
M =  m10 m11 m12 
m 
 20 m21 m22 

şi notând complementul algebric al elementului m0 j cu M oj( 3) , j = 0,1,2 ecuaŃia de regresie devine:

( 3)
M 00 (Y ( X 1 , X 2 ) − M (Y ) ) + M 01(3) ( X 1 − M ( X 1 ) ) + M 02(3) ( X 2 − M ( X 2 ) ) = 0
Pentru cazul mai general al legăturii liniare dintre Y şi X 1 , X 2 ,..., X n , matricea de variaŃie şi covariaŃie
este:
 m00 m01 ... m0n 
 
( n +1)  m10 m11 ... m1n 
M =
... ... ... ... 
 
m m ... m 
 n0 n1 nn 

iar ecuaŃia de regresie se poate scrie:

( n+1)
M 00 (Y ( X1, X 2 ) − M (Y )) + M01(n+1) (X1 − M ( X1 )) + ...+ M 0(nn+1) ( X n − M ( X n )) = 0
Matricea de variaŃie şi covariaŃie M ( n+1) este simetrică în raport cu prima diagonală. Elementele mii
de pe diagonala principală sunt varianŃele variabilelor Y , X 1 , X 2 ,..., X n , iar elementele mij , i ≠ j
reprezintă covarianŃele dintre variabilele corespunzătoare.

Regresia liniară simplă

În cazul regresiei liniare simple, cu variabila endogenă Y şi factorul X 1 , matricea de variaŃie şi


covariaŃie este:
m m01 
M ( 2 ) =  00 
 m10 m11 

iar ecuaŃia de regresie devine:


m11 (Y ( X ) − M (Y )) − m10 ( X 1 − M ( X 1 ) ) = 0

de unde îl putem exprima pe Y ( X ) ca:


m m
Y ( X ) = 10 X 1 + M (Y ) − 10 M ( X 1 )
m11 m11

de unde rezultă coeficienŃ ii:


m10
a 0 = M (Y ) − M ( X1)
m11
m10
a1 = X1
m11
Regresia parabolică

În economie sunt numeroase exemplele în care legătura dintre fenomene şi deci variabilele
care le cuantifică nu este liniară. Dacă Y reprezintă recolta la hectar dintr-un produs agricol, iar X
cantitatea de îngrăşăminte, ne vom da seama chiar şi intuitiv că o anumită creştere a lui X nu provoacă
aceeaşi creştere a lui Y pe tot intervalul de variaŃie al celor două variabile. La valori mari ale cantităŃii
de îngrăşăminte, acestea provoacă saturaŃie sau chiar nocivitate, ducând la o stagnare, respectiv
diminuare a producŃiei. Alte exemple pot fi: legătura dintre vechimea în muncă şi mărimea salariului,
dintre cheltuielile cu publicitatea şi volumul vânzărilor, etc.
Determinarea parametrilor funcŃiei parabolice de regresie se poate face fie aplicând direct
funcŃiei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat anterior. În ambele
cazuri vom exemplifica pentru parabola de ordinul doi.

a) Estimarea parametrilor prin aplicarea directă a metodei patratelor minime

EcuaŃia de regresie a modelului se scrie:


Y ( X ) = a0 + a1 X + a 2 X 2

Din condiŃia de minimizare a expresiei:


G (a0 , a1 , a2 ) = M [Y − Y ( X )]
2

avem următoarele egalităŃi:


∂G (a0 , a1 , a2 )
=0
∂a0
∂G (a0 , a1 , a2 )
=0
∂a1
∂G (a0 , a1 , a2 )
=0
∂a2

din care rezultă sistemul de ecuaŃii:


[ ]
− 2 M Y − (a 0 + a1 X + a 2 X 2 ) = 0

[ ]
− 2 M (Y − (a 0 + a1 X + a 2 X ) )X = 0
2


[
− 2 M (Y − (a 0 + a1 X + a 2 X ) )X = 0
2 2
]
care este echivalent cu:
a0 + a1M ( X ) + a2 M ( X 2 ) = M (Y )
 2 3
a0 M ( X ) + a1M ( X ) + a 2 M ( X ) = M (YX )
 2 3 4 2
a0 M ( X ) + a1M ( X ) + a 2 M ( X ) = M (YX )

Rezolvând acest sistem în necunoscutele a0 , a1 , a2 , rezultă parametrii ecuaŃiei de regresie parabolice.


În mod asemănător se poate proceda pentru orice regresie neliniară.

b) Estimarea parametrilor prin reducerea la cazul liniar

Având modelul parabolic de ecuaŃie:


Y ( X ) = a0 + a1 X + a2 X 2
facem substituŃiile:
X = X1
X 2 = X2

dup ă care ecuaŃia devine:


Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2

care reprezintă un model liniar cu doi factori. Elementele matricei de variaŃie şi covariaŃie vor arăta
astfel:
m00 = M (Y 2 ) − ( M (Y )) 2 = σ Y2
m01 = m10 = M (YX ) − M (Y ) M ( X ) = cov(Y , X )
m02 = m20 = M (YX 2 ) − M (Y )M ( X 2 ) = cov(Y , X 2 )
m11 = M ( X 2 ) − ( M ( X )) 2 = σ X2
m12 = M ( X 3 ) − M ( X ) M ( X 2 ) = cov( X , X 2 )
m22 = M ( X 4 ) − (M ( X 2 )) 2 = σ X2 2

Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o problemă de
regresie liniară, care se rezolvă conform cazului liniar. În cazul mai general, dacă ecuaŃia de regresie
este un polinom de gradul n:
Y ( X ) = a0 + a1 X + a 2 X 2 + ... + an X n

efectuând substitu Ńiile:


X = X 1 ; X 2 = X 2 ; ... ; X n = X n

obŃinem cazul liniar în raport cu (n+1) variabile.

Regresia exponenŃială

Dacă ecuaŃia de regresie are formă exponenŃială:


Y (X ) = a ⋅bX

se încearcă aducerea la forma liniară. Mai întâi se logaritmează ecuaŃia:


lg Y ( X ) = lg a + X ⋅ lg b

iar apoi se fac substitu Ńiile:


Z ( X ) = lg Y ( X )
a0 = lg a
a1 = lg b

Rezultă astfel modelul liniar simplu:


Z ( X ) = a0 + a1 X

Regresia hiperbolică

Dacă ecuaŃia de regresie are formă hiperbolică:


1
Y (X ) = a + b ⋅
X

se face substituŃia:
1
X1 =
X

de unde rezultă modelul liniar:


Y ( X 1 ) = a + bX 1

În matricea de variaŃie şi covariaŃie elementele vor fi:


m00 = M (Y 2 ) − ( M (Y )) 2 = σ Y2
 1 1  1
m01 = m10 = M  Y ⋅  − M (Y ) M   = cov Y , 
 X X  X
2
 1   1  2
m11 = M  2  −  M    = σ 1 / X
X   X 

4.6. Analiza reprezentativităŃii funcŃiei de regresie

Coeficientul de corelaŃie
ConstrucŃia lui este similară cu a raportului de corelaŃie, cu deosebirea că varianŃa în fiecare
grup ă este calculată folosind suma patratelor abaterilor faŃă de valorile ajustate prin funcŃia de regresie
şi nu faŃă de media grupei. Ca urmare, coeficientul de corelaŃie va fi specific fiecărei funcŃii în parte.
Expresia lui de calcul (admisă aici fără demonstraŃie) este:
det M
rYX = 1 −
m00 M 00
rYX ∈ [0 ; 1]
Interpretarea acestui coeficient în funcŃie de valorile pe care le poate lua este următoarea:
- dacă rYX ∈ [0 ; 0,3] funcŃia nu este reprezentativă pentru modelarea legăturii dintre variabile
- dacă rYX ∈ (0,3 ; 0,7] funcŃia are o reprezentativitate medie pentru modelarea legăturii
dintre variabile
- dacă rYX ∈ (0,7 ; 1] funcŃia este foarte reprezentativă pentru modelarea legăturii dintre
variabile
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienŃ ilor este bine să fie comparate cu
ale altor coeficienŃi, ai altor funcŃii. Pentru aceeaşi repartiŃie de exemplu, pentru funcŃiile de regresie
alese ca fiind posibilecalculăm coeficienŃii de corelaŃie şi îl reŃinem pe cel mai mare, considerând acea
funcŃie ca fiind cea mai reprezentativă.
În cazul regresiei liniare simple, formula coeficientului poate fi adusă la o formă echivalentă
mai simplă:
 m00 m01 
M ( 2) =  
 m10 m11 

det M m m − m01 m10 m01 m10


rYX = 1 − = 1 − 00 11 = =
m00 M 00 m00 m11 m00 m11
m01 M ( XY ) − M ( X ) M (Y )
= =
m00 ⋅ m11 σ Y ⋅σ X
4.8. Probleme

Problema 1
Se cunoaşte următoarea distribu Ńie a 52 de societăŃi comerciale cu acelaşi profil de activitate, în raport
cu variabilele X – cheltuielile cu publicitatea (mil. lei) şi Y – volumul vânzărilor (mil. lei).
Y X [ 3 ; 5 ] ( 5 ; 7 ] ( 7 ; 9 ] Total
( 60 ; 80 ] 2 7 8 17
( 40 ; 60 ] 3 10 5 18
[ 20 ; 40 ] 14 2 1 17
Total 19 19 14 52
Se cere:
1) pe baza unui grafic adecvat să se emită ipoteze privind forma posibilă a funcŃiei de regresie;
2) în ipoteza unei forme liniare a dependenŃei dintre Y şi X, să se calculeze parametrii funcŃiei de
regresie;
3) să se studieze reprezentativitatea funcŃiei de regresie pentru modelarea legăturii dintre cele
dou ă variabile;
4) care este valoarea medie a volumului vânzărilor pentru un nivel al cheltuielilor cu publicitatea
de 5,5 milioane lei?;
5) aceleaşi cerinŃe de la punctele 2), 3) şi 4) pentru o formă parabolică a dependenŃei dintre Y şi
X.

1)

Y 80

70

60

50

40

30

20
3 4 5 6 7 8 9
X

Pe baza graficului reprezentând mediile condiŃionate ale lui Y în raport cu X, reŃinem ca posibile
funcŃii de regresie:
- funcŃia liniară: Y = a + b⋅ X +ε
- funcŃia parabolică: Y = a + b ⋅ X + c ⋅ X 2 + ε

2) Pentru funcŃia liniară Y = a + b ⋅ X + ε , prin minimizarea sumei p ătratelor abaterilor, ob Ńinem:


M ( X ⋅ Y ) − M ( X ) ⋅ M (Y )
b=
( )
M X 2 − [M ( X )]
2

a = M (Y ) − b ⋅ M ( X )
4 ⋅ 19 + 6 ⋅ 19 + 8 ⋅ 14
M (X ) = = 5,81
19 + 19 + 14
4 2 ⋅ 19 + 6 2 ⋅ 19 + 8 2 ⋅ 14
M (X 2 ) = = 36,23
19 + 19 + 14
30 ⋅ 17 + 50 ⋅ 18 + 70 ⋅17 2600
M (Y ) = = = 50
17 + 18 + 17 52
1
M (X ⋅ Y ) = ⋅ ( 4 ⋅ 30 ⋅ 14 + 6 ⋅ 30 ⋅ 2 + 8 ⋅ 30 ⋅ 1 +
52
+ 4 ⋅ 50 ⋅ 3 + 6 ⋅ 50 ⋅ 10 + 8 ⋅ 50 ⋅ 5 +
+ 4 ⋅ 70 ⋅ 2 + 6 ⋅ 70 ⋅ 7 + 8 ⋅ 70 ⋅ 8) = 305

305 − 5,81 ⋅ 50 14,5


b= 2
= = 5,86
36,23 − 5,81 2,4739
a = 50 − 5,86 ⋅ 5,81 = 15,95
Putem astfel scrie funcŃia de regresie liniară:
Y = 15,95 + 5,86 ⋅ X + ε
Y ( X ) = 15,95 + 5,86 ⋅ X

3) Calculăm coeficientul de corelaŃie liniară simplă:


M ( X ⋅ Y ) − M ( X ) ⋅ M (Y )
rYX =
σ X ⋅σ Y

σ Y2 =
(30 − 50)2 ⋅ 17 + (50 − 50)2 ⋅ 18 + (70 − 50)2 ⋅ 17 = 13600 = 261,54
17 + 18 + 17 52
σ Y = 16,17

σ X2 =
(4 − 5,81)2 ⋅ 19 + (6 − 5,81)2 ⋅ 19 + (8 − 5,81)2 ⋅ 14 = 2,5
19 + 19 + 14
σ X = 1,58
305 − 5,81 ⋅ 50
rYX = = 0,567
16,17 ⋅ 1,58
FuncŃia liniară are o reprezentativitate medie pentru modelarea legăturii dintre Y şi X.

4) Y ( X ) = 15,95 + 5,86 ⋅ X
Y (5,5) = 15,95 + 5,86 ⋅ 5,5 = 48,18
Prin urmare, pentru o valoare a cheltuielilor cu publicitatea de 5,5 milioane lei, se obŃine un volum
mediu al vânzărilor de 48,18 milioane lei.

5) Pentru funcŃia parabolică Y = a + b ⋅ X + c ⋅ X 2 + ε se calculează elementele matricii de


variaŃ ie şi covariaŃie:
m00 = σ Y2 = 261,54

m01 = M ( X ⋅ Y ) − M ( X ) ⋅ M (Y ) = 305 − 5,81 ⋅ 50 = 14,5

1
(
M X 2 ⋅Y = ) 52
⋅ ( 4 2 ⋅ 30 ⋅ 14 + 6 2 ⋅ 30 ⋅ 2 + 8 2 ⋅ 30 ⋅ 1 +

+ 4 2 ⋅ 50 ⋅ 3 + 6 2 ⋅ 50 ⋅ 10 + 8 2 ⋅ 50 ⋅ 5 +
+ 4 2 ⋅ 70 ⋅ 2 + 6 2 ⋅ 70 ⋅ 7 + 8 2 ⋅ 70 ⋅ 8) = 1979,23

( ) ( )
m02 = M X 2 ⋅ Y − M X 2 ⋅ M (Y ) = 1979,23 − 36,23 ⋅ 50 = 167,73

m11 = σ X2 = 2,5
4 3 ⋅ 19 + 6 3 ⋅ 19 + 8 3 ⋅ 14
M X3 =( ) 19 + 19 + 14
= 240,15
( ) ( )
m12 = M X 3 − M ( X ) ⋅ M X 2 = 240,15 − 5,81 ⋅ 36,23 = 29,65
4 4 4
4 ⋅ 19 + 6 ⋅ 19 + 8 ⋅ 14
M (X ) = 4
= 1669,85
19 + 19 + 14
m22 = M (X ) − M (X ) ⋅ M (X ) = 1669,85 − 36,23 ⋅ 36,23 = 357,24
4 2 2

Ob Ńinem astfel matricea de variaŃie şi covariaŃie:


 261,54 14,5 167,73 
(3 )  
M =  14,5 2,5 29,65 
167,73 29,65 357,24 
 

Calculăm complemenŃii algebrici:


1+1 2,5 29,65
M 00 = (− 1) ⋅ = 2,5 ⋅ 357,24 − 29,65 ⋅ 29,65 = 13,98
29,65 357,24

1+ 2 14,5 29,65
M 01 = (− 1) ⋅ = −206,78
167,73 357,24

1+ 3 14,5 2,5
M 02 = (− 1) ⋅ = 10,6
167,73 29,65

CoeficienŃii parabolei de regresie se obŃin prin metoda p ătratelor minime:


( ) (
M ε 2 = M Y −Y X, X 2 ( ))
2
→ min

 a + b ⋅ M ( X ) + c ⋅ M (X 2 ) = M (Y )

⇒  a ⋅ M ( X ) + b ⋅ M (X 2 ) + c ⋅ M ( X 3 ) = M ( X ⋅ Y )
a ⋅ M ( X 2 ) + b ⋅ M (X 3 ) + c ⋅ M (X 4 ) = M (X 2 ⋅ Y )

[
M 00 ⋅ [Y ( X ) − M (Y )] + M 01 ⋅ [X − M ( X )] + M 02 ⋅ X 2 − M X 2 = 0( )]
M M M M
⇒ Y ( X ) = M (Y ) + 01 ⋅ M ( X ) + 02 ⋅ M (X 2 )− 01 ⋅ X − 02 ⋅ X 2
M 00 M M 00 M 00
14444 442444004443 123 123
a b c

Astfel:
206,78 10,6
a = 50 − ⋅ 5,81 + ⋅ 36,23 = −8,46
13,98 13,98

 − 206,78 
b = −  = 14,79
 13,98 

 10,6 
c = −  = −0,76
 13,98 

Putem scrie deci funcŃia de regresie parabolică:


Y = −8,46 + 14,79 ⋅ X − 0,76 ⋅ X 2 + ε
sau Y ( X ) = −8,46 + 14,79 ⋅ X − 0,76 ⋅ X 2

Calculăm coeficientul de corelaŃie parabolică:


det M (3 )
rYXX 2 = 1 −
m00 ⋅ M 00
2435,224
rYXX 2 = 1 − = 0,578
261,54 ⋅ 13,98

det M (3 ) = 261,54 ⋅ 2,5 ⋅ 357,24 + 14,5 ⋅ 29,65 ⋅ 167,73 + 14,5 ⋅ 29,65 ⋅ 167,73 −
− 167,73 ⋅ 2,5 ⋅ 167,73 − 14,5 ⋅ 14,5 ⋅ 357,24 − 29,65 ⋅ 29,65 ⋅ 261,54 =
= 2435,224

Aşadar, funcŃia parabolică are o reprezentativitate medie pentru modelarea legăturii dintre Y şi X,
fiind mai reprezentativă, dar nu semnificativ, decât dreapta de regresie.

Y ( X ) = −8,46 + 14,79 ⋅ X − 0,76 ⋅ X 2

Y (5,5) = −8,46 + 14,79 ⋅ 5,5 − 0,76 ⋅ 5,5 2 = 49,9

Prin urmare, pentru o valoare a cheltuielilor cu publicitatea de 5,5 milioane lei, se obŃine un volum
mediu al vânzărilor de 49,9 milioane lei.

Problema 2
Un produs a fost lansat simultan pe 13 pieŃe. Pe aceste pieŃe, produsul a fost propus la preŃuri diferite
(P), veniturile consumatorilor (V) fiind şi ele diferite. Pentru fiecare piată s-a înregistrat un anumit
nivel al cererii (C), rezultatele fiind sintetizate în tabelul următor:

Nr. Cerere (C) PreŃ (P) Venit (V)


crt.
1 15,4 1,4 620
2 3,2 5,1 530
3 4,9 2,5 490
4 10,5 1,7 800
5 8,0 1,8 630
6 5,1 3,4 410
7 7,6 2,1 670
8 11,3 1,6 920
9 14,0 3,6 990
10 6,4 3,5 320
11 13,2 1,9 520
12 8,8 1,8 700
13 12,1 1,9 730

1) Să se formuleze ipoteze cu privire la forma legăturii dintre cerere (C) şi preŃ (P). Pentru formele
funcŃiilor de regresie reŃinute ca fiind posibile, să se calculeze parametrii funcŃiilor şi
reprezentativitatea acestora.
2) Similar pentru legătura dintre cerere şi venit.
3) Să se calculeze parametrii funcŃiei care modelează legătura liniară multiplă dintre cerere şi factorii
săi e influenŃă. AnalizaŃi reprezentativitatea acestei funcŃii în raport cu reprezentativitatea funcŃiilor de
regresie simple. Care va fi valoarea estimată a cererii pe o piaŃă unde preŃul de vânzare va fi 3,2 iar
venitul mediu al consumatorilor de 550 ?

1) Construim norul de puncte în raport cu P şi C:


18

16

14

12
cerere

10

0
0 1 2 3 4 5 6
pret

ReŃinem ca forme posibile ale funcŃ iei de regresie:


- dreapta: C ( P) = a1 + b1 ⋅ P
1
- hiperbola: C ( P) = a 2 + b2 ⋅
P

a) Pentru primul caz, cel al dreptei de regresie, avem:


1,4 + 5,1 + 2,5 + ..... + 1,9
M ( P) = = 2,485
13
1,4 2 + 5,12 + 2,5 2 + ..... + 1,9 2
M (P 2 ) = = 7,273
13
15,4 + 3,2 + 4,9 + ..... + 12,1
M (C ) = = 9,269
13
15,4 ⋅1,4 + 3,2 ⋅ 5,1 + 4,9 ⋅ 2,5 + ..... + 12,1 ⋅1,9
M (CP ) = = 20,81
13
M (CP ) − M (C )M ( P) 20,81 − 9,269 ⋅ 2,485
b1 = = = −2,025
M ( P 2 ) − [ M ( P)]2 7,273 − 2,4852
a1 = M (C ) − b1 ⋅ M ( P) = 9,269 + 2,025 ⋅ 2,485 = 14,3

Dreapta de regresie se scrie:


C ( P) = 14,3 − 2,025 ⋅ P

Calculăm reprezentativitatea dreptei de regresie:


(1,4 − 2,458) 2 + (5,1 − 2,458) 2 + ..... + (1,9 − 2,458) 2
σ P2 = = 1,1
13
σ P = 1,049
(15,4 − 9,269) 2 + (3,2 − 9,269) 2 + ..... + (4,9 − 9,269) 2
σ C2 = = 13,479
13
σ C = 3,671
M (CP) − M (C ) M ( P) 20,81 − 9,269 ⋅ 2,485
rC , P = = = −0,58
σ C ⋅σ P 3,671 ⋅ 1,049
Drepta de regresie are o reprezentativitate medie.

b) Pentru al doilea caz, cel al hiperbolei de regresie, facem schimbarea de variabilă:


1
Z=
P
Datele cu privire la cerere şi noua variabilă Z:

Nr. C Z Nr. C Z Nr. C Z


1 15,4 0,714 6 5,1 0,294 11 13,2 0,526
2 3,2 0,196 7 7,6 0,476 12 8,8 0,556
3 4,9 0,400 8 11,3 0,625 13 12,1 0,526
4 10,5 0,588 9 14,0 0,278
5 8,0 0,556 10 6,4 0,286

0,714 + 0,196 + 0,400 + ..... + 0,526


M (Z ) = = 0,462
13
0,714 2 + 0,196 2 + 0,400 2 + ..... + 0,526 2
M (Z 2 ) = = 0,238
13
15,4 ⋅ 0,714 + 3,2 ⋅ 0,196 + ..... + 12,1 ⋅ 0,526
M (CZ ) = = 4,639
13
M (CZ ) − M (C )M ( Z ) 4,639 − 9,269 ⋅ 0,462
b2 = = = 14,527
M ( Z 2 ) − [M ( Z )]2 0,238 − 0,4622
a2 = M (C ) − b2 ⋅ M ( Z ) = 9,269 − 14,527 ⋅ 0,462 = 2,56

Hiperbola de regresie se scrie:


1
C ( P) = 2,56 + 14,527 ⋅
P
Calculăm reprezentativitatea hiperbolei de regresie:

σ Z = 0,1519
σ C = 3,671

M (CZ ) − M (C )M ( Z ) 4,639 − 9,269 ⋅ 0,462


rC ,Z = = = 0,64
σ C ⋅σ Z 3,671 ⋅ 0,1519

Drepta de regresie are o reprezentativitate medie, dar este mai reprezentativă decât dreapta.
2) Construim norul de puncte în raport cu V şi C:

20

18

16

14

12
consum

10

0
0 200 400 600 800 1000 1200
venit

ReŃinem ca formă posibilă a funcŃiei de regresie:


- dreapta: C (V ) = a3 + b3 ⋅V
620 + 530 + ..... + 730
M (V ) = = 640,8
13
620 2 + 530 2 + ..... + 7302
M (V 2 ) = = 444731
13
M (C ) = 9,269
15,4 ⋅ 620 + 3,2 ⋅ 530 + ..... + 12,1 ⋅ 730
M (CV ) = = 6340 ,7
13
M (CV ) − M (C ) M (V ) 6340,7 − 9,269 ⋅ 640,8
b3 = = = 0,01176
M (V 2 ) − [M (V )]2 444731 − 640,8 2
a3 = M (C ) − b3 ⋅ M (V ) = 9,269 − 0,01176 ⋅ 640,8 = 1,73

Dreapta de regresie se scrie:


C (V ) = 1,73 + 0,01176 ⋅V

Calculăm reprezentativitatea dreptei de regresie:


σ V2 = 34146
σ V = 184,8
σ C = 3,671
M (CV ) − M (C ) M (V ) 6340,7 − 9,269 ⋅ 640,8
rC ,V = = = 0,59
σ C ⋅σV 3,671 ⋅ 184,8
Drepta de regresie are o reprezentativitate medie.

3) Pentru funcŃia de regresie liniară multiplă C = a4 + b4 ⋅ P + c4 ⋅ V + ε , calculăm elementele matricii


de variaŃie şi covariaŃie:
m00 = σ C2 = 13,479
m01 = M (CP) − M (C ) M ( P) = 20,81 − 9,269 ⋅ 2,485 = −2,223
m02 = M (CV ) − M (C )M (V ) = 6340,7 − 9,269 ⋅ 640,8 = 401,12
m11 = σ P2 = 1,1
1,4 ⋅ 620 + 5,1 ⋅ 530 + ... + 1,9 ⋅ 730
M ( PV ) = = 1529,4
13
m12 = M ( PV ) − M ( P)M (V ) = 1529,4 − 2,485 ⋅ 640,8 = −62,99
m22 = σ V2 = 34146

Ob Ńinem astfel matricea de variaŃie şi covariaŃie:


 13,479 − 2,223 401,12 
(3 )
 
M =  − 2,223 1,1 − 62,99 
 401,12 − 62,99 34146 
 

Calculăm complemenŃii algebrici:


1,1 − 62,99
M 00 = (−1)1+1 ⋅ = 33593
− 62,99 34146
− 2,223 − 62,99
M 01 = (−1)1+ 2 ⋅ = 50640
401,12 34146
− 2,223 1,1
M 02 = (−1)1+3 ⋅ = −301,2
401,12 − 62,99

Ob Ńinem astfel coeficienŃii regresiei:


a 4 = 7,3
b4 = −1,507
c4 = 0,00897

Putem scrie deci funcŃia de regresie liniară multiplă:

C = 7,3 − 1,507 ⋅ P + 0,00897 ⋅V + ε


sau C ( P,V ) = 7,3 − 1,507 ⋅ P + 0,00897 ⋅V

Calculăm coeficientul de corelaŃie liniară multiplă:


det M ( 3)
rCPV = 1 −
m00 ⋅ M 00

219406
rCPV = 1 −
13,479 ⋅ 33593
rCPV = 0,72
FuncŃia liniară multiplă este foarte reprezentativă pentru modelarea legăturii dintre consum (C) şi
factorii săi de influenŃă: preŃul produsului (P) şi venitul consumatorilor. Observăm că funcŃia multiplă
are un coeficient de corelaŃie mai mare decât ceilalŃi coeficienŃi, ai funcŃiilor de regresie cu câte un
singur factor. Se confirmă astfel teoria conform căreia o variabilă este cu atât mai bine explicată, cu
cât numărul de variabile explicative este mai mare.

C ( P,V ) = 7,3 − 1,507 ⋅ P + 0,00897 ⋅V


C (3,2 ; 550) = 7,3 − 1,507 ⋅ 3,2 + 0,00897 ⋅ 550 = 7,4

Pe o piaŃă unde produsul se va vinde la un preŃ de 3,2 iar venitul mediu al consumatorilor este 550, ne
aşteptăm la o valoare cea mai probabilă a consumului de 7,4.
Problema 3
Din diverse surse de statistică internaŃională, cunoaştem cu privire la 16 state ale lumii valorile
variabilelor X = P.I.B./locuitor (mii $) şi Y = cheltuielile pentru activităŃi de turism pe locuitor (mii $):
Nr. crt. X (mii $) Y (mii $)
1 9.8 0.97
2 15.3 1.23
3 12.8 1.59
4 30.1 6.69
5 22.0 3.4
6 18.1 1.82
7 13.4 1.71
8 28.1 5.11
9 29.0 6.02
10 11.6 1.42
11 25.3 3.84
12 10.9 1.36
13 19.4 2.01
14 21.7 3.29
15 18.2 2.42
16 27.7 5.03
1) Folosind un grafic adecvat şi elemente din teoria economică, să se formuleze ipoteze cu privire la
forma posibilă a funcŃiei de regresie.
2) Pentru una din formele funcŃionale selectate, să se estimeze parametrii şi să se scrie funcŃia.
3) DecideŃi care funcŃie este mai bună, atât pe baza coeficienŃilor de corelaŃie, cât şi pe baza valorilor
previzionate pe baza funcŃiilor.

1) Construim norul de puncte în raport cu cele două variabile:


Norul de puncte si functia de regresie exponentiala
Cheltuieli cu servicii turistice /

7
6
5
loc. (mii $)

4
3
2
1
0
5 10 15 20 25 30 35
P.I.B. / loc. (mii $)

Norul de puncte si functia de regresie liniara

7
Cheltuieli cu servicii turistice /

6
5
loc. (mii $)

4
3
2
1
0
5 10 15 20 25 30 35
P.I.B. / loc. (mii $)
La o primă vedere, ambele funcŃii par adaptate pentru modelarea legăturii, punctele norului nefiind
prea îndepartate de ele. Dacă judecăm pu Ńin din punct de vedere economic, cererea de servicii turistice
este crescătoare în raport cu P.I.B./loc., ceea ce este valabil pentru ambele funcŃii. Trebuie să Ńinem
cont însă că serviciile turistice sunt într-o măsură importantă un bun de lux, deci cu o elasticitate
supraunitară a cererii în raport cu venitul. Mai potrivită pare deci funcŃia exponenŃială.

2) FuncŃia exponenŃială dintre cele două variabile, sub forma ei deterministă se scrie:
Y = a ⋅bX
care prin logaritmare devine:
ln Y = ln a + ln b ⋅ X
iar sub forma aleatoare:
ln Y = ln a + ln b ⋅ X + ε

Facem următoarele schimbări de variabilă:


ln Y = Z
ln a = A
ln b = B

FuncŃia devine :
Z = A+ B⋅ X +ε

care este o funcŃie liniară. Datele numerice pentru estimarea parametrilor le prezentăm în tabelul
următor:
Nr. crt. X (mii $) Z=lnY
1 9.8 -0.030
2 15.3 0.207
3 12.8 0.464
4 30.1 1.901
5 22.0 1.224
6 18.1 0.599
7 13.4 0.536
8 28.1 1.631
9 29.0 1.795
10 11.6 0.351
11 25.3 1.345
12 10.9 0.307
13 19.4 0.698
14 21.7 1.191
15 18.2 0.884
16 27.7 1.615

 A + B ⋅ M ( X ) = M (Z )
 2
 A ⋅ M ( X ) + B ⋅ M ( X ) = M ( XZ )

M ( X ) = 19,59
M ( X 2 ) = 428,81
M (Z ) = 0,9199
M ( XZ ) = 21,91

M ( XZ ) − M ( X ) ⋅ M (Z ) 21,91 − 19,59 ⋅ 0,9199


B= = = 0,08634
M ( X 2 ) − M ( X )2 428,81 − 19,59 2
A = M ( Z ) − B ⋅ M ( X ) = 0,9199 − 0,08634 ⋅ 19,59 = −0,7715
De unde:
b = e 0,08634 = 1,0902
a = e −0,7715 = 0,4623

Putem scrie deci funcŃia de regresie:


Y = 0, 4623 ⋅ 1,0902 X + ε

3) Calculăm coeficienŃii de corelaŃie pentru funcŃia exponenŃială, respectiv cea liniară. Cum şi cea
exponenŃială a fost liniarizată, avem:
M ( XZ ) − M ( X ) ⋅ M (Z )
RZX = = 0,97
σ X ⋅σ Z
M ( XY ) − M ( X ) ⋅ M (Y )
RYX = = 0,95
σ X ⋅σ Y
FuncŃia exponenŃială este deci mai reprezentativă.
Pentru a compara valorile prezise prin cele două funcŃii, trebuie să calculăm şi parametrii
funcŃiei liniare. Fără a mai detalia calculele, scriem funcŃia:

Y = −2,328 + 0,2723 ⋅ X + ε

Pentru o valoare a venitului de 7000 $ (X=7) ob Ńinem:


- pentru funcŃia exponenŃială
Y (7) = 0,4623 ⋅ 1,0902 7 = 0,85
- pentru funcŃia liniară
Y (7) = −2,328 + 0,2723 ⋅ 7 = −0,42 rezultat evident absurd
Ca urmare, şi valorile prezise de cele două funcŃii o indică pe cea exponenŃială ca fiind cea adecvată
modelării legăturii dintre PIB/loc şi cheltuielile cu servicii turistice.

Capitolul 5

INDICII STATISTICI

Pentru studierea fenomenelor economice şi sociale este adesea nevoie să descriem şi să studiem
variaŃ ia unor mărimi. Indicele statistic este o funcŃie ale cărei valori numerice exprimă variaŃia relativă
totală sau parŃială a unei mărimi între două situaŃii (dou ă perioade, două spaŃii diferite, două categorii).
Fie Z o mărime a cărei variaŃie constituie obiectivul de studia şi λ un parametru de care
depinde mărimea Z, respectiv Z = Z(λ). Relativ la parametrul λ, acesta poate exprima timpul, spaŃiul
sau anumite categorii economice sau sociale. Considerând două stări oarecare ale parametrului λ,
respectiv λ = j cu Z(λ) = Z(j) şi λ = k cu Z(λ) = Z(k), atunci, în sens clasic, indicele mărimii Z este:
Z( k )
I Yk / j =
Z( j )
După numărul de unităŃi la care se referă mărimea Z, indicii sunt:
- indici elementari sau individuali, ce măsoară variaŃia unei mărimi relativ la o singură unitate
statistică a populaŃiei. De exemplu, pentru mărimea Z = x.y, avem:
x( k ) y( k ) Z ( k ) x( k ) ⋅ y( k )
I xk / j = , I ky / j = şi =
x( j ) y( j ) Z ( j ) x( j ) ⋅ y( j )
- indici sintetici sau de grup, ce măsoară variaŃia unei mărimi relativ la dou ă sau mai multe
unităŃ i ale populaŃiei.
m
De exemplu Z = ∑ xi y j , unde „i” reprezintă unitatea statistică, x şi z fiind factorii ce se măsoară
i =1
la nivelul tuturor celor „m” unităŃi. Indicele sintetic este:
∑ xi ( k ) y i ( k )
k/ j Z( k ) i
IY = =
Z ( j ) ∑ xi ( j ) y i ( j )
i
m
Frecvent, în domeniul economic, prezintă interes studiul unei mărimi de tip valoare Z = V = ∑ pi qi ,
i =1
unde pi sunt preŃuri iar qi sunt cantităŃi.
După natura parametrului λ, indicii sunt:
- indici ai dinamicii, unde λ exprimă timpul;
- indici teritoriali, unde λ exprimă spaŃiul;
- indici ai unor categorii, unde λ exprimă o anumită categorie economică sau socială.
Indicii dinamici după modul de comparare a stărilor parametrului λ sunt:
- indici cu bază fixă;
- indici cu bază în lanŃ.
O abordare sistemică a indicilor unei mărimi îi împarte în:
- indici ai variaŃiei integrale;
- indici ai variaŃiilor factoriale, denumiŃi şi indici factoriali.

5.1. Indicele variaŃiei integrale

Fie Z = f(x1, x2, ..., xm) modelul ce exprimă dependenŃa mărimii Z de factorii x1, x2 , ..., xm.
VariaŃia mărimii Z rezultată prin acŃiunea tuturor factorilor de influenŃă, se numeşte varia Ńie
integrală. Indicele variaŃiei integrale aferent mărimii Z este:
Z( k )
I zk / j =
Z( j )
ProprietăŃi ale indicelui variaŃiei integrale:
i) Identitatea (reflexivitatea)
I zk / k = 1
respectiv:
Z (k )
I zk / k = =1
Z (k )
ii) Reversibilitatea (simetria)
1
I zk / j ⋅ I zj / k = 1 sau I zk / j =
I zj / k
adică:
Z( k ) 1 1
I zk / j = = =
Z ( j ) Z ( j ) I zj / k
Z( k )
iii) Circularitatea (tranzactivitatea)
Fie j, h şi k trei stări a parametrului λ, h fiind starea intermediară atunci:
I zh / j ⋅ I zk / h = I zk / j
deoarece
Z ( h ) Z( k ) Z( k )
I zh / j ⋅ I zk / h = ⋅ = = I zk / j .
Z ( j ) Z ( h ) Z( j )
5.2. Indicii factoriali

Indicii I z / x1 , I z / x 2 ,..., I z / x m exprimând cote părŃi din variaŃia mărimii Y determinate, respectiv de
factorii x1, x2, ..., xm constituie sistemul de indici factoriali ai mărimii Y. Lipsa unei definiŃii efective a
condus cercetarea spre găsirea unor algoritmi de calcul ai indicilor factoriali. Cei mai cunoscuŃi
algoritmi au ca trăsătură comună menŃinerea la un nivel constant a factorilor nestudiaŃi, fiind numiŃi şi
sisteme de ponderare.
Principalele tipuri de indici factoriali (sisteme de ponderare) utilizaŃi în practică sunt:
- indicii de tip Laspeyres;
- indicii de tip Paasche;
- indicii de tip Fisher.
Se cunosc o serie de alte expresii de calcul a indicilor factoriali, destinate în principal pentru
calculul indicelui preŃurilor (Moldovan, 1999).

5.2.1. Indicii factoriali de tip Laspeyres

Cunoscut iniŃial sub denumirea de indicele preŃurilor, indicele de tip Laspeyres a fost definit având în
vedere o mărime exprimând valoarea:
r
V = ∑ pi qi
i =1
unde pi sunt preŃuri iar qi cantităŃi. Indicele factorial al preŃurilor, de tip Laspeyres se determină
conform relaŃiei:
r
∑ pi ( k )qi ( j )
k/ j j =1
I V / p ( ⋅L ) =
r
∑ p i ( j )qi ( j )
i =1
unde:
pi(j) – preŃul din perioada de bază;
pi(k) - preŃurile din perioada curentă;
qi(j) – cantităŃile din perioada de bază;
qi(k) – cantităŃile din perioada curentă.
Asemănător se poate scrie expresia indicelui volumului fizic (a cantităŃii):
r

∑ p ( j)q (k )
j =1
i i
k/ j
I V /q ( L⋅) = r
.
∑ p ( j )q ( j )
i =1
i i

Având în vedere expresiile celor doi indici, în Florea (1986) se deduce o regulă generală pentru
elaborarea indicilor factoriali de tip „Laspeyres”: partea din variaŃia unei mărimi determinată de un
factor se ob Ńine menŃinând ceilalŃi factori la nivelul bază de comparaŃie. Astfel, în cazul mărimii Z
depinzând de m factori, adică Z = f(X1, X2, ..., Xm), avem:
f ( x1 ( k ), x 2 ( j ),..., xi ( j ),..., x m ( j ))
I Zk // xj ( ⋅L...L...L ) =
1 f ( x1( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))
f ( x1 ( j ), x2 ( j ),..., xi (k ),..., xm ( j ))
I Zk // xji ( L L... ⋅ ...L) =
f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))

f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm (k ))
I Zk // xj m ( L L...L...⋅) = .
f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))
Exemplu 1.
Relativ la sortimentele importate, dintr-o anumită grupă de mărfuri, dispunem de următoarele
informaŃii:
Sortiment an j an k
Cantitate PreŃ unitar de Cantitate PreŃ unitar de
importată import importată import
S1 18 10 15 18
S2 15 6 25 12
S3 25 14 30 20
Se cere:
a) indicele valorii importului pentru această grup ă de mărfuri;
b) indicele preŃului de import respectiv indicele cantităŃii importate (a volumului importului),
ambii de tip Laspeyres.

Rezolvare
a) Valoarea importului, din această grupă de mărfuri (formată din trei sortimente), se determină astfel:
3
V = ∑ pi q i
i =1
unde:
pi – preŃul unitar de import al sortimentului i;
qi – cantitatea importată din sortimentul i.
Indicele exprimând variaŃia integrală a valorii importului este:
V ( j ) 15 ⋅18 + 25 ⋅12 + 30 ⋅ 20 1170
IVk / j = = = = 1,890
V (k ) 18 ⋅10 + 15 ⋅ 6 + 25 ⋅14 620
IVk / j = 1.890 indică o creştere a valorii importului, în anul k faŃă de anul j, de 1.89 ori.

b) Indicii factoriali, de tip Laspeyres


3

∑ p (k )q ( j )
i i
18 ⋅18 + 12 ⋅ 15 + 20 ⋅ 25 1004
I k/ j
V/p (L ) = i =1
3
= = = 1,619
18 ⋅10 + 15 ⋅ 6 + 25 ⋅14 620
∑ p ( j )q ( j )
i =1
i i

∑ p ( j )q (k )
i i
10 ⋅15 + 6 ⋅ 25 + 14 ⋅ 30 720
I k/ j
V /q (L ) = i =1
3
= = = 1,162
18 ⋅10 + 15 ⋅ 6 + 25 ⋅14 620
∑ p ( j )q ( j )
i =1
i i

Urmare a creşterii preŃurilor unitare, valoarea importului a crescut, în anul k faŃă de anul j, de 1,619
ori. Privind acest indice factorial ca un indice sintetic al preŃurilor, rezultatul obŃinut arată căci per
ansamblu celor trei sortimente preŃurile unitare au crescut de 1,619 ori.
Modificarea cantităŃilor importate a determinat o creştere a valorii importului, în anul k faŃă de
anul j, de 1,162 ori, sau cantităŃile importate au crescut per ansamblu de 1,162 ori.

5.2.2. Indicii factoriali de tip Paasche

Paasche, spre deosebire de Laspeyres, pentru a defini indicele preŃurilor, ponderează preŃurile
bunurilor cu cantităŃile din perioada curentă. Prin urmare, rezultă:
r

∑ p ( k ) q (k )
j =1
i i
k/ j
I V/p ( P) = r

∑ p ( j)q (k )
i =1
i i

Asemănător se poate deduce expresia de calcul a indicelui volumului fizic:


r

∑ p (k )q (k )
j =1
i i
k/ j
I V /q ( P) = r

∑ p ( k )q ( j )
i =1
i i

Şi în acest caz, în Florea (1986) autorul deduce o regulă generală pentru elaborarea indicilor
factoriali de tip „Paasche”: partea din variaŃia unei mărimi determinată de un factor se ob Ńine
menŃinând ceilalŃi factori la nivelul curent. Pentru mărimea Z, depinzând ce m factori, indicii
factoriali de tip „Paasche” sunt:
f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( k ))
I Zk // xj ( ⋅ P...P...P ) =
1 f ( X 1 ( j ), X 2 ( k ),..., X i ( j ),..., X m ( k ))
.........
k/ j f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( k ))
I Z / x ( P P... ⋅ ...P ) =
i f ( X 1( k ), X 2 ( k ),..., X i ( j ),..., X m ( k ))
.........
f ( X 1( j ), X 2 ( j ),..., X i ( j ),..., X m ( k )) .
I Zk // xj ( P P...P...⋅ ) =
m f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( j ))

5.2.3. Indicii factoriali de tip Fisher

Irving Fisher în 1922 a stabilit o nouă expresie de calcul a indicelui preŃurilor pornind de la
limitele indicilor Laspeyres respectiv Paasche. Astfel, indicii Fisher se exprimă ca o medie geometrică
a indicilor Laspeyres şi Paasche:
IVk // pj ( F ) = IVk // pj ( L ) ⋅ I Vk // jp ( P ) (indicele preŃurilor)
k/ j k/ j k/ j
IV / q ( F ) = IV / q ( L ) ⋅ IV / q ( P ) (indicele volumului fizic).
În Florea (1986) se extinde acest principiu de calcul pentru o mărimi Z depinzând după o lege oarecare
de m factori. Astfel, indicii factoriali obŃinu Ńi în urma aplicării principiului Fisher sunt definiŃi ca o
medie geometrică a tuturor indicilor factoriali de tip Laspeyres şi Paasche, relativ la acelaşi factor,
determinaŃ i prin toate succesiunile posibile de analiză a factorilor.

Spre exemplu în cazul în care mărimea Y depinde de doi factori, respectiv Z = f(X1, X2), indicii
factoriali se exprimă astfel:
f ( X1( k ),X 2( j )) f ( X1( k ),X 2( k ))
I zk // xj ( F ) = I zk // xj ( ⋅L ) ⋅ I zk // xj ( ⋅P ) = ⋅
1 1 1 f ( X1( j ), X 2( j )) f ( X1( j ), X 2( k ))
k/ j k/ j k/ j f ( X1( j ),X 2( k )) f ( X1( k ),X 2( k ))
I z / x ( F ) = I z / x ( L⋅ ) ⋅ I z / x ( P⋅ ) = ⋅
2 2 2 f ( X1( j ),X 2( j )) f ( X1( k ),X 2( j ))

Dacă mărimea Z depinde de 3 factori, respectiv Z = f(X1, X2, X3), având 6 succesiuni de analiză a
factorilor, indicii factoriali au următoarele expresii:
[ 2
] [
I zk // xj ( F ) = 6 I zk // xj ( ⋅L L ) ⋅ I zk // xj ( ⋅L P ) ⋅ I zk // xj ( ⋅P L ) ⋅ I zk // xj ( ⋅P P )
1 1 1 1 1
2
]
[ ]
2
[ ]
I zk // xj ( F ) = 6 I zk // xj ( L ⋅ L ) ⋅ I zk // xj ( L ⋅ P ) ⋅ I zk // xj ( P ⋅ L ) ⋅ I zk // xj ( P ⋅ P )
2 2 2 2 2
2

3 3 
2
3 3
[
I zk // xj ( F ) = 6 I zk // xj ( L ⋅ L ) ⋅ I zk // xj ( L P⋅ ) ⋅ I zk // xj ( P L⋅ ) ⋅ I zk // xj ( P P⋅ )
 1
]2

Justificăm în continuare aceste expresii. Dacă mărimea Z depinde de 3 factori se înregistrează 6


succesiuni de studiere a influenŃei factorilor asupra variaŃiei mărimii. O primă succesiune poate fi
următoarea (X1, X2, X3), iar indicii factoriali vor înregistra următoarele expresii:
k/ j f ( X 1( k ), X 2 ( j ), X 3 ( j ))
I z / x ( ⋅L L ) =
1 f ( X 1( j ), X 2 ( j ), X 3 ( j ))
f ( X 1 ( k ), X 2 ( k ), X 3 ( j ))
I zk // xj ( P ⋅ L ) =
2 f ( X 1 ( k ), X 2 ( j ), X 3 ( j ))
f ( X 1( k ), X 2 ( k ), X 3 ( k ))
I zk // xj ( P P⋅ ) =
3 f ( X 1 ( k ), X 2 ( k ), X 3 ( j ))

Astfel, factorii a căror influenŃă a fost măsurată sunt consideraŃi la nivelul lor din perioada curentă, iar
cei. În notaŃia indicilor au intervenit simbolurile „L”, „P” şi „ ⋅ ”, unde „L” semnifică faptul că
factorul se menŃine la nivelul bază de comparaŃie, „P” factorul se menŃine la nivelul curent, iar „ ⋅ ”
acel factor este analizat. Indiferent de ordinea în care sunt analizaŃi factorii, poziŃia lor în model nu se
schimb ă. Pentru toate succesiunile vor fi prezentaŃi indicii factoriali, fără a fi redate expresiile lor.

Succesiunea X1 X2 X3
(X1, X3, X2) I z / x1 (⋅L L) I z / x2 ( P ⋅ P ) I z / x 3 ( P L⋅ )
(X1, X2 X3) I z / x1 ( ⋅L L ) I z / x2 ( P ⋅ L ) I z / x 3 ( P P⋅ )
(X2, X1, X3) I z / x1 ( ⋅P L ) I z / x2 ( L ⋅ L ) I z / x 3 ( P P⋅ )
(X2 X3, X1) I z / x1 ( ⋅P P ) I z / x2 ( L ⋅ L ) I z / x 3 ( L P⋅ )
(X3, X1, X2) I z / x1 ( ⋅L P ) I z / x2 ( P ⋅ P ) I z / x 3 ( L L⋅ )
(X3, X2, X1) I z / x1 ( ⋅P P ) I z / x2 ( L ⋅ P ) I z / x 3 ( L L⋅ )

Dacă mărimea Z depinde de m factori, indicii factoriali se determină ca o medie geometrică a m!


indici ob ŃinuŃi prin cele m! succesiuni.

5.3. Testul Fisher şi indicii factoriali

5.3.1. Testul Fisher


Referitor la definirea axiomatică a indicilor factoriali, I.Fisher a propus un test care îi
poartă numele şi care conŃine un ansamblu de cerinŃe (axiome) pe care trebuie să le satisfacă
indicii factoriali ai unei mărimi, pentru a putea fi consideraŃi indici factoriali „buni”. Aceste
axiome, ce compun testul Fisher, sunt:
a) identitatea (reflexivitatea), respectiv:

I zk // xk = 1
b) reversibilitatea în timp (simetrie), respectiv:
1
I zk // xj =
I zj // xk
c) Circularitatea (tranzitivitatea), respectiv produsul indicilor cu bază în lanŃ trebuie să fie egal
cu indicele cu bază fixă. Considerând trei stări succesive j, h, k, atunci:
h/ j k/ j
I z / x ⋅ I zk // xh = I z / x
d) Reversibilitatea factorilor (completitudinea), respectiv produsului indicilor factoriali este
egal cu indicele variaŃ iei integrale a mărimii analizate.
I zk // xj ⋅ I zk // xj ...I zk // xj = I zk / j
1 2 m
e) ProporŃionalitatea indicelui, adică, dacă indicii individuali sunt egali cu A, indicele sintetic
trebuie să fie egal şi el cu A.
f) CerinŃa de determinare a indicelui. Indicele sintetic nu trebuie să devină nul, nedefinit sau
nedeterminat, dacă unul din indicii parŃiali devine nul, nedefinit sau nedeterminat.
g) Omogenitatea (comensurabilitatea) indicelui. Valoarea indicelui trebuie să fie independentă de
schimb ările unităŃilor de măsură.
h) CerinŃa schimbării bazei indicelui. Rezultatul împărŃirii a doi indici din dou ă perioade diferite,
calculaŃi cu aceeaşi metodă şi având aceeaşi bază trebuie să fie independent de alegerea bazei.
Se reŃin primele patru cerin Ńe ca fiind mai importante.

5.3.2. Indicii factoriali prin prisma testului Fisher


În continuare se vor raporta indicii factoriali definiŃi anterior, la testul Fisher (redus la cele 4
cerinŃe). Sunt valabile următoarele enunŃuri.
a) ToŃi indicii sunt reflexivi.
De exemplu, în cazul factorului xi avem:
f ( X 1( k ),...X i ( k ),..., X m ( k ))
I zk // xk ( L... ⋅ ...L ) = =1
i f ( X 1( k ),...X i ( k ),..., X m ( k ))
f ( X 1 ( k ),...X i ( k ),..., X m ( k ))
I zk // xk ( P ... ⋅ ...P ) = = 1.
i f ( X 1 ( k ),...X i ( k ),..., X m ( k ))

b) În general, indicii Laspeyres şi Paasche nu sunt simetrici, în schimb indicii Fisher sunt
simetrici.
De exemplu, în cazul indicilor Laspeyres avem:
I zk // xj ( L... ⋅ ...L ) ⋅ I zj // xk ( L... ⋅ ...L ) =
i i

f ( X 1( j ),...X i ( k ),..., X m ( j )) f ( X 1( k ),...X i ( j ),..., X m ( k ))


= ⋅ ≠1
f ( X 1 ( j ),...X i ( j ),..., X m ( j )) f ( X 1 ( k ),...X i ( k ),..., X m ( k ))
Un calcul similar arată că indicii Fisher sunt simetrici.
c) Nici unul dintre indicii factoriali prezentaŃi până aici nu sunt tranzitivi.
De exemplu, în cazul indicilor Laspeyres avem:
h/ j
I z / x ( L... ⋅ ...L ) ⋅ I zk // xh ( L... ⋅ ...L ) =
i i

f ( X 1( j ),...X i ( h ),..., X m ( j )) f ( X 1 ( h ),...X i ( k ),..., X m ( h ))


= ⋅ ≠
f ( X 1( j ),...X i ( j ),..., X m ( j )) f ( X 1( h ),...X i ( h ),..., X m ( h ))

f ( X 1 ( j ),...X i ( k ),..., X m ( j ))
≠ = I zk // xj
f ( X 1( j ),...X i ( j ),..., X m ( j )) i
d) Dintre indicii factoriali prezentaŃi, numai indicii Fisher verifică condiŃia de completitudine a
testului. Astfel, de exemplu, în cazul în care mărimea Z depinde de doi factori, Z = f(X1, X2), avem:

f ( X 1 ( k ), X 2 ( j )) f ( X 1 ( k ), X 2 ( k ))
I zk // xj ⋅ I zk // xj ( F ) = ⋅ ⋅
1 2 f ( X 1 ( j ), X 2 ( j )) f ( X 1( j ), X 2 ( k ))

f ( X 1 ( J ), X 2 ( K )) f ( X 1( k ), X 2 ( k )) f ( X 1( k ), X 2 ( k ))
⋅ ⋅ = = I zk / j
f ( X 1 ( j ), X 2 ( j )) f ( X 1( k ), X 2 ( j )) f ( X 1( j ), X 2 ( j ))
Observăm că indicii factoriali de tip „Fisher” satisfac cele mai multe axiome, fiind reflexivi,
simetrici respectiv verifică condiŃia de completitudine a testului Fisher.

5.4. Alte metode de calcul a indicilor factoriali - (facultativ)

Exemplu 2.
Considerăm mărimea Z=C reprezentând cheltuielile privind consumul a dou ă produse. Datele
referitoare la factorii săi de influenŃă, adică preŃul mediu de cump ărare şi cantitatea cump ărată, pentru
dou ă luni consecutive sunt prezentate în tabelul următor:

Produs Aprilie 2004 Mai 2004


PreŃ mediu Cantitate PreŃ mediu cantitate
Produs A 3400 2 (kg) 3550 3 (kg)
Produs B 890 10 (buc) 1100 8 (buc)

a) indicele variaŃiei integrale a mărimii C;


b) indicii factoriali ai mărimii C, de tip Laspeyres, Paasche respectiv Fisher. Verifică rezultatele
obŃinute condiŃia de completitudine a testului Fisher?
c) calculul restului nedescompus din metoda schimb ărilor simultane;
d) exprimarea indicilor factoriali sintetici în funcŃie de indicii elementari corespunzători.

Rezolvare
a) Mărimea C se exprimă în funcŃie de preŃ şi cantitate astfel:
n
C = ∑ p i qi
i =1
unde:
pi – preŃul mediu unitar al produsului i;
qi – cantitatea cumpărată din produsul i;
În cazul analizat avem n=2.
Notăm cu: 0 - luna aprilie
1 - luna mai.
Indicele exprimând variaŃia totală a mărimii C se determină astfel:
1/ 0 C (1) 19450
IC = = = 1,2388
C (0 ) 15700
2
C (1) = ∑ pi (1)qi (1) =3550 ⋅ 3 + 1100 ⋅ 8 = 19450
i =1
2
C (0 ) = ∑ pi (0 )qi (0 ) =3400 ⋅ 2 + 890 ⋅ 10 = 15700
i =1
1/ 0
I = 1,2388 arată o creştere a cheltuielilor cu consumul celor două produse, în luna aprilie faŃă de
C

luna mai, de 1,238 ori.


b) Indicii factoriali

b1) Indicii factoriali Laspeyres


2
∑ pi (1)qi (0 )
1/ 0 i =1 3550 ⋅ 2 + 1100 ⋅ 10 18100
IC / p (⋅ L ) = 2 =
C (0 )
=
15700
= 1,1528
∑ pi (0 )qi (0 )
i =1
2
∑ pi (0 )qi (1)
1/ 0 i =1 3400 ⋅ 3 + 890 ⋅ 8 17320
IC / q ( L ⋅) = 2 =
C (0 )
=
15700
= 1,1032
∑ pi (0 )qi (0 )
i =1

1,1528 ne arată de câte ori ar fi crescut cheltuielile C, dată s-ar fi modificat numai preŃurile, cantităŃile
rămânând constante la nivelul lunii aprilie.
1,1032 arată de câte ori ar fi crescut cheltuielile C dacă s-ar fi modificat numai cantităŃile cumpărate,
iar preŃurile ar fi rămas constante la nivelul lunii aprilie.

Verificăm cerinŃa de completitudine a testului Fisher, astfel:


1/ 0 1/ 0 1/ 0
IC / p (⋅ L )I C / q ( L ⋅) = 1,1528 ⋅ 1,1032 = 1,27177 ≠ I C

deci aceasta nu este îndeplinită.

b2) Indicii factoriali Paasche


∑ pi (1)qi (1)
1/ 0 C1 19450
I C / p (⋅ P ) = i = = = 1,12298
( ) ( )
∑ pi 0 qi 1 3400 ⋅ 3 + 890 ⋅ 8 17320
i
∑ pi (1)qi (1)
1/ 0 19450
I C / q ( P ⋅) = i = = 1,0746
∑ pi (1)qi (1) 18100
i
1,12298 ne arată de câte ori ar fi crescut cheltuielile C dacă s-ar fi modificat numai preŃurile,
cantităŃ ile rămânând constante la nivelul lunii mai.
1,0746 ne arată de câte ori ar fi crescut cheltuielile C dacă s-ar fi modificat numai cantităŃile
cump ărate, preŃurile rămânând constante la nivelul lunii mai.

CerinŃa de completitudine a testului Fischer, respectiv:


1/ 0 1/ 0 1/ 0
IC / p (⋅ P )I C / q (P ⋅) = 1,12298 ⋅ 1,0746 = 1,20675 ≠ I C
nu este verificată.

b3) Indicii factoriali Fisher


1/ 0 1/ 0 1/ 0
IC / p (F ) = I C / p (⋅ L )I C / p (P ⋅) = 1,1528 ⋅ 1,12298 = 1,1378
1/ 0 1/ 0 1/ 0
IC / q (F ) = I C / q (L ⋅)I C / q (P ⋅) = 1,1032 ⋅ 1,0746 = 1,0888 .
1/ 0 1/ 0 1/ 0
IC / p (F ) ⋅ I C / q ( F ) = 1,1378 ⋅ 1,0888 = 1,2388 = I C

Indicii Fisher verifică condiŃia de completitudine a testului Fisher.


Astfel,
1,1378 ne arată de câte ori cresc cheltuielile C pe seama modificării preŃurilor de cumpărare.
1,0888 ne arată de câte ori cresc cheltuielile C pe seama modificării cantităŃ ilor cump ărate.

c) facultativ

d) Exprimarea indicilor sintetici în funcŃie de indicii elementari


n
Considerând mărimea C = ∑ C i , unde Ci = piqi reprezintă cheltuiala cu produsul i, indicele variaŃiei
i =1
integrale este:
∑ C i (1)
1/ 0 C (1)
IC = = i
C (0 ) ∑ C i (0 )
i
1/ 0 C (1) 1/ 0
Notând prin I C = i rezultă că Ci (1) = I C ⋅ Ci (0 ) .
i C i (0 ) i

1/ 0 1/ 0
Înlocuind pe Ci(1) cu expresia I C ⋅ C i (0 ) , în I C , avem:
i
1/ 0
∑ Ci (1) ⋅ C i (1)
∑ IC
1/ 0 i
i i
IC = =
∑ Ci (0 ) ∑ Ci (0 )
i i
deci indicele exprimând variaŃia integrală a mărimii C se poate determina ca o medie aritmetică
ponderată a indicilor elementari (ICi).
Astfel:
1/ 0 C (1) 10650
IC = 1 = = 1,566
1 C1 (0) 6800
1/ 0 C (1) 8800
IC = 2 = = 0.9887
2 C 2 (0 ) 8900
1,566 ⋅ 6800 + 0,9887 ⋅ 8900
I C1 / 0 = = 1,2388
15700
La fel se pot exprima şi indicii factoriali în funcŃie de indicii elementari ai factorilor respectivi.
Ca atare, având indicele Laspeyres:

∑ pi (1) ⋅ qi (0 )
1/ 0
I C / p (⋅ L ) = i
∑ pi (0 ) ⋅ qi (0 )
i
şi indicele elementar al preŃului, respectiv:
pi (1)
I 1p/ 0 =
i pi (0 )
înlocuind p i(1) cu pi (1) = I 1p/ 0 ⋅ pi (0 ) , în expresia indicelui I C
1/ 0
/ p (⋅ L ) , rezultă:
i
1/ 0
∑Ip pi (0 ) ⋅ q i (0 )
1/ 0 i i
IC / p (⋅ L ) =
∑ pi (0 ) ⋅ qi (0 )
i
Deci, indicele factorial de tip Laspeyres se exprimă ca o medie aritmetică ponderată a indicilor
elementari.
Relativ la indicele factorial de tip Paasche,

∑ pi (1)qi (0 )
1/ 0 i
IC / p (⋅ L ) =
∑ pi (0 )qi (0 )
i
şi la indicii elementari ai preŃului, respectiv:
pi (1)
I 1p/ 0 =
i pi (0 )
1 1/ 0
înlocuind pe pi(0) cu expresia pi (1) ⋅ în expresia indicelui I C / p (⋅ P )
, rezultă:
1/ 0
Ip
i
∑ pi (1)qi (1)
1/ 0 i
IC / p (⋅ P ) = 1
∑ 1 / 0 pi (1)qi (1)
i I
p i
Deci, indicele factorial de tip Paasche se determină ca o medie armonică ponderată a indicilor
elementari.

Numeric rezultă:
3550 1100
I 1p/ 0 = = 1,044 I 1p/ 0 = = 1,236
1 3400 2 890
iar
1/ 0
∑Ip pi (0 ) ⋅ qi (0 )
1/ 0 i 1,400 ⋅ 6800 + 1,236 ⋅ 8900
IC ( ) i
/ p ⋅L = = = 1,1528
∑ pi (0 ) ⋅ qi (0 ) 15700
i
şi
∑ pi (1) ⋅ q i (1)
1/ 0 i 19450
IC / p (⋅ P ) = 1
=
1 1
= 1,112298
∑ 1 / 0 ⋅ p i (1) ⋅ qi (1) ⋅ 10650 + ⋅ 8800
i I 1,044 1,236
p i
Asemănător se pot exprima şi indicii factoriali ai cantităŃii în funcŃie de indicii elementari.

5.5. Principalii indici utilizaŃi în economie

În cadrul indicatorilor statistici, indicii ocup ă un loc important. Cu ajutorul indicilor se cuantifică
în mod sintetic mişcarea relativă a fenomenelor. Principalii indici sintetici (de grup) urmăriŃi şi
utilizaŃi pe scară largă de către agenŃii economici sunt:
1. indicii preŃurilor de consum;
2. indicele preŃurilor producŃiei industriale;
3. indicele salariilor;
4. indicii bursieri.
Aceştia sunt calculaŃ i şi publicaŃ i periodic de către institu Ńii specializate.

5.5.1. Indicii preŃurilor de consum

Indicele general al preŃurilor de consum mă soară evolu Ńia de ansamblu a preŃurilor mă rfurilor
achiziŃionate şi a tarifelor serviciilor utilizate de către populaŃia unei Ńari, într-o perioadă curentă faŃă
de o perioadă anterioară considerată bază de comparaŃie. În Ńara noastră, indicii preŃurilor de consum
se calculează lunar şi se publică în Buletinul Statistic de PreŃuri respectiv în Anuarul Statistic al
României.

Metodologia de calcul
Metodologia de calcul a indicelui preŃurilor de consum în Ńara noastră este în general armonizată
cu metodologia utilizată de Oficiul de Statistică a Uniunii Europene (EUROSTAT). Acest indice se
calculează ca şi un indice factorial de tip Laspeyres, relativ la mărimea Z reprezentând cheltuielile de
consum ale populaŃiei:
n
Z = ∑ p i qi
i =1

unde qi reprezintă cantităŃile cump ărate iar pi preŃurile respectiv tarifele la care au fost cump ărate
mărfurile şi serviciile.
Se ştie că indicele preŃurilor de tip Laspeyres se poate exprima ca şi o medie aritmetică ponderată
a indicilor individuali ai preŃurilor:
n n

∑ qi ( j ) pi (k ) ∑ q ( j ) p ( j ) ⋅ p (k ) / p ( j )
i i i i
I k/ j
Z/p (⋅ L ) = i =1
n
= i =1
n
=
∑ q ( j) p ( j)
i =1
i i ∑ q ( j) p ( j)
i =1
i i

n n
= ∑ k i ( j ) ⋅ p i (k ) / p i ( j ) = ∑ I pki/ j k i ( j )
i =1 i =1

qi ( j) pi ( j)
unde k i ( j ) = n
indică ponderea cheltuielilor cu produsul i în total cheltuieli, în perioada
∑ q ( j) p ( j)
i =1
i i

de bază, şi se numeşte coeficient bugetar al produsului i. Aceşti coeficienŃi redau structura de consum
a populaŃiei.
Indicele preŃurilor de consum se calculează în baza acestei forme de exprimare a indicelui
Laspeyres, ca şi medie aritmetică ponderată a indicilor individuali ai preŃurilor:
n
I Zk // pj (⋅ L ) = ∑ I pki/ j k i ( j ) .
i =1
În practica statistică din Ńara noastră se calculează şi se publică:
- indicele preŃurilor de consum cu bază fixă (luna octombrie 1990);
- indicele preŃurilor de consum cu bază în lanŃ;
- indicele preŃurilor de consum faŃă de luna decembrie a anului precedent;
- indicele preŃurilor de consum pe întregul an faŃă de media anului precedent (pentru
metodologia de calcul vezi Baron şi alŃii, 1996);
- indicele mediu lunar al preŃurilor de consum (Baron şi alŃii, 1996).

Culegerea datelor statistice


Calculul efectiv al indicelui presupune:
a) stabilirea eşantionului de mărfuri şi servicii reprezentative pentru consumul populaŃiei (coş
de mărfuri şi servicii);
b) calculul indicilor individuali ai preŃurilor I pki/ j ;
c) determinarea coeficienŃilor de ponderare k i ( j ) , cu care se introduce sortimentul i în
calculul indicelui general al preŃurilor.

a) Eşantionul de mărfuri şi servicii cuprinde circa 1430 de sortimente cu pondere semnificativă în


consum. Nomenclatorul utilizat este structurat pe trei nivele de agregare: grupe, posturi şi sortimente,
sortimentele fiind concretizate în diverse marfuri şi servicii.
Indicii individuali ai preŃurilor calculaŃi pentru fiecare sortiment se agregă la nivel de post de
cheltuieli, grupe respectiv la nivel de indice general, prin utilizarea ponderilor constante (în prezent
cele din 1997). Utilizarea ponderilor constante permite comparaŃii ale evoluŃiei preŃurilor în timp.

b) Indicii individuali ai preŃurilor I pki/ j , pentru fiecare sortiment, se determină î n baza datelor
culese într-un eşantion al punctelor de vânzare. Sondajul se realizează în mai multe faze, în prima fază
fiind stabilit un eşantion al localităŃilor (42) având în vedere criterii precum volumul vânzărilor de
mărfuri şi servicii, numărul populaŃiei ş.a.. Din aceste localităŃi sunt selectate centre de cercetare (68).
Punctele de vânzare supuse observării sunt magazine şi unităŃi prestatoare de sevicii din centrele de
cercetare, volumul eşantionului fiind de aproximativ 6000 puncte de vânzare.
PreŃurile unitare ale mărfurilor şi serviciilor din co şul consumatorului sunt observate săptămânal
în aceste puncte de vânzare. Media lunară a preŃului fiecărui produs sau serviciu notată p(k) se
compară cu preŃurile în perioada de bază p(j) obŃinându-se indicele individual al preŃului.

c) Determinarea coeficienŃilor de ponderare k i ( j ) se realizează în baza datelor ob Ńinute prin


Ancheta Integrată în Gospod ării. Aceasta este o cercetare statistică parŃială, fiind reprezentate în
eşantion familii de salariaŃi, patroni, Ńărani, şomeri, pensionari. Într-un caiet special pus la dispoziŃia
fiecărei familii din eşantion se completează zilnic toate intrările de bani şi toate ieşirile b ăneşti din
gospod ărie, precizându-se totodată sursele, respectiv destinaŃia acestora. Prin centralizarea lunară a
acestor bugete de familie se obŃin o serie de informaŃii, cum ar fi ponderarea cheltuielilor cu fiecare
bun sau serviciu în totalul cheltuielilor, consumurile medii din diferite produse etc. Practic, coeficienŃii
bugetari k i ( j ) utilizaŃi în calculul indicelui preŃurilor se actualizează doar la intervale de câŃiva ani,
atunci când se contată că mutaŃiile intervenite în structura cheltuielilor efectuate de populaŃie sunt
semnificative. O analiză a acestor mutaŃii în Ńara noastră relevă o tendinŃă de creştere, în ultimii ani, a
ponderii serviciilor în consum.

Utilizări ale indicelui preŃurilor


Indicele preŃurilor de consum (IPC) este utilizat în principal pentru:
a) Calculul ratei inflaŃiei (RI):
RI = ( IPC − 1) × 100% .
În pactica statistică, mărimea inflaŃiei se cuantifică de regulă pe baza indicelui preŃurilor de consum.
Astfel calculată, rata inflaŃiei indică ritmul de creştere al preŃurilor mărfurilor şi al tarifelor seviciilor
din consumul populaŃiei. O altă măsură a inflaŃiei propusă în literatură este deflatorul PIB.
Rata inflaŃiei este unul din cei mai cunoscu Ńi indicatori macroeconomici. Deciziile luate la nivel
macroeconomic respectiv microeconomic Ńin seama în general de evolu Ńia acestui indice. Este
deasemenea indicatorul cel mai prezent în mass media.
b) Determinarea indicatorilor reali
Exprimarea în preŃuri constante sau comparabile a unui indicator permite evidenŃierea evolu Ńiei
reale a acestuia, eliminându-se astfel influenŃa creşterii preŃurilor.
In general, pentru a ob Ńine evoluŃia reală a unei marimi economice se va imp ărŃi nivelul
(nominal) al acesteia la indicele preŃurilor cu bază fixă. Este indicat a se utiliza un indice al preŃurilor
adecvat indicatorului analizat, în măsura în care acesta este disponibil.
Indicele general al preŃurilor este utilizat pentru deflaŃionarea consumului privat, stă la baza
calculării veniturilor reale ale populaŃiei, a salariului respectiv a pensiei reale etc. Este utilizat de
asemenea ca punct de plecare în indexarea salariilor şi a pensiilor.

5.5.2. Indicele preŃurilor producŃiei industriale

Exprimă evoluŃia per ansamblu a preŃurilor/ tarifelor industriale fabricate şi livrate de către
producătorii interni, într-o perioadă curentă faŃa de o perioad ă bază de comparaŃie. Se are în vedere
doar primul stadiu de comercialiare a produselor/seviciilor.
Se calculează cu un indice factorial de tip Laspeyres, relativ la mărimea:
n
Z = ∑ pi qi = volumul valoric al productiei
i =1
unde pi – reprezintă preŃul de vânzare (preŃul tranzacŃiei) al produsului i;
qi – cantitatea vândută din produsul i.
Astfel, indicele preŃurilor producŃiei industriale, calculat pentru piaŃa internă, este:
I Zk // pj ( L ) = ∑ I pki/ j ⋅ k i ( j )
i

qi ( j ) pi ( j )
unde k i ( j ) = n
reprezintă ponderea valorii producŃiei industriale tranzacŃionată din
∑ q ( j) p ( j)
i =1
i i

produsul i în total producŃie industrială tranzacŃionată, în perioada de bază j.


PreŃurile considerate în calculul indicelui preŃurilor producŃiei industriale nu conŃin TVA, dar
includ unele impozite şi taxe specifice podusului. Indicii individuali ai preŃurilor se agregă succesiv
având în vedere Clasificarea ActivităŃilor Economiei NaŃionale (CAEN). In prezent se utilizează
ponderile din anul 1996.

5.5.3. Indicele salariilor

Exprimă evolu Ńia salariilor în perioada curentă faŃă de perioada de bază. Împreună cu indicele
preŃurilor de consum este folosit pentru analiza nivelului de trai.
Se calculează ca un indice factorial Laspeyres, relativ la mărimea
n
Z = ∑ ni si = fond total de salarii
i =1
unde:
si – salariul mediu al personalului din activitatea i;
ni – numărul de persoane din activitatea i.
n n

∑ n ( j )s ( j ) ∑ n ( j ) s ( j ) ⋅ s (k ) / s ( j )
i i i i i i
I Zk // sj (L ⋅) = i =1
n
= i =1
n
=
∑ n ( j )s ( j )
i =1
i i ∑ n ( j)s ( j )
i =1
i i

n n
= ∑ vi ( j ) ⋅ s i (k ) / si ( j ) = ∑ I ski / j ⋅ vi ( j )
i =1 i =1
unde vi – ponderea fondului de salarii a personalului din activitatea i în total fond de salarii.

5.5.4. Indicii bursieri

Indicele bursier reflectă evoluŃia generală a cursurilor unui ansamblu de titluri. PiaŃa bursieră
reprezintă barometrul cel mai sensibil al unei economii. Măsurarea evoluŃiei acesteia se realizează prin
intermediul indicilor bursieri. Principalii indici bursieri se diferenŃiază după: eşantionul titlurilor
considerate în coşul indicelui, reprezentativitate, mod de calcul respectiv natura variabilelor luate în
calcul (Todea, 2002). Eşantionul titlurilor ce intră în coşul indicelui va putea suferi modificări, pentru
a rămâne reprezentativ în timp. In ceea ce priveşte modul de calcul, s-au propus diferite metode,
fiecare având avantaje respectiv dezavantaje. Prezentăm în continuare principalele metode de calcul
utilizate în calculul celor mai cunoscu Ńi indici bursieri.

a) Indicele factorial de tip Laspeyres


In acest caz, indicele bursier se calculează ca şi un indice factorial relativ la mărimea CB, numită
capitalizare bursieră:
m
CB = ∑ ci ⋅ ni
i =1
unde:
ci – reprezintă cursul (preŃul) titlului i;
ni – numărul de titluri de tipul i tranzacŃionate (volumul) ;
m – numărul de titluri considerate în calculul indicelui (în co şul indicelui).
Indicele bursier de tip Laspeyres este un indice factorial al preŃului, cu bază fixă:
m

∑ n (0 )c (t )
i i
I t/0
CB / c (L ) = i =1
m
.
∑ n (0 )c (0 )
i =1
i i

Periodic, baza indicelui este ajustată, pentru a se înlătura unele neajunsuri legate de menŃinerea
constantă a ponderilor.
Principalii indici bursieri din lumea fianciară sunt calculaŃi în acest mod. Amintim aici următorii
indici:
- S&P 500, calculat pentru 500 de acŃiuni, cele mai reprezentative de pe piaŃa americană. A
fost lansat în 1943, baza sa fiind de 10 puncte;
- Topix ia in calcul titlurile (1250) din prima categorie cotate pe piaŃa japoneză. Baza sa este
de 100 puncte, iar data lansării 04.01 1968;
- Nikkei 300 cuprinde 300 de titluri din prima categorie a pieŃei din Tokyo. A fost lansat în
1993;
- CAC 40 este principalul indice francez. A fost lansat în anul 1997, baza sa fiind de 1000
puncte;
- FTSE 100 este principalul indice britanic, fiind lansat în 1983, cu baza 1000 de puncte.
Indicele cuprinde 100 de titluri din domenii diferite (69 industriale, 21 financiare, 5
petroliere, 2 de investiŃii, 2 miniere, 1 firmă de comerŃ internaŃional).

In Ńara noastră , indicele oficial al pieŃei bursiere este indicele BET (Bucharest Exchange
Trading), calculat pentru un eşantion de 10 societăŃi, cele mai reprezentative. A fost lansat la
19.09.1997, baza sa fiind de 1000 puncte. Se calculează deasemenea ca şi un indice factorial
Laspeyres, cu bază fixă. Indicele BET constituie suport al tranzacŃiilor la termen, la Bursa Monetar
Financiară şi de Mărfuri Sibiu. Se mai calculează şi se publică indicele BET Composite, care ia în
calcul toate acŃiunile cotate la Bursa de Valori Bucureşti.

b) Indicele de tipul mediei aritmetice


Indicele bursier se calculează în acest caz după formula :
m
c (t )
I t / 0 = B0 ⋅ ∑ i
i =1 c i (0)

unde :
- B0 reprezintă valoarea indicelui la momentul lansării;
- ci cursul (preŃul) titlului i;
- m este numărul de titluri considerate în calculul indicelui (în co şul indicelui).
Intervin aici indicii elementari, cu bază fixă, ai cursurilor celor n titluri. Acest mod de calcul nu Ńine
seama de capitalizarea bursieră, respectiv de importanŃa diferitelor titluri pe piaŃă.
Cel mai important indice calculat după această relaŃie este indicele Dow-Jones Industrial Average
(DJIA). Prima modalitate de calcul a unui indice bursier este de acest tip şi datează din 1884, autorii ei
fiind Charles Dow şi Eduard Jones. În practică, indicele Dow-Jones se calculează astfel: unul pentru
industrie (Dow-Jones Industiral) pe baza indicilor individuali a 30 titluri emise de cele mai importante
societăŃi industriale din SUA, al doilea este un indice Dow-Jones pentru transporturi, cuprinzând 20
titluri a celor mai importante firme din domeniu, al treilea indice Dow-Jones se calculează pentru
servicii publice şi cuprinde titluri emise de 15 societăŃi. Cei trei indici sunt reuniŃi într-un indice global
Dow-Jones, caracterizând una din pieŃele bursiere ale SUA – NYSE (New-York Stock Exchange).
O variantă a indicelui Dow-Jones o constituie indicele bursier japonez Nikkey Dow Jones,
instituit în 1950 şi calculat pe baza cursurilor a 225 acŃiuni cotate la bursa oficială (Tokio Stock
Exchange).

c) Indicele geometric
Indicele bursier se calculează în acest caz ca şi o medie geometrică a indicilor individuali ai
cursurilor titlurilor din co şul indicelui:
I ct / 0 = m I ct1/ 0 I c−2t / 0 L I c−mt / 0 .
Cel mai cunoscut indice calculat după această relaŃie este indicele bursier FT-30 (Financial Times
Industrial Ordinary).
Indicele de tip medie aritmetică respectiv indicele geometric nu au o fundamentare economică şi
nici statistică, pentru că în primul rând nici o expresie nu are în vedere structura titlurilor. Indicele
unui grup mai restrâns sau mai larg de titluri trebuie să exprime efectul schimbării cursurilor asupra
capitalizării bursiere, deci este indicat să fie un indice factorial.

Exemplul 3. Ob Ńinerea prin agregare a indicelui preŃurilor de consum.


Având la dispoziŃie datele privind coeficienŃ ii bugetari şi indicii preŃurilor pentru diverse grupe de
mărfuri servicii ce fac parte din eşantionul pe baza căruia se calculează indicele preŃurilor în România,
se cere:
a) calcularea indicelui preŃurilor mărfurilor alimentare, în luna noiembrie faŃă de luna
octombrie;
b) calcularea indicelui general al preŃurilor, la nivelul tuturor grupelor de mărfuri şi servicii.

Nr. Denumirea CoeficienŃ i de Indicele


crt. mărfurilor/serviciilor ponderare preŃurilor
(noiembrie faŃă
de octombrie)
I. Mărfuri alimentare, din care: 4692
1. - produse de morărit şi panificaŃie 883 108,0
2. - legume şi conserve din legume 474 108,0
3. - fructe şi conserve din fructe 255 111,1
4. - ulei, slănină, grăsimi 261 102,7
5. - carne, preparate din carne şi 1319 100,5
conserve din carne
6. - peşte şi conserve din peşte 62 101,5
7. - lapte şi produse lactate 470 105,8
8. - ou ă 161 115,6
9. - zahăr, produse zaharoase şi 276 107,8
miere de albine
10. - cacao şi cafea 163 102,4
11. - băuturi alcoolice 255 101,5
12. - alte produse alimentare 113 102,8
II. Mărfuri nealimentare 4054 104,2
III. Servicii 1254 104,9

Rezolvare
a) Considerăm mărimea C = ∑ pi ⋅ qi unde:
i
pi – reprezintă preŃul de cump ărare al produsului i;
qi – reprezintă cantitatea cump ărată din produsul i.
Indicele preŃurilor de consum, calculat în practica statistică de la noi din Ńară, este un indice de tip
Laspeyres:
I Ck // pj (L ) = ∑ I kpi/ j ⋅ k i ( j )
i
Indicele preŃurilor la produsele alimentare va fi egal cu:

101,6 ⋅ 883 + 108 ⋅ 474 + 111,1 ⋅ 255 + 102,7 ⋅ 261+ 100,5 ⋅1319 + 101,5 ⋅ 62
I Ck // pj A (L) = +
4692

105,8 ⋅ 470 + 115,6 ⋅161+ 107,8 ⋅ 276 + 102,4 ⋅163 + 101,5 ⋅ 255 + 102,8 ⋅113
+ = 103,8
4692
PreŃurile produselor alimentare au crescut per ansamblu, în luna noiembrie faŃă de octombrie, de 1.038
ori sau în proporŃie de 103.8%.

b) Indicele preŃurilor la nivelul tuturor grupelor de produse şi servicii este:

I Ck // pj , A (L ) ⋅ 4692 + I Ck // pj , NA (L ) ⋅ 4054 + I Ck // pj , S (L ) ⋅ 1254


I k/ j
C/ p (L ) = =
10000

103,8 ⋅ 4692 + 104,2 ⋅ 4054 + 104,9 ⋅ 1254


= = 104,1
10000
PreŃurile mărfurilor şi tarifele serviciilor din consumul populaŃiei au crescut per ansamblu, în luna
noiembrie faŃă de octombrie, de 1,041 ori sau în proporŃie de 104,1%.

Exemplul 4. DeflaŃionarea
Vânzările trimestriale ale unei societăŃi având ca obiect de activitate desfacerea laptelui de
consum, sunt următoarele:

 trim.I trim.II trim.III trim.IV 


Y :   mld.lei
 1000 1280 1560 1880 

Creşterile de preŃ de la un trimestru la altul au fost de 4 % în trim.II, 3 % în trim.III şi 6 % în trim.IV.


Se cere să se determine evolu Ńia reală (neafectată de inflaŃ ie) a vânzărilor din acest produs.

Rezolvare

Creşterile de preŃ se reprezintă sub formă de indici astfel:

I II
p
/I
= 1,04 I III
p
/ II
= 1,03 I IV
p
/ III
= 1,06

Pentru a corecta vânzările, avem nevoie de indicele preŃului calculat cu bază fixă, respectiv faŃă de
trim.I. Pentru calcularea indicilor cu bază fixă ne folosim de proprietatea de circularitate a indicilor,
respectiv:

I III
p
/I
= I II
p
/I
⋅ I pIII / II
I IV
p
/I
= I pII / I ⋅ I III
p
/ II
⋅ I IV
p
/ III

Astfel,
I pIII / I = 1,04 ⋅1,03 = 1,0712
I pIV / I = 1,04 ⋅1,03 ⋅1,06 = 1,1355

În acest caz evoluŃia vânzărilor reale trimestriale ale societăŃii (exprimate în preŃuri constante, ale
trimestrului I), obŃinute din cele iniŃiale prin împărŃire la indicele preŃului cu bază fixă, sunt:
 trim.I trim.II trim.III trim.IV 
Y :   .
 1000 1230,8 1456,3 1655,6 

Exemplul 5. Calculul indicelui bursier, de tip Laspeyres


Presupunem că în coşul indicelui bursier intră doar trei tipuri de acŃiuni. Relativ la acestea cunoaştem,
pentru două cotaŃii, următoarele date:

Tip acŃiune Perioada de bază Perioada curentă


19.09.1997 20.09.2004
n0 c0 nt ct
Antibotice Iaşi 65533 7400 482170 3800
Azo Mureş 25609 2850 40676 3370
Oltchim 450982 4300 418344 1840

Perioadă bază de comparaŃie este considerată aici data la care a fost lansat indicele BET. Prin n s-a
notat numărul de acŃiuni tranzacŃionate (volumul) iar c reprezintă cursul acŃiunii.
Se cere:
a) calculaŃi şi interpretaŃi indicii individuali de modificare a cursului;
b) calculaŃi şi interpretaŃi indicele bursier, de tip Laspeyres;
c) dacă indicele bursier la cotaŃia precedentă a fost de 560 puncte, determinaŃi şi interpretaŃi rata
rentabilităŃii pieŃei (faŃa de cotaŃia precedentă).

Rezolvare
a) Indicii individuali ai cursului acŃiunilor sunt:
c (t ) 3800
I ct1/ 0 = 1 = = 0.513
c1 (0) 7400
c (t ) 3370
I ct2/ 0 = 2 = = 1.182
c 2 (0 ) 2850
c (t ) 1840
I ct3/ 0 = 3 = = 0.428
c3 (0 ) 4300
Cursul acŃiunii Antibiotice Iaşi a scăzut, la 20.09.2004 faŃă de 19.09.1997, la 51.3%.

b) Indicele bursier se calculează ca şi un indice factorial relativ la mărimea CB, numită


capitalizare bursieră:
3
CB = ∑ ci ⋅ ni
i =1
unde:
ci – reprezintă cursul (preŃul) acŃiunii i;
ni – numărul de acŃiuni de tipul i tranzacŃionate (volumul).
Indicele bursier de tip Laspeyres înregistrează valoarea:
3

∑ n (0)c (t )
i i
65533 ⋅ 3800 + 25609 ⋅ 3370 + 450982 ⋅ 1840
I t/0
CB / c (L ) = i =1
3
= = 0.467
65533 ⋅ 7400 + 25609 ⋅ 2850 + 450982 ⋅ 4300
∑ n (0)c (0)
i =1
i i

Prin urmare, indicele bursier a scăzut de la 1000 de puncte la 467 de puncte.

c) Rata rentabilităŃii pieŃei bursiere (faŃă de cotaŃia precedentă) se determină din relaŃia
următoare:
I t / 0/ c ( L )
R t / t −1 = CB −1.
/ c (L )
t −1 / 0
I CB
Astfel,
0.467
R t / t −1 = − 1 = −0.166
0.560
ceea ce indică o scădere a rentabilitătii pieŃei cu 1.66%.

Exemplul 6. Cazul în care factorii se compun după un model matematic de tip sumă de produse
O firmă a achiziŃ ionat de la un furnizor, în decursul a doi ani, trei produse. Modul în care s-a
modificat preŃul acestora, precum şi cantităŃile achiziŃionate din cele trei produse în perioadele
considerate este ilustrat în tabelul următor:
2003 2004
p q p q
1 23 5 28 7
2 29 6 34 4
3 12 15 9 18
Să se studieze evoluŃia valorii acestor produse în funcŃie de indicele variaŃiei integrale şi indicii
variaŃ iilor factoriale.

Rezolvare
Suntem în cazul: V = ∑ pi qi
i

1. Indicele variaŃiei integrale


3

04 / 03
∑ p (04) ⋅ q (04)
i =1
i i
28 ⋅ 7 + 34 ⋅ 4 + 9 ⋅ 18 494
I V = 3
= = = 1,053
23 ⋅ 5 + 29 ⋅ 6 + 12 ⋅ 15 469
∑ p (03) ⋅ q (03)
i =1
i i

⇒ valoarea produselor achiziŃionate a crescut în 2004 faŃă de 2003 de 1,053 ori

2. Indicii variaŃiilor factoriale


a) Indicii Laspeyres
3

∑ p (04) ⋅ q (03)
i i
28 ⋅ 5 + 34 ⋅ 6 + 9 ⋅ 15 479
I V04/ /p03 (L ) = i =1
3
= = = 1,021
23 ⋅ 5 + 29 ⋅ 6 + 12 ⋅ 15 469
∑ p (03) ⋅ q (03)
i =1
i i

⇒ valoarea produselor achiziŃ ionate a crescut în 2004 faŃă de 2003 de 1,021 ori datorită variaŃiei
preŃului
3

∑ p (03) ⋅ q (04)
i i
23 ⋅ 7 + 29 ⋅ 4 + 12 ⋅ 18 493
I 04 / 03
V /q (L ) = i =1
3
= = = 1,051
23 ⋅ 5 + 29 ⋅ 6 + 12 ⋅ 15 469
∑ p (03) ⋅ q (03)
i =1
i i

⇒ valoarea produselor achiziŃ ionate a crescut în 2004 faŃă de 2003 de 1,051 ori datorită variaŃiei
cantităŃ ii

b) Indicii Paasche
3

∑ p (04) ⋅ q (04)
i i
28 ⋅ 7 + 34 ⋅ 4 + 9 ⋅ 18 494
I 04 / 03
V/p (P ) = i =1
3
= = = 1,002
23 ⋅ 7 + 29 ⋅ 4 + 12 ⋅ 18 493
∑ p (03) ⋅ q (04)
i =1
i i

⇒ valoarea produselor achiziŃ ionate a crescut în 2004 faŃă de 2003 de 1,002 ori datorită variaŃiei
preŃului
3

∑ p (04) ⋅ q (04)
i i
28 ⋅ 7 + 34 ⋅ 4 + 9 ⋅ 18 494
I V04/ /q03 (P ) = i =1
3
= = = 1,031
28 ⋅ 5 + 34 ⋅ 6 + 9 ⋅ 15 479
∑ p (04) ⋅ q (03)
i =1
i i

⇒ valoarea produselor achiziŃ ionate a crescut în 2004 faŃă de 2003 de 1,031 ori datorită variaŃiei
cantităŃ ii

c) Indicii Fisher
I V04/ /p03 (F ) = I V04/ /p03 (L ) ⋅ I V04/ /p03 (P ) = 1,021⋅ 1,002 = 1,011
⇒ valoarea produselor achiziŃ ionate a crescut în 2004 faŃă de 2003 de 1,011 ori datorită variaŃiei
preŃului
I V04/ /q03 (F ) = I V04/ /q03 (L ) ⋅ I V04/ /q03 (P ) = 1,051⋅ 1,031 = 1,041
⇒ valoarea produselor achiziŃ ionate a crescut în 2004 faŃă de 2003 de 1,041 ori datorită variaŃiei
cantităŃ ii

Exemplul 7. Cazul în care factorii se compun după un model matematic de tip produs
Se consideră o firmă pentru care se cunosc următoarele date aferente perioadei 2005-2006:
2005 2006
W 0,62 0,78
L 210 272

unde:
W – productivitatea/angajat;
L – numărul de angajaŃi.
Să se studieze pe baza indicelui variaŃiei integrale şi a indicilor variaŃiei factoriale evolu Ńia producŃiei
firmei în perioada 2005-2006.

Rezolvare
Suntem în cazul: Q =W ⋅L

1. Indicele variaŃiei integrale


W (06) ⋅ L(06) 0,78 ⋅ 272 212,16
I Q06 / 05 = = = = 1,629
W (05) ⋅ L(05) 0,62 ⋅ 210 130,2
⇒ producŃia firmei a crescut în 2006 faŃă de 2005 de 1,629 ori

2. Indicii variaŃiilor factoriale


a) Indicii Laspeyres
W (06) ⋅ L(05) 0,78 ⋅ 210 163,8
I Q06/ W/ 05 (L ) = = = = 1,258
W (05) ⋅ L(05) 0,62 ⋅ 210 130,2
⇒ producŃia firmei a crescut în 2006 faŃă de 2005 de 1,258 ori datorită influenŃei
productivităŃii/angajat
W (05) ⋅ L(06) 0,62 ⋅ 272 168,64
I Q06/ /L05 (L ) = = = = 1,295
W (05) ⋅ L(05) 0,62 ⋅ 210 130,2
⇒ producŃia firmei a crescut în 2006 faŃă de 2005 de 1,295 ori datorită variaŃiei numărului de
angajaŃi

b) Indicii Paasche
W (06) ⋅ L(06) 0,78 ⋅ 272 212,16
I Q06/ W/ 05 (P ) = = = = 1,258
W (05) ⋅ L(06) 0,62 ⋅ 272 168,64
⇒ producŃia firmei a crescut în 2006 faŃă de 2005 de 1,258 ori datorită variaŃiei
productivităŃii/angajat
W (06 ) ⋅ L(06 ) 0,78 ⋅ 272 212,16
I Q06/ /L05 (P ) = = = = 1,295
W (06) ⋅ L(05) 0,78 ⋅ 210 163,8
⇒ producŃia firmei a crescut în 2006 faŃă de 2005 de 1,295 ori datorită variaŃiei numărului de
angajaŃi

c) Indicii Fisher
I Q06/ W/ 05 (F ) = I Q06/ W/ 05 (L ) ⋅ I Q06/ W/ 05 ( P ) = 1,258 ⋅ 1,258 = 1,258
⇒ producŃia firmei a crescut în 2006 faŃă de 2005 de 1,258 ori datorită variaŃiei
productivităŃii/angajat
I Q06/ /L05 (F ) = I Q06/ /L05 (L ) ⋅ I Q06/ /L05 ( P ) = 1,295 ⋅ 1,295 = 1,295
⇒ producŃia firmei a crescut în 2006 faŃă de 2005 de 1,295 ori datorită variaŃiei numărului de
angajaŃi

Exemplul 8. Cazul în care factorii se compun după un model matematic de tip sumă
O firmă producătoare de obiecte sanitare deŃine trei magazine de desfacere pentru care se
cunoaşte cifra de afaceri (în mii euro) în perioada 2004-2005:
2004 2005
CA1 28 35
CA2 26 20
CA3 51 70

Să se studieze evoluŃia cifrei de afaceri pe baza indicilor variaŃiei integrale şi factoriale.

Rezolvare
Suntem în cazul: CA = CA1 + CA2 + CA3

1. Indicele variaŃiei integrale


05 / 04 CA 05 + CA205 + CA305 35 + 20 + 70 125
I CA = 104 = = = 1,190
CA1 + CA204 + CA304 28 + 26 + 51 105
⇒ cifra de afaceri a crescut în 2005 faŃă de 2004 de 1,190 ori
2. Indicii variaŃiilor factoriale
a) Indicii Laspeyres
CA105 + CA204 + CA304 35 + 26 + 51 112
/ CA1 (L ) =
05 / 04
I CA = = = 1,067
CA104 + CA204 + CA304 28 + 26 + 51 105
⇒ cifra de afaceri a crescut în 2005 faŃă de 2004 de 1,067 ori datorită variaŃiei cifrei de afaceri a
magazinului 1
CA104 + CA205 + CA304 28 + 20 + 51 99
05 / 04
I CA / CA2 ( L ) = = = = 0,943
CA104 + CA204 + CA304 28 + 26 + 51 105
⇒ cifra de afaceri s-a modificat în 2005 faŃă de 2004 de 0,943 ori datorită variaŃ iei cifrei de
afaceri a magazinului 2
CA104 + CA204 + CA305 28 + 26 + 70 124
05 / 04
I CA / CA3 ( L ) = = = = 1,181
CA104 + CA204 + CA304 28 + 26 + 51 105
⇒ cifra de afaceri a crescut în 2005 faŃă de 2004 de 1,181 ori datorită variaŃiei cifrei de afaceri a
magazinului 3

b) Indicii Paasche
CA105 + CA205 + CA305 35 + 20 + 70 125
/ CA1 ( P ) =
05 / 04
I CA = = = 1,059
CA104 + CA205 + CA305 28 + 20 + 70 118
⇒ cifra de afaceri a crescut în 2005 faŃă de 2004 de 1,059 ori datorită variaŃiei cifrei de afaceri a
magazinului 1
CA105 + CA205 + CA305 35 + 20 + 70 125
05 / 04
I CA / CA2 ( P ) = = = = 0,954
CA105 + CA204 + CA305 35 + 26 + 70 131
⇒ cifra de afaceri s-a modificat în 2005 faŃă de 2004 de 0,954 ori datorită variaŃ iei cifrei de
afaceri a magazinului 2
CA105 + CA205 + CA305 35 + 20 + 70 125
05 / 04
I CA / CA3 ( P ) = = = = 1,179
CA105 + CA205 + CA304 35 + 20 + 51 106
⇒ cifra de afaceri a crescut în 2005 faŃă de 2004 de 1,179 ori datorită variaŃiei cifrei de afaceri a
magazinului 3

c) Indicii Fisher
/ CA1 (F ) = / CA1 (L ) ⋅ I CA / CA1 ( P ) = 1,067 ⋅ 1,059 = 1,063
05 / 04 05 / 04 05 / 04
I CA I CA
⇒ cifra de afaceri a crescut în 2005 faŃă de 2004 de 1,063 ori datorită variaŃiei cifrei de afaceri a
magazinului 1
/ CA2 (F ) = / CA2 (L ) ⋅ I CA / CA2 (P ) =
05 / 04 05 / 04 05 / 04
I CA I CA 0,943 ⋅ 0,954 = 0,948
⇒ cifra de afaceri s-a modificat în 2005 faŃă de 2004 de 0,948 ori datorită variaŃ iei cifrei de
afaceri a magazinului 2
/ CA3 (F ) = / CA3 (L ) ⋅ I CA / CA3 (P ) = 1,181 ⋅ 1,179 = 1,180
05 / 04 05 / 04 05 / 04
I CA I CA
⇒ cifra de afaceri a crescut în 2005 faŃă de 2004 de 1,180 ori datorită variaŃiei cifrei de
afaceri a magazinului 3
Capitolul 6

ANALIZA ŞI PREVIZIUNEA SERIILOR CROLOLOGICE

6.1. Baza de date statistice


În derularea activităŃii lor, frecvent agenŃii economici sunt puşi în situaŃia de a anticipa viitorul, iar
apoi de a lua decizii în consecinŃă. Oamenii de afaceri sunt nevoiŃi să previzioneze anual cifra de
afaceri şi alte elemente necesare întocmirii unui plan de afaceri, investitorii sunt interesaŃi de profitul
viitor degajat de investiŃie, respectiv guvernele de previziunea consumului sau a cheltuielilor
guvernamentale etc.. Ob Ńinerea rapidă de previziuni utilizând modele cantitative de previziune este la
îndemâna analiştilor, urmare şi a softurile de statistică accesibile şi uşor de exploatat.
Anticiparea, previziunea evoluŃiei viitoare a fenomenelor economice presupune în primul rând
cunoaşterea istoriei acestora, punerea în evidenŃă a unor legităŃ i privind comportamentul lor trecut.
Baza de date pe care se fundamentează analiza evolu Ńiei fenomenelor în timp este constituită din serii
cronologice.
O serie cronologică este o secvenŃă de observaŃii asupra unei variabile, ordonate după
parametrul timp. Frecvent, măsurătorile asupra variabilei sunt efectuate la intervale egale de timp,
seria cronologică fiind prezentată sub forma:
 1 2 ... t ... n 
Y :  
 y1 y 2 ... yt ... y n 
Din punct de vedere statistic, în contextul modelării şi previziunii, seria cronologică cu datele
observate y1 , y 2 ,...., y n constituie o realizare a secvenŃei de variabile aleatoare Y1 , Y2 ,...., Yn , adică a
unui proces stochastic de tip discret (Tertişco ş.a., 1985).
În analiza seriilor cronologice este necesar ca lungimea perioadei observate să fie suficient de
lungă pentru a face posibilă estimarea unui model adecvat calitativ, care să surprind ă mecanismul real
de generare al fenomenului, respectiv să permită identificarea unor componente ale evolu Ńiei pe
termen lung. De regulă se impune utilizarea unor serii cronologice cu cel pu Ńin 15 termeni, respectiv
pentru serii sezoniere este de dorit ca perioada observată să acopere cel puŃin cinci cicluri sezoniere.
În acelaşi timp datele trebuie să rămână comparabile în timp. CondiŃiile în care evoluează
fenomenul este necesar să rămână în esenŃă aceleaşi. Astfel, nu este indicat a se utiliza în elaborarea de
modele, serii cronologice ce acoperă perioade de schimbări economice sau politice majore, război, sau
alte evenimente excepŃionale; în analiza evolu Ńiei majorităŃii indicatorilor economici pentru Ńara
noastră este indicat ca datele să înceap ă după 1989. Înainte de aplicarea tehnicilor specifice de analiză
şi previziune, dacă este necesar, unii indicatori vor fi exprimaŃi în preŃuri comparabile. Când se
analizează spre exemplu evolu Ńia cifrei de afaceri sau a indicatorilor macroeconomici de rezultate şi ne
interesează evoluŃia datelor neafectate de schimb ările de preŃ, este indicat a se exprima datele în
preŃurile anului bază de comparaŃie, prin împărŃirea acestora la un indice adecvat al preŃurilor. De
asemenea, creşterea în timp a unor variabile din economie se datorează în principal creşterii populaŃiei,
astfel că în aceste situaŃii este mai util a se analiza evoluŃia variabilei per cap de locuitor.
Atunci când cronograma indică prezenŃa unor valori aberante, corespunzătoare unor greve,
calamităŃi naturale sau altor evenimente punctuale, acestea vor fi înlocuite cu valorile medii ce ar fi
fost înregistrate în circumstanŃe normale. De asemenea, dacă graficul indică puncte de schimbare
bruscă a sensului evoluŃiei, de tipul o tendinŃă crescătoare ce se schimb ă brusc într-una descrescătoare,
se vor elabora modele diferite pentru cele doua p ărŃi ale seriei.
FrecvenŃa măsurătorilor este condiŃionată şi de practică. Spre exemplu, vânzările unui magazin
pot fi înregistrate zilnic, profitul poate fi observat lunar şi / sau anual respectiv indicele bursier la
încheierea zilei de cotaŃie. În general, acolo unde sunt disponibile, poate fi utilă utilizarea unor date cât
mai frecvente. Datele anuale nu fac posibilă observarea caracterului sezonier specific anumitor
indicatori respectiv modelarea unor dependenŃe în care timpul de reacŃie al variabilei efect este scurt.
Scopul final al tehnicilor de analiză a seriilor cronologice este previziunea. InformaŃiile ob Ńinute
respectiv modelele elaborate sunt valabile, strict vorbind, doar pentru perioada observată. Atunci când
se fac previziuni pornim de la presupunerea că fenomenul va continua să aibă acelaşi comportament
ca şi în trecut. Este important ca analistul să se întrebe în ce măsură această presupunere este realistă,
respectiv să Ńină seama de aşteptă rile sale. Se spune pe bună dreptate că „previziunea rămâne în
acelaşi timp ştiinŃă şi artă”. Previziunea fenomenelor economice este o sarcină relativ dificilă, urmare
a complexităŃii mediului economic. Abord ările tradiŃionale sunt uneori subiective şi prea
simplificatoare, în timp ce metodele moderne sunt mai riguros fundamentate teoretic dar sunt şi mai
complexe, necesitând experienŃă şi o intervenŃie activă a analistului.

6.2. Indicatori medii specifici seriilor cronologice

Considerăm o serie cronologică ce red ă evolu Ńia în timp a unui indicator de nivel Y. Pentru ob Ńinerea
unor informaŃii privind modul de desfăşurare a fenomenului în medie pe perioada analizată, se face
apel la indicatori medii. Fac parte din această categorie: nivelul mediu sau valoare medie a
indicatorului, indicele mediu, ritmul mediu respectiv diferenŃa medie absolută.

6.2.1. Nivelul mediu (valoarea medie) - FACULTATIV

6.2.2. Indicele mediu. Ritmul mediu


Pentru calculul acestui indicator se întâlnesc în literatură mai multe abordări.

a) Indicele mediu este parametrul modelului autoregresiv: (FACULTATIV)


yt = I y ⋅ yt −1 + ε t , t = 2, 3,..., n

b) Presupunem că indicii cu bază în lanŃ sunt aproximativ egali: I y2 / 1 = I y3 / 2 = ... = I yn / n−1 = I y ,


valoarea comună fiind indicele mediu. În această ipoteză, şi având în vedere că I yk / k −1 = y k / y k −1 se
obŃin următoarele relaŃii:
y 2 = y1 ⋅ I y
y3 = y 2 ⋅ I y = y1 ⋅ ( I y ) 2
………………………
y n = y n −1 ⋅ I y = y1 ⋅ ( I y ) n−1
Din ultima relaŃie rezultă:
yn
I y = n−1
y1
expresie de calcul adecvată pentru indicatori ce evoluează aproximativ exponenŃial.

c) Se defineşte I y în raport cu tendinŃa (Florea, 1974): (FACULTATIV)


yt = I y ⋅ Tt −1 + ε t .

Exemplu 2. Determinarea indicelui mediu respectiv a ritmului mediu


Se cunoaşte populaŃia judeŃului Cluj la ultimele două recensăminte:
Recens. 5 ian 1977 7 ian 1992
Nr. pop. (mii loc.) 715.7 736.3

În ipoteza unei evolu Ńii aproximativ exponenŃiale a populaŃiei pe perioada 1977-1992, indicele mediu
anual se determină astfel:
736.3
I y = 15 = 1,002
715.7
În perioada 1977-1992, populaŃia acestui judeŃ a crescut în medie anual de 1,002 ori sau cu 0,2 %.

Dacă acest ritm de creştere s-ar fi menŃinut şi dup ă 1992, în anul 1995 numărul populaŃiei ar fi fost de:
736.3 × ( I y ) 3 = 740.7 mii loc.
PopulaŃia judeŃului Cluj în anul 1995 a fost de 727.6 mii loc.

6.2.3. DiferenŃa absolută medie


DiferenŃa medie satisface relaŃia autoregresivă :
y t = ∆ y + yt −1 + ε t , t = 2, 3,...., n
n
Metoda celor mai mici pătrate, respectiv condiŃia: ∑ε
t =1
t
2
→ min, conduce la următoarea expresie de

calcul a diferenŃei medii absolute:


n n

∑ (y
t =2
t − yt −1 ) ∑∆ t=2
t / t −1
y
∆y = =
n −1 n −1
sau echivalent:
y n − y1
∆y = .
n −1
Acest mod de calcul conduce la rezultate satisfăcătoare în condiŃiile în care indicatorul evoluează,
pe perioada considerată, aproximativ liniar.

Exemplul 3. DiferenŃa medie absolută


Fondul de locuinŃe din Ńara noastră a înregistrat o creştere lentă dup ă 1990:

An 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Fond de 7659 7683 7710 7749 7782 7811 7837 7860 7883 7907
loc. (mii)

DiferenŃa medie absolută, evaluată din expresia de calcul:


y − y1 7907 − 7659
∆y = n = = 27,5 mii
n −1 9
indică o creştere medie de la un an la altul cu 27,5 mii.

6.3. Componentele unei serii cronologice

În abordarea tradiŃională, fluctuaŃiile din seriile cronologice sunt privite ca o rezultantă a


suprapunerii următoarelor componente: tendinŃa T, componenta ciclică C, sezonieră S respectiv
reziduală E. Primele trei componente sunt considerate deterministe, sistematice, determinate de factori
cu acŃiune continu ă asupra fenomenului, în timp ce componenta reziduală are caracter aleator fiind
efectul acŃiunii unor factori imprevizibili, accidentali.

Modelul clasic de descompunere a seriilor cronologice este de regulă:


• aditiv: Y = T + C + S + E sau
• multiplicativ: Y = T ⋅ C ⋅ S ⋅ E respectiv
• o combinaŃie mixtă a componentelor seriei.
În acest context, tehnicile de analiză au ca obiective:
• separarea fiecărei componente şi modelarea comportamentului său, respectiv
• previziunea evoluŃiei fiecărei componente, iar apoi compunerea acestora în scopul obŃinerii de
previziuni privind evoluŃia fenomenului Y. Principiul de la baza acestei
• tehnici este “descompune pentru a modela iar apoi recompune”.

Componentele deterministe sunt dificil de definit în termeni exacŃi.


TendinŃa sau tendinŃa generală redă evoluŃia fenomenului pe termen lung, având alura unor funcŃii
neperiodice, lent variabile în timp. Factori cu acŃiune permanentă asupra fenomenului (ex. creşterea
populaŃiei, progresul tehnic, inflaŃia) imprimă, pe o perioad ă lungă de timp, o tendinŃă de regulă
crescătoare sau descrescătoare majorităŃii indicatorilor economici.
Componenta ciclică este observabilă analizând evoluŃia fenomenului pe termen lung, şi se
manifestă sub forma unor oscilaŃii cu perioadă şi amplitudine ce variază de regulă în timp, un ciclu
acoperind câŃiva ani de zile. EvoluŃiile ciclice apar în principal urmare a ciclurilor economice sau a
pulsaŃiilor din cererea unui produs, componenta fiind prezentă în evoluŃia unor indicatori
macroeconomici de rezultate sau din domeniul financiar dar şi în alte domenii.
Componenta sezonieră se evidenŃiază sub forma unor cicluri de durată mai mică sau egală cu un
an, şi apare în principal datorită ritmului impus de schimbarea anotimpurilor dar şi de activităŃi
economice respectiv sociale (regularităŃi în plata salariilor, sărbători, vacanŃe, obiceiuri, tradiŃii, etc.).
Componenta aleatoare sau reziduală se manifestă prin fluctuaŃii aparent aleatoare în jurul
componentelor deterministe, fiind efectul acŃiunii unor factori cu acŃiune punctuală în timp, de tipul
evenimentelor politice sau meteorologice.
Componenta aleatoare este prezentă în toate seriile cronologice, în timp ce o serie poate prezenta
sau nu tendinŃa, variaŃie ciclică sau sezonieră. EvidenŃierea componentelor deterministe este
dependentă şi de perioada supusă observării respectiv de frecvenŃa observaŃiilor. Deseori cronograma
seriei sugerează componentele prezente.

Exemplul 4. Componentele seriei cronologice


Examinând cronogramele variabilelor economice din figurile 6.2., 6.3. şi 6.4. identificăm prezenŃa
următoarelor componente:
• populaŃia României în perioada 1990-2000: tendinŃă descrescătoare, componentă aleatoare;
• durata medie de viaŃă în Ńara noastră, perioada 1974-2000: componentă ciclică preponderentă,
componentă aleatoare;
• producŃia trimestrială de bere a României, perioada 1996-2000 (zeci mii hl): uşoară tendinŃă de
creştere, componentă sezonieră predominantă (durata unui ciclu este de 1 an), componentă
aleatoare.

Vor face obiectul acestui capitol doar componentele deterministe. Componenta aleatoare nu
trebuie nici ea ignorată deoarece conŃine informaŃii utile în previziune, dar pentru analiza şi
previziunea acesteia sunt necesare concepte de statistică matematică mai evoluate. Dacă nu se
precizează altfel, în prezentul capitol pentru previziunea variabilei Y componenta aleatoare se ignoră
(se presupune a fi nepredictibilă, adică de tip zgomot alb [Granger & all, 1977]). In practică,
identificarea şi separarea celor patru componente din seria cronologică nu sunt de regulă realizabile cu
exactitate, reziduul rămas dup ă extragerea estimaŃiilor componentelor deterministe regăsindu-se în
componenta aleatoare.
Figura 6.2. Numărul populaŃiei României

Figura 6.3. Durata medie de viaŃă

Figura 6.4. ProducŃia trimestrială de bere

Pentru rezolvarea exerciŃiilor din acest capitol s-a făcut uz de pachetul de programe Statistica 1997.

6.4. Modelarea tendinŃei prin funcŃii elementare


EvoluŃia majorităŃii indicatorilor din economie este dominată de tendinŃă, ceea ce justifică importanŃa
acordată acestei componente. Pentru modelarea şi previziunea tendinŃei se au în vedere funcŃiile
elementare lent variabile în timp.
Vom considera în acest paragraf că seria prezintă doar tendinŃă şi componentă aleatoare,
modelul de descompunere fiind aditiv respectiv multiplicativ:
yt = Tt + ε t , respectiv y t = Tt ⋅ ε t .
De asemenea, în acest context presupunem ca tendinŃa poate fi modelată suficient de bine prin
funcŃii elementare.

1. FuncŃii elementare utilizate în modelarea tendinŃei


Cele mai uzuale funcŃii utilizate pentru modelarea tendinŃei indicatorilor din economie sunt redate în
tabelul 6.1..

Tabelul 6.1. FuncŃii elementare utilizate în modelarea tendinŃei


TendinŃă Forma liniarizată DiferenŃe aprox. constante
liniară ∆ty/ t −1 = y t − y t −1
Tt = a + bt
parabolă T = a + bt + cX ( 2)
∆y
t / t −1
= ∆ty/ t −1 − ∆ty−1 / t − 2
2
Tt = a + bt + ct Unde X = t ²
hiperbolă T = a + bX ∆tty/ t −1 = ty t − (t − 1) y t −1
1
Tt = a + b 1
t Unde X =
t
exponenŃială Z = A + Bt unde ∆tln/ ty−1 = ln yt − ln y t −1
t
Tt = a ⋅ b
Z t = ln Tt ; A = ln a; B = ln b
putere Z = A + bX Unde
Tt = a ⋅ t b
Z t = ln Tt ; A = ln a; X = ln t

logaritmică T = a + bX
Tt = a + b ln t
unde X = ln t
curba logistică
a
Tt = , a, c > 0
1 + e b −ct

2. Stabilirea funcŃiei adecvate pentru modelarea tendinŃei (FACULTATIV)


3. Estimarea parametrilor tendinŃei
Pentru estimarea parametrilor tendinŃei liniare
Tt = a + bt
se utilizează metoda celor mai mici p ătrate, expusă în cadrul regresiei. Rolul variabilei exogene
(independente) este jucat aici de variabila timp t:
yt = a + bt + ε t t = 1, 2, ... , n .
Expresiile de calcul a parametrilor a, b sunt deci următoarele:
n

∑ (t − t )( y
t =1
t −Y)
b= n
,
∑ (t − t )
t =1
2

a = Y − bt ,
sau echivalent
M (tY ) − M (t ) M (Y )
b= ,
M (t 2 ) − [M (t )]2
a = Y − bt .
Seria prezintă o tendinŃă de creştere atunci când b > 0 respectiv de descreştere dacă b < 0.

Precizăm că variabila timp se măsoară cu ajutorul scalei de interval, astfel că originea scalei
respectiv unitatea de măsură se pot stabili în mod arbitrar. Uneori, pentru u şurarea calculelor sunt
stabilite astfel încât t = 0 , variantele variabilei t rezultând în consecinŃă. Astfel:
- daca n este impar t = ...,−3, − 2, − 1, 0,1, 2, 3,...
- daca n este par t = ...,−2,5; − 1,5; − 0,5; 0,5;1,5; 2,5;...
sau t = ....,−5, − 3, − 1,1, 3, 5,....

Cu excepŃia curbei logistice, celelalte funcŃii neliniare din tabelul 6.1. pot fi aduse la o formă
liniarizată prin anumite substituŃii, respectiv prin aplicarea operaŃiei de logaritmare în cazul funcŃiei
exponenŃiale şi a funcŃiei putere.
Spre exemplu în cazul tendinŃei exponenŃiale
Tt = a ⋅ b t ,
considerând un model de descompunere multiplicativ yt = Tt ⋅ ε t , operaŃia de logaritmare a ambilor
membri conduce la:
ln yt = ln a + t ln b + ln ε t .
Prin substituŃiile A = ln a, B = ln b,η t = ln ε t se ob Ńine forma liniarizată:
ln yt = A + Bt + η t .
Aplicând metoda celor mai mici pătrate, se determină A, B:
M (tX ) − M (t )M ( X )
B= 2
M (t 2 ) − [M (t )]
A = M ( X ) − bM (t )
unde s-a notat X = ln Y , variantele variabilei X fiind deci xt = ln yt , t = 1, 2, ...,K n .
Odată calculaŃi A respectiv B se pot determina parametrii tendinŃei exponenŃiale a = e A , b = e B .

În cazul tendinŃei parabolice:


yt = a + bt + cX + ε t
unde X = t ² , pentru estimarea parametrilor a, b, c se utilizează relatiile de calcul deduse în cadrul
regresiei liniare multiple, lucrând eventual cu variante pentru variabila t astfel încât t = 0 (scopul fiind
u şurarea calculelor).

Estimarea parametrilor curbei logistice necesită utilizarea unor metode specifice de tipul
procedurilor numerice iterative pentru modele neliniare sau a metodei celor trei puncte (Melard,
1990), metode integrate în softurile pentru statistică.

Exemplul 5. Estimarea tendinŃei liniare


Indicele lunar al preŃului producŃiei industriale pentru piaŃa internă, în perioada ianuarie 1999 –
iunie 2000 baza de comparaŃie 1996, a avut o tendinŃă crescătoare:
Luna (t) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Indice (yt) 3.7 3.8 4.1 4.3 4.5 4.8 4.9 5.1 5.3 5.5 5.6 5.8 6.0 6.2 6.3 6.5 6.6 7.0

Cronograma seriei sugerează prezenŃa unei tendinŃe liniare, peste care se suprapune o componentă
aleatoare de amplitudine redusă:
yt = a + bt + ε t , t = 1, 2,...,18.
Parametrii tendinŃei se determină din relaŃiile:
M (tY ) − M (t ) M (Y )
b= 2
M (t 2 ) − [M (t )]
a = M (Y ) − bM (t ).

Figura 6.6. --ο-- Indice preŃ productie industrială; ------ TendinŃa

Exemplificăm din calculele intermediare:


1 + 2 + L + 18
M (t ) = = 9 .5
18
3.7 + 3.8 + L + 7.0
M (Y ) = = 5.33
18
(1 × 3.7) + (2 × 3.8) + L + (18 × 7.0)
M (tY ) = = 55.72
18
12 + 2 2 + L + 18 2
M (t 2 ) = = 117,2
18
rezultând
55.72 − 9.5 × 5.33
b= = 0.19,
117.2 − (9.5) 2
a = 5.33 − 0.19 × 9.5 = 3.55.
TendinŃa seriei se estimează prin funcŃia de gradul întâi:
Tt = 3.55 + 0.19t ,
al cărei grafic este redat în figura 6.6..

Exemplul 6. Estimarea tendinŃei parabolice


Vânzările dintr-un produs urmează în general pe termen lung o tendinŃă conformă curbei logistice.
Considerând intervale mai scurte de timp, curba logistică poate fi privită ca o succesiune de tendinŃe:
în prima fază evoluŃia poate fi schiŃată printr-o dreaptă, urmată apoi de o exponenŃială, iar în partea
finală, pentru perioada de creştere lentă respectiv saturaŃie se apelează de regulă la o parabolă. Datele
de mai jos redau evoluŃia vânzărilor pe o perioad ă de 10 luni consecutive din această perioadă finală:

Luna F M A M I I A S O N
Vânzări 20 32 40 47 52 60 62 63 65 67
Figura 6.7. EvoluŃia volumului vânzărilor

Considerăm adecvat pentru modelarea tendinŃei un polinom de gradul doi: Tt = a + bt + ct 2


În condiŃiile în care pentru estimarea parametrilor a, b şi c nu facem uz de un soft de statistică,
vom stabili variantele variabilei timp astfel încât t = 0 , respectiv aici (n par) t = −9, − 7, K ,−1,1, K 7, 9 .
Parametrii sunt în acest caz daŃi de relaŃiile:
M (tY )
b= ,
M (t 2 )
M (t 2Y ) − M (Y ) M (t 2 )
c= ,
[
M (t 4 ) − M (t 2 ) ]
2

a = M (Y ) − cM (t 2 ).
Calcule intermediare:
t -9 -7 -5 -3 -1 1 3 5 7 9 Media
yt 20 32 40 47 52 60 62 63 65 67 50.8
t2 81 49 25 9 1 1 9 25 49 81 33
tYt -180 -224 -200 -141 -52 60 186 315 455 603 82.2

t4 6561 2401 625 81 1 1 81 625 2401 6561 1933.8

t 2 Yt 1620 1568 1000 423 52 60 558 1575 3185 5427 1546.8

Se ob Ńin următoarele valori pentru parametrii tendinŃei:


b = 2.49, c = −0.15, a = 55.86,
Tt = 55.86 + 2.49t − 0.15t 2 .
Dacă ne punem problema alegerii celei mai adecvate funcŃii dintre parabolă şi dreaptă (posibile
funcŃii sugerate de cronogramă pentru modelarea tendinŃei) şi dispunem de un soft de statistica pentru
efectuarea calculelor, este indicat a se utiliza criteriul minimizării sumei p ătratelor reziduurilor
SSR= ∑ ( yt − Tt ) . Astfel:
2

• se estimează parametrii dreptei Tt = 50.8 + 2.5t , apoi se determină suma pătratelor reziduurilor
SSR= ∑ ( yt − (50.8 + 2.5t )) = (20 − 28.3) 2 + ... + (67 − 73.3) 2 =210.07
2

t
Variantele variabilei timp au fost considerate şi aici t = −9, − 7, K ,−1,1, K 7, 9 ;
• pentru parabolă Tt = 55.86 + 2.49t − 0.15t 2 se obŃine SSR = 11.25.
Conform acestui criteriu, parabola este mai indicată decât dreapta în modelarea tendinŃei.
Exemplul 7. Estimarea tendinŃei exponenŃiale
Previziunea populaŃiei unei Ńări, a schimbărilor în structura sa pe vârste, constituie componente
importante ale deciziilor pe termen lung privind sistemul asigurărilor sociale (în principal a pensiilor)
influenŃând şi politica de imigrare. PopulaŃia României a crescut în perioada 1980-1988 într-un ritm
destul de accelerat, după cum arată şi datele de mai jos:
An 1980 1981 1982 1983 1984 1985 1986 1987 1988
Nr. 22.20 22.35 22.48 22.55 22.62 22.72 22.82 22.94 23.15
populaŃiei
(mil. loc.)

1. Datele confirmă ipoteza modelării tendinŃei printr-o funcŃie exponenŃială?


Un grafic al acestei serii conologice sugerează următoarele funcŃii candidate pentru modelarea
tendinŃei:
a) dreapta: Tt = a + bt respectiv
b) funcŃia exponenŃială: Tt = a ⋅ b t .
Pentru stabilirea funcŃ iei adecvate vom calcula coeficienŃii de variaŃie corespunzători diferenŃelor ∆ Y
respectiv ∆ ln Y :
yt 22.20 22.35 22.48 22.55 22.62 22.72 22.82 22.94 23.15
X1 = ∆ t / t −1 - 0.15 0.13 0.07 0.07 0.1 0.1 0.12 0.21
Y

ln y t 3.100 3.107 3.109 3.116 3.119 3.123 3.128 3.133 3.142

X 2 = ∆tln/ tY−1 - 0.007 0.002 0.007 0.003 0.004 0.005 0.005 0.009

0.15 + 0.13 + L + 0.21 0.007 + 0.002 + L + 0.009


X1 = = 0.1187 iar X 2 = = 0.0052
8 8
(0.15 − 0.1187) 2 + L + (0.21 − 0.1187) 2
σ 12 =
8
(0.007 − 0.0052) + L + (0.009 − 0.0052) 2
2
σ 22 =
8
σ 12 σ 22
v1 = = 0.388 respectiv v2 = = 0.384
X1 X2
min(v1 , v 2 ) = 0.384.

Valorile celor doi coeficienŃi de variaŃie sunt destul de apropiate, totuşi diferenŃele datelor logaritmate
prezintă un grad mai mic de dispersie, exponenŃiala fiind deci mai indicată decât dreapta în modelarea
tendinŃei.

2. Estimarea tendinŃei exponentiale


Modelăm tendinŃa printr-o funcŃie exponenŃială, în modelul multiplicativ:
yt = a ⋅ b t ⋅ ε t
Logaritmarea ambilor membrii conduce la liniarizarea tendinŃei:
ln yt = ln a + t ln b + ln ε t ,
respectiv
z t = A + Bt + η t ,
unde z t = ln yt , A = ln a, B = ln b, η t = ln ε t .

t 1 2 3 4 5 6 7 8 9
z t = ln y t 3.100 3.107 3.109 3.116 3.119 3.123 3.128 3.133 3.142
M (tZ ) − M (t ) M (Z )
B= 2
,
M (t 2 ) − [M (t )]
A = M ( Z ) − BM (t ).

3.100 + 3.107 + L + 3.142


M (Z ) = = 3.119,
9
(1 × 3.100) + (2 × 3.107) + L + (9 × 3.142)
M (tZ ) =
9

Se obŃin pentru parametrii A respectiv B următoarele estimaŃii:


B = 0.005, A = 3.09 .
Parametrii tendinŃei exponenŃiale rezultă în consecinŃă:
a = e A = 22.11, b = e B = 1.005
Tt = 22.11 × (1.005) t .

6.5. Estimarea componentelor deterministe în cazul seriilor sezoniere


Presupunem în acest paragraf că seria cronologică prezintă tendinŃă, sezonalitate şi o componentă aleatoare.
Vom prezenta modul de estimare a tendinŃei respectiv a componentei sezoniere.

6.5.1. Modelul de descompunere. Perioada componentei sezoniere


Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei. Tabelul 6.2. ilustrează
modul de obŃinere a doua serii, din date fictive, prin compunerea dintre o tendinŃă liniară şi o componentă sezonieră. Pentru
claritate, s-a considerat ca seriile nu prezintă variaŃie ciclică respectiv aleatoare, adică C = 0 şi E = 0 în cazul
modelului aditiv respectiv C = 1 şi E = 1 în caz multiplicativ.

Tabelul 6.2. Modele de descompunere a seriilor cronologice


Trim t Model aditiv Model multiplicativ
Tt St Yt = Tt + St Tt St Yt = Tt * St
I 1 10 -3 7 10 0,75 7,5
II 2 12 4 16 20 1,25 25
III 3 14 6 20 30 1,5 45
IV 4 16 -7 9 40 0,5 20
I 5 18 -3 15 50 0,75 37,5
II 6 20 4 24 60 1,25 81
III 7 22 6 28 70 1,5 105
IV 8 24 -7 17 80 0,5 40
I 9 26 -3 23 90 0.75 67.5
II 10 28 4 32 100 1.25 125
III 11 30 6 36 110 1.5 165
IV 12 32 -7 25 120 0.5 60

Cronograma celor două serii este redată în figura 6.8. respectiv 6.9..
În general, este adecvat un model aditiv atunci când amplitudinea oscilaŃiilor este aproximativ
constantă (vezi figura 6.8.) respectiv multiplicativ dacă amplitudinea creşte (figura 6.9.) sau scade în
timp. Frecvent în practică este mai adecvat modelul multiplicativ.
Perioada componentei sezoniere, notată cu p, reprezintă numărul unităŃilor de timp din cadrul
unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata unui ciclu de un
an, p fiind egal cu 4 în cazul datelor trimestriale respectiv 12 în cazul datelor lunare. Prin extensie pot
fi studiate şi fenomene cu durata unui ciclu mai mică de un an. Exemple în acest sens sunt prezentate
în tabelul 6.3.
Figura 6.8. Modelul aditiv T + S

Figura 6.9. Modelul multiplicativ T⋅S

Tabelul 6.3. Exemple de serii cu componentă sezonieră


Durata unui Date Perioada Exemple
ciclu p
1 an trimestriale 4 • încasări din vânzarea băuturilor
lunare 12 răcoritoare
• vânzările de jucării
• preŃul unor produse agricole
• cifra de afaceri a societatilor din
transportul de calatori respectiv din
construcŃii
• consum gaz, energie electrică
pentru uz casnic.
o săptămână Zilnice 7 • volumul vânzărilor unui magazin
alimentar
• încasările unui cinematograf
o zi din oră în oră • numarul de călători ce folosesc
mijloacele de transport în comun
• retragerile de la o bancă

Cronograma seriei respectiv conŃinutul variabilei analizate sugerează perioada p. Pentru descoperirea
unor oscilaŃii ascunse se apelează la metode specifice analizei spectrale (Tertişco ş.a., 1985).
6.5.2. Eliminarea componentei sezoniere utilizând mediile mobile

Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplică datelor o medie mobilă de
ordin p egal cu perioada componentei sezoniere. În general, mediile mobile sunt transformări liniare f
utilizate în scopul desezonalizării seriei respectiv al atenuării amplitudinii fluctuaŃiilor aleatoare:
• eliminarea componentei sezoniere f ( St ) ≈ 0 ,
• eliminarea componentei aleatoare f (ε t ) ≈ 0 respectiv
• conservarea tendinŃei şi a componentei ciclice f (Tt ) ≈ Tt .
Mediile mobile de ordin p, notate în continuare MM(p), sunt definite de următoare relaŃii:
• daca p este impar p = 2k + 1 , mediile mobile de ordin p sunt
y + y t − k −1 + ... + yt + ... + yt + k
yt = t −k ; t = k + 1, k + 2,..., n − k ;
p
• daca p este par p = 2k se definesc analog
y t −k + 0,5 + yt − k +1,5 + ... + yt −0,5 + y t + 0,5 + .... + y t + k + 0,5
yt = ,
p
t = k + 0,5; k + 1,5; ... ; n − k + 0,5.
În cazul p impar se realizează o corespondenŃă între valorile observate şi cele netezite (transformate),
astfel:
y1 y2 ... yk yk+1 ... yt ... yn-k yn-k-1 ... yn
- - ... - y k +1 ... yt ... y n−k - ... -

Pentru p par avem:


y1 y2 ... yk yk+1 ... yt yt+1 ... yn-k yn-k-1 ... yn
- - ... - y k + 0.5 ... y t + 0 .5 ... y n− k + 0.5 - ... -

astfel că valorile netezite sunt atribuite unui t intermediar, mijlocul intervalului dintre două observaŃii
succesive. În scopul efectuării unor comparaŃii între valorile observate şi cele netezite este indicată
existentă unei corespondenŃe între acestea, motiv pentru care, în cazul p par, se introduc mediile
mobile centrate de ordin p definite prin:
y t −0,5 + y t +0,5 0,5 y t −k + yt −k +1 + ... + y t + ... + yt + k −1 + 0,5 y t + k
yt = = .
2 p
Astfel, y t corespunde valorii observate yt pentru t = k + 1, k + 2, .... n − k . În continuare prin medie
mobilă în cazul p par se va înŃelege medie mobilă centrată.
În cazul particular p = 4, caz întâlnit frecvent în practică, mediile mobile centrate sunt date de relaŃiile:
0,5 y1 + y 2 + y3 + y 4 + 0,5 y 5
y3 = ,
4
0,5 y 2 + y3 + y 4 + y 5 + 0,5 y 6
y4 = ,
4
L
0,5 y n − 4 + y n−3 + y n− 2 + y n −1 + 0,5 y n
y n− 2 = .
4

ProprietăŃi ale mediilor mobile


• Dacă seria este periodică:
yt + p = y t , ∀t
atunci prin aplicarea unei medii mobile de ordin p egal cu perioada, oscilaŃiile se elimină din
date, valorile netezite fiind constante y t = y t +1 . Astfel, pentru eliminarea unei componente
sezoniere de ordin p se va aplica seriei o medie mobilă de ordin p.
• Mediile mobile de tipul mediilor aritmetice, prezentate aici, lasă nedeviată funcŃia de gradul
întâi yt = a + bt . Astfel, tendinŃa liniară se conservă prin aplicarea acestor medii mobile. Teoria
permite construirea unor medii mobile ponderate ce conservă şi polinoame de grad superior
[10].
• Valorii observate yt îi corespunde o valoare netezită y t calculată ca o medie aritmetică a
valorilor adiacente.
• Seria valorilor netezite are mai puŃin cu p − 1 respectiv cu p termeni decât seria iniŃ ială, după
cum p este impar sau par. Acest aspect constituie un dezavantaj al metodei.

Exemplul 8. Eliminarea componentei sezoniere utilizând mediile mobile


Datele din tabelul de mai jos se referă la transportul feroviar de călători. Parcursul pasagerilor,
exprimat în milioane kilometri, a evoluat lunar astfel:
Lună I F M A M I I A S O N D
An
1999 184 167 193 220 202 252 325 296 220 196 174 253
2000 178 175 188 230 213 272 330 279 225 198 187 247
2001 176 157 183 220 189 332 315 276 209 186 164 243

Graficul seriei din figura 6.10. sugerează o componentă sezonieră predominantă, de perioadă p = 12,
conform aşteptărilor traficul fiind mai intens în lunile de vară respectiv în perioada sărbătorilor de
iarnă. Pentru eliminarea sezonalităŃii aplicăm datelor o medie mobilă de ordin 12, egal cu perioada
componentei sezoniere. Graficul valorilor desezonalizate este prezentat în figura 6.10.
Mediile mobile de ordin p = 12 sunt calculate conform relaŃiei de definiŃie a mediilor mobile
centrate. Astfel, spre exemplu:
0.5 × y1 + y 2 + y 3 + y 4 + y 5 + y 6 + y 7 + y 8 + y 9 + y10 + y11 + y12 + 0.5 × y13
y7 = =
12
0.5 × 184 + 167 + 193 + 220 + 202 + 252 + 325 + 296 + 220 + 196 + 174 + 253 + 0.5 × 178 ...
= =
12
= 223.3
0.5 × y 24 + y 25 + y 26 + y 27 + y 28 + y 29 + y 30 + y 31 + y 32 + y 33 + y 34 + y 35 + 0.5 × y 36
y 30 = =
12
0.5 × 247 + 176 + 157 + 183 + 220 + 189 + 332 + 315 + 276 + 209 + 186 + 164 + 0.5 × 243
= =
12
= 221.0

Figura 6.10. --ο-- Parcurs pasageri; ----- MM(12)


Datele observate au fost indexate aici în ordine cronologică y1, y2, ..., y36 .
Tabelul 6.4 indică valorile mediilor mobile. Seria mediilor mobile prezentată grafic în figura 6.10.
indică absenŃa componentei de tendinŃă în evoluŃia traficului de călători pe perioada considerată.

Tabelul 6.4. Mediile mobile de ordin 12


t MM(12) t MM(12) t MM(12)
1 - 13 226.9 25 226.3
2 - 14 226.4 26 225.5
3 - 15 225.9 27 224.7
4 - 16 226.2 28 223.6
5 - 17 226.8 29 222.1
6 - 18 227.1 30 221.0
7 223.3 19 226.7 31 -
8 223.3 20 225.9 32 -
9 223.5 21 224.9 33 -
10 223.7 22 224.3 34 -
11 224.5 23 222.9 35 -
12 225.8 24 224.4 36 -

6.5.3. Estimarea tendinŃei seriilor sezoniere


În cazul seriilor sezoniere se întâlnesc preponderent în literatură doua modalităŃi de estimare a
tendinŃei:
• desezonalizarea seriei iar apoi estimarea tendinŃei pornind de la valorile desezonalizate
(Florea ş.a., 1998);
• modelarea tendinŃei pornind de la mediile anuale.

1. Estimarea tendinŃei pornind de la valorile desezonalizate


Conform proprietăŃii mediilor mobile de anulare a componentelor periodice, pentru eliminarea
componentei sezoniere (desezonalizarea seriei) se va aplica datelor o medie mobilă de ordin p, unde p
este perioada componentei sezoniere. Seria mediilor mobile y t rezultată, numită şi seria valorilor
desezonalizate, nu conŃine componenta sezonieră. Pentru modelarea tendinŃei seriei iniŃiale se va
estima deci componenta de tendinŃă, conform celor prezentate în paragraful 6.4., pornind de la seria
desezonalizată yt . Exemplul 9 este revelator în acest sens.
2. Estimarea tendinŃei în baza mediilor aferente fiecărui an
Această modalitate de estimare presupune calculul valorii medii a variabilei Y pentru fiecare din
cei n ani supuşi observării:
y i1 + yi 2 + ... + yip
yi = , i = 1, 2,..., n .
p
Seria cronologica a mediilor corespunzatoare fiecărui an:
 1 2 ... n 
y i :   ,
 y 1 y 2 ... y i 
nu conŃine componentă sezonieră, estimarea tendinŃei realizându-se aici în baza celor prezentate în
paragraful 6.4.

6.5.4. Estimarea componentei sezoniere

Vom expune aici modalitatea de estimare a componentei sezoniere prin intermediul coeficienŃilor
sezonalităŃii. Alte alternative de estimare a componentei sezoniere sunt:
• introducerea ei într-un model de regresie multiplă prin intermediul unor variabile
alternative(Gourieroux & all, 1990);
• modelarea componentei prin intermediul funcŃiilor trigonometrice (Tertişco ş.a., 1985).
În vederea determinării coeficienŃilor sezonalităŃii vom utiliza următoarele notaŃii:
i indice pentru an (în general pentru un ciclu sezonier), variind de la 1 la n;
j indice pentru sezon, variind de la 1 la p.
Modelul de descompunere a seriei are forma:
yij = Tij + S j + ε ij respectiv yij = Tij ⋅ S j ⋅ ε ij
Sezonalitatea se manifestă sub forma unor abateri de la componentele evoluŃiei pe termen lung
(tendinŃă şi componenta ciclică). Indicii respectiv coeficienŃii sezonalităŃ ii cuantifică aceste abateri de
la tendinŃă - ciclu, urmare a acŃiunii factorilor sezonieri. În funcŃie de ipoteza considerată privind
componenta tendinŃă - ciclu în practică întâlnim în principal două metode de calcul a acestora: metoda
comparării cu mediile mobile respectiv metoda comparării cu tendinŃ a.

1. Metoda comparării cu mediile mobile

Se consideră, în acest context, că seria prezintă componentă de tendinŃă respectiv ciclică, dar nu
se emite o ipoteză privind forma acestora. Componenta evoluŃiei pe termen lung tendinŃă - ciclu este
privită ca o medie curentă a seriei TC t = M (Yt ) , estimată prin mediile mobile y ij .
În cazul modelului multiplicativ
yij = Tij ⋅ S j ⋅ ε ij ,
metoda se întâlneşte în literatură şi sub denumire de metoda raportă rii la mediile mobile şi constă în
următoarele:
• calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere;
• calculul rapoartelor S ij = yij / y ij ce cuantifică abaterea datelor observate de la tendinŃă. Dacă
fixăm indicele j (ne situăm în sezonul j), aceste diferenŃe constituie estimaŃ ii pentru S j ;
• determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaŃiilor precedente:
1 n−1
Ij = ∑ Sij ; j = 1, 2,..., p ,
n − 1 i =1
aceasta justificându-se prin necesitatea eliminării efectului aleator din S ij . Pentru a nu fi
afectaŃi de valorile extreme, uneori înainte de calculul mediei, aceste valori se elimină, sau în
loc de medie se consideră valoarea mediană a estimaŃiilor S ij ;
• determinarea componentei sezoniere S j , etapă ce constă într-o corecŃie adusă indicilor medii
I j astfel încât media lor să fie 1:
1 p 
S j = I j /  ∑ I i  j = 1, 2,..., p .
 p i =1 
Această cerinŃă impusă indicilor sezonalităŃii este naturală, variaŃiile sezoniere se compensează
în medie pe parcursul unui an.

Valorile rezultate S j se numesc indici ai sezonalităŃii şi constituie componenta sezonieră. În


sezoanele pentru care Sj *100 < 100 factorii sezonieri au condus la o diminuare a valorii observate faŃă
de valoarea corespunzătoare de pe tendinŃă în medie cu 100(Sj –1) procente, respectiv dacă Sj > 1
valorile observate sunt mai mari decât cele de pe tendinŃă în medie de Sj ori.

În cazul modelului aditiv


yij = Tij + S ij + ε ij
determinarea componentei sezoniere decurge analog, dar având în vedere forma aditivă de
descompunere, coeficienŃii ce intervin se determină astfel:
S ij = y ij − y ij
1 n −1
Cj = ∑ S ij
n − 1 i =1
iar ajustarea coeficienŃilor medii C j , pentru a obŃine componenta sezonieră S j sau coeficienŃii
sezonalităŃii se face astfel încât media lor să fie zero:
1 p
∑C j = 0.
p j =1

Exemplul 9. Estimarea componentelor deterministe în cazul seriilor sezoniere.


Datele privind evoluŃia trimestrială a producŃiei de bere din Ńara noastră (zeci mii hl) în perioada 1996-
2001 sunt indicate în tabelul 6.5..

Tabelul 6.5. EvoluŃia trimestrială a producŃiei de bere, perioada 1996-2001


An/Trim. I II III IV
1996 124.1 263.2 252.4 124.5
1997 130.1 280.2 260.6 151.1
1998 157.5 301.2 353.3 185.0
1999 169.7 340.0 350.9 168.7
2000 177.5 407.6 417.2 224.1

a) Calculul mediilor mobile de ordin p=4


Graficul seriei (figura 6.11.) indică prezenŃa unei componente sezoniere predominante, de
perioadă p = 4. Punctul de pornire în estimarea componentelor deterministe îl constituie seria
mediilor mobile (valorilor desezonalizate) prezentată în tabelul 6.6., iar grafic în figura 6.11..

Mediile mobile de ordin p = 4 sunt calculate conform relaŃiei de definiŃie a mediilor mobile
centrate. Astfel, spre exemplu:

0.5 × y1 + y2 + y3 + y4 + 0.5 × y5
y3 = =
4
0.5 × 124.1 + 263.2 + 252.4 + 124.5 + 0.5 × 130.1
= = 191.8
4

0.5 × y 2 + y3 + y4 + y5 + 0.5 × y6
y4 = =
4
0.5 × 263.2 + 252.4 + 124.5 + 130.1 + 0.5 × 280.2
= = 194.7
4
L

0.5 × y 20 + y 21 + y22 + y23 + 0.5 × y 24


y 22 = =
4
0.5 × 224.1 + 202.9 + 385.3 + 425.6 + 0.5 × 196.6
= = 306.0.
4

Datele observate au fost numerotate aici în ordine cronologică y1, y2, ..., y24.
Tabelul 6.6. Mediile mobile de ordinul 4
t MM(4) T MM(4)
1 - 13 261.7
2 - 14 259.4
3 191.8 15 258.3
4 194.7 16 267.7
5 197.8 17 284.5
6 202.2 18 299.7
7 208.9 19 309.8
8 214.9 20 310.2
9 229.2 21 308.4
10 245.0 22 306.0
11 250.8 23 -
12 257.1 24 -

b) Estimarea tendinŃei pornind de la valorile desezonalizate


Seria mediilor mobile prezentată grafic în figura 6.11. relevă o uşoară tendinŃă de creştere a
producŃiei de bere. Vom considera tendinŃa liniară:
Tt = a + bt + ε t ,
originea de măsurare a timpului trimestrul II al anului 1996, unitatea de măsură un trimestru. Astfel,
pentru trimestrul III 1996 avem t = 1 ş.a.m.d:

t 1 2 3 ... 19 20
Valori desezonalizate (Z) 191.8 194.7 197.8 ... 308.4 306.0

M (tZ ) − M (t ) M ( Z )
b= 2
,
M (t 2 ) − [M (t ) ]
a = M ( Z ) − bM (t ).
Calcule intermediare:
M (t ) = 10.5, M ( Z ) = 252.9, M (t 2 ) = 143.5, M (tZ ) = 2884.9,
b = 6.9, a = 180.44.
TendinŃa producŃiei de bere în perioada ianuarie 1996 – iunie 2000 este estimată prin:
Tt = 180.44 + 6.9 × t .

Figura 6.11. --ο-- ProducŃia de bere; -- -- MM(4); ---- TendinŃa

c) Estimarea componentei sezoniere prin metoda raportă rii la mediile mobile


Cum amplitudinea oscilaŃiilor creşte uşor în timp, cronograma seriei sugerează luarea în
considerare a unui model multiplicativ:
yij = Tij ⋅ S j ⋅ ε ij ; i = 1, 2,..., 6 iar j = 1, 2, 3, 4 .
Datele sunt disponibile pentru 6 ani şi sunt prezente aici 4 sezoane. łinând seama de notaŃiile
specifice paragrafului 6.5.4., yij reprezintă nivelul producŃiei de bere în anul i trimestrul j. Astfel, spre
exemplu y13 = y1996;III = 252.4 sau y34 = y1998;IV = 185 .0 . Mediile mobile din tabelul 6.6 vor fi
transpuse într-un tabel analog cu cel de prezentare a datelor observate:

An/Trim. I II III IV
1996 - - 191.8 194.7
1997 197.8 202.2 208.9 214.9
1998 229.2 245.0 250.8 257.1
1999 261.7 259.4 258.3 267.7
2000 284.5 299.7 309.8 310.2
2001 308.4 306.0 - -
y ij
Rapoartele S ij = ⋅ 100 , respectiv mediile acestora pentru fiecare sezon sunt indicate în tabelul 6.7..
y ij

Tabelul 6.7. Calculul indicilor sezonalităŃ ii


An/Trim. I II III IV
1996 - - 131.6 63.9
1997 65.8 138.6 124.7 70.3
1998 68.7 122.9 140.9 71.9
1999 64.8 131.1 135.8 63.0
2000 62.4 136.0 134.7 72.7
2001 65.8 125.9 - -
Ij 65.5 130.9 133.5 68.4 Media 99.6
Sj 65.6 131.4 134.0 68.8 Media 100

ExplicaŃii privind calculele:


y 252.4 y 124.5
S13 = 13 ⋅ 100 = ⋅ 100 = 131.6 , S14 = 14 ⋅ 100 = ⋅ 100 = 63.9 ,
y13 191.8 y14 194.7
y 130.1
S 21 = 21 ⋅ 100 = ⋅ 100 = 65.8 , ş.a.m.d.
y 21 197.8
Cum era de aşteptat, aceste rapoarte între datele observate şi mediile mobile sunt mai mici decât 1
pentru trimestrele I şi IV, când nivelul producŃiei a fost sistematic mai mic (sub tendinŃă).

S 21 + S 31 + S 41 + S 51
I1 = = 65.5, I 2 = 130.9,
4
S + S 23 + S 33 + S 43
I 3 = 13 = 133.5, I 4 = 68.4.
4
Valoarea medie a acestor indici este 99.6, astfel că este necesară o corecŃie astfel încât media să fie
100:
I 65.5
S1 = 1 ⋅ 100 = ⋅ 100 = 65.6, S 2 = 131.4, S 3= 134.0, S 4 = 68.8 .
99.6 99.6
Urmare a caracterului sezonier specific producŃiei de bere, în trimestrul I producŃia a fost mai mică în
medie cu 34.4% decât valorile corespunzătoare de pe tendinŃă. În trimestrul II producŃia a fost în
medie mai mare de 1.314 ori decât valorile de pe tendinŃă. Analog se interpretează S3 şi S4.
Componenta sezonieră este dată de vectorul format cu indicii sezonalităŃii:
S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688).
Exemplul 10. Estimarea tendinŃei pornind de la mediile aferente fiecă rui an
Vom considera aceleaşi date: evoluŃia trimestrială a producŃiei de bere din Ńara noastră (zeci mii
hl) în perioada 1996-2001, indicată în tabelul 6.5. ProducŃia medie trimestrială determinată pentru
fiecare din cei 5 ani este:
An 1996 1997 1998 1999 2000 2001
Medie 191.05 205.5 249.25 257.32 306.6 302.6

124 .1 + 263.2 + 252 .4 + 124 .5


y1996 = = 191 .05,
4
130.1 + 280.2 + 260.6 + 151.1
y1997 = = 205.5.
4
Considerăm 1995 anul origine de măsurare a timpului, unitatea de măsură un an, astfel că t
corespunzător anului 1996 este 1, ş.a.m.d:
t 1 2 3 4 5 6
yt 191.05 205.5 249.25 257.32 306.6 302.6

TendinŃa liniară aferentă acestei serii este:


Tt = 157.07 + 28.3t .
Creşterea medie anuală a producŃiei este 28.3, iar creşterea medie trimestrială se consideră a fi 28.3/4
≅ 7.1. Valorile tendinŃei aferente perioadei observate sunt redate în tabelul de mai jos, având în vedere
creşterea medie trimestrială de 7.1:
An/Trim. I II III IV
1996 174.7 181.8 188.9 196.0
1997 203.1 210.2 217.3 224.4
1998 231.5 238.6 245.7 252.8
1999 259.9 267.0 274.1 281.2
2000 288.3 295.4 302.5 309.6

Valoarea corespunzătoare trimestrului I din 1996 se justifică Ńinând seama de următoarele:


• în general pentru serii de intervale, valoarea indicatorului se atribuie mijlocului intervalului;
• punctul de pe tendinŃă M(1; 185.37) corespunde datei de 1 iulie 1996; mijlocului trimestrului I
din 1996 îi corespunde valoarea 185.37 – 7.1 – 7.1/2 = 174.7.

6.6. Componenta ciclică (FACULTATIV)

6.7. Previziuni utilizând modelul de descompunere. Măsurarea acurateŃii previziunilor


1. Previziuni utilizând modelul de descompunere
Previziunile privind evoluŃia variabilei analizate Yˆ se obŃin prin compunerea previziunilor realizate pentru fiecare
componentă prezentă în serie, Ńinând seama de forma modelului:
Yˆ = Tˆ + Cˆ + Sˆ respectiv Yˆ = Tˆ ⋅ Cˆ ⋅ Sˆ .
Notăm cu yˆ n + h previziunea realizată la momentul n, utilizând datele y1 , y 2 ,...., y n , pentru un orizont de timp h.
Previziunea componentelor deterministe se realizează astfel:
• tendinŃa: se extrapolează tendinŃa estimată printr-o funcŃie elementară. Spre exemplu în cazul tendinŃei liniare:
Tˆn+ h = a + b(n + h)
Se are în vedere aici şi modul de definire a variantelor variabilei t;
• componenta sezonieră: se utilizează coeficientul sezonalităŃii aferent sezonului corespunzător momentului n+h,
sau o altă metodă de modelare a acestei componente;
• componenta ciclică: Ńinând seama de seria indicilor de ciclicitate respectiv de opinia experŃilor privind punctele de
întoarcere previzibile.
Spre exemplu, în cazul absenŃei ciclicităŃii, valoarea previzionată este:
yˆ n+ h = Tˆn + h + Sˆ s respectiv yˆ n+ h = Tˆn + h ⋅ Sˆ s ,
după cum modelul este aditiv sau multiplicativ.
Extrapolarea tendinŃei respectiv a celorlalte componente deterministe, conduc la previziuni adecvate în condiŃiile
în care:
- modelele estimate reuşesc să surprindă ceea ce este esenŃial, repetabil, în comportamentul trecut al fenomenului
respectiv
- comportamentul factorilor ce determină schimbările în timp în nivelul înregistrat de variabila Y rămâne şi pe
viitor aproximativ acelaşi.
Extrapolarea este adecvată în principal pentru obŃinerea de previziuni pe termen scurt, elaborându-se de regulă dou ă
sau mai multe scenarii de evoluŃie.

Exemplu 9 (continuare). Previziunea producŃiei de bere


Tabelul următor conŃine previziunile, datele reale respectiv erorile de previziune privind nivelul producŃiei de bere.

An Trim. TendinŃă Sezonalitate Previziune ŷ ProducŃie Eroare

2001 III 325.34 1.34 435.95 425.6 -10.35


IV 332.24 0.688 228.58 196.6 -31.98
2002 I 339.14 0.656 217.9 203.2 -14.7

Prezentăm modul de obŃinere a rezultatelor anterioare pentru trim. III an 2001. Valorile tendinŃei respectiv a componentei
sezoniere sunt:
) )
T (21) = 180.44 + 6.9 × 21 = 325.34 respectiv S 3 = 1.34.
Modelul de descompunere considerat a fost cel multiplicativ, astfel că valoarea previzionată este:
)
y = 325.34 × 1.34 = 435.95
iar eroarea de previziune aferentă:
)
e = 425.6 − 435.95 = −10.35

Exemplu 5 (continuare). Previziunea indicelui lunar al preŃului producŃiei industriale.

Având în vedere tendinŃa estimată privind evoluŃia acestui indicator:

Tt = 3.55 + 0.19t

previziunile respectiv erorile de previziune pentru perioada Iulie - Decembrie 2000 sunt indicate mai jos:

Luna I A S O N D
Indice y 7.40 7.66 7.96 8.26 8.47 8.65
) 7.16 7.35 7.54 7.73 7.92 8.11
Previziune y
) 0.24 0.31 0.42 0.53 0.55 0.54
Eroare e

Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinŃei conducând la:
) )
y19 = T19 =3.55 + 0.19 × 19 = 7.16
) )
e19 = y19 - y19 = 0.24.

Exemplu 7 (continuare). Previziunea populaŃiei României


TendinŃa evoluŃiei populaŃiei Ńării noastre estimată pentru perioada 1980 – 1988 în baza unui model de
creştere exponenŃială a fost:
Tt = 22.11 × (1.005)t
O extrapolare a acestei tendinŃe ( fără a se Ńine seama de condiŃiile în care previziunea prin extrapolare
conduce la valori adecvate) ar indica o populaŃie previzibilă pentru anul 2000 de:
T20 = 22.11 × (1.005)21 = 24.36 mil. locuitori,
valoarea reală fiind de 22.43 mil. locuitori. După 1989 tendinŃa s-a schimbat brusc într-una
descrescătoare, mediul economic şi social, cu influenŃă directă asupra evoluŃiei populaŃiei unei Ńări,
schimbăndu-se substanŃial faŃă de cel din perioada 1980 – 1988 (perioadă utilizată în estimarea
tendinŃei).
2. Mă surarea acurateŃii previziunilor
Dacă modelul elaborat conduce la previziunile yˆ1 , yˆ 2 ,..., yˆ p corespunzătoare datelor y1 , y 2 ,..., y p ,
pentru a măsura calitatea acestuia de a genera previziuni adecvate se utilizează o serie de indicatori
sintetici ai erorilor de previziune, cei mai frecvent întâlniŃi fiind:
1 p
MSE = ∑ ( y h − yˆ h )
2
- eroarea medie pătratică:
p h =1
1 p
- eroarea medie absolută: MAE = ∑ y h − yˆ h
p h =1

1 p y h − yˆ h
- eroarea medie absolută exprimată procentual: MAPE = ∑ yˆ
p h=1 h

Frecvent, în practică se utilizează doar o parte din date în estimarea modelului, cele rămase (cele
mai recente), urmând a fi comparate cu previziunile corespunzătoare generate de model. Dintre mai
multe modele alternative de previziune este selectat cel ce conduce la erori medii de previziune mai
mici. După alegerea modelului, acesta poate fi reestimat luând în considerare toate datele disponibile.
O altă variantă de lucru constă în compararea previziunilor obŃinute din model cu cele generate
“naiv”. Conform “modelului naiv de previziune” (mers aleator) valoarea înregistrată de variabilă în
următoarea perioadă va fi cea înregistrată în prezent.

6.8. Descompunerea seriei pe componente

Odată determinate componentele deterministe, componenta aleatoare se obŃine prin eliminarea


acestora din datele observate:
y ij
• ε ij = în cazul modelului multiplicativ, respectiv
Tij ⋅ C ij ⋅ S j
ε ij = yij − (Tij + C ij + S j ) în caz aditiv.
Seria cronologică cu datele iniŃiale poate fi descompusă astfel pe componente.

Exemplul 9 (continuare). Descompunerea seriei pe componente


Pentru tendinŃă a fost estimat modelul liniar:
Tt = 180.44 + 6.9t t=1, 2, ....
originea de măsurare a timpului fiind trimestrul II al anului 1996, unitatea de măsură un trimestru.
Componenta sezonieră constă în indicii sezonalităŃ ii:
S1 = 65.6, S 2 = 131.4, S 3= 134.0, S 4 = 68.8 .
Componenta ciclică s-a neglijat, iar componenta aleatoare (reziduu) se deduce Ńinand seama de forma
multiplicativă a modelului:
Y
Comp. aleatoare (Reziduu) =
T ⋅S
Tabelul 6.8. Descompunerea seriei pe componente
An Trim. ProducŃie MM(4) TendinŃă Comp. Reziduu
Y T sezonieră S
1996 I 124.1 - - - -
II 263.2 - - - -
III 252.4 191.8 187.34 1.340 1.005
IV 124.5 194.7 194.24 0.668 0.959
1997 I 130.1 197.8 201.14 0.656 0.986
II 280.2 202.2 208.40 1.314 1.023
III 260.6 208.9 214.94 1.340 0.905
IV 151.1 214.9 221.84 0.688 1.020
1998 I 157.5 229.2 228.74 0.656 1.049
II 301.2 245.0 235.64 1.314 0.973
III 353.3 250.8 242.54 1.340 1.087
IV 185.0 257.1 249.44 0.688 1.078
1999 I 169.7 261.7 256.34 0.656 1.009
II 340.0 259.4 263.24 1.314 0.983
III 350.9 258.3 270.14 1.340 0.969
IV 168.7 267.7 277.04 0.688 0.885
2000 I 177.5 284.5 283.94 0.656 0.953
II 407.6 299.7 290.84 1.314 1.066
III 417.2 309.8 297.74 1.340 1.046
IV 224.1 310.2 304.64 0.688 1.069
2001 I 209.9 308.4 311.54 0.656 1.027
II 385.3 306.0 318.44 1.314 0.856
III 425.6 - 325.34 1.340 0.976
IV 196.6 - 332.24 0.688 0.860

Pentru modelarea şi previziunea componentei aleatoare se porneşte de la seria reziduurilor,


care este o serie staŃionară, şi se elaborează un model de tip autoregresiv-medie mobilă.

6.9. Tehnici de netezire


Atunci când cronograma seriei nu oferă indicii foarte clare privind prezenŃa respectiv forma
tendinŃei, este indicat a se utiliza în prealabil o tehnică de netezire ce atenuează amplitudinea
fluctuaŃiilor aleatoare din serie, scopul fiind evidenŃierea (estimarea) tendinŃei. Tehnicile de netezire
general utilizate sunt mediile mobile sau tehnicii netezirii exponenŃiale.
1. Mediile mobile
În practică, alegerea ordinului mediei mobile pentru eliminarea componentei aleatoare rămâne în
sarcina analistului, fiind indicat un ordin p mai mare dacă amplitudinea fluctuaŃiilor aleatoare este mai
mare. Oricum, oscilaŃiile din componenta aleatoare fiind neregulate, eliminarea acesteia se realizează
doar parŃial. Prin aplicarea unei medii mobile, indiferent de ordinul acesteia, amplitudinea fluctuaŃiilor
se reduce. Raportul dintre dispersia componentei aleatoare din seria netezită σ *2 şi seria iniŃială
σ 2 este aproximativ (Gourieroux & all, 1990):
σ *2 1
= .
σ² p
Astfel, cu cât ordinul mediei mobile este mai mare cu atât seria mediilor mobile este mai netedă.

Exemplul 11. Reducerea amplitudinii componentei aleatoare utilizând medii mobile


EvoluŃia cursului unei acŃiuni este dominată în principal de fluctuaŃii aleatoare. EvidenŃierea şi
estimarea unor componente deterministe, în scopul efectuării de previziuni este uneori imposibilă, cea
mai adecvată previziune pentru cursul din cotaŃia următoare fiind chiar cursul prezent (model de tip
mers aleator).
Pentru 16 zile succesive de cotaŃie redăm grafic în figura 6.12. evoluŃia cursului unei acŃiuni. In
scopul evidenŃierii tendinŃei s-au utilizat mediile mobile de ordin p = 3, respectiv p = 7, rezultatele
fiind redate în tabelul de mai jos, iar grafic în figura 6.7:
Zi (t) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Curs (yt) 29.9 29.8 30.1 31.2 31.9 30.1 28.6 31.5 31.2 30.7 31.2 30.4 31.0 30.4 31.5 32.7
MM(3) - 29.9 30.4 31.1 31.1 30.2 30.1 30.4 31.1 31.0 30.8 30.9 30.6 31.0 31.5 -

Mediile mobile de ordin p = 3 sunt:


y + y 2 + y 3 29.9 + 29.8 + 30.1
y2 = 1 = = 29.9,
3 3
y + y 3 + y 4 29.8 + 30.1 + 31.2
y3 = 2 = = 30.4,
3 3
celelalte fiind calculate într-o manieră similară.
Observăm că mediile mobile de ordin 3 nu conduc la rezultate satisfăcătoare. Prin creşterea
ordinului la p = 7, gradul de netezire creşte dar numărul termenilor seriei valorilor netezite se reduce
substanŃ ial (la 10 termeni).

Figura 6.12 --ο-- Cursul acŃiunii , -- -- MM(3), ----- MM(7)

2. Tehnica netezirii exponenŃiale simple

Valorile netezite, notate S1 , S 2 ,..., S n , se determină conform formulei de recurenŃă:


S t = cyt + (1 − c) S t −1 ,
unde S1 = y1 iar c ∈ [0, 1] este constanta de netezire. Următoarea expresie echivalentă,
t −1
S t = c∑ (1 − c) j y t − j ; t = 2, 3,..., n ,
j =0

arată că valoarea netezită calculată la momentul t depinde de trecutul fenomenului yt , y t −1 ,..., y1 , dar
ponderea fiecărei observaŃii descreşte. Viteza cu care se realizează aceasta depinde de constanta de
netezire c. Când c este apropiată de 1 atunci coeficientul (1 − c) j descreşte rapid spre zero, astfel ca
valoarea netezită S t depinde în mare măsură de observaŃiile recente.
Alegerea unei valori optime pentru c depinde de caracteristicile seriei. Pentru serii fluctuante se va
utiliza o valoare mai apropiată de zero, iar acolo unde evoluŃia seriei este stabilă se va considera o
valoare pentru c apropiată de unu. Un criteriu mai obiectiv de determinare a constantei poate fi studiat
în (Gourieroux & all, 1990).
Utilizată în scopul eliminării componentei aleatoare, tehnica netezirii exponentiale simple
conduce în general la rezultate mai bune decât cele obŃinute utilizând mediile mobile.

Exemplul 12. Reducerea amplitudinii componentei aleatoare prin tehnica netezirii exponenŃiale
Reluăm datele din exemplul referitor la evoluŃia cursului unei acŃiuni. Graficul 6.9. redă seria
valorilor netezite obŃinute prin tehnica netezirii exponenŃiale simple pentru două valori ale constantei
de netezire c = 0.1 respectiv c = 0.5.
Figura 6.9. -ο- Cursul acŃiunii; - - Valori netezite c = 0.5; ----- Valori netezite c = 0.1

Valorile netezite respectiv modul de calcul al acestora pentru c = 0.1 este redat în cele ce urmează:
T 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
yt 29.9 29.8 30.1 31.2 31.9 30.1 28.6 31.5 31.2 30.7 31.2 30.4 31.0 30.4 31.5 32.7
St - 29.9 29.9 30.0 30.2 30.2 30.1 30.2 30.3 30.3 30.4 30.4 30.5 30.5 30.6 30.8

Valorile netezite s-au calculat din relaŃia de recurenŃă:

S t = 0.1 y t + 0.9 S t −1 .
Astfel,
S 2 = 0.1y 2 + 0.9S1 = 0.1 ⋅ 29.8 + 0.9 ⋅ 29.9 = 29.9
S 3 = 0.1 y 3 + 0.9 S 2 = 0.1 ⋅ 30.1 + 0.9 ⋅ 29.9 = 29.9
celelalte valori fiind obŃinute analog.
Observăm că o valoare apropiată de 0 pentru constanta de netezire conduce la un grad de netezire mai
pronunŃat.

6.10. Alte metode de previziune (FACULTATIV)

Capitolul 7

APLICAłII

Problema 1

Considerând rata şomajului ca mărime analizată notată cu Z se cere:


1. Expresia de calcul a mărimii Z în funcŃie de factorii de influenŃă;
2. Având seriile cronologice relativ la numărul de şomeri X şi populaŃia activă notată cu Y în 10
luni consecutive respectiv:
- numărul de şomeri
 1 2 3 4 5 6 7 8 9 10 
X :  
 330 420 370 480 520 550 600 580 630 635

- populaŃia activă
 1 2 3 4 5 6 7 8 9 10 
Y :  
 3882 4827 4302 5485 5843 6189 6593 6304 6702 6738
redaŃi seria cronologică aferentă ratei lunare a şomajului;
3. Rata de şomaj medie lunară;
4. De câte ori au crescut în medie de la o lună la alta numărul de şomeri;
5. Exprimarea, calcularea şi interpretarea următorilor indici:
I Z5 //1x ( F ) ; I Z5 //1y ( F ) ; I Z5 / 1 .

1) Z (rata şomajului) este influenŃată de numărul de şomeri direct proporŃional şi de numărul


populaŃiei active invers proporŃional.

S X
Z= ⋅ 100 = ⋅ 100
Pa Y

 1 2 3 4 5 6 7 8 9 10 
2) Z :  
 8,5 8,7 8,6 8,75 8,90 8,90 9,1 9,2 9,4 9,42 

3) Seria cronologică fiind de momente, nivelul mediu se determină după următoarea relaŃie:
1 1
⋅ Z 1 + Z 2 + Z 3 + Z 4 + Z 5 + Z 6 + Z 7 + Z 8 + Z 9 + ⋅ Z 10
Z= 2 2 =
10 − 1
1 1
8,5 ⋅ + 8,7 + 8,6 + 8,75 + 8,90 + 8,90 + 9,1 + 9,2 + 9,4 + 9,42 ⋅
= 2 2 = 8,945
9
Rata de şomaj medie lunară din perioada analizată este de 8,945.

4) I X =
∑ X (t − 1) ⋅ X (t ) =
∑ [X (t − 1)]2
330⋅ 420+ 420⋅ 370+ 370⋅ 480+ 480⋅ 520+ 520⋅ 550+ 550⋅ 600+ 600⋅ 580+ 580⋅ 630+ 630⋅ 635
=
3302 + 4202 + 3702 + 4802 + 5202 + 5502 + 6002 + 5802 + 6302

1386+1554+1776+ 2496+ 2860+ 3300+ 3490+ 3654+ 40005


= = 1,056
1089+1764+1369+ 2304+ 2704+ 3025+ 3600+ 3364+ 3969
Numărul de şomeri au crescut în medie de 1,056 ori de la o lună la alta.

Z 5 8,9
5) I Z5 / 1 = = = 1,047 , rata şomajului a crescut de 1,047 în luna a 5-a faŃă de luna 1.
I 1 8,5

I Z5 //1x ( F ) = I Z5 //1x ⋅ (L ) ⋅ I Z5 //1x ⋅ (P ) = 1,57 ⋅ 1,57 = 1,576


x5
y 520 3882
I Z5 //1x ( L ) = 1 = ⋅ = 1,576
x1 3882 330
y1
x5
y
I Z5 //1x (P ) = 5 = 1,576
x1
y5
- rata şomajului ar fi crescut de 1,576 datorită modificării numărului de şomeri, populaŃia activă
rămânând constantă;

I Z5 //1y (F ) = I Z5 //1y ⋅ (L ) ⋅ I Z5 //1y ⋅ (P ) = 0,664


x1
y y 3882
I Z5 //1y (L ) = 5 = 1 = = 0,664
x1 y 5 5843
y1
x5
y y
I Z5 //1y (P ) = 5 = 1 = 0,664
x5 y5
y1

- rata şomajului ar fi scăzut de 0,664 datorită modificării populaŃiei active, numărul de şomeri
rămânând constant;
I Z5 //1x ⋅ I Z5 //1y = 1,57 ⋅ 0,66 = 1,0465 = I Z5 / 1

Problema 2

Din mulŃimea autoturismelor vândute prin licitaŃie s-a constituit un eşantion de 30 de unităŃi,
rezultatele observării în raport cu variabilele X – vechimea autoturismelor exprimată în ani şi y –
preŃul la care s-au vândut (în milioana lei) sunt prezentate în tabelul următor:

Nr . crt. X Y Nr. crt. X Y Nr . crt. X Y


1 4 30 11 6 32 21 7 30
2 1 40 12 5 33 22 10 25
3 9 20 13 11 24 23 5 36
4 13 17 14 13 19 24 8 23
5 15 17 15 2 38 25 10 27
6 8 28 16 8 22 26 12 22
7 13 20 17 12 20 27 3 35
8 19 13 18 20 10 28 9 29
9 6 33 19 5 35 29 14 19
10 0 41 20 14 17 30 7 30

Se cere:
1. Elaborarea repartiŃiei bidimensionale ştiind că numărul de intervale pentru variabila X = 4, iar
lungimea unui interval pentru Y, ly = 8 intervalele fiind egale.
2. Parametrii tendinŃei centrale în raport cu preŃul de vânzare şi interpretarea acestora;
3. Studierea reprezentativităŃii funcŃiilor de regresie, liniară şi hiperbolică şi alegerea celei mai
reprezentative;
4. Pentru funcŃia aleasă la punctul precedent calculaŃi parametrii.

X max − X min 20 − 0
1) lungime interval = = =5
numar intervale 4

 [0;5) [5;10) [10;15) [15;20)


X :  
 5 12 10 3 

 [10;18) [18;26) [26;34) [34;42)


Y :  
 5 10 9 6 

X [0;5) [5;10) [10;15) [15;20) TOTAL

Y
[10;18) - - 2 3 5
[18;26) - 3 7 - 10
[26;34) 1 7 1 - 9
[34;42) 4 2 - - 6
TOTAL 5 12 10 3 30

2) Media:
R

∑Y
i =1
i
'
⋅ Ni
14 ⋅ 5 + 22 ⋅ 10 + 30 ⋅ 9 + 37,5 ⋅ 6 785
Y= = = = 26,26
N 30 30
- preŃul mediu de vânzare al maşinilor este de 26,26 mii lei
1 30
Mediana: rMe = ⋅ N = = 15
2 2
5 + 10 = rMe = 15 ⇒ Me ∈ [18;26 )
15 − 5
Me = 18 + ⋅ 8 = 26
10
- jumătate din maşini se vând cu un preŃ mai mic de 26.000 mii lei, iar cealaltă jumătate cu un preŃ mai
mare de 26.000.000 lei.

 [10 − 26) [26;41)


 
 15 15 

Modala:
max(5, 10, 9, 6) = 10 ⇒ Mo ∈ [18;26)
Cele mai multe autoturisme se vând cu un preŃ cuprins între 18.000 şi 26.000 mii lei.
10 − 5 5
Mo = 18 + ⋅ 8 = 18 + ⋅ 8 = 24,66
(10 − 5) + (10 − 9) 5 +1
- cea mai mare parte a autoturismelor se vând la un preŃ în jur de 24.666,666 mii lei.

3) Din tabelul de corelaŃie se observă că frecvenŃele diferite de zero sunt grupate, rezultă că între cele
două variabile există legătură, ce poate fi modelată cu ajutorul funcŃiei de regresie.
a. Dacă funcŃia de regresie este o dreptă Y ( X ) = a + bx
1
b. Dacă funcŃia de regresie este o hiperbolă Y ( X ) = a + b ⋅
x
Mai reprezentativă este funcŃia care are coeficientul de regresie mai mare. Ca urmare trebuie calculat
acest coeficient pentru cele două cazuri.
M ( XY ) − M ( X ) ⋅ M (Y )
a. RYX =
σ X ⋅σ Y
M (Y ) = 26,26
2,5 ⋅ 5 + 7,5 ⋅ 12 + 12,5 ⋅ 10 + 17,5 ⋅ 3
M (X ) = = 9,33
30
1
[ 2 2 2 2
σ Y2 = ⋅ (14− 26,26) ⋅ 5 + (22− 26,26) ⋅10+ (30− 26,26) ⋅ 9 + (38− 26,26) ⋅ 6 = 62,86
30
]
1
[ 2 2 2 2
]
σ X2 = ⋅ (2,5 − 9,33) ⋅ 5 + (7,5 − 9,33) ⋅12+ (12,5 − 9,33) ⋅10+ (17,5 − 9,33) ⋅ 3 =19,1389
30
1
M ( XY ) = ⋅ [2,5 ⋅ 30 ⋅ 1 + 2,5 ⋅ 38 ⋅ 4 + ... + 17,5 ⋅ 14 ⋅ 3] = 216
30
216 − 9,33 ⋅ 26,26
RYX = = −0,836
62,86 ⋅ 19,1389

1  1
M  ⋅ Y  − M   ⋅ M (Y )
X  X
b. RYX ' = 
σ  1  ⋅σ Y
 
X

1 1
M  = ⋅ (0,4⋅ 5 + 0,133⋅12+ 0,08⋅10+ 0,057⋅ 3) = 0,152
 X  30

1 1
σ 2  = [ 2 2 2 2
]
⋅ (0,4 − 0,152) ⋅ 5 + (0,133−,0152) ⋅12+ (0,08− 0,152) ⋅10+ (0,057− 0,152) ⋅ 3 =
 X  30
= 0,013
1  1
M ⋅Y  = ⋅ [0,4 ⋅ 30⋅1+ 0,4⋅ 38⋅ 4 +...+ 0,057⋅14⋅ 3] = 4,632
 X  30
4,632 − 0,152 ⋅ 26,26
RYX ' = = 0,7218
0,013 ⋅ 62,86
RYX > RYX ' , rezultă că dreapta de regresie este mai reprezentativă.

4) Y ( X ) = a + bX
[ ]2
Folosind metoda celor mai mici pătrate, unde M Y − Y ( X ) - min, rezultă:

a + bM ( X ) = M (Y )
 2
aM ( X ) + bM ( X ) = M ( XY )

a = M (Y ) − bM ( X )
M ( XY ) − M ( X ) ⋅ M (Y ) M ( XY ) − M ( X ) ⋅ M (Y )
b= 2
=
M ( X 2 ) − [M ( X )] σ X2
1
M (X 2) = ⋅ (2,52 ⋅ 5 + 7,52 ⋅ 12 + 12,52 ⋅ 10 + 17,5 2 ⋅ 3) = 106,25
30

216 − 9,33 ⋅ 26,26


b= = −1,516
19,1389
a = 26,26 + 1,516 ⋅ 9,33 = 40,40

Y ( X ) = 40,40 − 1,516 X

Problema 3

PreŃul unui produs a fost observat în 30 puncte de vânzare la un moment t dat. Valorile înregistrate
sunt următoarele: 21; 24; 26; 30; 25,9; 26; 20; 24,2; 27; 29; 25,6; 26,3; 27; 22; 24,5; 28; 25; 27,5;
22,5; 24,7; 26,6; 23,2; 25,1; 27,5; 23; 24,8; 23,7; 25; 22,8; 23.

Se cere:
1. elaborarea distribuŃiei statistice a punctelor de vânzare în raport cu preŃul;
2. analiza reprezentativităŃii preŃului mediu;
3. reprezentarea grafică a structurii repartiŃiei;
4. având seria cronologică ce redă variaŃia preŃului produsului studiat în 6 luni consecutive ca fiind
următoarea:
1 2 3 4 5 6
Y :  
 25 25,7 26 26,5 26,8 28 
CalculaŃi şi interpretaŃi:
a) preŃul mediu lunar;
b) ritmul mediu lunar.

1) elaborarea distribuŃiei statistice a punctelor de vânzare în raport cu preŃul:


30 − 20 10
- calculăm lungimea intervalului: l X = = =2
5 5

 [20 − 22) [22 − 24) [24 − 26) [26 − 28) [28 − 30)
X :  
 2 7 10 8 3 

- serie de repartiŃie unidimensională, având la bază o variabilă atributivă, cantitativă continuă şi


frecvenŃa absolută.

2) Analiza reprezentativităŃ ii preŃului mediu:

21⋅ 2 + 23 ⋅ 7 + 25 ⋅10 + 27 ⋅ 8 + 29 ⋅ 3 42 + 161+ 250 + 216 + 87 756


X= = = = 25,2
30 30 30
- preŃul mediu este 25,2;

→ analizăm reprezentativitatea mediei cu ajutorul varianŃei şi a coeficientului de variaŃie a lui


Pearson:
R

∑ (X )
' 2
i −X ⋅ Ni
2 i =1
V (X ) = σ X =
N
2
σ (X ) = σ X = V (X )

σX
CV ( X ) = ⋅ 100
X

- dacă CV(X) ≥ 50% - media este nereprezentativă

σ X2 =
(21− 25,2)2 ⋅ 2 + (23− 25,2)2 ⋅ 7 + (25− 25,2)2 ⋅10+ (27− 25,2)2 ⋅8 + (29− 25,2)2 ⋅ 3 = 4,63
30
- preŃul se abate în medie de la valoarea medie cu 2,15.
σ X = σ X2 = 4,63 = 2,15

σX 2,15
CV ( X ) = ⋅ 100 = ⋅ 100 = 0,0853 ⋅ 100 = 8,53% < 30% ⇒ media este reprezentativă.
X 25,2

3) Reprezentarea grafică a structurii repartiŃiei:


- reprezentarea grafică a structurii unei repartiŃii se face cu ajutorul diagramelor de structură;

Ni
fi = ⋅ 100 → frecvenŃa relativă
N
2
f1 = ⋅ 100 = 0,0667 ⋅ 100 = 6,67%
30
7
f2 = ⋅ 100 = 0,2333 ⋅ 100 = 23,33%
30
10
f3 = ⋅ 100 = 0,3333 ⋅ 100 = 33,33%
30
8
f4 = ⋅ 100 = 0,2667 ⋅ 100 = 62,67%
30
8
f5 = ⋅ 100 = 0,1 ⋅ 100 = 10%
30

µ i = f i ⋅ 360 o
µ1 = 24,01o
µ 2 = 83,99o
µ 3 = 119,99o
µ 4 = 96,01o
µ 5 = 36 o

Titlu: Stuctura punctelor de vânzare în raport cu preŃul


10% 6,67%

1
23,33%
2
26,67%
3
4
5

33,33%

Legendă:
1. 6,67% din punctele de vânzare au preŃuri cuprinse între 20 şi 22;
2 . 23,33% din punctele de vânzare au preŃuri cuprinse în intervalul [22 - 24);
3 . 33,33% din punctele de vânzare au preŃuri cuprinse în intervalul [24 - 26);
4 . 26,67% din punctele de vânzare au preŃuri cuprinse în intervalul [26 - 28);
5 . 10% din punctele de vânzare au preŃuri cuprinse în intervalul [28 - 30);

1 2 3 4 5 6
4) Y :  
 25 25,7 26 26,5 26,8 28 

CalculaŃi şi interpretaŃi:
a) preŃul mediu lunar;
b) ritmul mediu lunar.

1 1
25 ⋅ + 25,7 + 26 + 26,5 + 26,8 + 28 ⋅
a) Y / luna = 2 2 = 26,33
5
- preŃul mediu lunar este de 26,33

b) R Y = I Y − 1 = I Y ⋅ 100% − 100%

25,7 ⋅ 25+ 26⋅ 25,7 + 26,5 ⋅ 26 + 26,8 ⋅ 26,5 + 28⋅ 26,5


IY = =
252 + 25,72 + 262 + 26,52 + 26,82
642,5 + 668,2 + 689+ 710,2 + 750,4
=
625+ 660,49 + 676+ 702,25+ 718,24
= ( )
R Y = I Y − 1 ⋅ 100 = 0,0231 ⋅ 100 = 2,31%

3460,3
= =1,0231
3381,98
- preŃul a crescut în medie de la o lună la alta cu 2,31%.
Problema 4

Se consideră un eşantion de 100 gospodării şi variabilele X-număr de membrii şi Y-cantitatea de pâine


consumată zilnic de o gospodărie (Kg), rezultatele fiind prezentate în tabelul următor:

X 1 2 3 4 TOTAL
Y
0,25 5 - - - 5
0,5 5 30 5 - 40
1 - 5 15 10 30
1,5 - - 5 20 25
TOTAL 10 35 25 30 100

Se cere:
1. cantitatea medie, mediană şi modală de pâine consumată zilnic de o gospodărie (calcul şi
interpretare);
2. în ce proporŃie cantitatea de pâine depinde de numărul de membrii;
3. analiza numerică şi caracterizarea intensităŃii legăturii între cele două variabile.

 0,25 0,5 1 1,5 


1) Y :  
 5 40 30 25 

Y - Media
0,25 ⋅ 5 + 0,5 ⋅ 40 + 1 ⋅ 30 + 1,5 ⋅ 25 1,25 + 20 + 30 + 37,5 88,75
Y= = = = 0,89[kg ]
100 100 100
- 0,89 este cantitatea medie de pâine consumată zilnic de o gospodărie.

Me – Mediana
N
- variabila discretă N=100 ⇒ = 50
2

Y N  + Y N 
2
  Y50 + Y51 1 + 1
 2  +1
 
Me = = = =1
2 2 2
- jumătate din gospodării consumă zilnic pâine între 0,25 şi 1 kg, iar cealaltă jumătate între 1 şi 1,5 kg
de pâine pe zi.

Mo – Modala

- variabila discretă NMo = max(N1, N2, N3, N4) ⇒ NMo = 40 ⇒ Mo = 0,5


- cele mai multe gospodării consumă zilnic în jur de 0,5 kg de pâine.

V EXP
2) Se calculează: rxy2 =
VTOT

VTOT (Y ) =
(2,25 − 0,89)2 ⋅ 5 + (0,5 − 0,89)2 ⋅ 40 + (1 − 0,89)2 ⋅ 30 + (1,5 − 0,89)2 ⋅ 25 = 0,18
100
r

∑ (Y )
2
i − Y ⋅ N i.
i =1
VTOT =
N
J

∑ (Y / x )
2
j −Y ⋅ N. j
j =1
VEXP =
N

Calculăm mediile condiŃionate ale lui Y în funcŃ ie de X.

0,25 ⋅ 5 + 0,5 ⋅ 5
Y 1 = Y / x1 = = 0,35
10
0,5 ⋅ 30 + 1 ⋅ 5
Y 2 = Y / x2 = = 0,57
35
0,5 ⋅ 5 + 1 ⋅ 15 + 1,5 ⋅ 5
Y 3 = Y / x3 = =1
25
1 ⋅ 10 + 1,5 ⋅ 20
Y 4 = Y / x4 = = 1,33
30

VEXP(Y ) =
(0,35 − 0,89)2 ⋅10 + (0,57 − 0,89)2 ⋅ 35 + (1 − 0,89)2 ⋅ 25 + (1,33− 0,89)2 ⋅ 30 =
100
2,9 + 3,5+,025+ 5,7 12,35
= = = 0,12
100 100
V 0,12
rxy2 = EXP = = 0,66 ⇒ 66%
VTOT 0,18

- consumul zilnic de pâine de gospodărie depinde de numărul de membrii al gospodăriei în proporŃie


de 66%.

3) Analiza numerică şi caracterizarea intensităŃii legăturii între cele 2 variabile


- X, Y variabile cantitative
⇒ intensitatea legăturii se studiază cu ajutorul raportului de corelaŃie (rXY)

2 V EXP
rXY = r XY = ∈ [0;1]
VTOT

2
rXY = rXY = 0,66 = 0,81 → 1 ⇒ legătura intensă între cele dou ă variabile.

Problema 5

Cunoscând seriile cronologice cu privire la: numărul de şomeri muncitori (X), numărul de şomeri cu
studii medii (Y), numărul de şomeri cu studii superioare (Z) din judeŃul Cluj în 10 luni consecutive,
respectiv:
mii persoane

Luna 1 2 3 4 5 6 7 8 9 10
X 22,2 22,2 22,3 23,2 24,7 26,8 28,7 29,1 28,3 28,3
3 4 4 1 5
Y 3,86 3,87 3,98 4,52 4,1 4,53 4,91 5,28 6,18 6,2
W 0,39 0,39 0,41 0,43 0,35 0,40 0,45 0,48 0,5 0,5
6 5 9 7 7 6 5 7

Se cere:
1. RelaŃia matematică ce exprimă legătura dintre numărul total de şomeri (Z) şi X, Y, W;
2. Seria cronologică având la bază numărul total de şomeri din judeŃul Cluj;
3. Numărul mediu lunar de şomeri;
4. Indicele mediu şi ritmul mediu al numărului total de şomeri;
5. DiferenŃa medie absolută a numărului total de şomeri;
6. Primii 4 indici exprimând variaŃia integrală a numărului total de şomeri, calculaŃi cu bază fixă;
7. Indicii factoriali de tip Paasche aferenŃi fiecărui factor care influenŃează numărul total de şomeri în
luna 4 faŃă de luna 1.

1. z(t) = x(t) + y(t) + w(t); t = 1, 10

2.

Luna 1 2 3 4 5 6 7 8 9 10
z(t) 26,4 26,2 27,7 28,1 29,1 31,7 34,0 34,8 34,9 35,0
86 05 39 67 54 86 65 67 80 00

3. z(t) este o serie cronologică de momente

z(1) z(10)
+ z(2) + z(3) + ..... + z(9) +
z= 2 2 = 277 = 30,77
9 9

Numărul mediu de şomeri din Cluj în cele 10 luni este de 30,77 mii

4.
10

∑ z (t ) ⋅ z(t − 1)
i =1
Iz = 10
=
∑ [ z(t − 1)]
i =1
2

26,505 ⋅ 26,486 + 26,739 ⋅ 26,505 + .... + 35 ⋅ 34,98


= = 1,03
26,486 2 + 26,5052 + .... + 34,98 2

În primele 10 luni, numărul de şomeri a crescut în medie de 1,03 ori de la o lună la alta.
R z = I z − 1 = 1,03 − 1 = 0,03 = 3%
Numărul total de şomeri a crescut în medie cu 3% de la o lună la alta.
z(10) − z(1)
5. ∆ z = = 0,945
9
Numărul total de şomeri a crescut în medie cu 0,954 mii persoane de la un an la altul.

z(2) 26,505
6. I 2z / 1 = = = 1,007
z(1) 26,486

Numărul total de şomeri din judeŃul Cluj a crescut de 1,007 ori în luna a doua faŃă de prima.

z(3) 26,739
I 3z / 1 = = = 1,0095
z(1) 26,486
z(4 ) 28,167
I z4 / 1 = = = 1,063
z(1) 26,486
z(5) 29,154
I 5z / 1 = = = 1,1
z(1) 26,486

7. Numărul total de şomeri z(t) depinde de factorii de influenŃă astfel:


z(t) = x(t) + y(t) + w(t)

x (4) + y(4) + w (4)


I z4 // 1x (P ) = = 1,036
x(1) + y(4) + w (4)
Numărul total de şomeri ar fi crescut de 1,036 ori în luna 4 faŃă de luna 1 datorită modificării
numărului de şomeri muncitori.

x (4) + y(4) + w (4)


I z4 // 1y (P ) = = 1,023
x (4) + y(1) + w (4)

Numărul total de şomeri ar fi crescut de 1,023 ori în luna 4 faŃă de luna 1 datorită modificării
numărului de şomeri cu studii medii.

x(4) + y(4) + w (4)


I z4 // 1w (P ) = = 1,0014
x(1) + y(4) + w (1)

Numărul total de şomeri ar fi crescut de 1,0014 ori în luna 4 faŃă de luna 1 datorită modificării
numărului de şomeri cu studii superioare.

Problema 6

EvoluŃia numărului de contracte de vânzare încheiate de o societate în zilele lucrătoare într-o

anumită perioadă a fost următoarea:

 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
Y :  
 20 21 22 21 19 21 22 24 23 22 23 24 25 24 23 

Se cere:
1. TendinŃa mărimii analizate (dacă se constată prezenŃa factorilor sezonieri desezonalizaŃi serie).
2. Previziunea mărimii pe următoarele 5 zile.
Rezolvare:
1. Pentru a determina tendinŃa, trebuie să reprezentăm cronograma în vederea stabilirii prezenŃei
factorilor sezonieri:

 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
Y :  
 20 21 22 21 19 21 22 24 23 22 23 24 25 24 23 

30
24 25 24
25 22
21 21 21
23 24
20 23 23
22 22
20 19
15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

După cum se observă din grafic, există factori sezonieri, tendinŃa fiind crescătoare. Deci, variaŃia

numărului de contracte este de forma:

y(t) = T(t) + S(t) + ε(t)

unde: T(t) – tendinŃa


S(t) – componenta sezonieră
ε (t) – factori neesenŃiali

Ne organizăm datele astfel:

Ziua I II III IV V
Săpt.
1 20 21 22 21 19
2 21 22 24 23 22
3 23 24 25 24 23

Folosind procedeul mediilor mobile calculăm seria desezonalizată după relaŃia:

Y11 + Y12 + Y13 + Y14 + Y15


Y13' =
5
Y + Y13 + Y14 + Y15 + Y21
Y14' = 12
5
.
.

Y31 + Y32 + Y33 + Y34 + Y35


Y33' =
5
Ziua I II III IV V
Săpt.
1 - - 20,6 20,8 21
2 21,4 21,8 22,4 22,8 23,2
3 23,4 23,6 23,8 - -

Calculăm coeficienŃii de sezonalitate:

Ziua I II III IV V
Săpt.
1 - - 1,07 1,01 0,90
2 0,98 1,01 1,07 1,01 0,95
3 0,98 1,02 1,05 - -
K 0,98 1,015 1,063 1,01 0,925

Yts
K ts =
Yts'
K 2 I + K 3I
KI =
2
.
.
.
.
K 1V + K 2V
KV =
2

 1 2 3 4 5 6 7 8 9 10 11 
Y('t ) :  
 20,6 20,8 21 21,4 21,8 22,4 22,8 23,2 23,4 23,6 23,8 

25
24

23 23,6 23,8
23,4
23,2
22,8
22 22,4
21 21,8
21,4
20 20,6 20,8

19
1 2 3 4 5 6 7 8 9 10

Din grafic se observă că tendinŃa cea mai probabilă este o dreaptă. Deci:
T(t) = a + b·t
2
Punând condiŃia ca: M[Y (t ) − T(t )] =minim, obŃinem:

a = M [ y(t ] − bM (t )
a + bM (t ) = M [ y (t )] 
 ⇔ M [ y (t ) ⋅ t ] − M [ y (t )] ⋅ M (t )
b =
2
aM (t ) + bM (t ) = M [ y (t ) ⋅ t ] M (t 2 ) − [M (t )]
2

1 + 2 + ... + 11
M (t ) = =6
11
1 2 + 2 2 + ...112
M (t 2 ) = = 4,61
11
20,6 + 20,8 + ... + 23,8
M ( y(t )) = = 22,25
11
1 ⋅ 20,6 + 2 ⋅ 20,8 + ... + 11 ⋅ 23,8
M ( y(t ) ⋅ t ) = = 137,07
11
137,07 − 22,25 ⋅ 6
b= = 0,357
46,1 − 36
a = 22,25 – 0,357 · 6 = 20,108

T(t) = 20,108 + 0,357 t

2. Previziunea valorilor lui Y


Y4PI = T (14) ⋅ K I = (20,108 + 0,357 ⋅ 14) ⋅ 0,98 = 24,6 ≈ 25
Y4PII = T (15) ⋅ K II = (20,108 + 0,357 ⋅ 15) ⋅ 1,015 = 25,8 ≈ 26
Y4PIII = T (16) ⋅ K III = (20,108 + 0,357 ⋅ 16) ⋅ 1,063 = 27,44 ≈ 27
Y4PIV = T (17) ⋅ K IV = (20,108 + 0,357 ⋅ 17 ) ⋅ 1,01 = 26,4 ≈ 26
Y4PV = T (18) ⋅ K V = (20,108 + 0,357 ⋅ 18) ⋅ 1,925 = 24,54 ≈ 25

Problema 7

O agenŃie imobiliară doreşte să dispună de o funcŃie cu ajutorul căreia să poată evalua rapid valoarea
de piaŃă a apartamentelor. Pentru aceasta, are la dispoziŃie o bază de date cuprinzând 30 de
apartamente observate în raport cu variabilele:
Y = preŃul de vânzare în mii euro
X 1 = suprafaŃa în metri pătraŃi
X 2 = numărul de camere
X 3 = finisaj*nr.camere. Se calculează prin înmulŃirea gradului de finisare (0 pentru nefinisat, 1
pentru semifinisat şi 2 pentru finisat) cu numărul de camere.
Nr.crt. Y X1 X2 X3

1 15,3 22 1 2
2 42,0 74 4 4
3 13,0 21 1 1
4
20,0 32 2 4
5
25,8 52 3 0
6
46,6 88 4 4
7 24,7 48 2 0
8 18,9 35 1 0
9 41,5 78 3 6
10 47,5 80 4 8
11
24,0 45 2 0
12
22,3 39 2 2
13
33,5 68 3 0
14
20,7 42 1 0
15 49,5 92 4 4
16 26,6 50 2 0
17 16,0 26 1 1
18
32,7 60 3 3
19
38,1 64 3 6
20
15,1 28 1 0
21
15,6 30 1 1
22 39,8 83 4 0
23 27,0 44 2 4
24 35,0 71 3 0
25
17,3 28 1 2
26
25,5 49 2 2
27
25,0 46 2 2
28
14,5 22 1 1
29 39,5 65 3 6
30 41,5 69 3 6

Se cere:
1) StudiaŃi grafic existenŃa şi forma legăturii dintre preŃ şi fiecare din variabilele dependente.
2) CalculaŃi parametrii funcŃiei liniare multiple dintre preŃ şi toate variabilele explicative.
3) Este reprezentativă această funcŃie ?
4) Să se facă câteva simulări ale valorii de piaŃă a apartamentelor pentru diferite valori ale
variabilelor explicative.
5) ComparaŃi reprezentativitatea funcŃiei obŃinute cu a funcŃiilor de regresie simple.

Rezolvare

1) Graficul care ne poate indica existenŃa sau forma legăturii este diferit în funcŃie de natura variabilei
explicative: discretă sau continu ă.

a) Legătura dintre preŃ şi suprafaŃă. Deoarece suprafaŃa este o variabilă continu ă, putem construi norul
de puncte.

50
45
40
35
pret (mii euro)

30
25
20
15
10
5
0
0 20 40 60 80 100
suprafata (mp)

Se observă că legătura există şi este liniară.

b) Legătura dintre preŃ şi numărul de camere. Norul statistic se prezintă astfel:

50

45

40

35
pret (mii euro)

30

25

20

15

10

0
0 1 2 3 4
numar camere
Dacă forma legăturii nu pare evidentă prin norul de puncte se poate utiliza şi un grafic care foloseşte
mediile condiŃionate, din grupe.
Procedând analog şi pentru variabila rămasă, concluzionăm că putem modela legăturile dintre
preŃ şi fiecare din variabile prin funcŃii liniare.

2) FuncŃia de regresie liniară multiplă se scrie :


Y = a1 X 1 + a 2 X 2 + a 3 X 3 + ε
Prin aplicarea metodei celor mai mici patrate ajungem la ecuaŃia scrisă sub formă implicită :

M 00 [Y − M (Y )] + M 01 [X 1 − M ( X 1 )] + M 02 [ X 2 − M ( X 2 )] +
+ M 03 [X 3 − M ( X 3 )] = 0

Scriem matricea de variaŃie şi covariaŃie :

 m00 m01 m02 m03 


 
 m11 m12 m13 
M ( 4) =
m22 m23 
 
 m33 

m00 = σ Y2 = 121,55

m01 = M (YX 1 ) − M (Y ) M ( X 1 ) = 227

m02 = M (YX 2 ) − M (Y ) M ( X 2 ) = 11,196

m03 = M (YX 3 ) − M (Y ) M ( X 3 ) = 16,229

m11 = σ X2 1 = 443

m12 = M ( X 1 X 2 ) − M ( X 1 )M ( X 2 ) = 21,39
m13 = M ( X 1 X 3 ) − M ( X 1 )M ( X 3 ) = 23,19

m22 = σ X2 2 = 1,143

m23 = M ( X 2 X 3 ) − M ( X 2 ) M ( X 3 ) = 1,2767

m33 = σ X2 3 = 5,41

121,55 227 11,196 16,229 


 
 443 21,39 23,19 
M (4) =
1,143 1,2767 
 
 5,41 

Calculăm complemenŃii algebrici:

M 00 = 193,92

M 01 = −82,58

M 02 = −135,4

M 03 = −195,79

EcuaŃia de regresie devine :

193,92[Y − M (Y )] − 82,58[ X 1 − M ( X 1 )] − 135,4[ X 2 − M ( X 2 )] −


− 195,79[ X 1 − M ( X 3 )] = 0

Prin înlocuirea valorilor medii, avem:

193,92[Y − 28,48] − 82,58[ X 1 − 51,7 ] − 135,4[ X 2 − 2,3] −


− 195,79[ X 1 − 2,3] = 0
După efectuarea calculelor se obŃine ecuaŃia sub formă explicită :

Y = 2,559 + 0,4258 X 1 + 0,698 X 2 + 1,01X 3 + ε

3) Reprezentativitatea funcŃiei o apreciem prin coeficientul de corelaŃie liniară multiplă:

det M ( 4) 131,75
RY , X1X 2 X 3 = 1 − = 1− = 0,997
m00 M 00 121,55 ⋅ 193,92
deci funcŃia este foarte reprezentativă.

4) Pentru un apartament de 65mp, cu 3 camere, semifinisat :

X 1 = 66 X2 = 3 X3 = 3

Y (66,3,3) = 2,559 + 0,4258 ⋅ 66 + 0,698 ⋅ 3 + 1,01 ⋅ 3 = 35,8 mii euro

Rezultatul este foarte realist dacă privim baza de date iniŃială.

5) Rezolvarea acestui punct rămâne la latitudinea cititorului.

S-ar putea să vă placă și