Sunteți pe pagina 1din 120

STATISTIC ECONOMIC

NOTE DE CURS

CAPITOLUL 1
STATISTICA - INSTRUMENT DE CUNOATERE A
FENOMENELOR DE MAS

Conceptul de statistic, scurt istoric


Statistica este stiinta care se ocupa cu descrierea si analiza numerica a
fenomenelor de masa, dezvaluind particularitatile lor de volum, structura, dinamica,
conexiune, precum si regularitatile sau legile ce le guverneaza [Trebici, V., 1985].
Exista un mare numar de definitii ale statisticii fapt care are mai multe explicatii;
istorice - statistica s-a constituit la confluenta mai multor orientari si discipline, dar avand
la origine un caracter social; metodologice - statistica incorporeaza o serie de metode in
care predomina cele cantitative, cu fundamentarea epistemologica corespunzatoare;
aplicative - prin generalitatea metodelor sale, statistica se aplica in cele mai variate
domenii, de la astronomie la societate, de la microcosmos la macrocosmos in natura si
societate, de la fizica statistica pana la statistica sociala. Trebici, V., 1985\.
O definitie sau alta, staruie fie asupra unei faze din demersul metodologic, fie asupra unui
domeniu restrans, fie asupra unui grup de metode, asupra teoriei sau dimpotriva a
aplicatiilor.
In prezent statistica dispune de un corp de metode a caror putere de cunoastere
este verificata in variate domenii si de o teorie generala in continua dezvoltare. Cultura
statisticii devine tot mai mult o componenta din cultura generala a omenirii
contemporane, iar gandirea statisticii - o modalitate stiintifica indispensabila pentru
analiza si interpretarea unor clase foarte largi de fenomene.

-1-

Rezultat al unui indelungat proces, statistica se prezinta cu un corp comun de


notiuni organizat in jurul conceptului de probabilitate, de metode stiintifice, cu
fundamentare epistemologica explicita si cu o varietate de domenii de aplicare,
acoperind practic natura si societatea.
Astazi, statistica constituie un puternic instrument de cunoastere a lumii
inconjuratoare. Marea majoritate a disciplinelor imprumuta de la statistica modelele si
procedeele acesteia, indispensabile de altfel indeplinirii rolului acestora. Trebuie
mentionat insa marele pericol la care aceste discipline pot fi supuse in cazul folosirii
necorespunzatoare a metodelor si procedeelor statistice.
Analiza si cunoasterea fenomenelor si proceselor social economice se poate
realiza numai ca urmare a unei observari riguroase si metodice, in cursul careia ele pot fi
masurate. In cadrul operatiei de modelare a fenomenelor si proceselor are loc un proces
de simbolizare si abstractizare a lor in vederea analizarii sub aspect cantitativ. Analiza
cantitativa constitute o faza premergatoare analizei calitative. Testarea modelelor
construite se realizeaza prin intermediul operatiei de simulare. Pe parcursul tuturor
fazelor de construire si testare a modelelor, statistica este mereu prezenta in campul
cercetarii stiintifice fiind solicitata de a lua decizii pe baza metodelor si procedeelor pe
care le pune la dispozitie. Modelul construit si testat vine in ajutorul statisticii sa
aprofundeze cunoasterea fenomenelor si proceselor.
Modelarea matematica a castigat tot mai mult teren, dobandind o importanta
deosebita, odata cu intensificarea aplicarii modelelor statistice. Culegerea si organizarea
datelor rezultate din observari statistice constituie etapa premergatoare elaborarii unui
model. In acest mod, modelul realizat va reprezenta o macheta a realitatii, alcatuita pe
baza datelor din observarea statistica. Pe buna dreptate, modelarea este considerate o
modalitate de cunoastere a realitatii inconjuratoare.
Organizarea culegerii, transmiterii si receptionarii informatiilor in cadrul unui
sistem economic constituie obiectivele esentiale ale unui sistem informational. Un sistem
informational este alcatuit din mai multe circuite informationale, unde fiecare in parte
trebuie sa includa operatii de culegere, transmitere neperturbata a datelor si receptionarii
acestora in scopul folosirii lor. Trecerea de la prelucrarea manuala la cea automatizata a
tuturor fazelor din cadrul sistemului informational, adanceste procesul de cunoastere a

-2-

realitatii, permitand asimilarea sistemului informational unui flux tennologic


informational, prin transformarea lui intr-un sistem cibernetic. Organizarea circulatiei
informatiei intr-un sistem in conformitate cu principiile sistemelor cibernetice, constituie
un suport stiintific in abordarea gestiunii eficiente a acestuia. Avand in vedere natura
nedeterminista a majoritatii elementelor componente dintr-un sistem cibernetic, studierea
stabilitatii acestora se realizeaza apeland tot la statistica. Studii de reglare si echilibru
intr-un sistem cibernetic se pot aborda numai pe baza unor observari statistice realizate
metodic care ne permit sa construim modelul matematic in conformitate cu realitatea.
`

Informatica, prin aparatul sau, se implica tot mai mult in toate fazele de

vehiculare si prelucrare a informatiilor din cadrul sistemelor informationale, conducand


in acest mod la un salt calitativ important, cu consecinte semnificative si asupra statisticii.
Calculatoarele electronice, prin puterea lor de calcul, conduc la o noua viziune cu
privire la functiile statistice, precum si la modalitatile de realizare a acestor functii.
Realizarea automata si in regim interactiv a tuturor metodelor si procedeelor
algoritmizabile din statistica, cu ajutorul calculatorului nu afecteaza cu nimic obiectul si
metoda statisticii. Calculatorul electronic nu constituie decat un instrument de calcul,
degajand statistica de volumul mare de calcule. In aplicatiile practice implementate cu
ajutorul calculatorului specialistul este absolvit in totalitate de manipularea datelor cat si
a operatiilor cu acestea, concentrandu-se in exclusivitate asupra interpretarii rezultatelor
intermediare si finale.
Statistica informationala, care a fost denumita asa de academicianul Octav
Onicescu, si-a gasit aplicatii practice in diverse domenii. Studierea sistemelor in raport cu
informatia continuta in acestea, a permis o abordare sistemica si mai bine fundamentata
matematic a realitatii. Teoria matematica a informatiei formuleaza legile cele mai
generale cu privire la comenzile, controlul si comunicatiile dintr-un sistem, stabilind in
acelasi timp principiile de codificare, prelucrare, pastrare si transmitere a informatiei de
care statistica beneficiaza din plin. Initiatorul teoriei matematice a informatiei a fost
Claude Shannon, care s-a bazat pe teoria probabilitatilor. Teoria initiata de Shannon a
permis reducerea perturbatiei care influenteaza transmiterea informatiei.
Fiind un proces complex de cunoastere, judecata si actiune, managementul se
concretizeaza prin operatii de informare, analiza si control, punctul esential constituindu-l

-3-

momentul luarii deciziei. Toate aceste operatii folosesc metodele si procedeele statisticii
incepand cu culegerea (observarea) datelor si incheind cu deducerea concluziilor necesare
luarii deciziilor. Aceasta a permis conturarea unei discipline denumita teoria deciziei,
avand drept scop fundamentarea stiintifica a procesului decizional. Deoarece teoria
deciziei face apel si la modele deterministe, aceasta se integreaza intr-un domeniu mai
larg privind matematica aplicata si anume in cercetarea operationala. Cercetarea
operationala este considerata un instrument de conducere nationala a proceselor si
fenomenelor cu un inalt grad de complexitate. Aceasta disciplina integreaza in cuprinsul
sau metode si procedee statistice cat si o multime de tehnici de natura stiintifica, tehnica
si de culegere si prelucrare a informatiei.
Decizii in situatii de risc constituie un alt domeniu in care statistica se aplica.
Diversele variante de dezvoltare a unui fenomen sau proces, fie social sau economic,
presupune descompunerea acestuia intr-o multime de evenimente care formeaza un camp
complet de evenimente. Anticiparea celei mai plauzibile variante de dezvoltare a
fenomenului presupune cunoasterea distributiei de probabilitate asociata acestuia. Acest
lucru nu este posibil fara o observare metodica a evolutiei fenomenului in timp si ca
urmare o determinare a legii de probabilitate pe care o urmeaza.
Aflarea distributiei de probabilitate, utilizand modele si procedee statistice,
permite a aprecia gradul de risc la care este supusa o actiune sau alta.
In marketing statistica se regaseste in S.S.D.M. (sistemul suport al deciziilor de
marketing), ca acesta fiind compus din ,,Banca statistica" si ,,Banca de modele". SSDM
este un ansamblu coordonat de date, sisteme, instrumente si tehnici, inzestrat cu
tehnologia necesara ce ajuta o organizatie sa culeaga si sa interpreteze informatiile
relevante referitoare la activitatea sa si la mediul in care opereaza facand din acesta
temelia actiunilor de marketing. [Kotler.Pk, 1997}.
Pe baza celor prezentate se poate sublinia inca o data rolul si importanta
cunoasterii metodelor si procedeelor puse la dispozitie de statistica in procesul
cunoasterii. Nu este lipsit de importanta aportul statisticii nici in domenii ca: medicina,
biologie, fizica, chimie, stiinte juridice etc. Frecvente sunt cazurile in care studii
intreprinse in aceste domenii trag concluzii care au la baza o multime de date rezultate in
urma unor observari statistice, implicand nemijlocit modele ale inferentei statistice.

-4-

Ronald Fisher a remarcat: ,,Catre statisticieni ne indreptam pentru a raspunde la


problemele cele mai serioase puse de marile aventuri ale epocii noastre. De fiecare data
cand se intreprinde ceva important, statisticienii sunt in culise. In toate cercetarile
stiintifice de baza, ei sunt cei care elaboreaza planurile de experiena sau observatii si tot
la ei se recurge pentru a analiza rezultatele pentru a evalua constatarile si pentru a separa
faptele clar demonstrate de cele ce mai cer confirmarea" [Trebici, V., 1985\.
Cercetarile stiintifice simt necesitatea unei ,,escorte statistice" in doua momente
fundamental ale cercetarii: momentul de inceput legat de culegerea si prelucrarea datelor
si in momentul aplicativ, de verificare a teoriilor pe calea confruntarii cu realitatea.
Multitudinea de domenii in care statistica se aplica i-a permis lui M.G. Kendall sa spuna
ca ,,Statistica, in sensul cel mai larg, este matricea oricarei stiinte experimentale".
Statistica, in contextul celorlalte stiinte, s-a confruntat ca discipline de sine
statatoare, urmand o traiectorie care leaga practica de teorie. Preocupari de natura
statistica, prin abordari variate a diverselor fenomene, se pierd in vechimea istoriei. Atat
in Grecia antica, dar mai cu seama in imperiul roman, investigatiile arheologice au scos la
iveala o serie de date care privescinventarierea bunurilor, a resurselor umane, descrierea
geografica si politica a diverselor state.
Toate aceste preocupari, indiferent de natura lor, au constituit o consecinta a
necesitatii practice, executandu-se in mod empiric si fara respectarea unor criterii
riguroase. Beneficiari ai acestor date erau organele fiscale, militare si cele administrative,
direct interesate in evaluarea potentialului uman si material a diverselor forme de
organizare teritoriala sau statala. Aceste date serveau in principal nevoilor practice de
orientare.
Interesele de ordin stiintific nu au intarziat prea mult sa apara, obligand statistica
sa paraseasca stadiul de statistica practica. Incepea sa se impuna cunoasterea unor
fenomene, referitor la care se cereau o multitudine de date. Ca urmare, apare necesitatea
cunoasterii unor tehnici care sa permita desprinderea unor concluzii fundamentale pe
baza datelor inregistrate. In faza incipienta de confruntare a statisticii, aceasta se
marginea la descrierea statului, expunerea situatiei geografice, economice si politice.
Acest mod de abordare a statisticii cunoscut sub numele de ,,descrierea statului"
a predominat pana in sec. al 17-lea si al 18-lea cand a atins punctul culminant,

-5-

concordand cu constituirea a in Germania a unei scoli, cunoscuta sub denumirea de


scoala descriptiva germana.
In conformitate cu normele teoretice, care erau specifice universitatilor germane,
descrierea statului s-a conturat ca o disciplina cu obiect propriu de predare. Ulterior,
aceasta disciplina nascuta din practica a primit numele de statistica, devenind un obiect
de studiu favorit in Germania. Termenul de statistica definit in spiritul scolii din
Gottingen, a fost preluat de multi statisticieni recunoscuti ai epocii respective.
Reprezentantii scolii de statistica din Germania, s-au ridicat in oarecare masura
peste orientarea pur descriptiva a inaintasilor, studiile care aveau drept obiectiv,
descrierea statului inregistrand o noua dimensiune si anume cea numerica. In acest nou
context, de imbogatire prin componenta numerica, statistica nu s-a schimbat din punct de
vedere a continutului, ea continuand sa ramana o discipline orientata cu preponderenta
spre descrierea fenomenelor si nu spre cautarea unor legi, ramanand o disciplina
caracterizata de un mod de prezentare preponderent verbal. In acest context au fost
elaborate lucrari cu privire la descrierea statelor in diferite tari europene, constituind
astazi valoroase surse de informatie.
In Moldova, cea mai de seama lucrare este ,Descrierea Moldovei" a lui Dimitrie
Cantemir. Aceasta lucrare, cu un pronuntat caracter monografic in plan geografic, politic,
social si cultural, s-a impus in mod deosebit lumii europene din acea perioada,
desemnandu-l pe autor in randul fruntasilor statisticii descriptive europene.
In perioada de avant a statisticii descriptive a statului, in Anglia si in afara universitatilor,
apare un curent statistic nou, cunoscut sub numele de aritmtlica politica. Noul curent din
statistica se caracterizeaza prin analiza datelor de observatie prin procedee matematice,
relevarea regularitatilor in fenomenele social-economice, formulari si incercari de
previzionare a unor fenomene.
Implicarea aparatului matematic in descoperirea legitatilor care caracterizau
fenomenele constituia un real progres, anticipand aparitia statisticii moderne.
Reprezentantii de seama a noului curent in statistica au insistat in mod deosebit
prin lucrari in domeniul demografiei, deoarece vedeau in studiul populatiei izvorul
bogatiei si puterii Angliei. Merita sa amintim in acest sens pe John Graunt, William Petty
si Edmund Malley.

-6-

J. Graunt, analizand cu atentie registrele de nasteri si decese din Londra, a


incercat sa gaseasca legitatile cresterii populatiei, a echilibrului numeric dintre sexe, a
fertilitatii, mortii etc. Studiile lui Graunt relevau, pentru prima oara, preponderanta
nasterilor masculine in raport cu nasterile feminine (107 baieti la 100 fete), calculand
primele rate de mortalitate pe grupe de varsta, alcatuind si o rudimentara tabela de
mortalitate.
W. Petty, prin lucrarile sale, foloseste estimarile cantitative in compararea
potentialului uman si economic al diferitelor state.
E. Halley a fost un reprezentant de seama a scolii statistice din acea vreme din
Anglia, abordand in lucrarile sale subiecte legate de estimarea populatiei catorva state,
bazandu-se pe criterii ceva mai rationale decat cele adoptate anterior, cat si alcatuirea
primei tabele complete de mortalitate.
La promovarea principiilor aritmeticii in investigarea fenomenelor economice sau evidential in mod deosebit alti doi reprezentanti ai scolii engleze: Devanant si King.
Ultimul s-a dedicat in mod special calculelor privind veniturile statului pe calea
impozitelor, de asemenea incercand sa stabileasca marimea capitalurilor de care dispunea
Anglia in sec. al 17-lea, pierderile suferite in urma razboaielor, incendiilor, epidemiilor.
Influenta aritmeticii politice engleze s-a facut simtita si in alte tari, conturandu-se
un curent al aritmeticii politice europene. Aritmetica politics s-a impus in lupta cu scoala
statisticii descriptive din Germania, prin intermediul lui J.P. Sussmlich. Lucrarile sale se
remarca in special prin: cautarea explicatiei fenomenelor vietii umane si indicarea legilor
ce le guverneaza, corelarea fenomenelor demografice si economice, examinarea
fenomenelor in dinamica, identificarea regularitatilor in volumul de date rezultate din
observatii etc.
In consecinta, se poate afirma ca la sfarsitu! sec. al 18-lea, in statistica se
prefigurau doua curente: primul curent corespunzator caruia statistica era
inteleasa ca o descriere empirica si verbala a caracteristicilor statului (statistica
descriptiva) si al doilea curent conform caruia statistica trebuie sa se dedice analizei
fenomenelor sociale, in cautarea de legitati intemeiate cu regularitate pe observatii si
calcule numerice (aritmetica politica).

-7-

Statistica, prin curentele sale, castiga teren tot mai mult, iar descrierile statistice
devin preocupari de baza in institutiile publice. Aritmetica politica, sub aspect conceptual,
capata o noua dimensiune odata cu inventarea calculului probabilitatilor. Aceasta noua
ramura a matematicii, avea sa indeplineasca misiunea fundamentarii stiinfifice a
preocuparilor statistice de pana atunci. Bernoulli si Laplace aveau sa fie primii care au
utilizat modelele teoriei probabilitatilor in studiul statistic al fenomenelor economice si
sociale. Bernoulli formuleaza ,,legea numerelor mari", deschizand drumul aplicarii
calculului probabilitatilor in economie. Laplace s-a preocupat de studierea fenomenelor
dependente de diversi factori complecsi de actiune, prefigurand utilitatea acestui calcul si
in abordarea de ansamblu a fenomenelor sociale.
Un alt reprezentant de seama al calculului probabilitatilor a fost Gauss, care a
definit legea de repartitie normala. In aceeasi perioada, Fourier a publicat un numar de
studii"despre aplicarea matematicii in investigatii demografice, iar Poisson descopera
legea de repartitie a evenimentelor rare.
Gandirea probabilistica avea sa se consolideze in statistica in secolul al 19-lea,
asigurandu-i progresul si renumele de care se bucura astazi in intreaga lume. Un
reprezentant de seama din aceasta perioada si care a dominat gandirea statistica a acestui
secol a fost matematicianul, astronomul si statisticianul belgian Adolphe Quatelet.
Conform teoriei acestui mare ganditor, diversele caractere fizice, intelectuale si
morale ale oamenilor, observati in masa, s-ar echilibra intr-o fiinta fictiva, ideala, dorita
de natura, dar neizbutita. Fiintele umane, conform teoriei ,,omului mediu", s-ar distribui
de-o parte si de alia a acestei fiinte ideale. Pentru a desprinde ce este general fiintei
umane, A. Quetelet presupune debarasarea omului de caracterele individuale ale sale care
nu sunt decat accidentale. Ideea de ,,om mediu" a constituit izvorul de inspiratie privind o
serie de notiuni si concepte noi din statistica, cum ar fi: repartitie, medie, dispersie,
observare de masa, regularitate etc. In conformitate cu teoria iui A. Quetelet, regularitatile
deduse ca urmare a unei observari de masa deriva din legi care sunt urmate de om atat in
ordinea fizica cat si in cea morala. Lui A. Quetelet i se atribuie, pentru prima oara, o
teorie sintetica a statisticii bazata pe principii, tehnici si procedee statistice.

Acesta

imprima statisticii noi directii de cercetare: cercetarea variatiei si a relatiilor cazuale in


masa fenomenelor, sesizarea regularitatilor, abordarea cu prioritate a fenomenelor vietii

-8-

umane etc. Conform teoriilor lui A. Quetelet, statistica defineste metode unice necesare
studierii fenomenelor bazate pe calculul probabilitatilor, endinta de ansamblu, dedusa pe
baza unui volum mare de observatii statistice. Legea statistica se poate pune in evidenta
numai daca se considera un numar suficient de mare de unitati statistice elementare ale
populatiei de studiat supuse observarii.
Legea numerelor mari, care constituie o expresie a legaturii dintre neccsitate si
intamplare, se verifica in colectivitati relativ mari si cuprinzatoare. In conformitate cu
aceasta lege, actiunea conjugata a unui numar mare de factori aleatori, in conditii bine
determinate, conduce la rezultate aproape independent de intamplare, dand astfel
posibilitatea ca necesitatea sa se realizeze. Referindu-ne la prima lege statistica
descoperita stim ca la nastere numarul baietilor intrece pe eel al fetelor, raportul initial
admis era de baieti 107; fete 100. Particularizand aceasta lege statistica la distributia pe
sexe a nascutilor in sanul fiecarei familii in parte, ar fi imposibil sa indicam ce fel de
raport exista, date fiind variabilele sale destul de numeroase si in acelasi limp importante
pentru diferite familii. O cercetare statistica care sa prezinte rezultate semnificative in
acest sens, trebuie intreprinsa pe mase indeajuns de mari de nasteri : insusi J. Bernoulli
care a dat acestei legi o forma matematica, a tinut sa mentioneze la vremea sa, ca sporirea
numarului observatiilor in scopul maririi gradului de siguranta a deciziei nu constituie
ceva nou si neobisnuit, deoarece omul indiferent de pregatirea sa stie ca sursa de reusita
referitor la o actiune a sa este cu atat mat mare, cu cat mai multe observatii sunt luate in
considerare.
Despre un inceput de organizare statistica in tarile romanesti nu poate fi vorba
decat din secolul al. XVIII-lea incoace. Prima scriere sau recensamant al locuitorilor pare
sa fi fost facuta de Constantin Mavrocordat, cu ocazia reformelor sale in Muntenia si
Moldova. Regulamentul organic (1831) introduce catagrafia sau recensamantul sistematic
si periodic. Din 7 in 7 ani trebuia sa se faca categrafia populatiei, dupa norme bine
stabilite, pentru a servi la ,,asezarea birului si la hotararea veniturilor tarii".
La 28 aprilie 1859, domnitorul Al. I. Cuza aproba infiintarea unui birou de
statistica in Tara Romaneasca, numind sef pe Dionisie Pop Marxian, iar la I iulie 1859
aproba infiintarea Directiei de Statistica din Moldova, sub conducerea lui Ion lonescu de
la Brad.

-9-

La 4 august 1862 cele dou3 organe de statistica se reunesc sub denumirea


Oficiului Statistic pentru Principatele Unite sub conducerea lui Dionisie Pop Martian.
Gandirea statistica romaneasca s-a aliniat in contextul amplu al curentelor statistice
existente in Europa. Reprezentantii statisticii romainesti au pastrat un contact permanent
cu preocuparile statistice din tarile Europei, aducandu-si contributia de seama atat la
promovarea statisticii teoretice si practice, cat si al organizarii ei institutionale. Cei mai
de seama reprezentati ai statisticii romanesti din acea perioada au fost Ion lonescu de la
Brad si Dionisie Pop Martian. Primul si-a prezentat punctul de vedere despre statistica in
lucrarea intitulata ,,Povaturi pentru catagrafia Moldovei" (1859). Statistica, in viziunea
lui I. I. de la Brad trebuie sa cuprinda doua parti: o prima parte care sa presupuna
culegerea datelor de observare, iar a doua parte sa implice aparatul matematic. Se
regaseste in aceste abordari metodologice, in linii mari, insusi demersul statistic modern,
format din doua etape: una descriptiva, alta inductiva, inferentiala..
In conceptia lui D. P. Marjian statistica trebuie sa studieze fenomenele naturale si
sociale, avand drept scop descoperirea legilor care le guvemeaza. Se evidentiaza
apartenenta sa la curentul de larga circulatie conform caruia obiectul de cercetare al
statisticii trebuie sa depaseasca granitele sferei fenomenelor sociale.
In spiritul statisticii descriptive europene si la noi in tara s-au scris lucrari
statistice, statistica figurand ca obiect de studiu in invatamantul romanesc. Un curs de
statistica a fost introdus in 1856 la Facultatea Juridica de la Academia Mihaileana din lasi
de catre Al. Papiu llarian, care avea drept obiect descrierea statelor componente ale
Europei sub aspect economic si social.
In 1860 apar Analele Statistice pentru cunoasterea Romaniei, in care se publica
lunar date privind statistica agricola, statistica vamilor, a miscarii populatiei precum si
studii cu caracter economic.
In 1918 este creat Institutul Social Roman, forma institutionalizata de cercetare
sociologica. Rezultatele au fost publicate sistematic in ,,Arhivele pentru stiinta si reforma
sociala", aparand primele cercetari statistice sub forma de monografii. [Bogdan, V.,
1995].

- 10 -

Un recensamant general al populatiei, cladirilor, intreprinderilor industriale si


comerciale are loc in 1930. Debutul Anchetei Bugetelor de Familie are loc in 1950, care
va deveni cercetare permanenta intre 1950-1994.
In 1964 are loc o reuniune stiinpfica cu tema ,,Anchetele selective", cand pentru
prima data in Romania sunt formulate principle proiectarii si utilizarii unui esantion
maitre .
Categoriile fundamentale ale statisticii -Concepte de baza

Populatia statistica reprezinta multimea elementelor simple sau complexe, de


aceeasi natura, care au una sau mai multe insusiri esentiale comune, proprii elementelor
cat si populatiei privita ca un tot unitar. \Florea I., 1998}
O populatie este finita daca include un numar determinat de elemente, dar ea
poate fi considerate drept reprezentativa a unei populatii teoretice infinite. Ca urmare
apare necesitatea de a delimita o populate in: continut, spatiu si timp. Se mai denumeste
si populafia univers.
Exemple de populatii statistice: multimea persoanelor dintr-o anumita tara, localitate,
zona etc. in anul t, multimea gospodariilor din Romania, la momentul t, multimea
consumatorilor unui produs, multimea societatilor producatoare sau concurente ale unui
produs, mullimea societatilor distribuitoare, angajatii unei societati, etc.
Se noteaza cu majusculele de la inceputul alfabetului: A, B, etc.
Unitatea statistica constituie elementul component, al populatiei statistice,
asupra caruia se va efectua nemijlocit observarea.
Unitatea statistica este purtatorul originar de informatie sau subiectul logic al informatiei
statistice. Datorita varietatii aspectelor sub care se poate prezenta in fapt, unitatea
statistica comporta o definitie precisa, care sa excluda prin posibilitate de interpretare
diferita de catre observatori si astfel orice eroare ce poate prejudicia valoarea
investigatiei.
In exemplele citate mai sus, unitatile statistice sunt: persoana, gospodaria,
consumatorul, societatea producatoare sau concurenta, societatea distribuitoare, angajatul
etc.
- 11 -

Se noteaza cu minusculele corespunzatoare majusculei ce simbolizeaza populatia


statistica, respectiv aL, b, etc..
Volumul populatiei reprezinta numarul unitatilor statistice care alcatuiesc
populatia statistica. Acesta poate fi finit sau infinit, in functie de tipul populatiei care
poate fi la fel finita sau infinita.
Se noteaza cu N, iar pentru o populate A, avem: A : { a
Esantion reprezinta o submultime a unei populatii statistice, constituita dupa
criterii bine stabilite. In raport cu procedeul de formare a esantionului avem esantioane
aleatoare si esantioane dirijate.
Esantionul aleator este format din unitatile statistice care rezulta printr-un
procedeu aleator: procedeul tragerii la sorti, tabelul cu numere intamplatoare, procedeul
extragerilor sistematice.
Esantionul dirijat este constituit pe baza unor informatii auxiliare existente la
nivelul populatiei studiate sau lasand liber pe anchetator sa aleaga unitatile respectand
doar realizarea structurii esantionului in functie de criteriile stabilite.
Se noteaza cu n.
Majoritatea studiilor au ca suport datele provenite de la nivel de esantion, de aici
importanla constituirii acestuia si implicit, apelarea la inferenta statistica, pentru a estima
parametrii la nivelul populatiei univers.
Variabila statistica reprezinta o insusire sau o trasatura comuna tuturor unitatilor
unei populatii. Nivelul inregistrat de o variabila statistica la o unitate oarecare a
populatiei se numeste realizare sau starea variabilei. \FloreaL, 1998\.
In general se noteaza cu majusculele de la sfarsitul alfabetului, X, Y, Z etc. Daca
se noteaza cu X o variabila statistica oarecare, atunci cu x, x2,..-, XN se vor nota starile
variabilei respective.
Variabilele statistice se clasifica in raport cu natura, modul de exprimare si modul
de variatie.
a) Dupa natura lor variabilele statistice pot fi atributive, de timp si de spatiu.

Variabila atributiva exprima un atribut sau insusire esentiala (alta, decat timpul sau

spatiul) unitatilor populatiei;

- 12 -

Variabila de timp ne arata timpul in care au luat fiinta unitatile populatiei sau

perioada de timp in care au existat (exista);

Variabila de sptiu ne arata spatiul in care exista sau au luat nastere unitatile populatiei.

b) Dupa modul de exprimare a starilor deosebim:

Variabila cantitativa este variabila ale carei stari se exprima prin valori mimerice. Se

mai numeste si variabila metrica.

Variabila calitativa este variabila ale carei stari se exprima prin cuvinte sau coduri. Se

mai numeste variabila nominala (starile se exprima prin cuvinte) sau variabila ordinala
(starile se exprima prin coduri).
c) dupa modul de variatie variabila cantitativa poate fi:

Variabila discreta este acea variabila care, in intervalul sau de definite inregistreaza

eel mult valori rationale, variatia are loc in salturi.


Variabila continua este acea variabila care poate lua orice valoare reala din intervatul
sau de variatie.
Exemple de variabile statistice relativ la populatia formata din multimea consumatorilor
unui produs:
- varsta: variabila atributiva, cantitativa, continua
X={x1 = [l5-20)[20-30)... }
- frecventa de cumparare: variabila atributiva calitativa
Y = { y - foarte rar; y2 - rar, ... }
- numar de sortimente cumparate relativ la produsul analizat: variabila atributiva,
cantitativa, discreta:
Z={z1 = l; z 2 = 2,...}
- localizarea magazinelor de unde cumpara: variabila de spatiu , calitativa
S= {s1-cartierul M sau s2-strada P,... }
- data ultimei cumparari a produsului analizat: variabila de timp,
T = {t1 = 27.01.2002; t2 = 24.02.2002,... }
Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei
multimi finite sau infinite, cu o anumita probabilitate, rezultata dintr-o functie asociata

- 13 -

variabilei, numita lege de probabilitate.Ca si variabila statistica, variabila aleatoare in


raport cu valorile sale poate fi discreta sau continua.
In timp ce o variabila aleatoare inregistreaza valori la intamplare, variabila
statistica constituie o insusire certa a unitatilor statistice din populatie. Valorile unei
variabile aleatoare sunt probabile si in stransa legatura cu un anumit experiment. Starile
unei variabile statistice nu sunt probabile, ele cuantifica o trasatura proprie fiecarei unitati
din populatie.
Observarea statistica consta in identificarea unitatilor populatiei si inregistrarea
starilor variabilelor in raport cu care este studiata. Ansamblul starilor variabilelor
rezultate prin observare se numesc statistici.
Dupa gradul de cuprindere a populatiei statistice, observarea statistica este de
doua feluri: totala si partiala.
Observarea totala este acel tip de observare statistica in care are loc inregistrarea tuturor
unitatilor care fac parte din populatie statistica supusa studiului. Recensamantul
populatiei Romaniei este un exemplu de observare totala.
Observarea partiala presupune observarea si inregistrarea unui anumit numar de unitati
din populatie, alese dupa criterii bine definite.
In cercetarea statistica a unei populatii punctul de pornire il poate constitui fie
statistici exhaustive rezultate prin observarea populatiei univers , fie statisticile rezultate
din observarea partiala a unui esantion A A, in ambele cazuri scopul final fiind acelasi obtinerea de informatii la nivelul populatiei univers A.
In primul caz, ansamblul de tehnici folosite in prelucrarea statisticilor se bazeaza
pe matematica delerminista si au un caracter relativ simplu. Acest demers al cercetarii
statistice constituie obiectul asa numitei statistici descriptive.
In al doilea caz tehnicile cantitative utilizate se bazeaza pe teoria probabilitatilor,
permitand extinderea informatiilor de la esantion la populatia univers inductie
statistica. Acest demers constituie obiectul asa numitei statistici inferentiale.
Seria statistica

- 14 -

Seria statistica este o constructie care reda fie distributia unei populatii in raport
cu una sau mai multe variabile, fie variatia unei marimi in timp, in spatiu sau de la o
categorie la alta.
Seriile statistice se clasifica in raport cu mai multe criterii, astfel:
1. In raport cu numarul variabilelor

Serii statistice unidimensionale, au la baza o singura variabila;

Serii statistice multidimensionale, care au la baza doua sau mai multe variabile.

2. Dupa natura variabilelor deosebim:

Serii aiributive, care au la baza variabile atributive;

Serii cronologice (de timp sau istorice), care au la baza variabile de timp;

Serii de spatiu sau teritoriale, care au la baza o variabila de spatiu.

3. Dupa modul de exprimare a starilor variabilei deosebim:

Serii calitative, care au la baza variabile calitative;

Serii cantitative, care au la baza variabile cantitative si care dupa modul de variatie a

variabilei pot fi: discrete (cand variabila este discrete) si continue (cand variabila este
continua).
4. In raport cu natura indicatomlui din care este alcatuita seria, avem:

Serii de frecventa sau serii de distributie (repartitie);

Serii de variatie.
Seria statistica redand distributia populatiei in raport cu una sau mai multe

variabile constituie o descompunere a acesteia intr-un numar R de clase. O astfel de serie


este formata in exclusivitate din frecvente (absolute cumulate sau necumulate, relative
cumulate sau necumulate) si de aceea se numesc serie de frecventa, de distributie sau de
repartitie. Prescurtat se mai foloseste si denumirea de repartitie statistica sau distributie
statistica.
Seria statistica ce reda variaria unei marimi in timp, in spatiu sau de la o categorie
la alta se numeste serie de variatie.
Seria statistica de repartitie
Conform definitiei de mai sus, prin aceasta serie se distribuie unitatile

- 15 -

unei populatii statistice in raport cu una sau mai multe variabile.


Fie o serie statistica unidimensionala avand la baza variabila X,
respectiv:

i
2
R
1

X:
N1 N 2 N i N R

Ni este frecventa absoluta a clasei i, i= 1, R si reprezinta numarul de unitati ale


populatiei din clasa pentru care variabila X a inregistrat valoarea Xi ;
N1+N2++NR = N
Clasa (grupa) de unitati in raport cu o variabila reuneste acele unitati din cadrul
populatiei care inregistreaza aceeasi stare a variabilei sau starile variabilei apartinand
unui anumit interval de variatie.
Ca urmare, in raport cu o variabila statistica populatia poate fi structurata intr-un anumit
numar de clase.
Exemplu
Fie A - populatia statistica reprezentand unitatile de cazare turistica din Romania, in anul
1999 si X - categoria de confort (este o variabila statistica atributiva, cantitativa
discreta). Distributia acestor unitati in raport cu variabila X este urmatoarea (conform
A.S. al Romaniei, 2000)

X:

666

1108

1090

290

91

0 - neclasificate;

1090 - ne arata numarul unitatilor de cazare turistice avand categoria de ,,2 stele";
De asemenea, relativ la seria statistica unidimensionala avand la baza variabila X,

poate fi formata cu frecvente relative, frecvente cumulate absolute sau relative.


Fie seria X formata cu frecvente relative:

- 16 -

x1 x2 xi xR
X:
f f f f
i
R
1 2

fi ne arata ponderea unitatilor din populatie care au inregistrat pentru variabila X starea
xi:
fi =

Ni
N

fi =

Ni
N *100

sau

i=

1, R

i 1

=1

(100%)

Exemplu:

0.341

0.3355

0.089

0.028

0.0015

20.5%

34.1%

33.55%

8 .9 %

2 .8 %

0.15%

X:

0.205

Sau:

X:

33,55 % reprezinta ponderea unitatilor de cazare turistica avand categoria de ,,2 stele".

- 17 -

Pornind de la seria (1.1) se poate deduce seria formata cu frecvente absolute cumulate,
respectiv:

1
X :
N ( x1 )

x2

xi

xR

N ( x2 )

N ( xi )

N (xR )

(1.3.)

unde: N(xi) reprezinta numarul de unitati din populatia studiata pentru care variabila
inregistreaza valori ce nu depasesc valoarea xi.

N(x1) = N1
N(x2) = N1+N2

N(xi) = N1 + N2 + ... +Ni

..

N(xR) = N1 + N2 + ... +Ni + + NR = N

Exemplu.

X:

666

1774

2864

3154

3245

3250

- 18 -

2864 - ne arata numarul unitatilor de cazare turistica avand cel mult doua stele.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria formata cu frecvente relative
cumulate, respectiv:

1
X:
F
(
N x1 )

x2
FN ( x 2 )

xi
FN ( xi )

xR
FN ( x R )

(1.4.)

unde: FN(XI) - exprima ponderea unitatii populatiei studiate pentru care variabila a
inregistrat valori ce nu depasesc valoarea xi.
FN(XI) = f1 + f2 + + fi

FN(XI) =

N ( x1 )
* 100
N

i = 1, R

Exemplu:

X:

20.5%

54.6%

88.15%

97.05%

99.85% 100%

88,15 % - reprezinta ponderea unitatilor de cazare turistice avand cel mult ,,2 stele".

- 19 -

Asa cum se poate constata din definitia celor doua marimi de frecvente cumulate,
acestea se pot calcula si are sens elaborarea unor serii statistice doar in cazul in care la
baza seriei se gaseste o variabila cantitativa.
Relativ la aceeasi populatie statistica studiata A multimea unitanlor de cazare turistica
din Romania in anul 1999, din A.S. al Romaniei /2000, se pot extrage alte serii statistice
de repartipe, ca de exemplu:
- distributia unitatilor de cazare in raport cu forma de proprietate (cf. A.S. al
Romaniei/2000, pg.518).

majoritar de stat majoritar privat


Y:

1290
1960

Aceasta este o serie statistica de repartitie unidimensionala avand la baza o


variabila atributiva, calitativa si formata cu frecvente absolute, in aceasta situatie se poate
elabora seria statistica formata cu frecvente relative, respectiv:

majoritar de stat majoritar privat


Y:
39,69% 60,31%

distributia unitatilor de cazare in raport cu tipul destinatiei turistice (cf. A.S. al


Romaniei/2000, pag.519)

- 20 -

litoral ba ln ear mon tan D. Dunarii orase resed int a de ju det alte localit.

69
418
908
729 435 691
Este o serie statistica de repartitie unidimensionala avand la baza o variabila
atributiva calitativa si formata cu frecvente absolute. Se poate elabora seria formata cu
frecvente relative.
De asemenea, se pot elabora serii de repartitie unidimensionale in raport cu
numarul de turisti cazati, cu gradul de utilizare a capacitatii in functiune, capacitatea
existenta etc.
Seria statistica de repartitie bidimensionala este o constructie ce reda distributia
unei populatii in raport cu doua variabile.
Astfel, fie populatia statistica A studiata in raport cu variabilele X si Y, rezultatele
observarii se pot grupa intr-un tabel de forma urmatoare:

X x1

x2

xj

xJ

Total

Y
y1

N11

N12

y2

N21

N22

yi

Ni1

Ni2

yl

N1l

Nl2

Total

N1

N2

N1j

N2j

Nij

N1J

N1

N2J

N2

NiJ

Ni

.
.

(1.5.)

Nlj
Nj

Nl

NlJ

- 21
NJ-

unde:

- Nij reprezinta numarul de unitati pentru care, variabila X inregistreaza starea Xj si


variabila Y inregistreaza starea yi, ;
- Ni numarul de unitati pentru care Y = y,, indiferent de nivelul inregistrat de variabila X;
- Nj numarul de unitati pentru care X = Xj, indiferent de nivelul inregistrat de variabilaY;
- N - numarul total de unitati analizate.
Din seria bidimensionala se pot extrage serii unidimensionale de forma
urmatoare :
x

1
X : N
1

1
X :
N
1

x2

xj

xJ

N2

Nj

NJ

y2

yi

yl

N2

Ni

Nl

denumite si serii de repartitie marginale, in raport cu X si Y

x1
X/Y = yj :
N i1

x2 x j
N i 2 N ij

xJ
N iJ

denumita seria de repartitie unidimensionala in raport cu X conditionata de Y = yi,


numarul acestora fiind egal cu numarul de stari a variabilei Y.

y1
Y/ X = xj :
N1 j

y2

yi

yl

N2 j

Ni j

Nl j

- 22 -

j 1, J

denumita serie de repartitie unidimensionala in raport cu Y conditionata de X = xj,


numarul acestora fiind egal cu numarul de stari a variabilei X.
De asemenea se poate elabora sau deduce seria de repartitie bidimensionala
formata cu frecvente relative, respectiv:

x1

xj

xJ

Total

f11 ... fij

f1J

f1

Y
Y1
-

Yi

fi1

Yl
Total

... fij

flj

fl1
f1

...

fj

fiJ

(1.6.)

fi

flJ

fl
fJ 1

fij =

N ij
N

j 1, J

fj =

Nj
N

fi =

Ni
N

i = 1, I

Exemple:
Relativ la populatia statistica A studiata, din A. S. al Romaniei/2000, se poate
extrage o serie de repartitie bidimensionala, avand la baza variabilele:
X - categoria de confort (numar de stele)
Y - tipul unitatii de cazare turistica de forma urmatoare:

- 23 -

Total

neclasificate

Hoteluri

57

259 388 91

Moteluri

12

50 53

14

811

120

Hanuri turistice

22
22

Cabane turistice
Campinguri

83
56

Vile turistice si bungalouri

2 57

Tabere scolare

17 6

Pensiuni turistice

Sate de vacanta

Pensiuni agroturistice

Spatii de cazare pe nave

59 19

165

69 15

142

1145

176

322

341

482 212 122 69


-

77 191 44
-

110 210 21
2

Sursa: A.S. al Romaniei/2000, pag.515


21 - ne arata numarul de pensiuni agroturistice avand categoria de confort de 3 stele.

- 24 -

Tabelul de mai sus este o repartitie statistica bidimensionala avand la baza o variabila X
atributiva cantitativa discreta si o variabila Y atributiva calitativa, formata cu frecvente
absolute.
Se poate deduce seria de repartitie bidimensionala formata cu frecvente relative,
respectiv:
X

Total

Y
Hoteluri

0,018

0,08

0.119

0,028

0,004

0,0006

0,25

Moteluri

0,004 0,015

0,016

0,002

Hanuri turistice

0,007

Cabane turistice

0,026 0,018

0,006

0,001

0,051

Campinguri

0,017 0,021

0,005 0,0006

0.044

Vie turistice si

0,079 0,148

0,065

0.037
0.007

0,038

0,021

0,0009

0,352

bungalouri
Tabere scolare

0,054

0,054

Pensiuni

0,0009 0,024

0,059

0,014

0,002

0.099

turistice
Sate de vacanta

Pensiuni agroturistice
Spatii de cazare pe nave

Total

0,0003

0,034

0,065

0,0003

0,006

0.105

0,000 6 0,0003 0,0003 0,0003

0,205 0,341

0,335
- 25 -

0,089

0,028

0,002

0,0015

0,6 % - reprezinta ponderea pensiunilor agroturistice avand categoria de confort de ,,3


stele", din totalul unitatilor de cazare turistica.
De asemenea se pot extrage seriile unidimensionale marginale in raport cu X si Y si cele
conditionate, de exemplu:

X:

0
666

1108

1090

290

91

y9
1

1
2
3
4
5
6
7
8
Y:
811
120
22
165
142
1145
176
322

X/Y = pensiuni turistice :

y1

Y/X = 3 :
91

y2
5

y3

y4
4

y5
2

y6
122

77

191

44

y7

y8
44

y9

y10
21

y11
1

y10
341

y11
5

Seria statistica de variatie


Conform definitiei seria de variatie reda variatia unei marimi, in timp, in spatiu
sau de la o categorie la alta. Ca urmare, in continuare vom vorbi de serii cronologice (au
la baza o variabila de timp), serii de spatiu si serii categoriale (au la baza variabile
atributive). Cele mai des intalnite sunt seriile cronologice si seriile de spatiu.
Seriile de variatie au la baza marimi absolute si relative. Dupa unii autori din
cadrul marimilor absolute fac parte indicatorii de nivel si diferenta absoluta a unei
- 26 -

marimi, iar din cadrul marimilor relative fac parte: indicatorul relativ de intensitate,
indicele statistic si diferenta relative a unei marimi.
Indicatorul de nivel (Y) este o marime ce reflecta nivelul unui fenomen analizat.
De exemplu: productia diferitelor produse, veniturile populatiei, suprafata cultivata cu
principalele culturi, transportul, exportul, importul etc.
Diferenta absoluta a unei marimi (y) exprima diferenta dintre nivelul cercetat si
nivelul baza de comparatie al marimii analizate. Se exprima in aceeasi unitate de masura
in care este cuantificat fenomenul analizat si ne arata cu cat s-a modificat acesta de la un
nivel la altul.
Indicele statistic al unei marimi (/y ) exprima raportul dintre nivelul cercetat si
nivelul baza de comparatie al marimii analizate. Ne arata de cate ori se modifica acea
marime, de la un nivel la altul.
Diferenta relativa a unei marimi (Ry) exprima raportul dintre diferenta absoluta a
marimii respective si nivelul baza de comparatie al acesteia. Ne arata cu cat la suta se
modifica marimea de la un nivel la altul.
Indicatorul relativ de intensitate (d) se defineste ca raport intre doi indicatori de
nivel de natura diferita si arata gradul de raspandire a fenomenului cuantificat de
indicatorul de la numarator in raport cu fenomeoul cuantificat de indicatorul de la
numitor. De exemplu: productia diferitelor culturi / ha, densitatea populatiei, productia
principalelor produse / locuitor, rata somajului etc.
Greutatea specifica (g) reflecta structura fenomenului analizat in raport cu starile
variabile X, de la baza seriei.
Seriile cronologice
Seria cronologica reflecta evolutia in timp a unei marimi.
Valorile variabilei ca functie de timp pot fi fixate la un anumit moment de timp sau sa se
refere la un interval de timp.
Seria cronologica de momente este o serie de observatii ordonate in timp,
exprimand stocuri [Trebici V.. 1985]. De exemplu, volumul populatiei, numar de
universitati, banci, institutii, fonduri fixe, numarul salariatilor, intreprinderile mici si

- 27 -

mijlocii din diferite domenii de activitate, unitatile de cazare turistica etc.Intr-o astfel de
serie insumarea marimii analizate nu are sens din punct de vedere al continutului, aceasta
fiind permisa din considerente de calcul, ajustat etc.
Seria cronologica de intervale este o serie de observatii ordonate in timp
exprimand fluxuri. De exemplu: nascutii vii, divorturile, decesele, productia diferitelor
culturi sau produse, venituri, cheltuieli, productia industriala, agricola, exportul, importul
etc.Intr-o astfel de serie are sens insumarea marimii analizate.
Fie o serie cronologica de momente sau de intervale ce reflecta evolutia in timp a
nivelului unei marimi Y,

0 1 2 . . t ... T
Y:
y y y . . y ... y
0 1 2 t T

Pornind de la aceasta serie se pot deduce seriile formate cu diferente absolute,


indici si diferente relative. In functie de modul de raportare a starilor variabilei timp t,
marimile de mai sus se pot calcula cu baza fixa (t / to) (baza de comparatie ramane
aceeasi) sau cu baza in lant(t /t-1) (baza de comparatie se schimba, fiind considerata cea
precedenta nivelului comparat).
Fie seriile cronologice formate cu: - diferente absolute cu baza fixa:

t / t0
y

0 1 2 ... t ... T

: 1/ 0 2 / 0
t/0
T /0
0
... y ...
y
y y

t/0
y

= y(t) y(0)

- 28 -

(1.8)

diferente absolute cu baza in lant

t / t 1
y

0 1 2 ... t ... T

: 1/ 0 2 /1
t / t 1
T / T 1
y y ... y ...
y

(1.9)

Intre cele doua tipuri de diferente absolute cu baza fixa si cu baza in lant, exista relatii de
legatura ce ne permit exprimarea unora in functie celelalte. In acest context, insumand
diferentele absolute cu baza in lant se obtin diferentele absolute cu baza fixa.

t/0
y

1/ 0
y

2 /1
y

t / t 1
y

Scazand diferentele succesive cu baza fixa se obtin diferenfele cu baza in lant.

t/0
y

t 1 / 0
y

y(t) y(0) y(t-1) + y(0) = y(t) y(t-1) =

t / t 1
y

Diferenta absoluta ne arata cu cat se modifica marimea analizata de la un moment


la altul. Se exprima in aceeasi unitate de masura in care este cuantificat fenomenul
studiat.

- 29 -

Daca fenomenul analizat se exprima valoric, atunci diferenta absoluta nu reflecta


prea bine modificarile ce intervin, impunandu-se utilizarea marimilor relative respective,
indicele statistic si diferenta relativa.
Fie seriile cronologice formate cu:
- indici statistici cu baza fixa

t / t0

t/0

0 1 2 ... t ... T

: 1/ 0 2 / 0
t/0
T /0
1
... I y ... I
y
Iy Iy

(1.10)

y (t )
*100
y (0)

- indici statistici cu baza in lant :

I
I

t / t 1
y

0 1 2 ... t ... T

: 1/ 0 2 /1
t / t 1
T / T 1
I y I y ... I y ... I
y

t / T 1
y

y (t )
* 100
y (T 1)

- 30 -

(1.11)

Indicele statistic ne arata de cate ori se modifica fenomenul analizat. Este


marimea cel mai des folosita in caracterizarea evolutiei fenomenelor din economie.
Avand ca baza de referinta o serie cronologica de forma (1.7) se pot elabora serii formate
cu:
- diferente relative cu baza fixa

t / t0
y

0 1 2 ... t ... T

: 1/ 0 2 / 0
t/0
T /0
0
... R y ... R
y
Ry Ry

t /0

t/0
y

y ( 0)

y (t )
1
y (0)

t/0
y

(1.12)

sau

t /0

t / t 1
y

t/0

I y * 100 100
diferente relative cu baza in lant

0 1 2 ... t ... T

: 1/ 0 2 /1
t / t 1
T / T 1
R y R y ... R y ... R
y

- 31 -

(1.13)

t / t 1

t / t 1
y

* 100 100

Diferentarelativa ne arata cu cat la suta se modified fenomenul de la un moment la altul.


Aceasta mSrime la fel ca si indicele statistice, se foloseste frecvent in caracterizarea
fenomenelor din economic.
Daca seria cronologica analizata, de forma (1.7) este de intervale, se poate deduce seria
formata cu greutatea specifica :

gy

0 1 2 .. t .. T

g 0 g1 g 2 . . g t . . g T

(1.14)

y (t )
g(t) =

y (t )
t 1

Seria statistica de spatiu (teritoriala)


Seria statistica de spatiu este o constructie statistica ce reflecta variatia in spatiu a
unei marimi.
Seria de spatiu prezinta o importanta din ce in ce mai mare, datorita dezvoltarii
sistemului informational, a necesitatii comparatiilor internationale si a comparatiilor intre
regiunile unei tari.
In cadrul Anuarului Statistic al Romaniei exista capitole distincte de ,,Statistica
teritoriala" si ,,Statistica internationala". In capitolul de ,,Statistica teritoriala" sunt

- 32 -

cuprinse informatii privind: populatia, fort a de munca, conditii de munca, veniturile


populatiei, cheltuielile si consumul populatiei, locuinte, asistenta sociala, sanatate,
invatamant, cultura, sport, conturi nationale, rezultate si performante ale intreprinderilor,
agricultura, silvicultura, industrie, transporturi, posta, telecomunicatii, turism, finante,
justitie si starea infractionala, pe cele 7 regiuni si Bucuresti.
La baza seriei de spatiu se gasesc atat marimi absolute (indicator de nivel,
diferenta absoluta), cat si marimi relative (indicator relativ de intensitate, indicele
statistic, diferenta relativa).
Fie seria statistica Z, de forma urmatoare:

s0 s1 s2 ... si ... sR
Z:
Z (1) Z (2) Z (3) ... Z (i) ... Z (R)

unde:

(1.15)

__

Si - este o stare a variabilei ce exprima spatiul,

i=1,R,

Z(i) - exprima o marime (indicator de nivel sau relativ de intensitate).


Plecand de la seria de forma (1.15) se pot deduce seriile formate cu:
- diferente absolute cu baza fixa:

s / s0
z

s0 s1 s2 ... si ... sR

: s1 / s0 s2 / s0
si / s 0
0 z z ... z ... sR / s0
z

si / s 0
z

= z(i) z(0)

- indicii statistici cu baza fixa


- 33 -

(1.16)

s / s0
z

s0 s1 s2 . . si . . sR
: s1 / s0 s2 / s0 si / s0 sR / s
0 I z I z . . I z . . I 0
z

si / s 0
z

s / s0
z

(1.17)

Z (i )
* 100
Z ( 0)

diferente relative cu baza fixa

s0 s1 s2 ... si ... sR

: s1 / s0 s2 / s0
si / s 0
0 Rz Rz ... Rz ... RsR / s0
z

si / s0
z

Si / s0

Z ( 0)

* 100

- 34 -

(1.17)

Se deduc seriile formate cu marimi absolute si relative calculate doar cu baza fixa (se
poate alege orice stare a variabile ce exprima spatiu).

PROBLEME PROPUSE
PI. Dati 5 exemple de populatii statistice a caror cercetare ar prezenta interes si pentru
fiecare populatie selectata precizati:
1. denumirea populatiei, a unitatii statistice si volumul acesteia;
2. scopul cercetarii statistice;
3. variabilele statistice in raport cu care s-ar face observarea statistica a populatiei.
P2. Sa se extraga din Anuarul Statistic sau alte surse informationale o serie statistica
bidimensionala ce reda distributia unei populatii in raport cu doua variabile atributive,
relativ la care se cere:
1. denumirea populatiei ce a fost supusa observarii si volumul acesteia;
2. unitatea statistica;
3. caracterizarea variabilelor statistice in raport cu care a fost studiata populatia;
4. caracterizarea seriei statistice in raport cu toate criteriile cunoscute;
5. elaborarea seriei bidimensionale formata cu frecvente relative, interpretare;
6. extragerea

repartitiilor

unidimensionale

marginale

si a celor conditionate;

7. pornind de la o repartitie marginala deduceti celelalte serii statistice posibile,


interpretare.
P3. Din Anuarul Statistic sau alte surse informationale extrageti o serie statistica de
repartitie, avand la baza o variabila de spatiu, relativ la care se cere:
1. denumirea populatiei statistice si volumului ei;
2. unitatea statistica;
3. caracterizarea seriei dupa toate criteriile cunoscute;
4. deducerea seriei formata cu frecvente relative;
5. interpretare.
P4. Din Anuarul Statistic sau alte surse informationale extrageti doua serii cronologice
avand la baza indicatorul de nivel, una de momente, alta de intervale si deduceti seriile

- 35 -

formate cu diferente absolute, indici statistici, diferente relative, cu baza fixa si cu baza
in lant (interpretari).
P5. Dati 5 exemple de serii cronologice avand la baza indicatorul relativ de
intensitate.
P6. Din Anuarul Statistic sau alte surse informationale extrageti o serie de spatiu formata
cu indicatorul de nivel sau indicator relativ de intensitate si deduceti seriile formate cu
diferente absolute, indici si diferente relative, calculate cu baza fixa. Interpretare.
P7. Extrageti 5 exemple de serii de spatiu ce contin informatii importante pentru
domeniul economic.
P8.Se da urmatoarea serie de variatie, cronologica, de momente, avand la baza un
indicator de nivel :
-farmaciile din Romania la sfirsitul anului 1989

Z:

1980

1857

1985

1986

1987

1988

1989

1922

1924

1930

1925

1935

Deduceti seriile formate cu toti indicatorii derivati posibili.


P9.Se da urmatoarea serie de variatie, cronologica, de intervale, avand la baza un
indicator de nivel :

Z:

1980

3810

1985

1988

1989

1990

1991

3063

2478

2159

1475

1302

Deduceti seriile formate cu toti indicatorii derivati posibili.


P.10 Se considera o firma a carei C.A. a evoluat in ultimele 12 luni dupa cum urmeaza :
-Luna 1-220

- 36 -

- Luna 2-225
- Luna 3-240
-Luna 4-250
- Luna 5-240
- Luna 6-245
- Luna 7-260
- Luna 8-280
- Luna 9-270
- Luna 10-275
- Luna 11-290
- Luna 11-290

(mil.lei)

Se cere :
1.Alcatuiti o serie cronologica cu datele din problema si comentati tipul de
indicator folosit.
2.Analizati cu cat s-a modificat C.A. atat in raport cu prima luna cat si in raport cu
luna precedenta.
3.Aratati de cate ori se modifica C.A. in raport cu prima luna, cat si de la o luna la
alta.
4.Aratati cu cat la suta s-a modificat
C.A. in raport cu prima luna, cat si de la o luna la alta.
5.Graficul seriei.(cronograma).

CAPITOLUL II
OBSERVAREA, SISTEMATIZAREA I
PREZENTAREA DATELOR STATISTICE

Observarea statistica

- 37 -

Observarea statistica constituie prima etapa in cadrul studierii fenomenelor


sociale, economice sau de alta natura, etapa in care se culeg datele statistice despre
fenomenul supus cercetarii. Cercetarea fenomenelor respective presupune cunoasterea
populatiei statistice in vederea surprinderii actiunii legilor care actioneaza la nivelul
acesteia. De calitatea acestei etape, intr-un proces de cercetare statistica, depinde si
calitatea rezultatelor obtinute in celelalte faze.
Observarea statistica presupune identificarea, urmarirea si inregistrarea, dupa
reguli unitare si precise, a nivelutui atins de variabilele statistice studiate la unitatile din
care este formata populatia luata in studiu.[Florea L, 1998},
Pentru asigurarea unor date, rezultate din observare, valide si pertinente se impun
cateva precizari. In primul rand, observarea statistica presupune urmarirea si inregistrarea
unui numar mare de unitati statistice, ceea ce implica un volum mare de munca. In al
doilea rand, pentru ca cercetarea populatiei sa-si atinga scopul, trebuie precizate care sunt
variabilele in raport cu care este studiata populatia. Variabilele statistice ce urmeaza sa fie
urmarite si inregistrate la nivelul flecarei unitati din populatie, trebuie sa fie esentiale si
sa prezinte interes din punct de vedere al studiului intreprins. In al treilea rand, trebuie
stabilite criterii exacte, daca observarea si inregistrarea datelor este facuta de mai multe
persoane este necesar ca acestea sa se alinieze unei metodologii unitare pentru a asigura
corectitudinea necesara datelor rezultate.
Observarea statistica, ca prima etapa intr-un studiu de cercetare presupune:
specificarea unitatilor statistice care trebuie sa fie urmarite si inregistrate, alegerea
variabilelor statistice care caracterizeaza cel mai bine populatia si care raspund
obiectivului urmarit, inregistrarea starilor variabilelor statistice considerate.
Atingerea scopului cercetarii statistice presupune rezolvarea urmatoarelor probleme care
sa asigure o pregatire stiintifica a observarii statistice:
-

delimitarea populatiei supuse observarii;

definirea unitatilor statistice de observat;

timpul si locul unde va avea loc observarea;

programul observarii;

alegerea purtatorilor de informatie;

- 38 -

pregatirea persoanelor ce urmeaza sa faca observarea.


Fiecareia din aceste probleme trebuie sa i se acorde importanta cuvenita, fiindca

fiecare dintre ele conduce la o pregatire cat mai completa a observarii, de rezultatele
careia depinde corectitudinea celorlalte etape a cercetarii statistice.
Delimitarea populatiei supuse observarii fata de alte populatii statistice cu care
aceasta se afla in legatura se realizeaza prin evidentierea insusirilor si trasaturilor comune
ce caracterizeaza populatia supusa studiului. In conditiile in care se impune cercetarea
doar a unei parti din populatie, atunci trebuie precizat care anume vor fi unitatile ce vor fi
supuse observarii, dupa ce criterii se selecteaza acestea din populatia initiaia, astfel incat
rezultatele cercetari sa poata fi extinse la nivelul intregii populatii.
Definirea unitatilor statistice de observat presupune claritate si precizie pentru a
nu da loc confuziilor. In momentul observarii trebuie cunoscut exact care sunt unitatile
statistice ce trebuie inregistrate in raport cu variabilele de studiat.
Stabilirea timpului si a locului unde va avea loc observarea are importanta din
punct de vedere a comparabilitalii datelor rezultate din observare. Notiunea de timp a
observarii are in statistica doua acceptiuni:
-

momentui sau perioada la care se refera datele inregistrate (timpul de referinta);

durata observarii.
Momentul sau perioada la care se refera datele inregistrate trebuie sa fie in

concordanta cu natura fenomenelor cercetate . In cazul in care presupune inregistrarea


unui fenomen in mod static trebuie precizat un moment critic. Stabilirea momentului
critic are in vedere posibilele repetari sau omisiuni in inregistrarea unitatilor datorate
evolutiei populatiei in timp. Daca fenomenul de studiat presupune o inregistrare continua,
atunci trebuie pretizata perioada de timp in care are loc observarea. De exemplu,
recensamantul populatiei Romaniei din anul 2002 a avut ca moment critic ora ,,zero"
dintre 17 si 18 aprilie, iar timpul inregistrarii a fost de 7 zile. In cazul indicatoriior care
cuantifica activitatea de productie, timpul la care se refera datele inregistrate poate fi
luna, trimestml sau anul. Observarea statistica trebuie facuta intr-un timp optim.
Recensamantul populatiei ar trebui sa se realizeze de obicei iarna cand miscarea
populatiei este redusa in comparatie cu celelalte sezoane.

- 39 -

Alegerea momentului critic sau a perioadei de timp la care se refera datele


obtinute prin inregistrarea unitatilor, trebuie facuta de asa maniera incat populatia sa fie
surprinsa in starea ei tipica si naturala.
Locul observarii reprezinta punctul din spatiu in care se deruleaza procesul supus
cercetarii (incinta unei intreprinderi, a unui magazin, o localitate in cazul in care
populatia o reprezinta familiile etc.).
In cadrul programului observarii statistice trebuie stabilite variabilele statistice
care urmeaza sa fie studiate in populatia de cercetat. Alegerea si definirea variabilelor
statistice trebuie sa fie in consens cu natura populatiei si obiectivul cercetarii statistice
intreprinse. Variabilele statistice care fac parte din programul cercetarii trebuie sa
surprinda aspectele esentiale, sa expliciteze fenomenul sau procesul studiat, sa permita
prelucrarea si generalizarea acestora la nivelul intregii populatii. Programul observarii
trebuie sa cuprinda un numar optim de variabile. Alegerea unui numar de variabile prea
mare sau prea mic poate dauna calitatii cercetarii statistice efectuate asupra populatiei in
cauza. Stabilirea programului observarii presupune o consultare reciproca a
statisticienilor, care intreprind cercetarea si a specialistilor din domeniul considerat.
Alegerea purtatorilor de informatie se face in functie de volumul datelor ce
urmeaza a fi inregistrate. Purtatorii de informatie reprezinta suportii materiali pe care se
inregistreaza datele din observarea unitatilor statistice.
Problema selectarii si pregatirii persoanelor care urmeaza sa fie angrenate in etapa
de observare, se pune mai ales in cazul in care fenomenul sau procesul de studiat este de
mare amploare. Un asemenea fenomen il constitute recensamantul, care constituie o
observare la scara nationals cu un mare consum de mijloace materiale si financiare.
Observarea statistica se poate desfasura in diverse forme in raport cu: natura
proceselor social-economice de studiat, obiectivul cercetarii, formele de organizare cat si
posibilitatile practice de urmarire si inregistrare a unitatilor statistice din populate.
Dupa cum se stie, in raport cu gradul de cuprindere a populatiei considerate avem:
observarea totala si observarea partiala. Observarea totala permite inregistrarea, in raport
cu variabilele statistice a tuturor unitatilor statistice din populatie, implicand un volum
mare de munca, antreneaza, de obicei, un numar de persoane si dureaza mult timp. Ca
urmare se creaza conditii pentru apariritia de erori de observare, ceea ce va conduce la

- 40 -

micsorarea eficientei observarii. Forma cea mai frecventa de observare totala o constituie
recensamantul populatiei. Avand in vedere anvergura unei asemenea observari totale,
recensamantul presupune o pregatire prealabila din punct de vedere uman, material si
financiar de reusita careia depinde in mare masura eficacitatea lui. Cu prilejul fiecarui
recensamant se elaboreaza o metodologie corespunzatoare cerintelor perioadei
considerate, constituind baza de referinta a tuturor celor implicati in aceasta actiune.
Observarea totala se practica si in domeniul controlului tehnic de calitate, in cazul
produselor de inalta tehnicitate , asa cum ar fi: televizoare, masini de spalat, frigidere,
automobile etc. Este necesara o observare totala in acest caz, deoarece constatarea
defectiunilor de catre cumparatori ar implica cheltuieli mult mai mari cu remedierea
acestora in comparatie cu organizarea unei observari totale a loturilor de produse ce
urmeaza a fi scoase pe piata.
In cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt
nesemnificative, este suficienta realizarea unor observari partiale prin care sa se asigure
ca rebuturile nu depasesc un anumit procent admis. O astfel de observare, care include
doar o parte din unitatile populatiei supuse studiului corespunde observarii partiale.
Observarea partiala constituie o alternativa la observarea totala in cazul
populatiitor infinite sau chiar daca sunt finite prin observare are loc distrugerea acestora.
Avand la baza procedeul observarii partiale se pot evalua rezervele de titei,
carbune sau alte minerale, se poate evalua masa de material lemnos din fondul silvic a
unei zone sau la nivelul intregii tari. In general, observarea partiala se recomanda in toate
cazurile in care se considera mai avantajoasa decat observarea totala. Avantajele acestui
tip de observare se materializeaza de cele mai multe ori intr-un program de observare mai
complex si mai complet, cu cheltuieli de timp si materiale mai reduse si nu de putine ori
cu un grad de exactitate mai ridicat.
Esantionul, ca rezultat al observarii partiale, presupune respectarea cu strictete a
principiului reprezentativitatii, in conformitate cu care fiecare unitate statistica din
populatia generala sa aiba aceeasi sansa de a face parte din esantion. Asigurarea
respectarii principiului reprezentativitatii in formarea esantionului de observat permite
acestora o structura foarte apropiata cu cea a populatiilor din care sunt formate. Aceasta
ne asigura, cu o anumita probabilitate dinainte fixata, ca rezultatele obtinute la nivelul

- 41 -

esantionului pot fi extinse la nivelul intregii populatii. In raport cu legea de probabilitate


urmata de variabilele urmarite in populatia generala sunt doua tipuri de esantioane:
esantioane de volum mare si esantioane de volum redus.
O forma de observare partiala este observarea prin ancheta. In cadrul acestei
forme de observare, unitatile supuse observarii se aleg in functie de scopul cercetarii, iar
inregistrarea lor se face sub forma de raspunsuri scrise pe care persoanele desemnate in
acest sens le dau intrebarilor dintr-un chestionar. Persoanele ce urmeaza a fi chestionate
primesc chestionarul respectiv raspunzand benevol la intrebari.
Observarea statistica in raport cu procedeul folosit este de doua feluri: observarea directa
si observarea indirecta.
Observarea directa presupune o observare nemijlocita a unitatilor din populatie,
care sunt prevazute pentru cercetare. Acest mod de observare se realizeaza printr-un
contact direct cu unitatile statistice, fie prin masurare, fie prin interogare, daca unitatile
sunt persoane. Acest procedeu permite observatorului perceperea nemijlocita a
fenomenelor luate in studiu in vederea masurarii nivelelor inregistrate de variabilele
considerate.
Observarea indirecta presupune un intermediar intre unitatile care urmeaza sa fie
supuse observarii si observator. Intermediarul poate fi un document special conceput in
vederea observarii si atunci observarea este pe baza de document sau intermediarul poate
fi o alta persoana decat observatorul, caz in care avem observare prin interogare.
Observarea prin interogare presupune ca persoana intermediara sa fi participat la
desfasurarea fenomenului sau sa fie in masura sa dea informatiile despre nivelul
variabilelor care prezinta interes pentru studiul intreprins. Observarea indirecta
neimplicand in mod direct observatorul, constituie o posibila sursa de erori.
Suportul pentru culegerea datelor il reprezinta chestionarul.
Elaborarea si testarea chestionarului
Chestionarul este o lista de intrebari de diferite forme care sunt puse oral sau in
scris in vederea culegerii de informatriei relative la un subiect [Chirouze Y., 1985].
Redactarea chestionarului este o problema dificila mai ales in cazul studiilor de

- 42 -

piata, pentru ca nu exista o formula unica de elaborare care sa conduca la stabilirea unui
chestionar foarte bun. De fapt un chestionar este bun, atunci cand furnizeaza raspunsuri
precise, adevarate si utilizabile. Conceperea unui chestionar se bazeaza foarte mult pe
experienta.
Problemele care intervin in elaborarea unui chestionar sunt numeroase si
complexe. Acestea nu vor fi prezentate detaliat in acest studiu, ci vor fi abordate doar in
linii mari.
Elaborarea chestionarului depinde de ohiectivul anchetei. Intrebarile si
eventualele probleme ce intervin in elaborarea lor sunt legate de obiectivele urmarite.
Astfel daca informatiile privesc anumite fapte, evenimente petrecute, atunci
intrebarile sunt relativ usor de formulat. Ceea ce ar putea impiedica obtinerea de
informatii ar fi refuzul celor intrebati de a da un raspuns exact la unele din intrebari,
datorat unor motive personale sau imposibilitatii furnizarii unui raspuns total sau partial
aferent unor evenimente mai indepartate. Este evident ca lungimea perioadei analizate
depinde de natura faptelor. Daca evenimentele se produc curent atunci perioada este mai
scurta, iar daca evenimentele sunt rare, perioada analizata este mai lunga.
Ia schimb in cazul anchetelor asupra opiniilor, motivatiilor, intentiilor, elaborarea
chestionarului este mai dificila, intrebarile vor fi formulate si studiate cu o foarte mare
atentie. Ca de exemplu in cazul anchetelor asupra opiniilor, intrebarile privind exprimarea
acestora sunt usor de formulat, in cea mai mare parte se primesc raspunsuri (fiecare isi
exprima opinia). Ceea ce este dificil in culegerea informatiilor privind opiniile il
reprezinta masurarea intensitatii de manifestare a acestora [Fournis, 1985].
In situatii ca cele formulate mai sus trebuie sa se evite intrebarile care ar conduce
la aparitia de erori in raspunsuri. Aceste erori pot sa fie provocate voluntar, de catre
repondent, datorita mascarii unei atitudini, opinii etc., sau pot fi involuntare datorate
neintelegerii clare a problemei in cauza.
Pentru evitarea acestor inconveniente intrebarile puse trebuie sa raspunda la o
serie de caracteristici bine definite [Heifer, 1985].
Astfel ele trebuie sa fie:
usor de inteles, adica sa nu contina cuvinte ce nu pot fi intelese de orice repondent;
stimulatoare, adica intrebarile puse trebuie sa incite la raspuns;

- 43 -

precise, sa antreneze raspunsuri usoare si sa permita o buna prelucrare a datelor culese.


Inainte de a vedea in ce maniera se prezinta chestionarul trebuie rezolvate problemele
legate de continutul intrebarilor, ca de exemplu: tipul si forma intrebarilor, succesiunea
lor si codificarea.
Tipuri de intrebari
Pentru redactarea chestionarului este nevoie sa se aleaga intre diferitele tipuri de
intrebari. Alegerea nu este indiferenta, ci fiecare tip corespunde nevoilor specifice
anchetei.
Mai mult autori printre care sunt si M. Lejeune, C. Javeau, clasifica intrebarile in:
intrebari inchise;
intrebari deschise;
intrebari semi-deschise.
Intrebarile inchise sunt acele intrebari pentru care raspunsurile sunt fixate dinainte si
repondentii trebuie sa-si aleaga din variantele de raspunsuri propuse. Acest tip necesita o
precodificare a raspunsurilor, ceea ce va permite prelucrarea imediata a acestor intrebari.
Intrebarile inchise sunt usor de exploatat, aceasta determinand utilizarea frecventa a lor.
Acest tip de intrebare este eficienta atunci cand ancheta se desfasoara asupra faptelor,
deoarece variantele de raspuns pot fi usor delimitate. In schimb in cazul anchetelor asupra
opiniilor, motivatiilor, atitudinilor, este diflcila sa se asigure pertinenta, exclusivitatea si
exhaustivitatea prin variantele de raspuns propuse.
Desi intrebarile inchise aduc informatii ce pot fi exploatate usor si rapid, uneori
ele sunt destul de restrictive, deoarece permit alegerea uneia sau a mai multor variante de
raspuns numai dintre cele propuse, excluzandu-se variantele pe care cel ce a formulat
intrebarea nu le-a avut in vedere. Aceste intrebari sunt foarte utile atunci cand are loc o
urmarire in timp a unor evenimente, pentru ca asa se pot observa modificarile in structura
raspunsurilor.
Intrebarile inchise sunt de mai multe tipuri :
- cu raspuns unic, unde repondentul trebuie sa aleaga doar o varianta de raspuns. Acestea
sunt cel mai usor de prelucrat din punct de vedere statistic.

- 44 -

- cu raspunsuri multiple, unde repondentul poate sa aleaga mai multe variante de raspuns.
Daca acest numar nu este limitat atunci codificarea si prelucrarea datelor necesita
o perioada mai lunga, motiv pentru care se recomanda limitarea numarului de raspunsuri.
- cu clasameme, unde repondentul claseaza raspunsurile posibile intr-o anumita ordine in
functie de preferintete sale. Aceste tipuri de intrebari cer un efort mai mare din partea
repondentului, ca urmare ele devin obositoare. Astfel se impune limitarea variantelor de
raspuns. De asemenea aceste intrebari necesita o perioada mai mare de pregatire a lor
pentru prelucrare, iar exploatarea nu este imediata,
- intrebari cu scale ale atitudinilor, permit nuantarea raspunsurilor binare pe o gradate de
tip excelent - foarte rau. Aceasta se poate realiza explicitand fiecare varianta prin cuvinte
de tipul excelent, bun, mediu, rau, foarte rau, sau un sistem de note de exemplu, acordand
note de la 1 la 5, stiind ca 1 este pentru foarte rau iar 5 pentru excelent. Aceste intrebari
permit masurarea atitudinilor folosind instrumente puse la punct de psihologi, iar atasarea
de note fiecarei trepte a scalei simplifica prelucrarea si da posibilitatea efectuarii unor
calcule. In schimb daca scala are prea multe trepte alegerea unei sau alteia dintre ele
devine diflcila, de aceea utilizarea unui numar de 5 trepte este cel mai convenabil. Daca
treptele nu sunt bine diferentiate si scala nu se schimba de la o intrebare la alta atunci
repondentul poate avea tendinta de a ramane mereu in aceeasi zona a scalei.
Claude Jeveau in ,L 'enquette par questionnaire" caracterizeaza intrebarile inchise astfel:
sunt cele care se preteaza cel mai bine la prelucrarea si analiza statistica, raspunsurile
primite pot fi prelucrate imediat fara a necesita analize intermediare complicate;
sunt usor de inteles si se poate raspunde repede;
garanteaza un anumit anonimat;
ele pot fi folosite ca intrebari filtru, servind la gruparea repondentilor;
ele prezinta pericolul de a ,,dicta" raspunsul celui anchetat in masura in care raspunsul
la care s-a gandit nu figureaza printre cele posibile, el alegand unul care se apropie cel
mai mult de ceea ce s-a gandit;
ele nu pot fi folosite pentru obtinerea de informalii nuantate, corespunzatoare
atitudinilor, motivatiilor profunde, aplicarea lor se limiteaza doar la culegerea de
informatii obiective.

- 45 -

Intrebarile deschise
O intrebare deschisa este aceea care lasa pe cel interesat sa raspunda cum vrea el,
neexistand nici o constrangere. Intrebarile deschise pot fi prezentate astfel:
complet nestructurate, sunt intrebarile la care repondentii pot sa raspunda cum doresc,
de tipul: ce parere aveti... ?
asociere de cuvinte, cand se dau pe rand diferite cuvinte iar repondentilor li se cere sa
noteze primul cuvant care le vine in gand;
completarea frazei, cand repondentilor li se prezinta o fraza incompleta, pe care trebuie
sa o completeze;
completarea unei povestiri, cand repondentilor le este prezentata o
povestire incompleta, pe care trebuie sa o continue, etc. In chestionar trebuie rezervat
spatiu suficient pentru completarea intregului raspuns.
Intrebarile deschise pot fi caracterizate astfel:
daca sunt bine formulate atunci se pot obtine informatii asupra oricarui subiect;
ele sunt indispensabile in culegerea informatiilor privind problemele delicate, cum sunt
cele legate de masurarea atitudinilor, nevoilor, motivatiilor;
utilizarea lor este impusa in cazurile in care nu pot fi prevazute toate raspunsurile
posibile;
formularea lor este foarte delicata, de aceea ele trebuie sa fie cuprinzatoare, sa nu
comporte ambiguitati si contrasensuri;
prelucrarea lor este foane costisitoare si anevoioasa.
Intrebirile semi-deschise (mixte) sunt intrebari in care principalele raspunsuri
posibile sunt propose ca in cazul intrebarilor inchise, dar se lasa si posibilitatea adaugarii
de raspunsuri libere in afara celor propuse, cum sunt intrebarile deschise[Javeou, 1992].
Aceasta forma mixta tinde sa rezolve problemele de exhaustivitate a fntrebarilor
inchise si sa reduca costul de codificare al intrebarilor deschise. Intrebarile mixte sunt
avantajoase atunci cand sunt precodificate raspunsurile stabilite, care acopera cea mai
mare parte din aria raspunsurilor, ramanand ca un numar destul de mic de raspunsuri,
obtinute pe parcursul anchetei, sa fie codificat ulterior.
Aceste intrebari au urmatoarele caracteristici:

- 46 -

ele contribute la usurarea prelucrarii deoarece un numar mare de raspunsuri sunt


prevazute, acestea fiind codificate;
ele risca sa influenteze reactia repondentilor prin sugerarea posibilelor raspunsuri;
variantele de raspuns sugerate in prima parte a intrebarii trebuie sa fie stabilite foarte
riguros, in general acestea se bazeaza pe o cercetare prealabila, astfel incat sa fie evitata
situatia ca cele mai importante si cele mai multe raspunsuri sa fie concentrate in partea
deschisa a intrebarii. Intr-o astfel de situatie intrebarile mixte nu mai sunt avantajoase.
Redactarea chestionarului
Dupa ce a fost definit continutul chestionarului, respectiv diversele domenii ce
trebuie regasite in intrebari, este necesar sa se rezolve problemele legate de forma si de
structura chestionarului si anume acestea depind de urmatoarele aspecte [Javeau C.,
1992]:
modul de administrate a chestionarului, care influenteaza lungimea chestionarului,
nivelul de aplicare al intrebarilor;
tipul de intrebari ce vor fi utilizate, acesta determinand modul de prelucrare, termenul
anchetei, mijloacele financiare;
ce limbaj va fi utilizat, acesta depinzand de specificul anchetei, de pregatirea celor
anchetati;
modul de prelucrare ce va fi folosit, adica manual, sau pe calculator;
cum pot fi evitate erorile involuntare realizate de repondenji prin intermediul
raspunsurilor date. Aceste erori pot fi provocate de frica de a nu fi judecat prost, de
dorinta de a se conforma normei sociale, de reactia la intrebari le prea ,,delicate" sau
personale, de sugestibilitatea continutului intrebarilor.
In redactarea unui chestionar trebuie sa se aiba in vedere si aspectele care ar putea
conduce la non-raspunsuri patiale sau totale, pentru a putea fi evitate.
C. Javeau in ,L 'enqueue par questionnaire" propune anumite principii de redactare ale
unui chestionar legate de:
a) Ordinea in care sunt puse intrebarile

- 47 -

Ordinea de succesiune a intrebarilor depinde de tipul anchetei, de modul de


administrate a chestionarului, de lungimea sa, dar este dificil de propus un model adecvat
pentru orice situatie.
b) Textele de introducere si de legatura
Oricare ar fi modul de administrate a chestionarului este necesar sa existe texte de
introducere si texte de legatura intre diferitele parti si mai ales intre diferitele teme
abordate. Atunci cand repondentul trebuie sa completeze singur chestionarul, acesta
trebuie sa contina mai multe texte, fiind sursa principala de explicatii. Textele ce contin
informatii privind obiectivul anchetei, sunt plasate la inceputul chestionarului, pe urma
exista texte care sa informeze despre caracterul de anonimat al datelor si despre faptul ca
ele nu vor fi folosite in alte scopuri. De asemenea trebuie sa existe texte care sa
informeze repondentii cu privire la modul de completare a chestionarului.
Daca chestionarul este completat in prezenta anchetatorului sau acesta scrie in
chestionar raspunsurile primite, atunci multe din textele prezentate mai sus nu trebuie sa
apara in chestionar. In acest caz anchetatorul trebuie sa fie bine pregatit si la randul sau
sa-l informeze pe repondent.
c) Prezentarea materiala si tipogrqfica, prezentarea materiala a chestionarului trebuie
realizata cu foarte mare atentie, mai ales in cazul administrarii directe.
In concluzie, redactarea unui chestionar presupune munca in echipa, necesita
multa atentie si mai ales multa experienta deoarece chestionarul este suportul de culegere
a datelor iar daca acesta este intocmit superficial, chiar daca metodologia de sondaj si
tehnicile de prelucrare a datelor sunt foarte avansate si complexe, rezultatele obtinute nu
vor fi chiar cele mai bune.
Testarea chestionarului
Oricare ar fi experienta celor care redacteaza chestionarul sunt foarte rare
situatiile cand acesta se prezinta intr-o forma perfecta, care sa nu necesite imbunatatiri.
De aceea este nevoie de testarea, chestionarului, respectiv verificarea modului de
intelegere, de interpretare si de acceptabilitate a intrebarilor.

- 48 -

Testarea chestionarului este absolut necesara in orice situate si la orice tip de


sondaj. Daca cei anchetati suni consumatorii, in general marele public, se stie ca exista
diferente intre nivelul de cultura al celor ce redacteaza chestionarul, care sunt specialisti
in domeniul respectiv, si repondenti care nu dispun de limbajul tehnic de specialitate.
Astfel in intrebari s-ar putea regasi cuvinte sau fraze strict de specialitate si care
sa nu fie infelese de majoritatea celor anchetati.
Chestionarul este testat pe un numar reduse de persoane apartinand populatiei
srudiate, respectiv in jur de 20, 30 persoane, acest esantion trebuie sa cuprinda persoane
cat mai diferite.
De asemenea anchetatorii trebuie sa fie persoane cu o anumita pregatire de
specialitate, pentru a fi in masura sa sesizeze reactiile celor anchetati, sa poata interpreta
comportamentul acestora.
In cursul acestei etape trebuie verificate urmatoarele aspecte: daca termenii
utilizati sunt usor de inteles si nu conduc la confuzii; daca ordinea intrebarilor nu conduce
la nici o reactie defavorabila; daca forma intrebarilor permite culegerea de informatii
dorite; daca intrebarile nu sunt prea lungi si nu produc dezinteres sau iritarea celor
anchetati; daca anumite intrebari nu sunt utile; daca textele de introducere si de legatura
sunt suficiente si eficiente; daca variantele de raspuns a intrebarilor inchise sunt
suficiente; daca numarul intrebarilor deschise nu este prea mare ca sa oboseasca pe cel
anchetat.
Modalitati de administrare a chestionarului
Pentru colectarea datelor exista mai multe modalitati, dar nu toate au aceleasi
avantaje si nu pot fi utilizate cu indiferenta. Alegerea uneia sau alteia depinde de o serie
de factori.
Culegerea datelor se poate realiza cu ajutorul urmatoarelor tehnici
ancheta prin interviu direct;
ancheta prin corespondenta;
ancheta prin telefon.

- 49 -

1) Ancheta prin interviu direct se caracterizeaza prin aceea ca administrarea


chestionarului se face direct la domiciliu, la locul de munca, in strada, la diferite puncte
de vanzare, la expozitii, etc.
Astfel, in cazul anchetei la domiciliu sau la locul de munca se pot administra
chestionare cu multe intrebari si se pot obtine numeroase informatii. Calitatea
raspunsurilor este asigurata datorita prezentei anchetatorului al carui rol este si acela de a
crea o atmosfera favorabila, de a explica sau reformula anumite intrebari care nu sunt
foarte explicite, de a prezenta fotografii (mai ales in cazul testarii intentiilor privind
produsele noi), chiar si mostre de produse. Uneori anchetatorul poate oferi produse celor
anchetafi, el urmand sa treaca dupa un timp si sa preia chestionarul cu raspunsurile
completate privind calitatile produselor testate.
De asemenea, anchetatorul are posibilitatea sa verifice sinceritatea unor
raspunsuri prin observare sau consultarea unor documente (facturi, chitante, bonuri etc.).
Ancheta la domiciliu are si unele inconveniente. Primul inconvenient este cel
legat de prezenta anchetatorului, care poate fi o sursa de erori, provenite din transcrierea
unor raspunsuri sau din formularea unor intrebari. De asemenea de multe ori prezenta
anchetatorului il determina pe cel anchetat sa se comporte altfel decat daca ar fi singur,
aceasta conduce la deformarea raspunsurilor, ele nu mai sunt sincere, sunt date pentru a
impresiona pe anchetator.
Un alt inconvenient este acela ca reusita anchetei la domiciliu depinde de
competenta si seriozitatea anchetatorilor, deci selectia lor trebuie sa fie foarte riguroasa.
Un alt aspect ce trebuie adaugat la inconveniente este acela ca persoanele din mediul
urban permit destul de greu patrunderea persoanelor straine in casa, astfel rata nonraspunsurilor provenite din mediul urban este mult mai mare decat din mediul rural.
Ancheta in strada sau la expozitii, targuri, magazine, are avantajul ca se poate
realiza un numar mare de interviuri, intr-un timp scurt si cu cheltuieli mici. Ancheta la
magazine, targuri permite culegerea de impresii la timp, recente, referitoare la produse,
publicitate, promovare etc.
Anchetele in strada au un camp de actiune limitat si pot fi folosite doar atunci cand se
doreste obtinerea unor informatii ieftine si rapide, calitatea si complexitatea lor
neinteresand foarte mult.

- 50 -

Ancheta prin corespondenta


Aceasta tehnica presupune trimiterea chestionarului, prin intermediul postei sau a
unor anchetatori, la destinatar. De regula destinatarul este ales folosind un procedeu
aleator. In general chestionarul se trimite intr-un plic care contine si o scrisoare
explicativa prin care repondentul sa inteleaga importanta sondajului, a raspunsurilor pe
care este rugat sa le dea. De asemenea se trimite si un plic pentru raspuns, iar uneori se
specifica ca in cazul returnarii raspunsului repondentul va primi un mic cadou.
Aceasta modalitate de administrare a chestionarului poate fi aplicata pentru orice
populate studiata. Ca o diversiflcare a acestei modalitati a aparut administrarea
chestionarului prin intermediul faxului, aceasta fiind folosita in cazul sondajelor in randul
intreprinderilor si a diferitelor institutii.
Avantajele anchetei prin corespondenta sunl legate de cheltuielile postale care
sunt cu mult mai mici decat cheituielile ocazionate de ancheta la domiciliu. De asemenea
dispersia geografica a corespondentilor poate fi mare fara a afecta costul anchetei. In plus
aceasta tehnica ofera repondentului un sentiment de libertate si de anonimat, deoarece el
nu vine in contact cu anchetatorul. Acest anonimat este asigurat atita timp cat nu trebuie
sa-si scrie adresa pe plicul ce contine raspunsul.
Ancheta prin corespondenta permite repondentului sa se gandeasca la raspunsuri,
sa-si culeaga informatiile necesare, sa consulte documente. El completeaza chestionarul
in ritmul si la momentul ales de el. Cel mai adesea raspunsurile sunt mai personale si mai
sincere. Deoarece ancheta nu se desfasoara intr-un timp foarte limitat, chestionarul poate
fi relativ lung.
Un inconvenient al acestei anchete il reprezinta rata non-raspunsurilor care este
destul de ridicata, aceasta impunand trimiterea de noi chestionare altor persoane si deci
cresterea cheltuielilor anchetei.
Ceea ce propunem este imbinarea anchetei la domiciliu cu cea prin
corespondenta, astfel s-ar imbunatati calitatea datelor culese. Respectiv anchetalorul ar
avea rolul de a duce chestionarul la repondent, de a-i da cateva explicatii si de a reveni
dupa un anumit timp bine specificat pentru a prelua raspunsurile. Repondentul va trebui

- 51 -

sa completeze singur chestionarul, asigurandu-se astfel conditiile ca raspunsurile sa nu fie


afectate de erori datorate anchetatorului. Rata raspunsurilor ar fi cu mult mai mare decat
in cazul anchetei prin corespondenta, dar in acelasi timp si cheituielile vor fi mai mari, in
special cele de deplasare.
Acest tip de administrare este eficient in cazul populatiilor statistice putin dispersate din
punct de vedere geografic.
Ancheta prin telefon
Anchetatorul pune o serie de intrebari persoanelor din esantion, prin intermediul
telefonului. Aceasta modalitate de culegere a datelor permite obtinerea de informatii
rapid, numerele de telefon fiind extrase din cartea de telefon, iar durata unei convorbiri
este de 10-15 minute. Aceasta tehnica este mai economica decat ancheta la domiciliu,
cheituielile cuprind doar tarifele telefonice. Ca o consecint a cheltuielilor reduse, este
faptul ca ancheta este eficienta atunci cand esantionul este dispersat geografic.
Printre avantajele anchetei prin telefon este si acela ca tele-anchetatorul poate
telefona la diferite ore din zi si de mai multe ori, pentru a contacta persoanele ce fac parte
din esantion. Astfel rata raspunsurilor este destul de mare.
Deoarece durata convorbirii telefonice este limitat a, chestionarul este relativ
scurt, intrebarile vor fi simple, ceea ce arata ca aceasta modalitate de culegere a datelor se
aplica in cazul temelor mai simple si care sunt supuse schimbarii intr-un timp scurt.
Principalul inconvenient este acela ca esantionul de cele mai multe ori nu este
reprezentativ. Acesta pentru ca nu toata populatia dispune de telefon, iar populatia din
mediul rural este foarte greu de contactat telefonic.
In concluzie alegerea unei tehnici sau a alteia depinde de obiectivele studiului, de
complexitatea informatiilor culese, de volumul esantionului si de dispersia geografica a
acestuia, de bugetul alocat si de timpul acordat pentru sondaj.
Ceea ce se contureaza pentru viitor este aparitia de noi modalitati de culegere a
datelor, mult mai eficiente decat cele aplicate in prezent (cum ar fi folosirea internetului).
Erori de observare

- 52 -

In cele mai multe cazuri observarea statistica presupune si manipularea unui


volum mare de date. Ca atare intervin diferite tipuri de erori:
-

eroare de esantionare (de reprezentativitate);

erori de observare;

erori datorate non-raspunsurilor.


Eroarea de esantionare exista in toate anchetele prin sondaj, dar ea este nula in

cazul observarii totale (nu constitute obiectul acestei lucrari).


Erorile de observare tin de faptul ca valoarea inregistrata poate fi o valoare y* diferita de
valoarea adevarata yi corespunzatoare unitatii i.
Din categoria erorilor de observare fac parte urmatoarele:
a) Erori datorate dificultatilor de vocabular, cum ar fi:
- utilizarea unui limbaj savant, prea tehnicist, cand de regula intr-un chestionar nu trebuie
sa fie folosite decat cuvinte usor de inteles;
- folosirea unor cuvinte a caror sens este variabil de la un mediu la altul, sau de la un
individ la altul;
- folosirea unor cuvinte a carui sens este vag sau sunt prea abstracte.

b) Erori datorate neintelegerii corecte a sensului intrebarilor, ca de exemplu:


- persoanele intervievate declara o aita situate decat cea normala, cum ar fi cazul
declararii venitului (cand cel in cauza declara venitul salarial si nu venitul total realizat),
declararea unei vechi profesii in loc de cea actuate etc.;
- persoanele intervievate comit erori fie datorate nedefinirii perioadei de referinta (o p
erioada pentru care se solicita informatii) sau datorate lungimii prea mari, solicitandu-se
prea mult memoria celor anchetati;
-

nedefinirea exacta a unitatilor de observat, pentru ca sunt intrebari ce se refera la o

persoana, iar altele la un grup, mai ales in cazul anchetelor organizate in gospodarii;
-

neintelegerea intrebarilor foane lungi, foarle complexe si care contin mai multe ideii

in acelasi timp;

- 53 -

folosirea unor intrebari vagi, abstracte, a caror implicatii nu sunt bine intelese;

- dificultatea alegerii unuia sau a mai multor raspunsuri dintr-o lista. Este important sa
se stie daca raspunsurile se exclud sau nu, daca poti alege doar unul sau mai multe. In
general se prefera o lista cu raspunsuri cat mai completa, dar sa nu fie prea lunga.
c) Erori datorate solicitarii memoriei, si anume:
- erori cauzate de uitarea unor evenimente sau retinerea lor partiala;
- erori cauzate de lungimea perioadei de referinta, mai ales atunci cand ea este mare.
d) Erori datorate lipsei sinceritatii in furnizarea informatiilor. Astfel de erori sunt mai
frecvente in cazul tarilor unde persoanele nu sunt obisnuite cu sondajele. In cadrul acestei
categorii s-ar include:
- erori datorate fricii de a declara o situate asa cum este ea, de exempiu in cazul
venitului, persoanele declara in general salariul, pensia sau ajutorul primit, veniturile
suplimentare nu sunt declarate mai ales de frica impozitelor fiscale;
- erori cauzate de dorinta impresionarii anchetatorului, de exemptu subestimand
consumul de alcool, supraestimand activitatile culturale etc.
e) Erori cauzate de anchetatori, si anume:
- prin interpretarea unor intrebari sau ,,suflarea" unor raspunsuri, la cei intervievati;
- in cazul organizarii de sondaje probabiliste, atunci cand o uniitate este inlocuita cu
aita, care nu este trecuta pe lista esantionului, situatie intalnita mai ales atunci cand nu se
obtin informatii de la unitatile ce trebuie supuse observarii.
Pentru reducerea acestor erori este necesara o selectie riguroasa a anchetatorilor, o
buna pregatire a acestora, si o testare prealabila a chestionarelor. De asemenea se
recomanda efectuarea de controale a anchetatorilor. Depistarea erorilor se poate realiza si
in faza de prelucrare a datelor, iar in functie de natura lor se pot lua diferite masuri pentru
eliminarea efectului acestora.
In concluzie, asa cum spunea J. Desabie , atunci cand o ancheta esueaza, eel mai frecvent
se datoreaza erorilor de observare decat erorii de esantionare. De aceea este irational sa
consacri mari eforturi pentru reducerea erorii de esantionare atunci cand erorile de
observare sunt consistente. Dar in general erorile de observare sunt mult mai mici in
cazul anchetelor prin sondaje decat in cazul recensamintelor, datorate faptului ca
anchetatorii au o pregatire mult mai buna decat agentilor recenzori.

- 54 -

Erorile datorate non-raspunsurilor provin din absenta totala sau partiala a datelor
privind unitatile supuse observarii.
Sistematizarea si prezentarea datelor statistice
Sistematizarea constitute o etapa in cadrul prelucrarii datelor statistice in vederea
prezentarii acestora sub forma de serie statistica.
Datele obtinute ca urmare a procesului de observare statistica, in forma lor bruta,
permit o caracterizare amanuntita a fiecarei unitati din populatia considerata. Deoarece,
datele rezultate din observare se prezinta sub forma dezorganizata nu permit o
caracterizare a populatiei in ansamblu.
In vederea atingerii scopului cercetarii statistice intreprinse si anume acela de a da
o caracterizare de ansamblu a populatiei considerate este necesar ca datele rezultate din
observare sa fie supuse unor operatii de sistematizare si prezentare in vederea deducerii a
ceea ce este esential, tipic si general in legatura cu populatia.
Deoarece in prelucrarea statistica primul pas il constituie prezentarea datelor
observate sub forma de serie, pentru construirea seriilor statistice se aleg variabilele care
trebuie sa fie in stransa dependent cu scopul cercetarii si cu natura fenomenului cercetat.
In raport cu una sau mai multe variabile din programul observarii, se poate
construi o serie statistica, permitand astfel diverse ordonari (grupari) a datelor
inregistrate. Orice cercetare statistica se face cu un anumit scop bine precizat. In urma
efectuarii observarii statistice, indiferent de numarul variabilelor prevazut in programul
cercetarii, prelucrarea datelor rezultate se face in raport cu acelea care sunt strans legate
de scopul final.
Odata precizate variabilele de la baza seriei, se stie care va fi continutul primului
sir de date si ca urmare esle elucidat criteriul in raport cu care informatiile rezultale din
observare vor fi ordonate, necunoscandu-se insa cum se face propriu-zis ordonarea si
cum se completeaza primul sir al seriei.
Completarea primului sir de date al unei serii statistice nu presupune doar o
simpia aranjare in ordine crescatoare sau descrescatoare a variabilelor numerice sau in

- 55 -

ordine alfabetica a starilor variabilelor calitalive. Definirea unei serii, referitor la primul
sir de date se realizeaza in raport cu toate starile variabilei stabilite.
In cazul unei variabile calitative sau cantitative discrete (si care inregistreaza un numar
redus de stari) ce sta la baza construirii unei serii, procedeul cel mai simplu de completare
a primului sir il constituie ordonarea sau aranjarea starilor variabilei respective intr-o
anumita ordine. Daca variabila care sta la baza seriei este de variatie continua sau desi
discreta inregistreaza un numar prea mare de valori in cadrul populatiei de studiat,
ordonarea valorilor acestei variabile va conduce la o faramitare prea mare a populatiei,
ceea ce nu permite evidentierea principalelor aspecte ale acesteia. Pentru asemenea
cazuri, completarea primului sir presupune in primul rand reunirea in clase distincte a
acelor unitati din populate pentru care variabila nu prezinta variatii esentiale. Ca urmare,
in vederea definitivarii primului sir de date al unei serii, se grupeaza datele in mod
corespunzator, fiind necesar in primul rand stabilirea claselor.
Operatia de stabilire a claselor presupune imparprea unitatilor unei populatii in
clase distincte in raport cu una sau mai multe variabile si aranjarea claselor rezultate intro anumita ordine. In urma unei asemenea operatii, fiecare unitate trebuie sa se gaseasca in
una si numai una din clasele rezultate. Aceasta operatie nu trebuie sa conduca la pierderi
de unitati, regasindu-se insa intr-o alta ordine decat cea dupa care s-a realizat observarea.
De modul cum se face operatia de grupare a unitatilor populatiei depinde in mare
masura sesizarea principalelor aspecte calitative care se pot contura in cadrul unei
populatii cat si calitatea informatiilor rezultate in urma prelucrarii datelor respective.
Omogenitatea constituie o proprietate de baza pe care trebuie sa o aiba clasele.
Se spune ca o clasa este omogena daca, pentru unitatile care fac parte din ea, variabila de
grupare inregistreaza variatii nesemnificative.
In cazul seriilor care au la baza o variabila de grupare calitativa sau cantitativa
discreta, problema omogenitatii nu se ridica deoarece, toate unitatile pentru care variabila
a inregistrat aceeasi stare constituie o clasa.
In cele ce urmeaza se va prezenta operatia de stabilire a claselor in cazul unei serii
unidimensionale.
Daca la baza seriei avem o variabila calitativa, atunci clasele se stabilesc in raport
cu starile acesteia. Pentru fiecare stare a variabilei se va construi o clasa. Ca urmare, in

- 56 -

acest caz, intr-o clasa vor intra toate unitatile care au inregistrat aceeasi stare in timpul
observarii in raport cu variabila considerate.
Pentru o variabila cantitativa, care sta la baza construirii unei serii, stabilirea
claselor se realizeaza in mod diferit pentru o variabila discreta si pentru o variabila
continua.
In cazul unei serii care are la baza o variabita cantitativa discreta (numarul
starilor nu este prea mare), clasele se stabilesc in mod asemanator ca si la variabilele
calitative, respectiv:

x1 x 2
X:
N1 N 2

xi
Ni

xR

NR

In conditiile in care cercetarea populatiei presupune elaborarea unei serii care are la baza
o variabila cantitativa continua sau o variabila cantitativa discreta, dar care in populatia
considerate inregistreaza un numar prea mare de stari, clasele nu se mai pot stabili cu
ajutorul starilor variabilei. Pentru asemenea cazuri, gruparea unitatilor populatiei in clase
se face cu ajutorul intervalelor de grupare (variatie), fiecare interval cuprinzand un numar
oarecare de valori ale variabilei. Ca urmare, pentru o serie continua, clasele se definesc
cu ajutorul intervalelor de grupare.
Doua probleme se pun in cazul elaborarii unei serii care are la baza o variabila cantitativa
continua:
determinarea lungimii intervalelor de variatie;
stabilirea formei de scriere a intervalelor de variable.
Determinarea lungimii intervalelor de variatie conduce la doua situatii:
serii construite cu intervale de lungime egala;
serii construite cu intervale de lungime diferita. Alegerea unuia din cazurile de mai sus
(intervalele de lungime egala sau diferita) trebuie precedaia de o analiza atenta a modului
de variatie a variabilei in cadrul populatiei. Stabitirea numarului de intervale de variable
trebuie sa asigure satisfacerea umiatoarelor conditii:
-

informatia care se pierde in urma operatiei de grupare sa nu fie prea mare, iar

populatia sa nu fie prea faramitata in raport cu variabilele de grupare;

- 57 -

media aritmetica a fiecarei grupe (in raport cu valorile inregistrate) sa fie cat mai

aproape de centrul intervalului de variatie respectiv;


-

sa nu existe grupe vide;

reprezentarea grafica a seriei rezultate sa permita conturarea unei regularitati a

fenomenului de studiat din cadrul populatiei. Trebuie remarcat ca acest lucru nu este
posibil nici in cazul unui numar mic de intervale deoarece se pierd prea multe date, nici
in cazul unui numar prea mare de intervale, populatia farmitandu-se prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul in care populatia in raport cu
variabila X este normala, urmatoarea expresie:

l x=

x max x min
1 3,322 lg N

avand semnificatia de ,,numar de intervale, pentru celelalte cazuri rezultatul fiind


orientativ, servind la determinarea cu aproximatie a lungimii intervalelor de variatie in
cazul in care acestea vor fi de lungime egala. In expresia de calcul a lungimii intervalelor
intervine valoarea maxima si cea minima a variabilei, cat si volumul populatiei. In urma
stabilirii lungimii intervalelor, se elaboreaza seria de intervale de lungime egala dupa cum
urmeaza:

xmin ; (xmin lx ) . . xmin (k 1)lx ; (xminklx )) . . xmin (R 1)lx ; (xmin Rlx ))


X :

N ..
Nk
. . NR
1

__

- 58 -

daca se presupune ca au rezultat R intervale, unde N k , k =1,R reprezinta volumele


claselor in care s-a structurat populatia.
Nu intotdeauna impartirea domeniului de variatie a variabilei in intervale de
lungime egala este relevanta din punct de vedere al scopului urmarit in ceea ce priveste
desprinderea tipurilor calitative din cadrul populatiei cercetate. Numeroase sunt cazurile
practice in care studiul unei populatii in raport cu o variabila sau mai multe presupune
impartirea domeniilor de variatie ale acestora in intervale de lungime neegala. In
asemenea cazuri nu exista o relatie decalcul in acest sens. Stabilirea intervalelor de
variatie se face in directa legatura cu variaria variabilelor si distribuirea unitatilor in
raport cu acestea.
Daca la baza seriei in cauza stau doua sau mai multe variabile calitative sau cantitative
atunci clasele se stabilesc in raport cu fiecare din variabilele considerate prin starile
acestora.
Nu este recomandat ca numarul variabilelor in raport cu care se studiaza populatia
sa fie prea mare, deoarece aceasta duce la o divizare exagerata a populatiei pierzandu-se
din vedere aspectele principale.
Dupa ce clasele au fost definite, are loc repartizarea unitatilor populatiei in clasele
respective, folosind in acest scop un algoritm adecvat.
Pentru elaborarea si prezentarea seriilor statistice se apeleaza la pachete de
programe statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences),
STATIST1CA, S.A.S. (Statistical Analysis System), STATGRAPHICS, etc.
Exemple
Elaborarea seriilor statistice unidimensionale.
De cat timp sunteti client al bancii R:
Frecventa absoluta Frecventa relativa Frecventc relativa cumulata
sub 1 an

20

22.2

22.2

1-3 ani

28

31.1

53.3

4-6 ani

11

12.2

65.6

- 59 -

peste 6 ani 31

34.4

Total

100.0

90

100.0

Ce tipuri de produse utilizati de la aceasta banca :


Frecventa

Frecventa relativa

absoluta

Frecventa relativa
cumulata

non-raspuns

56

62.2

62.2

card

12

13.3

75.6

card,cont

1.1

76.7

cont

10

11.1

87.8

credite

3.3

91.1

credite in valuta

1.1

92.2

depozit

5.6

97.8

depozit,cont

1.1

98.9

plata

1.1

100.0

90

100.0

utilit.,prod.econ.
Total

Veniturile familiei

- 60 -

Frecventa

Frecventa relativa Frecventa relativa cumulata

absoluta
pana la 2,5 mil. lei

25

27.8

27.8

2,6-5 mil.lei

26

28.9

56.7

6-10 mil. lei

28

31.1

87.8

11 -25 mil. lei

8.9

96.7

peste 25 mil.lei

3.3

100.0

Total

90

100.0

Categoria socio-profesionala

Frecventa absoluta

Frecvema

Frecventa relativa

relativa

cumulata

manager

7.8

7.8

patron

5.6

13.3

liber profesionist

10.0

23.3

salariat

29

32.2

55.6

profesor

3.3

58.9

medic

4.4

63.3

pensionar

10

11.1

74.4

- 61 -

fermier

5.6

80.0

elev/student

13

14.4

94.4

casnica

2.2

96.7

somer

3.3

100.0

Total

90

100.0

Calitatea si diversitatea serviciilor( note acordate)

Frecventa absoluta Frecventa relativa Frecventa relativa cumulata


2

1.1

1.1

10.0

11.1

55

61.1

72.2

25

27.8

100.0

Total 90

100.0

Promptitudinea personalului
Frecventa absoluta Frecventa relativa Frecventa relativa cumulata
3

1.1

1.1

23

25.6

26.7

66

73.3

100.0

- 62 -

Total 90

100.0

Nivelul dobanzilor

Frecventa absoluta Frecventa relativa Frecventa relativa cumulata


1

4.4

4.4

20

22.2

26.7

41

45.6

72.2

21

23.3

95.6

4.4

100.0

Total 90

100.0

Serii de repartitie bidimensionale


Nivelul dobanzilor * Veniturile familiei
Veniturile familiei
Nivelul Jobanzilo r

pana la 2,5 mil. lei

2,6-5 6-

11- peste Total

mil.lei 10 25 25
mil. mil. mil.lei
Lei lei
1

- 63 -

20

11

15

41

10

26

28 8

5
Total

25

21
1

4
3

90

Reprezentari grafice

Reprezentarea grafica a unei serii ne da o imagine geometrica (in plan sau spatiu)
cu privire la forma statica sau evolutia dinamica a fenomenului cuantificat de seria
respectiva.
Graficul asociat unei serii constituie o imagine spatiala a fenomenului de cercetat,
permitand evidentierea rapida a structurii, dinamicii si tendintei de dezvoltare a acestuia.
Reprezentarile grafice sunt folosite atat in scopul cunoasterii populatiei in cauza, cat si
pentru popularizarea unor rezultate din diverse domenii de activitate.
Elaborarea completa si corecta in acelasi timp a unui grafic presupune elucidarea
urmatoarelor elemente: titlul graficului, scara de reprezentare, reteaua graficului, semnele
conventional si notele.
Titlul graficului trebuie sa fie scurt, clar si semnificativ pentru continutul
fenomenului reliefat prin seria considerata.
In cele mai frecvente cazuri un grafic se traseaza intr-un sistera de axe
rectangulare xOy. Pe fiecare din cele doua axe se reprezinta valorile variabilelor X,
respectiv Y, un astfel de punct marcat se mai numeste punct cotat. Scara de reprezentare
reuneste multimea tuturor punctelor cotate. In cazul in care variabila inregistreaza valori
mici, gradarea scarii incepe in principiu de la zero, daca variabila inregistreaza valori
mari se considera o alta origine stabilita cu aproximatie. Pentru a nu incarca prea mult

- 64 -

desenul, se recomanda reprezentarea pe scara doar a valorilor dispuse la un anumit


interval convenabil ales. Distantele dintre doua puncte cotate consecutive se numeste
intervalul graficului. Cand intervalele sunt egale atunci avem scari uniforme, in caz
contrar avem scari neuniforme.
Scara aritmetica este o scara uniforma in timp ce scara logaritmica sau cea
binomiala constituie exemple de scari neuniforme.
Reteaua graficului permite identificarea cu usurinta in plan sau in spatiu a
punctelor corespunzatoare valorilor inregistrate de variabilele in cauza. Sistemul axelor
rectangulare (in plan sau spatiu) constituie cele mai uzuale repere in reprezentarea
grafica a seriilor statistice.
Semnele conventionale se pot materializa intr-o reprezentare grafica fie prin
inscriptii, fie printr-o legenda.
Inscriptia trebuie sa fie scurta si semnificativa si plasata cat mai bine in raport cu
elementul din grafic pe care il expliciteaza.
Legenda se foloseste pentru a explicita folosirea semnelor, culorilor sau
diverselor hasururi folosite in graficul in cauza. Legenda se plaseaza inafara graficului,
in coltul din stanga sau dreapta jos.
In cazul graficelor complexe, pentru o intelegere mai buna, sunt necesare unele explicatii,
care se dau sub forma de note. Notele generale privesc in ansamblu graficul si se plaseaza
chiar sub titlul graficului. Notele speciale privesc portiuni din grafic si sunt legate de
acestea prin diverse semne de trimitere. Notele se plaseaza in partea de jos a diagramei,
in coltul din stanga sub retea.
In continuare se vor prezenta principalele tehnici de construire a graficelor utilizate in
reprezentarea seriilor statistice ce descriu fenomenele social-economice.
Histograma
Graficul specific seriilor care au la baza o variabila continue (de intervale) este
histograma. Aceasta se construieste intr-un sistem de axe rectangulare dupa cum
urmeaza: pe abscisa se trec intervalele de variable, iar pe ordonata se traseaza scara
frecventelor. Scara frecventelor se construieste in conformitate cu respectarea principiului

- 65 -

proportionalitalii intre frecvente si segmentele delimitate pe scara ordonatelor. Pentru


fiecare interval de variajie a seriei (Xi-1 - Xi) se construieste un dreptunghi a carui baza
este chiar lungimea intervalului, iar cealalta latura se determina din conditia proportional
itatii ariei dreptunghiului cu marimea indicatorului in clasa respectiva.
Latura necunoscuta a dreptunghiului, notata cu L, se determina din
urmatoarea relatie:
Li*li = k * Ni

(2.2)

1i= latura cunoscuta a dreptunghiului corespunzator intervalului (Xi-1 - Xi) ;


Li= latura necunoscuta a dreptunghiului corespunzator intervalului (Xi-1 - Xi)
Ni= frecventa absolute a clasei i;
k = un coeficient de proporponalitate care se alege in raport cu scara dereprezentare.
Din relatia (2.2) se deduce Li :

Li = k

Ni
li

i = 1, R

unde: li = xi xi-1 adica diferenta dintre limita superioara si cea inferioara a intervalului de
variatie.
Multimea tuturor dreptunghiurilor astfel determinate, formeaza histograma atasata seriei.
Poligonul frecventelor
Este o reprezentare grafica a seriilor statistice avand la baza o variabila atributiva
cantitativa continua si formata cu frecvente absolute sau relative, simple sau cumulate.
Trasarea acesteia presupune realizarea in prealabil a histogramei. Poligonul frecventelor
se obtine unind prin segmente de dreapta mijloacele laturilor superioare ale
dreptunghiurilor, din care este alcatuita histograma.

- 66 -

Poligonul frecventelor poate fi construit si direct, fara intermediul histogramei.


Aceasta presupune ridicarea de perpendiculare din mijlocul fiecarui interval de variatie, a
caror lungimi(inaltimi) sunt proportionale cu frecventele intervalelor corespondente.
Unind prin segmente de dreapta varfurile acestor perpendiculare, se obtine graficul dorit.
Graficul produce o imagine a functiei densitate de probabilitate empirice (in cazul
utilizarii frecventelor simple), sau a functiei de repartitie empirica (in cazul utilizarii
frecventelor cumulate).
Poligonul frecventelor este un grafic important pentru aproximarea formei distributiei
populatiei studiate, cat si pentru compararea a doua distributii pe aceeasi diagrama.
Diagramele de structura
Punerea in evidenta sub forma grafica a structurii unei populatii statistice este
posibila apeland la diagramele de structura. In acest sens se prezinta: dreptunghiul,
patratul, cercul si semicercul de structura. Aceste tipuri de grafice permit reprezentarea
grafica a seriilor unidimensionale construite cu marimi de structura( frecvente relative,
greutate specifica).
Cel mai des folosit este cercul de structura denumit si diagrama sectoriala (piechart).
Cercul de structura
Se construieste un cerc de raza oarecare a carei suprafata se considera ca
reprezinta volumul intregii populatii in cauza (exprimat in frecvente absolute sau
relative).
Fiecare clasa in care este divizata populatia supusa studiului este reprezentata
printr-un sector de cerc de arie direct proportionala cu volumul clasei. Trasarea sectorului
de cere presupune determinarea masurii in grade a unghiurilor la centru a fiecarui sector.
Unghiul la centru de 360 corespunde volumului intregii populatii. Unghiurile sectoarelor
de cere care reprezinta clase din populatie trebuie sa fie proportionale cu volumul
acestora (exprimat in frecvente absolute sau relative). Unui procent ii corespunde 3,6 cu
procentul corespunzator clasei respective.

- 67 -

Exemplu
Din Anuarul Statistic al Romaniei din anul 2000 am extras seria care urmeaza, redand
distributia voturilor electoratului pentru Senat (dupa redistributie) la alegerile din 3
noiembrie 1996:
Formaitunea Politica CDR PDSR USD UDMR PRM PUNR
Voturi obtinute (%) 37,0 28,7

16,1 7,7

5,6

4,9

Sa se realizeze cercul de structura in acest caz.


Semicercul de structura
Constructia acestuia este asemanatoare cu a cercului de structura, cu a cercului de
structura, cu deosebirea ca volumul populatiei cercetate este reprezentat printr-un
semicerc de 180, cu respectarea aceluiasi principiu conform caruia unghiurile la centru
corespunzatoare sectorului prin care se reprezinta clasele trebuie sa fie proportionale cu
indicatorii care le reprezinta. In acest caz, unui procent ii corespunde 1,8, unghiurile la
centru corespunzatoare sectoarelor se vor determina inmultind 1,8 cu procentele
corespunzatoare claselor respective.
Diagrama prin benzi (barchart)
Acest tip de grafic utilizeaza benzile (barele), pentru a reprezenta distributia unei
populatii in raport cu o variabila cantitativa discreta sau calitativa. Benzile au aceeasi
latime (baza), iar lungimea (inaltimea) lor este direct proportionala. cu frecventa clasei
reprezentate. Numarul benzilor este egal cu numarul claselor in care este impartita
populatia studiata. De asemenea se pot lua in considerare o variabila sau doua.
In reprezentari se utilizeaza benzi simple sau benzi grupate. Pozitia benzilor poate fi
orizontala sau verticala.
Exemplu

- 68 -

Din Anuarul Statistic al Romaniei din anul 2000 am extras seria care urmeaza, redand
nivelul PNB/loc in S calculat pe baza puterii de cumparare in Romania si alte tari esteuropene
Tara

Bulgaria Cehia Polonia Romania Slovacia Ungaria

PNB/loc ($) 4683

12197 7543

6153

9624

9832

Cartograma si cartodiagrama
Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafica a seriilor
statistice de spatiu.
Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spatiului (sub
forma de harta) in interiorul caruia se manifesta fenomenul care este cuantificat de seria
de reprezentat. in interiorul hartii astfel realizata, prin diverse culori sau nuante ale
aceleiasi culori, prin hasururi sau prin diferite diagrame, este evidentiata intensitatea
dezvoltarii fenomenulut cercetat precum si marimea indicatorilor seriei.
Cartograma in culori sau nuante ale aceleiasi culori se utilizeaza pentru redarea
intensitatii manifestarii unui fenomen. Acest tip de grafic este recomandat in special
atunci cand intensitatea fenomenului surprins de seria de spatiu nu prezinta o variabila
prea mare pentru a nu apela la prea multe culori sau nuante ale acestora, care sa
ingreuneze citirea graficului.
Cand realizarea unei cartograme in culori este prea costisitoare sau culori le si
nuantele sunt greu de reprodus este utilizata cartograma prin hasuri. Si in acest caz
densitatea hasurilor trebuie sa redea diferente de intensitate a fenomenului in spatiu
surprins de seria de reprezentat. Dupa ce harta a fost desenata si impartita in
conformitate cu starile variabilei de spatii, ce sta la baza seriei, in interiorul fiecarei
subdiviziuni se utilizeaza hasuri a caror intensitate sa fie proportionala cu intensitatea
fenomenului cuantificat de indicatorul cu care s-a construit seria.
Cartodiagrama constitute o modalitate de reprezentare grafica a seriilor de spatiu,
realizandu-se ca o imbinare intre cartograma si diferite alte tipuri de diagrame, ca de

- 69 -

exemplu diagrame prin benzi, cerc , patrat, dreptunghi etc. De exemplu, pentru a
reprezenta o serie de spatiu ce exprima volumul investitiilor straine pe judete, la noi in
tara, se procedeaza astfel: in primul rand se deseneaza harta Romaniei, delimitandu-se
judetele; in cadrul fiecarui judej se deseneaza o figura geometrica oarecare convenabil
aleasa, a carei arie sau marime sa fie direct proportionala cu volumul investitiilor straine
din judetul respectiv.
Si acest tip de reprezentare grafica isi are o larga aplicabilitate in special in
urmarirea acelor fenomene de natura economica sau sociala care sunt urmarite in spatiu.

CAPITOLUL 3
SERII STATISTICE ATRIBUTIVE DE REPARTIIE
UNIDIMENSIONALE
Organizarea datelor rezultate din observarea statistica sub forma de serie de
frecvente, constituie o prima etapa a prelucrarii acestora. O serie statistica reda sub forma
rezumativa (sintetica) o prima imagine asupra populatiei de studiat in raport cu variabila
de la baza seriei.
Pornind de la repartitia statistica, ca forma sintetica de prezentare a rezultatelor
observarii, se pot deduce o serie de caracteristici specifice populatiei considerate, cum ar
fi:
- nivelul mediu al variabilei;
- structura populatiei in raport cu variabila considerata;
- variatia variabilei in raport cu nivelul mediu al acesteia;
- forma dupa care se dispun unitatile populatiei in jurul valorii medii. Caracterizarea
numerica a acestor aspecte poate fi realizata prin urmatorii parametri (caracteristici):
- parametrii tendintei centrale;
- parametrii de structura;
- parametrii variatiei;
- parametrii concentrarii;
- parametrii formei.
- 70 -

Se prezinta, in cele ce urmeaza, aspecte legate de definirea, semnificatia si modalitati de


calcul pentru fiecare parametru.
Parametrii tendintei centrale
Parametrii din aceasta grupa au menirea de a evidentia pozitia in jurul careia se
grupeaza ansamblul valorilor unei variabile de la baza unei serii. Aceasta pozitie
exprimata printr-un numar se numeste pozitie centrala. Ea poate fi evidentiata prin:
__
- valoarea medie (X);
- valoarea mediana (Me(x));
- valoarea modaia (M0(x).
1. Valoarea medie
Valoarea medie reprezinta principalul parametru care caracterizeaza tendinta
centrala a unei repartitii statistice.
In vederea definirii parametrului valoarea medie se considera o populatie
statistica studiata in raport cu variabila cantitativa X si o functie G(x1,x2,...,xR) unde xi,
i = 1, R reprezinta starile variabilei X. Functia G exprima o anumita insusire esentiala,
un atribut al populatiei in raport cu variabila X. Aceasta functie se numeste functie
determinanta.,
Prin definitie, valoarea medie

a variabilei X este parametrul care lasa invarianta

functia determinanta, adica:


G(x1,x2,...,xR) = G (

, X , ..., X )

(3.0)

Aceasta egalitate se intalneste sub denumirea de relatia lui BOIARSKI-KISINI. In


functie de forma analitica a functiei G, din relatia (3.0) se deduce expresia analitica
(indicatorul) de calcul a valorii medii X .
Determinarea, pe aceasta cale, a valorii medii X , este destul de anevoioasa.
Utilizarea acesteia presupune stabilirea continutului (semnificatiei) si a formei analitice a
functiei determinante G, pentru fiecare caz in parte. Dar, valoarea medie X poate fi

- 71 -

definita ca un raport a doua marimi din care se deduce aceeasi expresie pentru X ca si
din (3.0).
Exista, asadar, doua modalitati echivalente de definire a valorii medii, criteriul
relatiei determinante a lui Boiarski-Kisini si criteriul raportului, ultima fiind mai
accesibila. Criteriul raportului presupune raportarea volumului fenomenului cercetat la
volumul populatiei. Acesta presupune cuantificarea volumului fenomenului in functie de
natura lui.
Pentru a exemplifica cele prezentate mai sus, se considers populatia familiilor
dintr-o localitate, cercetata in raport cu numarul de copii. Datele rezultate din observare
se prezinta ca o serie de repartitie de forma:

xi
X:
N
i i 1,R
In acest caz, functia determinanta are urmatoarea forma:
R

x N

G(x1,x2,...,xR) =

i 1

semnificand numarul total de copii din localitatea respectiva. Pentru a gasi numarul
mediu de copii pe familie se particularizeaza relatia (3.0) dupa cum urmeaza:
R

x N = XN
i 1

i 1

De unde rezulta

- 72 -

x N
i 1

N
i 1

La acelasi rezultat se putea ajunge pornind de la faptul ca numarul mediu de copii


pe familie se poate exprima ca un raport intre numarul total de copii si numarul de familii
din localitatea respectiva, adica:

Nr. total de copii


Nr. de familii

In acest exemplu, fenomenul fiind de natura demografica, volumul acestuia se


cuantifica prin numarul total de copii la nivelul populatiei statistice considerate. Aceasta
este in directa concordanta cu natura si senmificatia variabileiifn raport cu care se face
cercetarea statistica.
Cunoasterea "naturii" parametrului valoare medie, conduce la o definite mai
completa si plina de semnificatie. _
Pentru a intelege semnificafia valorii medii X , trebuie subliniat faptul ca, in
general, variatia unui fenomen, de orice natura, si in particular variatia unei variabile X in
raport cu care este cercetata o populate, este determinata de actiunea simultana a doua
categorii de factori: factori esentiali si factori neesentiali.
In categoria factorilor esentiali intri acei factori care actioneaza asupra tuturor
unitatilor populatiei in mod continuu si in acelasi sens, determinand, in principal, nivelul
de dezvoltare a variabilei pentru fiecare unitate componenta din populatie.
Factorii esentiaii se conjuga in actiunea lor cu factorii neesentiali, care, in general,
au un caracter aleator, sunt numerosi si neuniform raspanditi printre unitatile populatiei.
Fiecare din factorii considerati neesentiali acjioneaza numai asupra unui anumit numar de
unitati din populatie. Ca urmare, acestia pot contribui fie la cresterea nivelului variabilei
(pentru unele unitati din populatie), fie la scaderea nivelului variabilei (pentru alte unitati
din populatie).
- 73 -

La randul lor factorii esentiali nu actioneaza cu aceeasi intensitate asupra tuturor


unitatilor din cadml populatiei considerate, determinand, in acest fel, variatia neuniforma
a variabilei respective in cadrul populatiei.
In consens cu cele sublimate mai sus, se poate afirma ca parametrul valoarea
medie a unei serii statistice care are la baza variabila X, constituie acel nivel pe care 1-ar
putea inregistra variabila tn cadrul populatiei cercetate in conditiile in care factorii
neesentiali nu s-ar fi manifestat, iar factorii esentiali ar fi actionat asupra unitatilor din
populatie cu aceeasi intensitate.
Parametrul valoarea medie, calculat pentru o serie statistica, pune in evidenta ceea
ce este comun, general si esential sub aspectu! nivelului de dezvoltare al variabilei, in
raport cu care este studiata o populatie.
In raport cu natura variabilei ce sta la baza seriei, cat si a formei de prczentare a
indicatorilor cu care aceasta este construita, exista mai multe posibilitati de calcul a
valorii medii.
Pornind de la respectare conditiei (3.0) se determina expresia de calcul a valorii medii.
Pentru diverse valori ale lui k, in stricta concordanta cu continutul si semnificatia functiei
G, se intalnesc mai multe tipuri de medii:
media armonica (k = -1);
media aritmetica (k = 1);
media patratica (k = 2);
media cubica (k = 3);
media de ordinul k in general.
In caz concret, valoarea medie reala X este aceea care se obtine prin indicatorul
(mediu) rezultat fie prin aplicarea criteriului relatiei determinante, fie criteriului
raportului.
Modalitati de calcul a valorii medii
Media aritmetica

- 74 -

Acesta este indicatorul eel mai utilizat in calculul parametrului valoarea medie a
unei serii statistice, asa cum rezulta din practica statistica.
Se considera acum doua serii statistice de repartitie, una formata din frecvente absolute,
iar cealalta din frecvente relative:

xi
X:
N
i i 1,R

(3.4.)

xi
X:
f
i i 1,R

(3.5.)

Avand in vedere respectarea relatiei (3.0) se gasesc urmatoarele expresii de calcul pentru
media aritmetica:
-

in cazul seriilor de forma (3.4) se obtine:


R

xi N i =
i 1

XN
i 1

De unde rezulta

x N
i 1

(3.6)

N
i 1

- 75 -

In cazul seriilor de forma (3.5) se obtine:


R

xi f i =
i 1

X f
i 1

De unde rezulta prin definitie, media aritmetica ponderata, exprimata cu ajutorul


frecventelor relative, respectiv :
R

x f
i 1

i i

f
i 1

x
i 1

fi

(3.7.)

Expresia (3.6) reprezinta, prin definitie, expresia de calcul a mediei aritmetice


ponderate pentru o serie discreta, unde ponderile sunt insasi frecventele absolute
N1,N2,...NR.
Pentru cazul particular in care frecventele absolute sunt egale intre ele, adica:
N1 = N2 = = Nr = C
Relatia de calcul (3.6) devine:
R

x C
i 1

xi
i 1

CR

x
i 1

(3.8.)

i 1

reprezentand media aritmetica simpla a unei repartitii discrete.


Fie o serie de repartitie, care are la baza o variabila continua X, respectiv,

- 76 -

xi 1 xi
X:
f
i i 1,R
Daca s-ar cunoaste densitatea f(x) a variabilei X, atunci, prin definite, media aritmetica
teoretica (speranta matematica) a acesteia, notata cu E(X), ar fi:

E(X) = xf ( x )dx

(3.9)

Cum densitatea sa de probabilitate f(x) nu se cunoaste, aceasta se aproximeaza in


fiecare interval de variable (clasa), prin raportul dintre frecventa intervalului si lungimea
sa, respectiv prin:
f1
,
x1 x 0

f2
fR
,
x 2 x1 x R x R 1

Aplicand relapa de calcul (3.9') se deduce expresia de calcul a mediei aritmetice, dupa
cum urmeaza:
R

E(X) = M(X) = X =

i 1

Folosind notatiile:
X

xi xi 1
fi
2

xi xi 1

'
i

= M(X)=E(X) unde XI, reprezinta mijlocul intervalului "i", obtinem relatia:


R

x f
i 1

'

(3.10)

- 77 -

Relatia(3.10)ne arata ca media aritmetica a unei serii de intervale se reduce la


media aritmetica a unei serii discrete in care clasele sunt reprezentate prin mijloacele
intervalelor de variatie.
Pentru cazul particular de serie care are la baza o variabila alternativa de forma:

X:

0 1

N1 N 2

calculand media aritmetica, obtinem:


R

x N
i 1

N
i 1

0 N i 1N 2 N 2

f 2 (3.11.)
N1 N 2
N

Ca urmare, media aritmetica a unei serii care are la baza o variabila alternativa
coincide cu frecventa relativa a starii notata cu 1.
In vederea intelegerii mai profunde a celor prezentate mai sus, se considera, in
cele ce urmeaza, doua exemple concludente in acest sens.

Exemplu
Angajatii unei societati comerciale se distribuie dupa salariul lunar cuvenit conform
urmatoarei serii de repartitie continua:

- 78 -

1,6 2,0 2,0 2,4 2,4 2,8 2,8 3,2 3,2 3,6 3,6 4,0
X:

7
13
18
6
4
2

unde variabila X este exprimata in milioane lei.


In vederea determinarii salariului mediu pe angajat, se recurge la transformarea seriei de
intervale intr-o serie discreta, dupa cum urmeaza:

1,8 2,2 2,6 3,0 3,4 3,8


X:
7 13 18 6 4 2

Salariul mediu se determine astfel:


R

x N
i 1

N
i 1

==

1,8 * 7 2,2 * 13 2,6 * 18 3,0 * 6 3,4 * 4 3,8 * 2 12,72

2,544
50
5

Presupunem ca este necesara determinarea ponderii agentilor economici, dintr-un


anumit judet, care au inregistrat pierderi in anal calendaristic incheiat. Datele inregistrate
de la institutiile competente se aranjeaza intr-o serie alternativa de forma:

X:

0 1

850 150
- 79 -

Unde starea 1 pentru variabila X corespunde acelor agenti care au inregistrat pierderi in
anul considerat. Media (ponderea) agentilor cu capital de stat care au inregistrat pierderi
se determina astfel:
R

x N
i

i 1

N
i 1

0 * 850 1 *150
0,15 (15%)
1000

In judetul considerat, 15% din agentii economici cu capital de stat au inregistrat


pierderi in anul calendaristic considerat.
Proprietati ale mediei aritmetice
Prezentarea celor mai reprezentative proprietati ale mediei aritmetice prezinta
importanta din punct de vedere al aplicatiilor practice, ilustrand, in acest fel si
posibilitatile de calcul simplificat al acestui indicator. In acest sens prezentam
urmatoarele proprietati:
I

1.Media aritmetica a unei constante este egala cu constanta respectiva, daca la

baza unei serii se afla o variabila-care a inregistrat o singura stare X = C, atunci aplicand
relatia de calcul a valorii medii se obtine:
M(X) = M(C ) = C
2. Media produsului dintre o variabila X si o constanta k este egala cu produsul dintre
media variabilei X si constanta respectiva:
R

i 1

i 1

M(k*X) = kxi f i k xi f i k X kM ( X )

- 80 -

unde am considerat o serie discreta forrmata cu frecvente relative; in acelasi mod se


procedeaza pentru o serie cu frecvente absolute.
3.Media aritmetica a sumei a doua sau mai multe variabile este egala cu suma mediilor
acestora:
M(X1+X2+...+XR) = M(X1)+ M(X2) +...+M(XR)
Pentru a nu ingreuna scrierea si pentru a intelege mai bine, se demonstreaza
aceasta proprietate pentru cazul a doua variabite X, Y. Se considera o populatie cercetata
in raport cu cele doua variabile X si Y pentru care se cunoaste

X si Y

si se intentioneaza

calcularea mediei M(X + Y).


4 Media produsului a r variabile doua cate doua independente este egala cu produsul
mediilor acestora:
M(X1*X2*...*XR) = M(X1)* M(X2) *...*M(XR)

(3.16)

Pornind de la cele patru proprietati ale mediei aritmetice se pot deduce o serie de
consecinte ale acestora, frecvent intalnite in calcule statistice privind media. Prezentam in
acest sens urmatoarele consecinte:
a) Facand media sumei dintre o variabila X si o constanta C se obtine suma
dintre media variabilei si constanta respectiva :
M(X + C) = M(X) + C

(3.19)

Aceasta proprietate se obtine ca o particularizare a proprietatii 3, pentru r = 2 siX2 = C.


Daca constanta C are semnul negativ, atunci relatia (3.19) devine:
M(X-C) = M(X)-C
De unde rezulta:
M(X) = M(X - C) + C

- 81 -

(3.20)

Aceasta ultima relatie, 3.20, conduce la concluzia conform careia, daca starile
unei variabile cantitative cresc sau descresc cu o constanta C, atunci si media noii
variabile obtinute creste sau descreste cu acea constanta.
b) Daca valorile unei variabile X sunt simplificate cu o constanta, atunci media
variabilei X descreste de acel numar de ori.
Daca in proprietatea 2, constanta este de forma 1/k, atunci, relatia (3.13)devine:
M(X/k ) = 1/k * M(X)

(3.21)

De unde rezulta
M(X) = k*M(X/k)
c) Primele doua consecinte conduc la relatia de calcul simplificata a indicatorului
media aritmetica. In acest sens, se face urmatoarea transformare asupra variabilei X:

Z=

X C
k

(3.22)

unde C si k sunt doua constante, iar Z numele variabilei rezultate.


Aplicand operatorul medie asupra relatiei (3.22) se obtine:
M(k* Z) = M(X)-C
M(X) = M(Z)*k + C
M(X) = M (X C/ k)

+C

(3.23)

Aceasta ultima relatie (3.23), constituie formula de calcul simplificat a mediei aritmetice.
Avantajul maxim privind aplicarea acestei relatii se obtine alegand pentru constanta C
starea de mijloc a seriei care are la baza variabila X, iar pentru k valoarea care reprezinta
cel mai mare divizor comun al tuturor diferentelor X-C.
Formula (3.23) se particularizeaza dupa cum seria, care are la baza variabila X,
este o serie construila cu frecvente absolute sau cu frecvente relative:
- in cazul unei serii construita cu frecvenfe absolute, de forma:

- 82 -

xi
X:
N
i i 1,R
Se obtine:

xi C
i1 k * N i

i 1

*k +C

(3.24)

- in cazul unei serii construite cu frecvente relative, de forma:

xi
X:
f
i

i 1,R

Se obtine:

R xi C
X * f i *k +C
i1 k

(3.25)

Formulele (3.24) si (3.25) se aplica in mod frecvent, sub denumirea de formula de


calcul simplificat, pentru determinarea mediei aritmetice, in cazul seriilor consruite cu
indicatorii frecventa absolute si relativa.
d) Proprietatea de aditiune a mediei aritmetice.

- 83 -

Se presupune o populatie care este structurata in raport cu un criteriu C cantitativ sau


calitativ, in P clase, C1, C2, ..., Cp. Atunci media aritmetica a variabilei X, in raport cu care
este studiata populatia, se poate obtine ca o medie a mediilor variabilei din cele P clase.
X X /C

5.Daca frecventele absolute cu care s-a construit o serie, se simplifica cu o constanta,


atunci media aritmetica a seriei respective nu se modifica.
Se considera o serie de forma:
Se noteaza cu N= N/ d , unde d reprezinta o valoare cu care se divid toate
frecventele absolute.

N
x i Ni
xi i

d
i 1
i 1
X
= R
=
R
Ni
Ni

i 1 d
i 1
R

x N
i 1

N
i 1

Pentru a se obtine un maxim de eficienta din punct de vedere a volumului


calculelor mediei aritmetice, este nevoie ca d sa fie ales drept cel mai mare divizor comun
a tuturor frecventelor absolute cu care a fost construita seria.
6 Media aritmetica a unei serii este cuprinsa intre valoarea minima si valoarea
maxima pe care o inregistreza variabila X, care sta la baza seriei.
Aceasta dubla inegalitate rezulta din urmatorul sir de inegalitati:
R

X min

x
i 1

min

Ni

N
i 1

x N
i 1
R

N
i 1

- 84 -

i 1

Ni

max

Xmax

N
i 1

7 Suma abaterilor liniare ale valorilor unei variabile de la media aritmetica este
nula.
M(X - X ) = 0
8 Proprietatea de minim a mediei aritmetice, se formuleaza astfel:
2
M(X - X )2 M ( X x0 )

unde x0 este un numar real oarecare.


Deci, valoarea medie a unei serii calculata cu media aritmetica, in sensul metricii
folosite, este cea mai apropiata de ansamblul valorilor variabilei X.
2.Media armonica
Se considera o serie de forma:

xi
X:
N
i

(3.27)

i 1,R

In cazul unei serii discrete de forma (3.27), media armonica notata cu X-1 se
defineste prin:
R

X 1

i 1

Ni

1
Ni

xi
i 1

(3.28)

numita si formula mediei armonice ponderate.


Daca ponderile sunt egale intre ele, adica N1=N2=...=NR=N*, atunci
relatia(3.28)devine:

- 85 -

X 1

N*

i 1

i 1

1
xi

(3.29)

i 1 x i

care reprezinta formula mediei armonice simple.


In cazul unei serii care are la baza o variabila continua X, respectiv,

xi 1 xi
X:
N
i i 1,R
procedand ca la media aritmetica, pentru media armonica rezulta:
R

X 1

i 1

Ni
(3.30)

1
Ni '

xi
i 1

unde xi reprezinta mijlocul intervalului "i", i = l,R.


Si in acest caz, daca ponderile sunt egale, se obtine relatia de calcul a mediei
armonice simple, de forma:

X 1

R
R

x
i 1

(3.31)

'
i

Proprietati ale mediei armonice


Cateva proprietati ale acestui indicator sunt absolut necesare in vederea
simplificarii volumului de calcule necesare pentru obtinerea valorii medii.

- 86 -

1 Media armonica este cuprinsa intre cea mai mica si cea mai mare valoare a variabilei
X, inregistrata in populatia cercetata
xmin x 1 xmax
2.Daca valoarea medie a unei serii avand la baza variabila X, a fost calculata cu
indicatorul media armonica, atunci, trebuie sa fie verificata urmatoarea relatie:

i 1

R
1
1
Ni
Ni
xi
i 1 X 1

respectiv, relatia determinanta Boiarski-Kisini.


3 Media armonica a unei serii nu se modifica daca ponderile ce intervin in
calculul acestui indicator se simplifica cu aceeasi constanta. Efectul maxim privind
simplificarea volumului de calcule, se obtine daca se alege cel mai mare divizor comun al
tuturor ponderilor, cu care urmeaza a se simplifica acestea.
4 Pentru doua serii, care au la baza aceeasi variabila X de forma:

xi
X:
N
i

i 1,R

xi
X:
m
i

i 1,R

intre care exista urmatoarea relatie de legatura:


mi = kxiNi ;

i= 1, R

(3,32)

media armonica apare ca oa forma transformata a mediei aritmetice.


Urmatoarele egalitati sunt relevante in acest sens:

- 87 -

X 1

m
i 1

1
mi

i 1 x i

x N k
i 1

1
N i xi k

xi
i 1

x N
i 1
R

N
i 1

Ca urmare, daca intre cele doua sisteme de ponderi mi si Ni, exista o relatie de forma
(3.32), media armonica este identica cu media aritmetica.

Exemplu
Se considera o intreprindere industriala formata din 5 sectii unde se cunosc
productivitatile medii in fiecare sectie la nivel de muncitor cat si a realizarilor totale la
nivelul fiecarei sectii. Datele din tabelul de mai jos redau acest lucru:

Sectia Productivitalea medie pe muocitor TOTAL REALIZARI


1

300

300.000

400

450.000

350

400.000

380

420.000

- 88 -

420

500.000

si sunt exprimate in mii lei.


Pornind de la acest tabel, se construieste urmatoarea serie:

400
350
380
420
300
X :
300.000 450.000 400.000 420.000 500.000

unde se respecta relatia mi = xiNi ; Ni reprezentand numarul de muncitori din sectia i,


i = 1,5 . Ca urmare, valoarea medie a acestei serii se poate determina folosind media
armonica, dupa cum urmeaza:

X 1

m
i 1

x
i 1

mi

300.000 450.000 400.000 420.000 500.000

1
1
1
1
1
300.000
450.000
400.000
420.000
500.000
300
400
350
380
420

2.070.000
372.168lei / muncitor
5562

Valoarea medie, astfel obtinuta, reprezinta productivitatea medie pe muncitor la


nivel de intreprindere, intr-o perioada considerata.
Media geometrica
Pentru o serie care are la baza variabila discreta X, formata cu frecvente absolute,
media geometrica notata cu

X g sau X 0

este definita prin expresia:

- 89 -

X g x1N1 x 2N 2 x RN R

(3.33)

Din (3.33), pentru media geometrica ponderata exprimata cu frecvente relative se


deduce:

Xg x

N1
1

N2
2

NR
R

x
i 1

Ni
i

1
N

x
i 1

Ni
N
i

xif i

(3.34)

i 1

Daca variabila X, de la baza seriei este de variatie continua, atunci relatiile de


calcul pentru diversele variante de medie geometrica, raman variabile cu singura
modificare ca valorile xi, i = 1,R, se inlocuiesc cu mijloacele intervalelor de variatie,
calculate conform formulei:

xi xi 1

'
i

i = 1, R

Raportul intre valorile medii calculate prin indicatori diferiti


Se considera o serie care are la baza variabila X a carei valori sunt pozitive. Daca
se calculeaza media acestei serii X, pe rand cu ajutorul indicatorilor: media armonica,
media geometrica, media aritmetica, media patratica etc., folosind acelasi sistem de
ponderi, atunci rezultatele obtinute verifica sirul de inegalitati:
X 1 X 0 X 1 X 2 ,

(3.40)

In relatia de mai sus, are loc egalitatea in cazul cand variabila X este constanta sau
intre ponderi exista anumite relatii.
Deoarece nu prezinta interes studiul variabilelor care inregistreaza o singura
valoare, prezinta inponanta intelegerea erorii ce poate fi comisa cand, in cazul unei serii
date cu un sistem de ponderi determinat, un indicator de calcul pentru medie se substituie
cu altul.
- 90 -

In vederea alegerii corecte a unuia dintre indicatorii de calcul a valorii medii a


unei serii, trebuie folosit in functie de semnificatia variabilei, fie criteriul raportului, fie
criteriul relatiei determinante.
Prin folosirea unuia duitre criterii, rezulta indicatorul care trebuie utilizat, precum
si a sistemul de ponderi corespunzator in calculul valorii medii.
Valoarea mediana
Valoarea mediana, notata cu Me este acea valoare a variabilei cantitative X
care imparte repartitia in doua parti egale, respectiv:
FN(Me) = sau

N(Me) = N/2

(3.41)

Calculul valorii mediane se face diferentiat, dupa cum seria are la baza o variabila
discreta sau continua.
Pentru o repartitie discreta, calculul medianei nu implica probleme deosebite si nici un
volum mare de calcule.
Se considera o repartitie cu frecvente absolute:

x1 x 2
X:
N1 N 2

xi
Ni

xR

NR

(3.42)

In calculul valorii mediane a unei serii discrete, pot aparea doua situatii:
a) volumul N al populatiei este un numar impar;
b) volumul N al populatiei este un numar par.
In ambele cazuri, calculul medianei presupune, in prima faza, determinarea
rangului medianei, notat cu rM , conform urmatoarei relatii:

rM e

1 R
N i N (M e )
2 i 1

- 91 -

(3.40)

a) Daca volumul populatiei N este un numar impar, rangul medianei este un numar
zecimal a carui parte intreaga[N/2] indica numarul de unitati din populatie pentru care
variabila X a inregistrat valori mai mici ca mediana.Ca urmare Me trebuie sa fie valoarea
imediat urmatoare celei de rang [N/2], adica :

Me =

x N

1
2

(3.44)

b) Daca volumul populatiei este un numar par, rangul medianei este un numar intreg si ca
urmare la mijlocul seriei nu se mai afla o valoare a variabilei X cu care sa coincida
mediana ci se gasesc doua valori, mediana calculandu-se in acest caz ca media aritmetica
a acestora. Relatia de calcul a medianei, in acest caz, este:

x N x N
Me =

1
2

(3.45)

2
Pentru o repartitie continua, calculul valorii mediane presupune
verificarea egalitatii (3.41) si ca urmare, trebuie cunoscuta densitatea de
repartitie f(x). Determinarea functiei implica un volum mare de calcule si
deci, din acest motiv, in activitatea practica f(x) este aproximat.
Acest lucru va conduce la o expresie aproximativa de calcul a valorii mediane,
care necesita un volum redus de calcule.

- 92 -

Pentru acesta se considera o repartitie continua in raport cu variabila X, si anume:

x0 x1 x1 x 2 xi1 xi x R 1 x R
N2 Ni
NR
N1

X :

(3.46)

unde intervalele Xi-1- Xi, i = l,R pot fi de lungime egala sau neegala. Calcularea rangului
medianei va permite stabilirea intervalului in care se afla valoarea mediana, interval
numit si interval median. Se cumuleaza frecventele absolute din aproape in aproape pana
ce este indeplinita inegalitatea:

N1 N 2 N i

1
N
2

Ultima frecventa Ni, cumulata, ne permite sa indicam intervalul median [Xi-1 - Xi).
Ca urmare, Me xi 1 xi , si deci se poate scrie:
Me = xi 1 x

(3.47)

unde x este distanta de la limita inferioara a intervalului median (Xi-1) pana la mediana.
Pentru determinarea medianei mai trebuie cunoscuta aceasta distanta x.
Determinarea distantei x , de la limita inferioara a intervalului median pana la
mediana se poate face in ipoteza ca in intervalul median frecventa absoluta se distribute
proportional cu lungimea intervalului, de unde rezulta:
N ( M e ) N ( xi 1 )
Ni

x
xi xi 1

(3.48)

unde:
N(Me)- reprezinta frecventa absoluta cumulata pana la mediana (rangul medianei);
N(Xi-1) - reprezinta frecventa absoluta cumulate pana la limita inferioara a intervalului
median care se mai numeste si suma frecventelor intervalelor premergatoare intervalului
median.

- 93 -

Valoarea necunoscuta x, rezulta din egalitatea (3.48):

x =

N ( M e ) N ( xi 1 )
xi xi 1
Ni

care intocuita in (3.47), permite gasirea formulei aproximative de calcul a medianei:

Me= xi-1+

N ( M e ) N ( xi 1 )
xi xi 1
Ni

(3.49)

Introducandu-se urmatoarele notatii mai sugestive:


Xi-1=XMe- limita inferioara a intervalului median;
Ni = Nme

- frecventa absoluta a intervalului median;

xi -xi-1 =1Me - lungimea intervalului median.


Aceeasi expresie de calcul a medianei este folosita si in cazul in care seria
continua este formata din frecventele relative, cu urmatoarele precizari:

rMe FN ( M e )

1 R
1
fi

2 i 1
2

FN(Me) - reprezinta suma frecventelor relative ale intervalelor


premergatoare intervaluiui median;
fMe ~ notatie sinonima pentru NM reprezentand frecventa relativa a
intervalului median.
Cu aceste notatii relatia (3.50) devine:

- 94 -

M e x Me

FN ( M e ) FN ( x Me )
l Me
FMe

Pe langa procedeul expus anterior, mai exista si un procedeu grafic de calcul a


valorii medianei. Acest procedeu poate conduce la rezultate cel putin la fel de bune, mai
ales in cazul seriilor care au la baza o variabila continua, deoarece, nu mai este necesara
persupunerea repartizarii proportionale a frecventei in intervalul median, cu conditia ca
reprezentarea grafica a seriei sa se faca cat mai exact posibil. In acest sens, se
construieste poligonul cumulativ crescator al seriei si se duce o paralela la axa Ox prin
punctul de ordonata *N. Abscisa punctului de intersectie a acestei paralele cu poligonul
cumulativ crescator va fi valoarea mediana a seriei respective.
Proprietati ale valorii mediane
In cele ce urmeaza se vor prezenta cateva din cele mai reprezentative proprietati
ale valorii mediane, care sa permita o caracterizare cat mai completa a acestui parametru
sub aspectut aplicabilitatii practice.
1. Valoarea mediana a unei serii este cuprinsa intre cea mai mica si cea mai mare
valoarea a variabilei care sta la baza ei:
x min M e x max

Aceasta proprietate este evidenta insasi din definitia data parametrului, dar ea poate
rezulta aplicand o serie de majorari si minorari in relatia de calcul (3.50).
2 Valoarea mediana a unei serii nu se modifica daca frecventele absolute se
simplifica cu aceeasi valoare (de obicei, cel mai mare divizor comun).
Demonstratia acestei proprietati rezulta din formula de calcul a valorii mediane
(3.50). Urmatorul raport:
N ( M e ) N ( x Me )
N Me

- 95 -

care apare in expresia de calcul a medianei ramane invariant la simplificarea frecventelor


absolute cu aceeasi valoare si ca urmare nu afecteaza marimea medianei.
3. Proprietatea de minim. Pentru o repartitie a carei mediana este Me , se poate
arata ca dintre toti parametrii care intervin in caracterizarea seriei respective, mediana
este aceea fata de care valorile individuale ale variabilei X de la baza seriei se abat cel
mai putin, daca aceste abateri se iau in valoare absoluta.
Aceasta proprietate este cunoscuta si sub numele de proprietatea de minim sau de
reprezentativitate a medianei.
In vederea demonstrarii acestei proprietati se considera o valoare reala x0 oarecare si
urmatoarea functie:
(xo) = M\X-x0\
Demonstrarea proprietatii enuntate este echivalenta cu a arata ca valoarea minima
a acestei functii se atinge pentru xo = Me . Fara a particulariza demonstratia, se poate
presupune ca x0 se afla intre doua valori consecutive xr si xr+1 ale variabiiei X.
Aceasta proprietate, confera valorii mediane calitatea de a juca rolul de valoare
medie. Valoarea mediana poate substitui valoarea medie in conditiile in care aceasta din
urma nu poate fi calculata. De obicei, pentru serii care au la baza o variabila X continua,
iar intervalele de variatie marginale sunt deschise si nu dispunem de informatii pentru a
putea fi inchise, calculul valorii medii nu este posibil, caz in care mediana ii va lua locul.
Valoarea mediana prezinta unele avantaje in comparatie cu valoarea medie.
In acest sens, se amintesc cateva dintre acestea:
-

volumul de calcule este mai redus, deoarece, in calculul acesteia nu

intervin toate valorile variabilei;


-

mediana este mai putin afectata de valorile extreme ale variabilei, care uneori, pot fi

anormal de mari sau de mici, situatie in care mediana este mat reprezentativa.
Cu toate aceste avantaje, totusi mediana nu poate compensa avantajele valorii
medii. Mediana nu se bucura de anumite proprietati ale valorii medii, cum ar fi: media
unei sume de variabile, proprietatea de aditiune.

- 96 -

Valoarea medie continua sa ramana parametrul care scoate in evidenta esentialul


despre o populate statistica studiata in raport cu o variabila X, a carei medie se
calculeaza.
Valoarea modala
Valoarea modala M0(X) a unei repartitii reprezinta aceea valoare a variabilei X
careia in corespunde frecventa cea mai mare.
Acest parametru se mai numeste modul, valoare dominanta, sou modala se
noteaza cu M0.
Mod de calcul:
a) Pentru o serie de repartitie discreta, data sub forma:

x1 x2 xi xR
X:
f f f f
i
R
1 2
(3.51)
valoarea modala se citeste direct din serie, nefiind nevoie de nici o tehnica sau formula de
calcul. In cazul acestui tip de serie, valoarea modala va fi acea valoare a variabilei X
pentru care frecventa este cea mai mare.
b) Pentru serii de repartitie continue, respectiv:

x0 x1 x1 x 2 xi1 xi x R 1 x R
f2
fi
fR

f1

X :

(3.52)

modala nu poate fi determinate direct.


Intervalul caruia ii corespunde frecventa cea mai mare, se numeste intervalul
modal si va contine modala. Sa presupunem ca intervalul modal este Xi-1 Xi .
Se vor prezenta doua modalitati de calcul a modalei, una care se bazeaza pe
aproximarea densitatii de probabilitate f(x) de-a lungul a trei intervale de variatie
(intervalul modal si cele doua intervale cu care se invecineaza), iar cealalta metoda

- 97 -

permite gasirea unei formule de calcul aproximativ, a carei deductie se bazeaza pe


principiul repartizarii uniforme a frecventei de-a lungul intervalului modal.
Prima metoda de calcul a modalei presupune estimata densitatea de probabilitate
f(x). Odata gasita f(x), valoarea modala va fi acea valoare a lui x pentru care f(x)
inregistreaza valoarea maxima.
Aceasta metoda se bazeaza pe posibilitatea aproximarii densitatii f(x) de-a lungul
celor 3 intervale precizate cu un arc de parabola de forma:
f(x) =ax2 + bx + c
unde, a, b, c sunt trei parametri ce trebuie determinati.
Estimarea celor trei parametrii a,b si c se face utilizand metoda ariilor, conform
careia suprafafa marginila de arcul de parabola, axa Ox si cele doua perpendiculare
ridicate in punctele de abscisa xi-2 si xi+1 si suprafata celor trei dreptunghiuri care
formeaza histograma seriei de-a lungul celor trei intervale, sa fie egale. Respectarea
acestei conditii conduce la urmatorul sistem de ecuatii:
xi 1

ax

bx c dx f i 1

bx c dx f i

bx c dx f i 1

xi 2

xi

ax

xi 1

x i 1

ax

(3.53)

xi

daca seria este de intervale egale.


Un calcul elementar de integrate definite printr-o functie polinomiala, transforma
egalitatile (3.53) intr-un sistem liniar de ecuatii in necunoscutele a, b, c. Rezolvand acest
sistem, se afla estimatiile pentru cei trei parametrii [5].
Determinarea modalei implica gasirea punctului pentru care f(x) isi atinge maximul.
Acest punct va fi chiar modala si se calculeaza din conditia:
f(x)=0

(3.54)

- 98 -

Rezolvand ecuatia (3.54), solutia acesteia x = M0 reprezinta valoarea modala daca


mai are loc si urmatoarea conditie:
f'(Mo)<0

(3.55)

A doua metoda de calcul a modalei se bazeaza pe repartizarea uniforma a


frecventei de-a lungul intervalului modal.
M0=xi-1+ x ,

(3.56)

unde s-a notat cu x, distanta necunoscuta de la limita inferioara a intervalului modal


pana la modala. Gasirea necunoscutei x, se face din urmatoarea egalitate de rapoarte:
f i f i 1

f i f i 1
xi xi 1 x

(3.57)

care semnifica repartizarea uniforma a frecventelor de-a lungul intervalului modal.


Avem urmatoarea expresie de calcul pentru x:
x

1
1 1

Atunci, formula de calcul aproximativa a modalei va fi :


M 0 ( x ) xMo

1
lMo
1 1

(3.58)

unde :
-

M0 reprezinta valoarea modala;

XMo-reprezinta limita inferioara a intervalului modal

1 -reprezinta diferenta dintre frecventa intervalului modal si frecventa

intervalului precedent;
-

1 - reprezinta diferenta dintre frecventa intervalului modal si frecventa

intervalului urmator;
-

lMo-reprezinta lungimea intervalului modal.


Parametrii de structura

- 99 -

Frecvente sunt cazurile cand este necesara studierea structurii populatiei in raport
cu o variabila sau alta.Parametrii statistici, in forma cea mai generala, folositi in
caracterizarea structurii unei populatii, poarta denumirea de valori quantile.
Valorile quantile ale unei serii de repartitie unidimensionale sunt acele marimi
inregistrate de variabila X, care impart seria in n parti egale ( mai precis imparte
populatia in n parti egale).In acest caz se vor calcula p quantile; p=n-1.
Pentru o serie continua a carei densitate de probabilitate f(x) este cunoscuta,
urmatoarea egalitate este satisfacuta de cele p quantile :

q1

q2

xR

X1

q1

qn 1

f ( x)dx f ( x)dx

f ( x)dx

1
n

(3.2.1.)

unde cele n-1 quantile s-au notat cu q1, q2,..., qn-1


Pentru o serie oarecare quantila de ordinul p, este definita astfel :
FN(qp)= p

1
n

sau

N(qp)= p

N
n

p 1, n 1

Dupa cum seria este cu frecvente relative sau absolute.


Fie o serie de repartitie care are la baza o variabila X discreta, de forma
urmatoare :
x

i
2
R
1

X:
N

N
N
N

1
2
i
R

Pentru calculul valorii quantile de ordinul p ( p= 1, n 1 ), in prima etapa trebuie


determinat rangul acesteia :

rq p N (q p ) p

N
n

- 100 -

Se disting doua cazuri :


a) Daca pn se divide cu n atunci quantila de ordin p se calculeaza ca o medie
aritmetica simpla a valorilor variabilei X, de ordinul rangului si al rangului
majorat cu o unitate, dupa cum urmeaza :

qp

x r qp x r qp 1
2

b) Daca pN nu se divide cu n atunci quantila de ordin p este egala cu acea valoare a


variabilei X corespunzatoare partii intregi a rangului majorat cu 1 :
q p x r qp 1

In cazul seriilor care au la baza o variabila continua , cf. definitiei, cele n-1 quantile
trebuie sa satisfaca relatia 3.2.1.
Fie o serie de variatie continua, ale carei intervale de variatie nu trebuie sa fie neaparat de
lungime egala, cum ar fi :

x0 x1 x1 x 2 xi1 xi x R 1 x R
N2 Ni
NR
N1

X :

In prima etapa se determina rangul quantilei de ordinul p, conform urmatoarei relatii :

rq p N (q p ) p

1 R
Ni
n I 1

Quantila de ordinul p, se calculeaza conform relatiei :


q p xi 1 x ,

unde am presupus intervalul Xi-1 Xi ca intervalul quantilei de ordinul p, iar x ,


reprezinta distanta necunoscuta inca, intre limita inferioara a intervalului quantilei de
ordinul p si valoarea din acest interval cu care coincide quantila de ordin p.
Distanta necunoscuta x se deduce astfel :

- 101 -

N (q p ) N ( xi 1 )
Ni

xi xi 1

Introducem urmatoarele notatii :


x q p xi 1 ,reprezinta limita inferioara a intervalului quantilei de ordinul p.
l q p xi xi 1 , reprezinta lungimea intervalului quantilei de ordinul p.
N q p N i , reprezinta frecventa absoluta a intervalului quantilei qp,

care conduc la formula de calcul ;

q p xq p

N (q p ) N ( x q p )

l qp

(3.2.2.)

Valoarea mediana Me este si un parametru de structura, obtinindu-se ca un caz


particular de quantila , cand n=2.Daca pentru o serie se cunoaste quantila de ordinul 2,
atunci structura populatiei poate fi redata astfel :

xmin M e M e xmax
X:
50% 50%

Semnificand faptul ca jumatate din populatia supusa studiului a inregistrat pentru


variabila X valori cuprinse intre valoarea minima a lui X si mediana, iar cealalta jumatate
din populatie a inregistrat pentru variabila X valori cuprinse intre mediana si valoarea
maxima a lui X.
Formula de calcul a medianei se poate gasi ca un caz particular a relatiei 3.2.2.
Valorile quartile reprezinta acel caz particular al valorilor quantile pentru care n=4.Cele 3
quartile care se obtin, notate cu Q1, Q2, Q3 sunt acei parametri de structura care impart
populatia in 4 parti egale.

- 102 -

In raport cu mediana quartila intai Q1 se numeste quantila mica (inferioara), quartila a


doua Q2 coincide cu mediana si se numeste quartila mijlocie , iar quartila a treia Q3, se
numeste quartila mare (superioara).
Valorile efective pentru cele 3 quartile se determina in mod diferit, dupa cum seria
este discreta sau continua.
1.In cazul seriilordiscrete, rangul pentru cele 3 quartile se calculeaza conform
formulelor :
1 R
1 R
rq1 1 N i N i
4 i 1
4 i 1

1 R
1 R
rq 2 2 N i N i
4 i 1
2 i 1

1 R
3 R
rq 3 3 N i N i
4 i 1
4 i 1

Expresiile rangurilor pentru cele 3 quartile sunt diferite, dupa cum valorile rangurilor
corespunzatoare lor sunt intregi sau nu.
In cazul in care rangurile sunt valori intregi, quartilele se calculeaza ca medie
aritmetica simpla a valorilor lui X corespunzatoare rangului si rangului majorat cu o
unitate.
R

Daca p N i , p 1,3 , se divide cu 4, atunci relatiile pentru calculul quartilelor


i 1

sunt :

Q1

x r Q1 x r Q11
2

- 103 -

Q2

Q3

x r Q 2 x r Q 21
2
x r Q 3 x r Q 31
2
R

iar daca p N i , p 1,3 , se divide cu 4, atunci relatiile pentru calculul quartilelor sunt :
i 1

Q1 x r Q1 1

Q2 x r Q 2 1

Q3 x r Q 3 1

In cazul seriilor de variatie continua , etapele privind determinarea celor 3 quartile


sunt aceleasi.
Mai intai se determina rangul quartilei, conform relatiilor :
Pentru prima quartila :
1 R
1 R
rQ1 1 N i N i
4 i 1
4 i 1
Primul interval care satisface inegalitatea :
N 1 N 2 ... N i

1 R
N i reprezinta intervalul quartilei mici.
4 i 1

Acest interval fiind gasit, quartila mica se determina conform relatiei:

Q1 xQ1

N (Q1 ) N ( xQ1 )
N Q1

l Q1

Pentru quartila mijlocie, calculele se fac ca si pentru mediana.


In cazul quartilei mari, rangul se calculeaza astfel :

- 104 -

1 R
3 R
rQ1 3 N i N i
4 i 1
4 i 1
Primul interval care satisface inegalitatea :
N 1 N 2 ... N i

3 R
N i reprezinta intervalul quartilei mari.
4 i 1

Acest interval fiind gasit, quartila mare se determina conform relatiei:

Q3 x

Q3

N (Q3 ) N ( xQ 3 )
N Q3

lQ 3

Valorile decile reprezinta acel caz particular al valorilor quantile pentru care
n=10. Valorile decile reprezinta acei parametri de structura care impart populatia in 10
parti egale.
Parametrii variatiei
In functie de elementul de referinta folosit in masurarea variatiei, deosebim :
-parametrii variatiei in raport cu valoarea medie
-parametrii variatiei in raport cu valoarea mediana.
1.3.1. Parametrii variatiei in raport cu valoarea medie
Din aceasta grupa fac parte:
-amplitudinea sau variatia maxima
-variatia maxima si variatia minima fata de valoarea medie
-abaterea medie liniara
- abaterea medie patratica.

Amplitudinea sau variatia maxima

- 105 -

Acest parametru se noteaza cu W si se defineste ca fiind diferenta intre valoarea maxima


si valoarea minima inregistrate de variabila.
Amplitudinea , sub forma absoluta, conform definitiei se exprima astfel:
Wx=xmax-xmin

si caracterizeaza imprastierea maxima a variabilei X.

Amplitudinea , sub forma relativa, conform definitiei se exprima astfel:

Wx
X

x max x min
X

sau

Wx
X

100

x max x min
X

100

si masoara imprastierea intre valorile extreme ale variabilei X, in ipoteza ca valoarea


medie ar fi fost 1 sau 100.
Abaterea medie liniara
Abaterea medie liniara notata cu

dx

, reprezinta media aritmetica a abaterilor variabilei X

de la valoarea medie a acesteia, luate in valoare absoluta:


(3.3.1.)

dx M X X

Pentru o serie discreta formata cu frecvente absolute relatia 3.3.1. se particularizeaza in :


R

dx

x
i 1

X Ni
R

N
i 1

Pentru o serie discreta formata cu frecvente relative relatia 3.3.1. se particularizeaza in :

- 106 -

d x xi X f i
i 1

Acest parametru serveste caracterizarii sintetice a gradului de reprezentativitate a


valorii medii, aratind cu cat se abate in medie orice valoare a variabilei X, de la valoarea
medie, intr-un sens sau altul.
Sub forma relativa acest indicator poarta denumirea de coeficient simplu de
variatie si se calculeaza conform relatiei :

VX

dx
X

100

Coeficientul simplu de variatie arata cu cat se abate in medie orice valoare a variabilei X
de la valoarea medie echivalenta cu 1 sau 100%.
Abaterea medie patratica
Acest indicator este utilizat atat pentru caracterizarea gradului de
reprezentativitate a valorii medii cat si in scopul estimarii unor parametrii necunoscuti.
Abaterea medie patratica , notata cu x , se defineste ca fiind media patratica a
abaterilor valorilor variabilei X, de la valoarea medie, adica:

x M (X X )2

Un calcul intermediar in aflarea acestui parametru, il constituie calcularea


patratului abaterii medii patratice, care se numeste dispersie sau varianta si are
urmatoarea expresie de calcul :
x2 M ( X X ) 2 D 2 ( X ) , aceasta fiind o alta notatie pentru varianta.

Relatia de calcul a dispersiei se particularizeaza in raport cu tipul seriei.Astfel, pentru o


serie care are la baza o variabila discreta, varianta are expresia :

- 107 -

x
R

x2

i 1

X )2 Ni
pentru o serie cu frecvente absolute,

N
i 1

sau :
R

x2 ( xi X ) 2 f i pentru o serie cu frecvente relative.


i 1

Pentru o serie data, varianta calculata nu are interpretare, dar daca se extrage
radacina patrata din aceasta se obtine un numar care se exprima in aceleasi unitati de
masura ca si variabila de la baza seriei. Acest numar reprezinta abaterea medie patratica,
simbolizind cu cat se abate in medie in plus sau minus orice valoare xi a variabilei X, de
la valoarea medie.
Parametrul abatere medie patratica se poate exprima si sub forma relativa, caz in
care se numeste coeficient de variatie a lui Pearson si se noteaza cu Vx.
Expresia de calcul este :
Vx

x
100
X

si reprezinta abaterea medie a oricarei valori a variabilei X de la valoarea medie,


considerata egala cu 1 sau 100.
Proprietati ale variantei :
1.Varianta unei constante este egala cu 0.
V(X)=V(C)=0.
2.Varianta unei variabile X este independenta de schimbarea originii.
V(X)=V(Y)
3.Daca intre doua variabile Y si X exista urmatoarea relatie liniara :

- 108 -

Y=aX + b, atunci are loc urmatoarea egalitate :


V(Y)= a2 * V(X)
4.Varianta unei variabile, fiind un moment centrat de ordinul doi, se poate exprima cu
ajutorul diferentei dintre momentul de ordinul doi si patratul momentului de ordinul intai
al variabilei, dupa cum urmeaza :
V(X)= M(X2)-(M(X))2
5.Varianta sumei a doua variabile X si Y este egala cu suma variantelor acestor variabile,
daca cele doua variabile sunt independente.
V(X+Y)=V(X)+V(Y)
6.Varianta unei variabile X fata de o constanta x0 este mai mare decat varianta acestei
variabile fata de media sa, cu patratul diferentei dintre valoarea medie si constanta
respectiva.
M(X-x0)2=M(X X ) 2 ( X x0 ) 2
7.Varianta produsului dintre o constanta si o variabila este egala cu produsul dintre
constanta la patrat si varianta :
V(a X)= a2 V(X)
8.Varianta diferentei dintre doua variabile independente este egala cu suma variantelor
acelor variabile.
V(X-Y)=V(X)+V(Y)
9.Varianta sumei a doua variabile dependente este egala cu suma variantelor celor doua
variabile plus covarianta dintre cele doua variabile.
V(X+Y)=V(X)+V(Y)+2M((X- X )(Y

Y ))

10.Varianta mediei aritmetice a n variabile independente care urmeaza aceeasi lege de


distributie este egala cu varianta uneia dintre variabile impartita la numarul variabilelor
considerate.

- 109 -

1
X1 X 2 . . X n 1
2 (V ( X 1 ) V ( X 2 ) . . V ( X n )) V ( X )
V
n
n n
11.Varianta unor variabile normate este unu, iar media este zero.
Pentru o variabila X oarecare, variabila normata atasata este :
Z=

X X
x

De medie M(Z)=0.
Si varianta Z2 1.
12.Regula de adunare a variantelor.
Varianta in intreaga populatie, care masoara variatia totala in raport cu X, este egala cu
suma a doua variante, din care una masoara variatia in cadrul grupelor, iar cealalta
variatia dintre grupe.
x2 x2 x2
i

Parametrii variatiei in raport cu valoarea mediana


Cand intervalele marginale ale unei serii sunt deschise, valoarea medie neputind fi
calculata, valoarea mediana joaca rolul valorii medii.
In acest scop, trebuie caracterizat gradul de reprezentativitate a valorii medii, care
se realizeaza cu ajutorul urmatorilor parametrii ai variatiei:
-

abaterea interquartila

abaterea interdecila

abaterea interquantila

Abaterea interquartila
Abaterea interquartila , prin definitie este media aritmetica simpla a segmentelor
Me-Q1 si Q3-Me, respectiv:

- 110 -

M e Q1 Q3 M e Q3 Q1

2
2

si arata cu cat se abat in medie in plus sau in minus, de la mediana cele 50% din valorile
variabilei cuprinse intre Q1 si Q3.
Forma relativa a acestui indicator , notat cu Qr este :
Qr

Q Q1
Q
100 3
100
Me
2M e

se numeste coeficient de variatie interquartilic si arata cu cat se abat in medie de la


mediana ( considerata egala cu 100), valorile variabilei inregistrate pentru cele 50% din
unitatile populatiei cuprinse intre Q1 si Q3.
Abaterea interdecila
Acest parametru ofera o imagine mult mai concludenta privind gradul de
reprezentativitate.
Parametrul abaterea interdecila permite caracterizarea gradului de
reprezentativitate a valorii mediane peste 80% din populatia supusa studiului si care
inregistreaza valori pentru variabila, in raport cu care este studiata, cuprinse intre decila
intai si decila a noua.
Abaterea interdecila se noteaza cu D si avem :

D=

D9 M e M e D1 D9 D1

2
2

Reprezentand forma absoluta a parametrului.


Raportind abaterea interdecila D la mediana si inmultind cu 100 se obtine forma
relativa a acestui parametru notata cu Dr :

Dr

D9 D1
100
2M e

care se mai numeste coeficient de variatie interdecilic.Acest coeficient masoara


dispersarea in medie a celor 80% din unitatile populatiei fata de valoarea medianasi

- 111 -

serveste la compararea gradului de reprezentativitate a valorilor mediane calculate pentru


diferite serii.
Gradul de reprezentativitate a medianei este cu atat mai mare cu cat abaterea
interdecila este mai mica.
Abaterea interquantila caracterizeaza gradul de reprezentativitate a valorii mediene.
Pentru acest parametru sub forma absoluta, avem :

q n 1 M e M e q1 q n 1 q1

2
2

iar sub forma relativa, denumita si coeficient de variatie interquantilic este :


qr

q q1
q
100 n 1
100
Me
2M e

Cu cat abaterea interquantilica este mai mica, cu atat valoarea mediana este mai
reprezentativa.
3.4.Parametrii concentrarii

Daca la baza unei serii se afla o variabila numerica, atunci caracterizarea sintetica
a concentrarii valorilor sale in jurul valorii medii se realizeaza in principal cu ajutorul
parametrilor adecvati ai variatiei.
In cazul in care seria are insa la baza o variabila nenumerica, caracterizarea
sintetica a concentrarii starilor variabilei se poate realiza prin:
-

lungimea vectorului de structura

energia informationala

entropia informationala

Lungimea vectorului de structura

- 112 -

Prin definitie intr-un spatiu cu R dimensiuni , norma vectorului f , notata cu

, se

exprima astfel:
f

f
i 1

2
i

Seria prezinta o concentrare maxima daca toate unitatile populatiei sunt repartizate intr-o
singura clasa a carei frecventa relativa va fi 1, iar pentru celelalte clase frecventele
relative vor fi 0.
Energia informationala
Acest parametru a fost introdus de academicianul Octav Onicescu.Prin definitie :
R

2
E= f i , unde s-a notat cu E, energia informationala.
i 1

In cazul unei populatii caracterizate de un grad de concentrare maxim, va exista o clasa


care va avea frecventa relativa egala cu 1, iar celelalte vor avea frecvente relative 0 si ca
urmare Emax=1.
Daca populatia este caracterizata de o concentrare minima, atunci :Emin=1/R.
Forma relativa a acestui parametru, notata cu Er, se deduce astfel :

1
E
R
Er
1
1
R

f
i 1

2
i

1
1
R

1
R

, de unde 0 E r 1 .

Referitor la populatia data , studiata in raport cu o variabila X, se calculeaza Er,


iar daca :
-Er se apropie de 1,atunci populatia respectiva este caracterizata de un inalt grad
de concentrare
- Er se apropie de 0,atunci populatia respectiva este caracterizata printr-o
concentrare minima.

Entropia informationala

- 113 -

Pentru o serie cu frecvente relative, entropia informationala, notata cu H se


defineste astfel :
R

H= f i ln
i 1

1
fi

In cazul unei concentrari minime, entropia informationala inregistreaza o valoare


maxima, deoarece :

1 1
H R ln ln R
R 1/ R
In cazul unei concentrari maxime, entropia informationala inregistreaza o valoare
minima, deoarece :
H=1 ln1+ (R-1)*0*ln 1/0 0

Ca urmare entropia informationala verifica urmatoarea dubla inegalitate :


0 H ln R

Formula relativa a entropiei informationale, notata cu Hr, se determina astfel :


R

Hr

H 0
H

ln R 0 ln R

f
i 1

ln

1
fi

ln R

3.5.Parametrii formei
Parametrii formei unei serii de repartitie, dupa continut, se clasifica in doua grupe ;
-parametrii asimetriei

- 114 -

-parametrii boltirii
Parametrii asimetriei
Asimetria unei serii se defineste in raport cu dispunerea unitatilor intr-o parte sau alta a
valorii medii.
In acest sens o serie de repartitie este simetrica in raport cu media sa daca
frecventele valorilor variabilei X, egal departate de valoarea medie, sunt egale intre ele,
adica :
f (X ) f (X

oricare ar fi astfel incat

si

),

sa se afle printre valorile lui X.

O serie de repartitie este asimetrica in raport cu valoarea sa medie daca exista cel putin o
pereche de valori ale variabilei X, egal departate de valoarea medie, pentru care
frecventele corespunzatoare sa nu fie egale intre ele, adica :
f (X ) f (X

oricare ar fi astfel incat

si

sa se afle printre valorile lui X.

Coeficientul de asimetrie a lui Pearson


Conform acestui parametru, o serie are o asimetrie cu atat mai pronuntata cu cat
diferenta dintre valoarea medie si valoarea modala este mai mare.
Expresia de calcul pentru coeficientul de asimetrie a lui Pearson, notat cu
este :

X Mo
x

In raport cu valoarea obtinuta pentru

, se poate aprecia gradul de asimetrie precum si

sensul acesteia.
In acest sens avem :

=0, atunci
2.daca >0, atunci
1.daca

X M0,

iar seria respectiva este simetrica

>M0 si ca urmare, valoarea modala este situata la stinga mediei,

ceea ce imprima distributiei o asimetrie pozitiva.

- 115 -

Coeficientul de asimetrie a lui Fisher


Acest parametru se noteaza cu

3, iar expresia sa de calcul este :

M ( X X )3
x3

Calculand valoarea acestui parametru, in functie de semnul ei, avem urmatoarele cazuri :
1. 3 0 , ceea ce inseamna ca M ( X X ) 3 0 , adica suma tuturor abaterilor cu
semnul minus, este egala cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a
treia.In acest caz, seria este simetrica.
2. 3 >0, ceea ce inseamna ca M ( X X ) 3 >0.Aceasta este echivalent cu faptul
ca pe total suma abaterilor cu semnul plus de la valoarea medie este mai mare decat suma
abaterilor cu semnul minus si ca urmare seria prezinta o asimetrie pozitiva.
3. 3 <0, deci M ( X X ) 3 <0. Aceasta este echivalent cu faptul ca pe total suma
abaterilor cu semnul minus de la valoarea medie este mai mare decat suma abaterilor cu
semnul plus si ca urmare seria prezinta o asimetrie negativa..
Parametrii boltirii
Aprecierea boltirii unei serii este utila in caracterizarea gradului de
reprezentativitate a valorii medii cat si pentru compararea reprezentativitatii a doua sau
mai multe valori medii ce reprezinta serii diferite.
Parametrul M ( X X ) 4 da o caracterizare numerica sub forma absoluta a
gradului de boltire a unei serii.
Sub forma relativa gradul de boltire a unei serii se masoara cu parametrul :

B4

M (X X )4
sau
x4

B4'

M ( X X )4
3
x4

- 116 -

unde B4' B4 3 , expresie cunoscuta sub denumirea de exces al seriei.


Urmatoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii :
-

daca B4' 0 ( adica B4=3) atunci seria in cauza prezinta aceeasi boltire cu a curbei
normale(excesul este nul)

B4' >0, atunci boltirea corespunzatoare curbei respective este mai inalta si mai

ascutita decat curba normala


-

B4' <0, atunci boltirea corespunzatoare curbei respective este mai plata ( mai

joasa si mai lata) decat curba normala.


PROBLEME PROPUSE
P1.In vederea studierii situatiei actuale pe piata actiunilor, s-a format un esantion
reprezentativ de volum 40, a carui repartitie in raport cu pretul ( in mii lei) este :

X:

10 16

16 22

22 28

28 34

34 40

15

10

Se cere :
a) pretul mediu
b) pretul inregistrat de cele mai multe actiuni din esantion
c) acel pret care divide esantionul in doua parti egale
d) reprezentativitatea pretului mediu
e) sa se calculeze cu cat se abate in medie pretul unei actiuni din esantion de la
pretul mediu
f) folosind valorile quartile sa se studieze structura actiunilor in raport cu pretul.
P2.Intr-o firma s-au realizat 40 de produse in cadrul unui trimestru.Acestea au fost
propuse prelucrarii in mod secvential in doua sectii de productie.
Repartitia produselor realizate in raport cu costurile ( in mii lei) din cele doua sectii a
fost :
C2

100-108

108-116

116-124

124-132

- 117 -

C1
62-66
58-62
54-58
50-58

3
1
1

2
5
10
3

1
3
5
1

1
1
3

Folosind proprietatea conform careia media sumei a doua variabile este egala cu
suma mediilor acestora, calculati costul mediu pe produs.
P.3.Distributia a 100 de angajati din trei ramuri de activitate diferite, in raport cu salariul
primit este :
R
S
8,0-8,5
7,5-8,0
7,0-7,5
6,5-7,0
6,0-6,5
Total

R1
6
6
7
11
10
40

R2
8
7
10
5
30

R3

Total

7
8
5
10
30

100

Folosind proprietatea de aditiune a mediei aritmetice sa se calculeze salariul


mediu pe angajat.
P.4.Se considera o populatie statistica a agentilor ec. Studiata in raport cu volumul
vinzarilor.Distributia populatiei in raport cu aceasta variabila este :

X:

0 200

10

200 400

400 600

600 800

800 1000

40

50

25

Se cere :1)Sa se determine valoarea modala a seriei si interpretati rezultatul


2)Gasiti valoarea mediana si interpretati-o corespunzator.
3) Calculati abaterea medie patratica si interpretati rezultatul.

- 118 -

P.5. Se da urmatoarea repartitie unidimensionala avand la baza o variabila discreta,


relativ la care se cere :
a) Valoarea medie si caracterizarea reprezentativitatii acesteia
b) Valoarea mediana si caracterizarea reprezentativitatii acesteia
c)Valoarea modala
d)Analiza statistica a asimetriei
e)Analiza gradului de concentrare a unitatilor
X:

12

16

unde X-este numarul de copii

P.6. Se da urmatoarea repartitie statistica unidimensionala avand la baza o variabila


continua, relativ la care se cere :
a) Valoarea medie si caracterizarea reprezentativitatii acesteia
b) Valoarea mediana si caracterizarea reprezentativitatii acesteia
c)Valoarea modala
d)Analiza statistica a asimetriei si a boltirii
X-reprezinta nr. de agenti economici care au inregistrat profit :

X:

0 100

152

100 160

160 220

220 280

280 320

15

83

49

20

BIBLIOGRAFIE
1. Biji, E.M., Gogu, E., - Teoria i Tehnica Sondajului Statistic, Editura Oscar Print,
2009.
2. Boboc, C., Analiza statistic multidimensional. Aplicaii n cadrul produselor i
serviciilor, Editura Meteor Press, 2007.
3. Buiga Anua, Statistic inferenial, Editura Universitii ,,Babe-Bolyai, Cluj
Napoca, 2009
3. Cmpeanu, A.S., - Statistic pentru afaceri (Statistic II), Bucureti, 2006.
- 119 -

4. Florea I., Statistic II, Curs litografiat n tipografia Universitii ,,Babe-Bolyai,


Cluj Napoca,1996;
5. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Teorie i aplicaii, Ed. Aisteda,
Alba Iulia, 1998.
6. Jaba, E., Grama, A., - Analiza statistic cu SPSS sub Windows,Editura Polirom,
Bucureti, 2004.
7. Merce E., Urs Fl., Merce C., Statistic, Ed. AcademicPres, Cluj Napoca, 2001;
8. Institutul Naional de Statistic i Studii Economice, Romnia i Uniunea European,
Integrarea statisticii romneti n sistemul statistic european, Bucureti, februarie 2001 ;
9. Institutul Naional de Statistic, Integrarea Statisticii romneti n sistemul statistic
european, Iai, mai 2001;

- 120 -

S-ar putea să vă placă și