Documente Academic
Documente Profesional
Documente Cultură
Statistica
Statistica
TEMA1
INTRODUCERE N STUDIUL
STATISTICII
1. Apariia i dezvoltarea statisticii
Statistica, alturi de matematic este una din cele mai vechi tiine, nceputurile acesteia
neputnd fi dect apreciate. Se tie ns c a aprut din nevoia real de cunoatere n expresie
numeric a diferitelor activiti umane, fenomene i procese ale vieii sociale care se produceau ntrun numr mare de cazuri. nceputurile acesteia, ca form simpl de eviden, se semnaleaz nc de
la cele mai vechi colectiviti umane i a evoluat ulterior sub impulsul dezvoltrii forelor de
producie, respectiv contientiznd procesele sociale. Ulterior, statistica s-a transformat ntr-o
disciplin de grani cu multiple relaii de dependen reciproc cu alte tiine, astzi fcnd parte
din cadrul disciplinelor ce studiaz fenomenele i procesele ntr-o viziune sistemic innd cont de
dinamismul structurilor existente i mai ales de factorii de influen cu caracter variabil n timp i
spaiu. n decursul dezvoltrii sale statistica a parcurs, dei nu neaprat cronologic, urmtoarele
etape de dezvoltare ce pot fi considerate rdcinile istorice ale statisticii moderne:
Statistica practic, a aprut n perioada de destrmare a comunei primitive i constituirii
primelor formaiuni statale ca eviden general n scopuri fiscale, demografice, militare i
administrative. Evidena statistic era doar o simpl consemnare, o exprimare numeric, a
fenomenelor social-economice, reprezentnd principala surs de informare a statului despre starea
social a comunitii. Astfel, n Egiptul antic se inventaria aurul i pmntul din doi n doi ani, iar n
China i Roma antic se practica recensmntul populaiei.
Statistica descriptiv a aprut n secolul XIII sub forma unor anuare de comer exterior.
Este practic cea mai vheche rdcin teoretic a statisticii. De abia n secolul XVIII, n special n
Germania a fost introdus ca disciplin n nvmntul superior i tratat ca o tiin. Reprezentani
de seam ai colii statistice descriptive sunt Francisco Sansovino (1521-1586), Giovanni Bottero
(1540-1617), Herman Conring (1606-1681) acesta fiind primul autor al unui curs de statistic,
Gottfried Achenwall (1719-1772) considerat printele statisticii deoarece a dat nume acestei tiine
prin analogie cu cuvntul latinesc status cu dubl semnificaie: stat i stare social. De fapt,
statistica descriptiv a aprut ca o necesitate impus de apariia i amplificarea schimburilor
comerciale internaionale, statele fiind interesate n cunoaterea potenialului economic al diferiilor
parteneri. Consemnarea cantitativ a diferitelor fenomene social-economice i mai ales a celor din
sfera cererii i ofertei, era nsoit de analize comparative i descrieri tocmai n scopul evalurii ct
mai exacte a statelor. Statistica descriptiv era deci subordonat intereselor statului i a determinat
apariia statisticilor naionale n cadru organizat. Primele state n care au aprut statististici naionale
au fost Suedia (1796), Norvegia (1797) i Frana (1800).
Aritmetica politic a fost o etap de tranziie a statisticii i a aprut n Anglia n cea de-a
doua jumtate a secolului al XVIII-lea, odat cu apariia primelor forme ale capitalismului. Se poate
vorbi de apariia aritmeticii politice odat cu apariia colii aritmeticii politice fondat de
matematicianul i statisticianul William Petty (1623-1687), coal care prin analogie cu tiinele
naturii ce are ca obiectiv principal depistarea regularitilor cu care se produc fenomenele naturale,
schimb scopul statisticii urmrind de aceast dat descoperirea, explicitarea i fundamentarea
regularitilor social-economice cu caracter de legitate. Astfel, statistica este preluat de politicienii
vremii i folosit n fundamentarea legilor obiective sub a cror aciune apar, se manifest i se
3
dezvolt diversele fenomene social-economice. Pentru realizarea unui asemenea scop se impuneau
i metode de analiz adecvate, astfel ca metod general de investigare a fost folosit metoda
analitic preconizat de materialitii metafizicieni ai vremii, iar ca mijloace practice de sintetizare
au fost folosite prelucrrile aritmetice axate n special pe calculul i interpretarea mrimilor medii.
Statistica modern este ultima etap, n care se fac resimite descoperirile din domeniul
statisticii matematice de la sfritul secolului XVIII i mai ales cele din secolul XIX i nceputurile
secolului XX. Este etapa n care statistica se consolideaz ca tiin. Fondatorul statisticii moderne
este considerat a fi Louis Quetelet (1796-1874) care pentru prima dat utilizeaz metodele cantitativ
numerice i analiza statistic. Folosirea aparatului statistico-matematic n prelucrarea i analiza
informaiilor statistice cu referire la diversele fenomene social-economice a ntrit caracterul
tiinific al statisticii. De aceast dat, scopul statisticii moderne este descoperirea, fundamentarea i
urmrirea aciunii legilor social-economice n continua schimbare a condiiilor de timp i spaiu.
Metoda general de investigare este metoda dialectic, potrivit creia fenomenele sunt studiate de la
general la particular i invers, dar mai ales n dinamica intercorelaiilor caracteristice dezvoltrii lor.
Ca metode specifice de analiz-sintez sunt folosite prelucrrile statistico-matematice n cadrul
crora i gsesc o larg aplicabilitate mrimile medii, indicatorii variaiei, coeficienii de corelaie,
metoda celor mai mici ptrate, etc.
Caracteristic pentru secolul al 19-lea este deci folosirea metodei matematice i a calculului
probabilitilor, aa numita statistic inductiv, ai crei promotori au fost Irving Fisher (18671947), George Yule (1871-1951), Karl Pearson (1857-1936), Pafnuti Cebev (1821-1894) i
Andrei Markov (1866-1922). Aceasta a fost etapa de cristalizare a statisticii ca tiin i de
dezvoltare a ariei de aplicabilitate a acesteia. Specific sfritului de mileniu 2 i nceputului
mileniului 3 este faptul c statistica modern a acceptat ca tehnici de lucru cele puse la dispoziie de
tehnologiile informaionale, aproape tot arsenalul de metode i tehnici i procedeee statistice fiind
accesibil prin intermediul unor pachete de programe specializate precum STATISTICA, SYSTAT,
SPSS.
Cele patru etape ale dezvoltrii statisticii sunt strns legate ntre ele, apariia i dezvoltarea
uneia fcndu-se n paralel sau pe fondul celor precedente.
Astzi termenul de statistic se vehiculeaz cu urmtoarele sensuri:
este activitatea practic de statistic care se ocup cu proiectarea cercetrii,
respectiv culegerea, nregistrarea, prelucrarea i analiza datelor numerice i valorilor acestora
referitoare la fenomene social-economice;
este mulimea datelor statistice obinute ca urmare a activitilor practice de
statistic;
totalitatea metodelor de descriere i analiz a datelor numerice n vederea
descrierii legii statistice, altfel spus statistica este de fapt metodologia statistic;
disciplina statistic cu obiectul i metoda proprie de cercetare.
interdependen ntre ele. Atunci cnd fenomenele au la baz o singur cauz, se prezint sub form
de fenomene simple. Spre deosebire de acestea, fenomenele de mas sunt rezultatul influenei
comune a unui numr mare de cauze. n cazul fenomenelor de mas, formele individuale de
manifestare difer de la o unitate la alta n funcie de modul cum se asocieaz factorii sistemici cu
cei ntmpltori, cei eseniali cu cei neeseniali, cei obiectivi cu cei subiectivi. Datorit acestei
aciuni asociate a factorilor se las impresia c fiecare form individual din cadrul ansamblului se
produce la ntmplare, fr s existe o anumit regul de manifestare. Dac ns aceste uniti
individuale sunt analizate la nivelul ansamblului, la nivelul fenomenului de mas, se constat c ele
sunt generate de cauze eseniale, comune. Pentru a descoperi aceste cauze comune este necesar s
se ia n studiu toate cazurile individuale. Dei la nivelul unitilor individuale se manifest o mare
variabilitate n timp i spaiu, tendina lor de manifestare nu poate fi cunoscut i verificat dect la
nivelul asamblului, la nivelul de mas al fenomenelor. Acest lucru este posibil deoarece toate
fenomenele de mas se afl sub incidena legii numerelor mari, potrivit creia variaiile
ntmpltoare de la tendina general se compenseaz reciproc, ntr-un numr mare de cazuri
individuale luate n studiu. De aici se desprinde o prim remarc i anume c fenomenelor de mas
le sunt specifice legile statistice, legi sub form de tendin unde abaterile ntmpltoare ntr-un sens
sau altul se compeseaz reciproc.
n consecin este necesar ca orice cercetare statistic s ia n studiu un numr suficient de
mare de cazuri individuale pentru ca ele s intre sub aciunea legii numerelor mari care presupune
c pentru descoperirea legturii dintre cauz i efect trebuie studiat o mulime relativ mare de
evenimente distincte ale aceluiai fenomen sau proces fie el natural, social sau economic.
Deci, o prim particularitate al obiectului de studiu al statisticii, s-ar putea formula astfel:
statistica studiaz fenomenele social-economice de mas, care prezint proprietatea de a fi
variabile n timp i spaiu i n cadrul crora acioneaz legile statistice.
Particulariti ale obiectului
Statistica studiaz aceste fenomene dintr-un anumit punct de vedere i astfeldeformulm
cea
studiu al statisticii
de-a doua particularitate a obiectului su de studiu i anume: statistica studiaz fenomenele de
mas din punct de vedere cantitativ, numeric.
Pornind de la cele dou particulariti, obiectul de studiu al statisticii se poate defini astfel:
statistica studiaz aspectele cantitative ale fenomenelor de mas, fenomene care sunt supuse
aciunii legilor statistice, care se manifest n condiii concrete variabile n timp i spaiu.
Evident, studiind latura cantitativ a acestor fenomene, statistica contribuie implicit la
cunoaterea esenei lor.
Metoda este reprezentat de totalitatea operaiilor, tehnicilor procedeelor i metodelor de
investigare statistic a fenomenelor ce aparin unor procese de tip statistic. Se mai numete i
metodologia statistic. Metodele de investigaie statistice se folosesc n studii concrete ale
fenomenelor de mas, i ele se diversific n funcie de cele trei etape ale unei cercetri statistice:
culegerea datelor, prelucrarea i analiza acestora. Dezvoltarea metodei statistice este strns legat de
progresele teoriei probabilitilor i statisticii matematice. Metode proprii statisticii pot fi
considerate gruparea datelor, reprezentarea grafic, tehnica comparaiei, abstractizarea i
generalizarea.
Legitile statistice sunt elaborate n cadrul analizei indicatorilor sintetici, generalizatori,
prin comparare, abstractizare, inducie-deducie i alte procedee specifice.
Statistica este considerat o tiin social dat fiind faptul c obiectul de studiu este
reprezentat n cea mai mare parte de fenomene social-economice. Cu toate acestea elemente
metodologice sunt folosite i n studiul fenomenelor de alt natur, ca urmare statistica are un
puternic caracter aplicativ.
Pentru a evita interpretrile greite n statistic i pentru a crea un cadru comun tuturor
activitilor investigate cu metodele statistice, se utilizeaz termeni de baz care se regsesc n toate
cele trei etape ale cercetrii statistice precum i n celelalte statistici aplicate.
Colectivitatea statistic numit i populaie statistic reprezint totalitatea evenimentelor
distincte din cadrul unui fenomen sau proces economic sau social, care formeaz obiectul
investigaiei statistice. Orice cercetare statistic trebuie s nceap cu delimitarea strict a populaiei
statistice n timp i spaiu, precum i din punct de vedere al coninutului i formei organizatorice.
Colectivitatea este de dou feluri:
- colectivitate total, caz n care toate apariiile fenomenului cercetat cu aceeai
carcteristic sunt supuse cercetrii;
- colectivitate parial, caz n care sunt cercetate doar o parte din apariiileColectiviti
individuale ale
statistice
fenomenului.
Colectivitile statistice pot fi:
- statice cnd exprim o stare sau au o anumit ntindere n spaiu formnd mpreun un
stoc la un moment dat;
- dinamice, atunci cnd exprim un flux, o devenire n timp. Elementele componente ale
unei astfel de colectiviti se nregistreaz de-a lungul unui interval.
La colectivitile statice timpul i forma organizatoric sunt constante, la colectivitile
dinamice spaiu i forma organizatoric sunt constante.
Unitile statistice reprezint elementele componente ale colectivitilor statistice
purttoare a unei nsuiri care face obiectul studiului statistic, ele fiind entiti de sine stttoare.
Ca i colectivitile din care fac parte ele pot fi uniti statistice statice sau dinamice. n
cazul colectivitilor statice, unitile compun efectivul, iar n cazul colectivitilor dinamice,
unitile exist n aceleai structuri dinamice, dar n condiii de timp diferite.
Unittea statistic pot fi:
- simpl (studentul n colectivitatea grup, muncitorul n echip);
complex este rezultatul organizrii sociale i economice a colectivitii (grupa n
universitate, echipa n ntreprindere).
De remarcat c unitile statistice pot fi obiective i independente i pot fi studiate att
separat ct i ca submulimi i mulimi.
Caracteristica statistic, denumit i variabila statistic reprezint atributul, nsuirea sau
trstura pe care o are unitatea statistic i care este supus cercetrii.
Caracteristicile statistice se difereniaz dup mai multe criterii:
a) dup coninutul lor pot fi:
- caracteristici de timp (arat apartenena la un moment dat sau la o perioad dat i ofer
posibilitatea cunoaterii evoluiei unui fenomen de la un moment la altul, de exemplu ziua, luna,
trimestrul, anul);
caracteristici de spaiu (arat situarea unitilor statistice ntr-un teritoriu i ofer
posibilitatea cunoaterii unui fenomen n spaiu, de exemplu localitatea, judeul, ara);
- caracteristici atributive (exprim o nsuire, un atribut al unitilor statistice de exemplu
vrsta, salariul, profesia, productivitatea muncii).
b) dup modul de exprimare pot fi:
- caracteristici calitative (exprimate prin cuvinte, de exemplu profesia, sexul, localitatea,
studiile);
caracteristici cantitative (exprimate numeric, de exemplu salariul, vrsta, vechimea n
TEMA 2
CULEGEREA, SISTEMATIZAREA I
PREZENTAREA DATELOR STATISTICE
1. Culegerea datelor statistice
Culegerea datelor este etapa n care se culeg, dup criterii unitare, datele individuale cu
privire la fenomenul de mas studiat. n aceast faz, se nregistreaz, dup o metodologie unitar,
variantele caracteristicilor cuprinse n programul cercetrii statistice.
Aceast faz este hotrtoare deoarece de modul cum este asigurat autenticitatea datelor,
calitatea informaiilor, depind rezultatele obinute n celelalte faze ale investigtaiei statiastice.
nregistrarea datelor se poate realiza fie direct, fie prin interogare, fie pe baza unor
documente deja existente n sistemul informaional economic. n prezent o mare parte din datele
statistice se pot culege din sistemul informaional curent al unitilor economico-sociale. O alt
surs, mai modern, o constituie bazele i bncile de date, gestionate n cadrul diferitelor verigi ale
sistemelor informatice.
Pentru culegerea datelor se pot folosi trei procedee:
1. Procedeul direct, care const n deplasarea cercettorului la unitatea statistic supus
studiului i culegerea datelor direct de la unitatea respectiv. Este folosit ndeosebi n cadrul
recensmintelor.
Pentru cercetri curente sunt utilizate mai frecvent dou variante ale acestui procedeu:
supuse studiului un numr restrns de uniti statistice, iar concluziile finale nu se extind asupra
colectivitii din care acestea fac parte;
sondajul statistic, este o culegere parial n cadrul creia sunt supuse studiului
un numr restrns de uniti statistice, iar concluziile desprinse se extind pri procedee probabilistice
asupra colectivitii din care cele extrase fac parte;
baza atributelor comune, n clase distincte astfel nct unitile statistice ce alctuiesc aceste clase se
fie ct mai omogene. Clasificarea trebuie s ndeplineasc urmtoarele cerine:
- completitudine, adic fiecare unitate statistic s aparin unei clase;
- unicitate, fiecare unitate statistic aparine unei singure clase;
- omogenitate, unitile statistice asemntoare aparin aceleiai clase, iar cele diferite
aparin claselor diferite.
Gruparea statistic este prima sistematizare a datelor observate i const n mprirea
unitilor n grupe omogene n funcie de variaia uneia sau mai multor caracteristici. Caracteristica
n funcie de care se distribuie unitile statistice se numete caracteristic de grupare.
Caracteristica de grupare trebuie s aib un caracter stabil i s determine n mod hotrtor
fenomenul studiat dnd n acelai timp posibilitatea obinerii unor grupe omogene. O grup este
omogen dac n interiorul ei variaia caracteristicii este minim.
Pentru realizarea operaiei de grupare se au n vedere urmtoarele aspecte:
- stabilirea scopului n care se va realiza gruparea;
- alegerea caracteristicilor de grupare eseniale;
- stabilirea numrului de grupe;
- alegerea mrimii intervalului de grupare;
Alegerea caracteristicilor de grupare se va face deci n strns legtur cu scopul analizei
statistice. Numrul de grupe n care va fi mprit colectivitatea depinde de modul n care se va
face gruparea, respectiv de tipul grupei care a fost ales.
Gruprile statistice pot fi clasificate dup mai multe criterii:
a)
dup numrul caracteristicilor folosite:
grupri simple, n care gruparea unitilor statistice se face n funcie de variaia unei
singure caracteristici;
Tabelul 2.1. Modelul de prezentare a gruprii simple
Intervale de grupare
x iinf xi xisup
Nr. uniti
x1inf x1 x1sup
x 2inf x 2 x 2sup
f1
f2
.
xi x
sup
i
fi
x kinf x k x ksup
fk
inf
i
Total
f
i 1
grupri combinate, n care se folosesc mai multe caracteristici de grupare, dar nu mai mult de
patru deoarece aceasta ar frmia prea mult colectivitatea.
n prima coloan sunt trecute intervalele de grupare ntre o limit inferioar i una
superioar, iar n coloana a doua sunt trecute frecvenele. Indicarea limitelor de interval se face
innd cont de reguli bine stabilite ce vor fi prezentate ntr-un capitol urmtor.
c)
d)
e)
c)
b)
Dup coninutul caracteristicii de grupare:
grupri cronologice, n care grupare se face dup o caracterisic de timp;
grupri teritoriale, n care grupare se face dup o caracterisic de spaiu;
grupri dup o caracteristic atributiv.
Dup modul de variaie a caracteristicii de grupare, dac aceasta este numeric:
10
grupri pe variante, n care numrul unitilor statistice poate fi orict de mare, dar variantele
caracteristicii au un numr restrns de valori;
grupri pe intervale egale de variaie, folosite n situaia n care variaia caracteristicii
permite alegerea unei mrimi egale a intervalelor, astfel nct numrul grupelr s nu modifice forma
ei de variaie;
grupri pe intervale neegale, care se folosesc n cazul n care caracteristica de grupare are un
gradmare de variaie, fie n cazul n care diferenierea pe tipuri calitative cere intervale neegale
(grupri tipologice).
Tabelul 2.2. Modelul de prezentare a gruprii combinate dup dou caracteristici
Prima caracteristic de
grupare X
x1
A doua caracteristic
de grupare Y
Frecvenele
corespunztoare
y11
f11
y1i
f1i
y1m
f1m
m
f 1 f1 j
Total grupa 1
j 1
...
...
yi1
...
fi1
xi
yii
fii
yim
fim
m
f i f ij
Total grupa i
j 1
...
...
yk1
...
fk1
..
xk
yki
fki
ykm
fkm
m
Total grupa k
f k f kj
j 1
TOTAL GENERAL
N f i f ij
i 1
i 1 j 1
Seria statistic poate fi alctuit din mrimi absolute sau mrimi derivate ordonate n urma
unor operaii cum ar fi: gruparea sau clasificarea unitilor unei colectiviti; descrierea evoluiei
unui fenomen n timp; descrierea repartizrii n spaiu (teritoriu); prezentarea unor indicatori
privitori la elementele unei uniti complexe sau ale unei populaii, etc.
Paralela ntre dou iruri de date definete o serie statistic simpl n cadrul creia primul ir
conine datele aferente caracteristicii de grupare, iar cel de-al doilea, datele unei caracteristici
oarecare.
Paralela ntre mai multe iruri de date definete o serie complex, n cadrul creia se pot
ntlni una, dou sau mai multe caracteristici de grupare. n general, seriile complexe sunt rezultatul
combinrii mai multor serii simple.
n funcie de tipul caracteristicii de grupare se deosebesc mai multe tipuri de serii: serii
statistice de repartiie (sau de distribuie), serii statistice cronologice (sau de timp) i serii statistice
de spaiu (sau teritoriale).
Seria de spaiu este o paralel ntre nivelurile caracteristicii de spaiu i nivelurile unei
caracteristici oarecare.
De reinut!
Prezentarea datelor sub forma seriilor statistice este deosebit de avantajoas drept pentru
care sunt considerate primul pas n analiza statistic.
Tabelele pot fi astfel utilizate la nregistrarea i culegerea datelor, pe parcursul prelucrrii
acestora ca modalitate de aplicare a algoritmilor de calcul, la interpretarea i analiza informaiilor, la
prezentarea i publicarea indicatorilor calculai. n aceste condiii se pot construi diferite tipuri de
tabele:
Tabelele simple n care se prezint indicatorii statistici ordonai dup anumite criterii
(cronologic, teritorial sau organizatoric) tabelul 2.3-2.5;
Tabelul 2.3. Tabel cronologic
Timpul (t)
Caracteristica
X
Unitatea teritorial
Caracteristica
Y
x0
yA
x1
yB
x2
yC
.
.
.
.
.
.
.
.
.
.
.
.
xt
yZ
Nr. indivizi
x1
f1
x2
f2
12
f3
.
.
.
.
.
.
xk
fk
Tabelele pe grupe folosite cnd datele sunt grupate cu valori centralizate pentru
frecvenele corespunztoare grupelor i pentru valorile caracteristicii principale de grupare
tabelul. 2.6.;
Tabel pe grupe
Tabelul 2. 6.
Nr. de indivizi
f1
f2
f3
.
.
.
.
.
.
G(xk)
fk
Grupe dup
caracteristica X
Total
grupa i
p
G(x1)
f11
...
fjj
...
fpp
1j
j 1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
p
G(xi)
f1i
...
fji
...
fpi
j 1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
G(xk)
f1k
...
fjk
...
fpk
ij
.
.
.
p
kj
j 1
Total grupa j
i 1
ij
i 1 j 1
ij
f ij N
j 1 i 1
x1
x2
...
xi
...
xp
Total
f11
f12
.
.
.
f1i
.
.
f21
f22
.
.
.
f2i
.
.
...
.
.
.
...
.
.
.
fij
fi2
.
.
.
fij
.
.
...
.
.
.
...
.
.
.
fp1
fp2
.
.
.
fpi
.
.
f.1
f.2
.
.
.
f.i
.
.
.
yk
Total
...
f1k
f1.
f2k
f2.
...
.
fik
fi.
...
...
fpk
fp.
.
f.k
f..
Tabele combinate pentru cazul n care datele sunt grupate dup cel puin dou
caracteristici de grupare (Tabelul 2.2.);
Indiferent de de motivul construirii unui tabel acesta trebuie s fie conceput astfel nct
datele s fie prezentate sistematizat i corelat n tabel tocmai pentru a asigura coerena mesajului
informaional. Pentru aceasta alctuirea unui tabel presupune n primul rnd stabilirea dimensiunilor
sale i a machetei, astfel nct configuraia obinut s fac uor de neles problema studiat. n
general macheta tabelului se prezint ca o reea compus din rubrici ce conin date numerice sau
scurte texte.
Subiectul tabelului este constituit din colectivitatea i prile ei componente i se nscrie n
capetele rndurilor. Predicatul tabelului este format din indicatorii care fac caracterizarea
colectivitii i se nscriu n captul coloanelor. Subiectul i predicatul tabelului constitue
elementele de coninut ale acestora.
Elementele de form se refer la titlul tabelului care trebuie s fie concis i clar pentru a
sintetiza coninutul datelor prezentate, preciznd colectivitatea studiat i criteriile de ordonare i
grupare a datelor. ntotdeauna trebuie s se indice unitatea de msur n care se exprim datele.
Coloanele i liniile se numeroteaz distinct.
De asemenea, tabelul trebuie nsoit de note care precizeaz unele noiuni folosite i mai ale
provenina datelor (sursa).
Reprezentrile grafice sunt utilizate la rndul lor fie ca mijloc de alegere a metodelor de
calcul statistic, fie ca metod de prezentare a rezultatelor cercetrii statistice. Reprezentarea grafic
a seriilor e foarte important i sugestiv fiind deseori utilizat n vederea creterii expresivitii i
nelegerii fenomenului respectiv.
Graficele ilustreaz volumul, structura i dinamica fenomenelor, tendina acestora precum i
corelaiile dintre ele. Graficele sunt utilizate deci pentru a facilita nelegerea mesajelor informative
ale tabelelor fiind foarte intuitive.
Indiferent de scopul graficului general n construirea sa trebuie avut n vedere precizarea
tuturor elementelor constitutive: titlul, reeaua, scara de reprezentare, legenda, figura propri-zis,
sursa datelor i notele explicative.
Titlul graficului care trebuie s fie concis i clar astfel nct s asigure specificarea
aspectelor reprezentate precum i localizarea n timp i spaiu a colectivitii cercetate. De regul
graficul preia titlul tabelului care st la baza construirii lui. Se trece fie deasupra graficului, fie sub
grafic dac acesta este integrat ntr-un text.
Reeaua graficului reprezint totalitatea liniilor ajuttoare ce constitue de fapt suportul
graficului ntre care o importan deosebit o au axa sau sistemul de axe de referin. Majoritatea
graficelor statistice apeleaz la sistemul de axe rectangulare, dar se ntlnesc i grafice cu reele
formate din axe concentrice, sectoare de cerc, reele oblice sau curbilinii.
Scara de referin este elementul care asigur proporionalitatea figurilor cu nivelurile
indicatorilor ce se reprezint grafic. Scrile de reprezentare pot fi uniforme (intervalele dintre
diviziuni sunt egale) sau logaritmice (mrimea intevalelor este proporional cu logaritmii zecimali
ai indicatorilor reprezentai) dac avem n vedere mrimea intervalelor dintre diviziuni, sau pot fi
scri liniare (de exemplu rigla) sau neliniare cerc sau arc de cerc (cadranul ceasului respectiv al
aparatelor de msur);
Figura propriu-zis este elementul de interpretat al graficului. Dimensiunile forma i
14
mii pers.
700
650
600
550
500
450
400
350
300
250
200
150
100
50
0
N-E
S-E
Agricultur
S-V
N-V Centru
Bucureti
Industrie
Comer
15
Reeaua
graficului
TEMA 3
INDICATORII STATISTICI
1. Indicatorii statistici primari i derivai
Dac se are n vedere forma de exprimare i modalitatea de obinere atunci putem spune c
indicatorii statistici pot fi absolui sau derivai.
Indicatorii primari se obin n cadrul prelucrrii primare a datelor, i au un coninut concret
i o form concret de exprimare. Ei se exprim n aceeai unitate de msur a caracteristici supuse
prelucrrii statistice fapt pentru care se mai numesc i indicatori absolii. Aceti indicatori au o mare
importan, i se regsesc pe toate structurile sistemului informaional statistic i n toate fazele de
agregare i dezagragare a fenomenelor.
Indicatorii primari se obin n diverse moduri, ceea ce imprim sensuri diferite n procesul
de analiz statistic. Modul de obinere a indicatorilor absolui se sistematizeaz astfel:
Prin nsumarea direct a unitilor componente unui fenomen complex. Numeroasele
exemple de acest fel le vom ntlni cnd analizm sistemul de indicatori a economiei naionale. La
un anumit nivel de nsumare indicatorii absolui obinui, pot fi considerai i indicatorii sintetici;
Prin agregarea unor valori individuale, cu acelai coninut calculat la treptele ierarhice
superioare. Agregarea se deosebete de nsumarea direct prin aceea c, nivelul fenomenului
cumulat se corecteaz cu anumite elemente ce apar pe o treapt ierarhic superioar. De exemplu
venitul naional este un indicator sintetic absolut obinut prin agregare, deoarece evaluarea
elementelor ce-l compun se face n mod diferit n funcie de treapta de agregare;
Prin obinerea unor indicatori absolui direct din observare, atunci cnd se face un studiu
monografic pentru o singur unitate statistic. De exemplu, pentru o societate comercial cu
activitate de producie indicatorii valorici ai produciei sunt n acelai timp i indicatori absolui
nregistrai direct la nivelul unitii.
Analiza statistic pe baza indicatorilor absolui reprezint un neajuns, n sensul c nu
permite o apreciere calitativ asupra fenomenului cercetat. Pentru a nltura acest neajuns fiecare
indicator absolut trebuie confruntat sau comparat cu ali indicatori sau completat cu informaii
suplimentare, de natur calitativ, obinute prin prelucrarea datelor observrii i centralizrii
statistice. Cu toat aceast limit indicatorii absolui constituie punctul de plecare al oricrei analize
statistice.
Indicatorii derivai se obin printr-un proces de comparare, abstractizare i generalizare ce
are loc n faza de prelucrare statistic a indicatorilor absolui.
Indicatorii derivai pun n lumin aspectele cantitative ale fenomenelor i proceselor
cercetate i exprim:
relaiile cantitative dintre diferitele caracteristici, dintre prile componente ale unei
colectiviti sau dintre fenomenele ce se gsesc ntr-un grad de interdependen;
valorile tipice care se formeaz n mod obiectiv n cadrul aceleiai perioade de timp sau n
dinamic;
rolul i contribuia diferiilor factori la formarea mrimii unui fenomen complex, etc.
n general, indicatorii derivai se obin prin aplicarea unui model de calcul statistic de
comparare sau de estimare.
Modelul statistic de comparare se face fie pe baz de diferen, fie pe baz de raport.
16
Compararea pe baz de raport, are o arie mai larg de aplicare, deoarece poate fi utilizat
att pentru indicatorii care au acelai coninut, ct i pentru indicatorii care au coninut diferit, dar
sunt corelai. Datorit multitudinii aspectelor ce trebuie rezolvate la acest tip de comparare pe baz
de raport, vom proceda la tratarea lor separat n capitolele urmtoare.
Modelul statistic de estimare se aplic pentru a estima gradul de influen a diferiilor
factori, asupra unui fenomen anlizat. Astfel, printr-o ecuaie de estimare, putem msura statistic,
dependena unei caracteristici rezultative de o serie de caracteristici factoriale sau dependena unei
caracteristici n funci de timp. Aceste aspecte vor fi tratate n temele urmtoare.
2. Mrimile relative
n categoria indicatorilor derivai un loc important l dein mrimile relative care se obin
pe baza raportului a dou mrimi absolute i exprim printr-un singur numr proporiile
indicatorului raportat fa de indicatorul baz de raportare. Sunt folosite frecvent n calculul i
analiza statistic. Mrimile relative se exprim n uniti sau coeficieni, procente, promile,
prodecimile, procentimile etc.
Exprimarea sub form de coeficieni ne arat cte uniti, din indicatorul absolut raportat,
revin la o singur unitate a indicatorului baz de raportare. n aceast categorie intr indicatorii de
eficien (care exprim fie raportul dintre efect i efort, fie raportul dintre efort i efect indicatori
ai consumului specific).
Exprimarea sub form de procente, este cea mai sugestiv form de exprimare, i ne arat
cte uniti din indicatorul de raportat revin la o 100 de uniti ale indicatorului baz de raportare.
Procentele sunt analizate pentru a analiza structura unui fenomen, greutatea specific, sau
ponderea diferitelor elemente componente. De asemenea, procentele sunt utilizate i la exprimarea
n dinamica unui fenomen fa de o anumit baz neschimbat sau variabil, i cnd ntre valorile
comparate sunt diferene mici ca mrime.
Exprimarea sub form de promile, ne arat cte uniti ale indicatorului de raportat revine la
1000 de uniti ale indicatorului baz da raportare. Se folosesc atunci cnd indicatorul comparat este
mult prea mic fa de indicatorul baz de comparare. Aceti indicatori se folosesc n comparaiile
unde coeficienii sau procentele devin nesugestive, de exemplu indicatorii micrii naturale sau
migratorii ai populaiei, eficiena fondurilor fixe, cheltuieli la o mie lei producie marf etc.
Exprimarea sub form de prodecimile, procentimile, etc., ne arat cte uniti lae
indicatorului de raportat revine la 10.000, respectiv 100.000., etc. ale indicatorului baz de
raportare. Rezultatul raportului exprimat n prodecimile, procentimile, etc., se folosete cnd
comparm indicatori absolui de valori foarte mici n comparaie cu valoarea foarte mare a
indicatorului baz de raportare. De exemplu, numrul de studeni sau de medici ce revin 10.000 de
locuitori, sau alte fenomene demografice (natalitatea, mortalitatea, sporul natural al populaiei etc).
Oricum, n astfel de comparaii, coeficienii, procentele sau chiar promilele au valori att de mici
nct devin nesemnificative.
Calcularea mrimilor relative, este precedat de o alegere atent a bazei de comparaie i,
mai ales, dac datele sunt sau nu comparabile. Fora coeficientului procentului, promilei etc.,
puterea mare de sintetizare i sensul economic, depinde de aceast comparabilitate riguroas a
datelor.
Merit s menionm cteva aspecte care trebuie luate n considerare la asigurarea
comparabilitii datelor: unitatea n definirea noiunilor din programul observrii; modificri n
modul de culegere i prelucrare a datelor statistice; folosirea unor preuri diferite la exprimarea
indicatorilor valorici; surse diferite de informaii; modificri n structura organizatoric a
colectivitii nregistrate.
17
Mrimile relative de structur, se folosec ori de cte ori o colectivitate statistic este
separat n grupe, subgrupe sau clase, dup variaia uneia sau mai multor caracteristici de grupare
sau dup anumite criterii.
Dac notm cu fi frecvenele, atunci:
n
fi
i1
deci:
f *i
- suma frecvenelor,
(3.1)
i 100
n
fi
i 1
(3.2)
Mrimile relative ale planului, se folosesc ori de cte ori un fenomen se desfoar n
mod organizat, programat, planificat. Agenii economici indiferent de specificul activitii, sunt
obligai s utilizeze aceti indicatori, fie la aprovizionare, la producie, fie la desfacerea de mrfuri.
Pentru calculul mrimilor relative ale planului, se introduc urmtoarele informaii privind
perioadele luate n discuie:
Tabelul 3.1.
Perioada de baz
Realizat
y0
Perioada curent
Planificat (programat)
ypl
Realizat
y1
n care:
y0 = realizat n perioada de baz.
ypl = planificat (programat) n perioada curent.
y1 = realizat n perioada curent.
Pe baza celor trei elemente se calculeaz mrimile relative ale sarcinii de plan i mrimile
relative ale realizrii planului.
- Mrimile relative ale sarcinii de plan (Kpl/0), se obin prin raportarea nivelului planificat al
activitii pentru perioada curent sau viitoare (ypl) i nivelul realizat n perioada de baz,
premergtoare celei de plan:
K
pl / 0
pl
100
y
0
(3.3)
- Mrimile relative ale realizrii planului (K1/pl), se obin prin raportarea nivelului
realizrilor din perioada curent (y1) la nivelul planificat pentru aceast perioad (ypl):
y
K
1 100
1 / pl
y
pl
(3.4)
18
Mrimile relative ale dinamicii sunt utilizate pentru caracterizarea evoluiei fenomenelor
n timp, i sunt specifice seriilor cronologice (dinamice).
Ele se calculeaz ca un raport ntre nivelul fenomenului ntr-o perioad i nivelul aceluiai
fenomen din perioada anterioar, considerat drept baz de comparaie i poart numele de indicii
dinamicii.
Pentru rezolvarea acestor indicatori prezentm urmtoarele informaii:
Anii
Nivelul fenomenului
2003
y0
2004
y1
2005
y2
Tabelul 3.2.
2006
y3
de exemplu:
y
y
1 100; 2 100
y
y
0
0
t /0
y
y
t 100
0
(3.5)
etc.,
de exemplu:
y
y
1 100; 2 100
y
y
0
1
t / t 1
y
y
100
t 1
(3.6)
etc.
A/ B
y
y
(3.7)
sau:
K
B/ A
y
B
y
A
(3.8)
n care yA i yB sunt cele dou niveluri absolute comparate (fie componentele unei
colectiviti, fie aceiai colectivitate situat n spaii diferite).
K
K
1
(3.9)
A/ B
B/ A
Se exprim de regul sub form de coeficient i au o larg aplicabilitate n comparaiile
internaionale dintre indicatorii sintetici ai economiei naionale.
n care:
xi = mrimea relativ de intensitate.
19
(3.10)
3. Mrimile medii
n categoria indicatorilor derivai, un loc important l ocup indicatorii medii, ntlnii i
sub denumirea de mrimi medii. Mrimile medii redau ceea ce este tipic, ceea ce se manifest ca
tendin, ca legitate n evoluia unui fenomen, din aceast cauz ele au un grad mare de
aplicabilitate n activitatea practic i n general, n cercetrile statistice.
Pentru a avea un coninut ct mai real, o medie trebuie s sintetizeze valori individuale ct
mai apropiate ntre ele, i s in seama de gradul de omogenitate al colectivitii supuse
cercetrii.
Dac totui colectivitatea statistic este eterogen, atunci se vor calcula medii pariale, pe
grupe de valori. Ele exprim raportul procentual n care se gsete fiecare grup sau element
component, fa de totalul colectivitii statistice.
Pentru ca mrimile medii s sintetizeze corect esenialul, este necesar s se respecte cteva
condiii:
calculul mediilor s se bazeze pe folosirea unui numr mare de cazuri individuale diferite
sub care s-a nregistrat caracteristica, a crei variaie este ntmpltoare, n raport cu fenomenul n
totalitatea lui;
alegerea acestei forme de medie care corespunde cel mai bine formei de variaie a
caracteristicii cercetate.
Media, prin definie este expresia sintetizrii ntr-o singur mrime numeric a tot ceea ce
este esenial, tipic i obiectiv n apariia, manifestarea i dezvoltarea unei variabile. Ea este o
valoare reprezentativ pentru toate nivelurile pe care le sintetizeat, ceea ce nseamn c media
poate substitui orice nivel individual. Substituirea se poate face fie din punct de vedere cantitativ
(nivelul total al caracteristicii supuse cercetrii, calculat prin totalizarea nivelurilor individuale, este
identic cu acelai total calculat cu mediile care substituie niveluirle individuale), fie din punct de
20
vedere calitativ (semnificaia i coninutul mediei depind de gradul nalt de omogenitate al unitii
statistice).
Se tie c evoluia n timp i spaiu al unui fenomen social-economic, este influenat de
intensitatea cu care acioneaz cele dou categorii de cauze: eseniale (obiective) i ntmpltoare
(subiective). Ori, media msoar influena cauzelor eseniale, fcnd abstracie de cauze
ntmpltoare. Deci, media poate fi interpretat ca nivel la care ar fi ajuns caracteristica nregistrat,
dac n toate cazurile, toi factorii eseniali i neeseniali, ar fi acionat constant, deci s-ar fi obinut
o valoare identic.
n sensul prezentat mai sus se poate emite ipoteza c media este sperana matematic,
ctre care tind toate valorile, variaia dintre ele nefiind altceva dect influena factorilor aleatori.
Dar, variaia este minim la fenomenele de acelai tip calitativ i deci poate fi considerat aleatoare.
Dac fenomenele au mai multe tipuri calitative, atunci colectivitatea se mparte pe grupe
omogene i atunci se opereaz cu dou tipuri de variaie: variaia din interiorul grupelor, care este
influena factorilor aleatori, i variaia dintre grupe, care este influena unor factori eseniali care
structureaz colectivitatea.
Diversitatea larg a fenomenelor social-economic, precum i complexitatea variabilitii
acestora, ne oblig s alegem cu grij tipul de medie potrivit.
n practica statistic ntlnim frecvent urmtoarele tipuri de medii: media aritmetic, media
armonic, media ptratic, media geometric, media cronologic, toate acestea calculate ca medii
simple sau ponderate.
21
TEMA4
SERII DE REPARTIIE
1. Seria de repartiie
Gruparea unitilor statistice ale unei colectiviti n funcie de caracteristici atributive
calitative sau cantitative are ca efect obinerea seriilor de repartiie (distribuie). Specific seriilor
de repartiie este faptul c indiferent de tipul lor, spaiul i timpul sunt constante.
Numrul de uniti statistice corespunztoare fiecrei grupe se numesc frecvene absolut, se
noteaz cu fi, iar suma acestora este egal cu numrul de uniti statistice ale colectivitii (N).
k
fi N
(4.1)
i 1
Seriile de repartiie pot fi clasificate dup mai multe criterii:
a)
Dac lum n calcul modul de variaie a caracteristicii de grupare se disting dou
tipuri de serii de distribuie:
Perechile (xi, fi) reprezint termenii seriei de repartiie. Dac f1=f2=...=fk atunci de regul nu
se mai scrie irul frecvenelor, iar irul variantelor caracteristicii x1, x2, ..., xk poart numele de
repartiie simpl.
De cele mai multe ori ns frecvenele difer ntre ele i prin urmare seria poart numele de
repartiie de frecvene.
(4.2)
n care:
xmax, xmin
- varianta maxim i varianta minim a caracteristicii de grupare;
N
- numrul total al unitilor statistice ale colectivitii.
b)
Dac avem n vedere numrul variabilelor (caracteristicilor) de grupare, seriile de
repartiie pot fi:
y2
...
yj
...
yp
Total (frecvenele
caracteristicii X)
f11
f21
.
f12
f22
.
...
.
.
f1j
f2j
.
...
.
.
f1p
f2p
.
f1.
f2.
.
.
xi
.
.
xk
Total (frecvenele
caracteristicii Y)
.
fi1
fk1
.
fi2
.
.
fk2
...
.
.
...
.
fij
.
.
fkj
...
.
.
...
.
fip
.
.
fkp
.
fi.
.
.
fk.
f.1
f.2
...
f.j
...
f.p
f.. =N
Seria de repartiie bidimensional se prezint sub forma unui tabel cu dubl intrare, n care
pe linii se nscriu variantele caracteristicii principale X (x1, x2, ...xk), iar pe coloane cele ale
caracteristicii secundare Y (y1, y2, ...yp), iar n interiorul tabelului frecvenele fij , respectiv numrul de
uniti statistice purttoare att a variantei xi a caracteristicii X, ct i a variantei yj a caracteristicii
Y.
Pentru caracteristicile X i Y, suma frecvenelor absolute fij este egal cu mrimea
colectivitii:
k
ij
(4.3)
i 1 j 1
f ..
i 1
j 1
f i. f ij , f . j f ij
(4.4)
Pentru prezentarea seriilor de repartiie se pot utiliza i ali indicatori de frecven obinui
pe baza frecvenelor absolute.
Dac frecvenele absolute fj se mpart la numrul total al colectivitii, se obin frecvene
relative notate cu fi*.
Frecvenele relative se pot exprima i n procente. Suma frecvenelor relative este egal cu 1
sau 100% dac sunt exprimate n procente.
f
f i* i (100) cu f * 1 (100%)
(4.5)
i
fi
i
i
Pe baza frecvenelor absolute, (sau a frecvenelor relative) se pot determina frecvenele
cumulate, notate cu Fi (respectiv Fi*).
Cumularea frecvenelor se poate face succesiv pornind fie din captul de sus al seriei, fie din
captul de jos, obinnd astfel pentru fiecare valoare a seriei frecvene cumulate cresctor sau
descresctor.
Modele de prezentare a unei serii de repartiie funcie de frecvenele folosite
Frecvena
Frecvena relativ
Frecvena relativ
Variante ale
Frecvena
cumulat
cumulat
fi
i
i
caracteristicii de
absolut
*
*
fi
Fi f j
F
grupare X
fi
f j*
i
N
j 1
x1
x2
.
.
.
f1
f2
.
.
.
F1
F2
.
.
.
j 1
f1*
f2*
.
.
.
F1*
F2*
.
.
.
24
fi
.
.
.
fk
N
fi*
.
.
.
fk*
1
Fi
.
.
.
Fk
-
Fi*
.
.
.
Fk*
-
Diagrama prin coloane este poate cea mai simpl i cea mai rspndit
reprezentare grafic. Indicatorii sunt reprezentai prin benzi a cror lungime este proporional cu
nivelul acestora, iar limea este aceeai pentru toate benzile diagramei.
n practic sunt utile mai ales pentru reprezentarea seriilor de repartiie cu caracteristica de
grupare calitativ.
56
54
52
N r . s tu d e n ti
50
48
46
44
Baieti
Fete
Sex
Histograma este o form particular a diagramei prin coloane fiind specific seriei
de repartiie cu caracteristic numeric. Pe ordonat n dreptul diviziunilor scrii de reprezentare se
trec frecvenele distribuiei.
Dac avem de-a face cu o distribuie pe variante ale caracteristicii de grupare, din dreptul
diviziunilor de pe abscis se ridic perpendiculare a cror nlime este proporional cu nivelul
frecvenelor corespunztoare, obinndu-se astfel histograma prin batoane.
25
20
18
16
14
12
N r. s tu d e n ti
10
8
6
4
4
10
Nota
Dac distribuia este pe intervale de variaie ale caracteristicii de grupare, de pe abscis, din
dreptul intervalelor dintre diviziuni se ridic dreptunghiuri a cror nlime este proporional cu
frecvenele corespunztoare, obinndu-se histograma prin dreptunghiuri.
20
18
16
14
12
10
Nr. firm e
8
6
4
4
10
Poligonul frecvenelor este un alt tip de grafic utilizat pentru reprezentarea grafic
a seriilor de repartiie cu caracteristic numeric. Se poate construi pe baza histogramei
corespunztoare unind vrfurile batoanelor, sau centrele bazelor superioare ale dreptunghiurilor, sau
se poate construi direct pe baza seriei ridicnd de pe axa absciselor perpendiculare ale cror nlimi
sunt proporionale cu frecvenele respective i apoi unind prin segmente de dreapt capetele acestor
perpendiculare.
26
Curba frecvenelor cumulate sau ogiva reprezint una dintre cele mai clare i mai
utile reprezentri grafice ale seriilor de repartiie. Pentru construirea ogivei pe ordonat, n dreptul
diviziunilor se trec frecvenele cumulate.
Pentru distribuiile pe intervale de variaie, de pe abscis, din dreptul intervalelor se ridic
dreptunghiuri cumulative a cror nlime este proporional cu nivelul frecvenelor cumulate
corespunztor. Unind extremitile din dreapta ale bazelor superioare ale acestor dreptunghiuri se
obine ogiva.
120
100
F r e c v e n te c u m u la t e
80
60
40
20
0
4
10
27
28
TEMA 5
I ND I C ATOR I I TE N DI N E I CE N T R A L E
1. Tipuri de medii
Media valorilor individuale ale unei variabile (caracteristici) statistice este expresia
sintetizrii ntr-un singur numr reprezentativ a tot ceea ce este esenial, tipic i obiectiv n apariia,
manifestarea i dezvoltarea acestuia1.
Deci, media este o valoare reprezentativ pentru un grup de date. Se pot defini mai multe
tipuri de medie, dar cel mai frecvent utilizate sunt: media aritmetic, media armonic, media
ptratic i media geometric. Diversitatea larg a fenomenelor social-economic, precum i
complexitatea variabilitii acestora, ne oblig s alegem cu grij tipul de medie potrivit.
Media aritmetic, ( x ) se folosete n general, cnd fenomenul prezint modificri
aproximativ constante apropiate de forma unei progresii aritmetice.
Se calculeaz ca medie aritmetic simpl atunci cnd numrul variantelor caracteristicii
studiate este egal cu numrul unitilor sau cnd se cunoate nivelul totalizat al caracteristicii i
numrul unitilor.
Dac notm cu X o caracteristic i cu x1, x2, .. , xn variantele acesteia, atunci suma tuturor
variantelor ne d nivelul totalizat al caracteristicii:
n
x x ... x x
1
2
n
i
i 1
deci nx xi , de unde:
i 1
n
x
i
x i 1
n
(5.1)
Pentru seriile de distribuie, cnd variantele caracteristicii se nregistreaz de mai multe ori,
deci apar frecvenele f1 , f 2 , ..., f n se calculeaz ca medie aritmetic ponderat.
n aceast situaia fiecrei variante a caracteristicii i corespunde o anumit frecven de
apariie, deci, suma variantelor se va face astfel:
n
x f x f ... x f x f
1 1
2 2
n n
i i
i 1
de unde:
deci:
1
n
xf xf ... xf x f
1
2
n
i i
i 1
n
n
x f x f
i
i i
i 1
i 1
Biji E., Baron T., Statistica teoretic i economic Ed. Didactic i Pedagogic, Bucureti, 1991, pag.71
29
n
xi fi
x i 1
n
f
i
i 1
(5.2)
x
f
0
i
i
- pentru media aritmetic ponderat
b) Proprieti de calcul simplificat:
- Media calculat din variantele caracteristicii micorate n prealabil cu o constant a este
mai mic dect media real cu constanta a, adic:
xi a f i
x a
fi
, deci
xi a f i
a
fi
(5.3)
k i
fi
x
k
, deci
xi
f
k i
fi
(5.4)
Combinnd cele dou proprieti (3.19) i (3.20) se obine relaia de calcul simplificat al
mediei aritmetice:
xi a
f
k i
k a
(5.5)
Constantele a i k pot avea orice valoare, totui se prefer ca acestea s se aleag pe baza
seriei de distribuie i anume:
a
- varianta caracteristicii cu frevena cea mai mare;
k
- mrimea intervalului de variaie.
Rezult din aceasta faptul c relaia de calcul simplificat al mediei aritmetice se folosete n
cazul distribuiilor cu intervale de variaie egale.
Simplificarea calculului const n faptul c odat stabilite valorile pentru a i k n cadrul
seriei, pentru rapoartele
x a
i
se obin valorile: 0 n dreptul lui a, -1,-2,etc deasupra i +1,+2 etc
k
sub zero.
Exemplu: S se determine media aritmetic ponderat pentru urmtoarea serie de distribuie
aplicnd cele dou metode de calcul:
Intervale de variaie dup
Frecvena
30
caracteristica X
2,0 2,5
2,5 3,0
3,0 3,5
3,5 4,0
4,0 4,5
Total
fi
7
16
9
2
1
35
Rezolvare:
Se construiete urmtorul tabel:
Intervale de variaie
dup caracteristica X
2,0 2,5
2,5 3,0
3,0 3,5
3,5 4,0
4,0 4,5
Total
Frecvena fi
xi
xi a
xi a
7
16
9
2
1
35
2,25
2,75
3,25
3,75
4,25
-1
0
1
2
3
-7
0
9
4
3
9
- metoda obinuit:
xi fi
100,75
x i
2,878
35
fi
i
- calculul simplificat
Pentru aplicarea formulei de calcul simplificat se stabilesc:
a=2,75 varianta corespunztoare celei mai mari frecvene;
k=0,5 lungimea intervalului de variaie.
x a
f
i
k i
k a 9 0,5 2,75 0,128 2,75 2,878
x
f
35
Media armonic, ( xh ), se folosete atunci cnd nu se cunosc frecvenele f1, f2 ,...,fn i nici
f i . Se deosebesc dou tipuri de medie armonic:
a) Medie armonic propriu-zis simpl sau ponderat;
b) Medie armonic derivat din media aritmetic ponderat cunoscut sub numele de medie
31
...
x
x
x
x
1
2
n i 1 i
...
x
x
x
x
h
h
h i 1 i
n 1
x
h i 1 i
, deci: x
de unde:
xh
n 1
- pentru serii simple de date.
(5.6)
i 1 xi
n cazul n care, fiecrei variante a caracteristicii i corespunde o anumit frecven de
apariie, nsumarea valorilor inverse se va face astfel:
n 1
1
1
1
f
f ...
f
f
x 1 x 2
x n i 1x i
1
2
n
i
deci:
n
n 1
1
f
f
x i 1 i i 1x i
h
i
de unde:
n
f
x i 1
- media armonic ponderat.
h
n 1
f
i
i 1 xi
(5.7)
nx f
x f
x f
i i
i i
i i n x
h
1
1
1
fi
x f
x f
i
i
i
i
x
x
x
i
i
i
(5.8)
2) Cnd f1x1 f2x2... fnxn, caz n care se folosete numai media armonic ponderat, adic:
32
xi f i
xi f i
x
h
1
fi
x
f
x i i
i
(5.9)
fi
7
9
12
5
2
35
Rezolvare:
Se construiete urmtorul tabel:
Intervale de variaie
dup caracteristica X
fi
xi
1
xi
1
f
xi i
12 18
18 24
24 30
30 36
36 - 42
Total
7
9
12
5
2
35
15
21
27
33
39
0,066
0,047
0,037
0,030
0,025
0,462
0,423
0,444
0,15
0,05
1,529
n
f
35
xh i 1
22,890
n 1
1,529
f
i
x
i 1 i
Exemplu: S se calculeze media armonic pentru urmtoarea distribuie pentru care se cunosc
produsele xi fi diferite ntre ele.
33
Intervale de variaie
dup caracteristica
X
12 18
18 24
24 30
30 36
36 - 42
Total
xi f i
105
189
324
165
78
861
Rezolvare:
Se construiete urmtorul tabel:
Intervale de variaie
dup caracteristica
X
12 18
18 24
24 30
30 36
36 - 42
Total
xi f i
xi
1
xi
1
x f
xi i i
105
189
324
165
78
861
15
21
27
33
39
0,066
0,047
0,037
0,030
0,025
6,93
8,88
11,98
4,95
1,95
34,69
x f
i i 861 24,819
1
34,69
x f
x i i
i
deci:
de unde:
n
x 2 x 2 ... x 2 x 2
p
p
p
i
i 1
n
nx 2 x 2
p
i
i 1
n 2
x
i
i
1
2
x
p
n
deci:
34
n 2
x
i
i
1
x
p
n
(5.10)
n
x 2 f x 2 f ... x 2 f x 2 f
p 1
p 2
p n
i i
i 1
deci:
n
n
x 2 f x2 f
p
i
i i
i 1
i 1
de unde:
n 2
x f
i i
i
1
sau: x
p
n
f
i
i 1
n 2
xi fi
x2 i 1
p
n
fi
i 1
Frecvena
fi
8
6
3
17
Rezolvare:
Se construiete urmtorul tabel:
Intervale de variaie
dup caracteristica
X
100-200
200-300
300-400
Total
x
p
35
Frecvena
fi
xi
xi2fi
8
6
3
17
150
250
350
750
180000
375000
367500
922500
n 2
xi fi
i 1
n
fi
i 1
922500
232,948
17
(5.11)
De reinut!
Media ptratic se folosete n statistic n situaii speciale i anume cnd se d o
importan mai mare termenilor mari ai seriei (n cazul n care acetia predomin, seria fiind
simetric ctre valori mari) sau n cazul n care termenii seriei au valori pozitive sau negative.
Media ptratic este ntotdeauna mai mare dect cea aritmetic. x x p .
deci:
n
x n x
g
i
i 1
de unde:
x n
g
n
x
i
i 1
(5.12)
deci:
n f
f
f
f
x 1 x 2 x n x i
1 2
n
i
i 1
n f
f
f
f
x 1 x 2 x n x i
g g
g
i
i 1
x
de unde:
n f
fi
x i
g
i
i 1
n f
x fi x i
g
i
i 1
(5.13)
1
f i ln xi
fi
sau
x g 10
1
f i lg xi
fi
(5.14)
Prin logaritmare se reduce variaia dintre termeni astfel nct valorile mai mici vor mai bine
reprezentate n valoarea mediei.
36
Frecvena
fi
4
9
6
2
1
22
Rezolvare:
Se construiete urmtorul tabel:
Intervale de variaie
dup caracteristica X
1000-1200
1200-1400
1400-1600
1600-1800
1800-2000
Total
xg e
Frecvena
fi
4
9
6
2
1
22
1
f i ln xi
fi
1
e 22
xi
ln xi
fi ln xi
1100
1300
1500
1700
1900
7500
7,003
7,170
7,313
7,438
7,547
36,473
28,012
64,530
43,878
14,876
7,549
158,845
158,845
e 7,220 1366,489
De reinut!
Media geometric nu poate fi folosit dac n cadrul seriei, exist cel puin un termen
negativ. Se folosete pentru a calcula ritmul mediu de cretere (scdere) a unui fenomen n evoluia
lui n timp. Media geometric este mai mic dect media aritmetic calculat pentru aceeai serie
de date, x g x .
2. Mediana i Modul
Mediana ( Me ) este acea valoare a caracteristicii care ocup locul central al seriei statistice
ordonate cresctor sau descresctor.
Deci, mediana este acea valoare care mparte seria n dou pri egale.
a) n cazul seriilor simple se deosebesc dou situaii:
Seria are un numr impar de termeni, situaie n care mediana este acea variant a
caracteristicii cu rangul
n 1
, n fiind numrul termenilor seriei, dup ce n prealabil seria a fost
2
ordonat;
Exemplul 6: Se d seria simpl cu 5 termeni (numr impar): 5, 6, 9, 2, 10.
Pentru determinarea medianei se ordoneaz seria cresctor: 2, 5, 6, 9, 10.
Se calculeaz rangul medianei
pe poziia 3 adic este Me=6.
37
5 1
n 1 5 1
3=
=3. Mediana este egal cu varianta de
2
3
2
Seria are un numr par de termeni, situaie n care mediana este dat de semisuma
termenilor centrali, dup ce n prealabil seria a fost ordonat.
Exemplul 7: Se d seria simpl: 7, 9, 3, 12, 5, 8.
Se ordoneaz seria cresctor:3, 5, 7, 8, 9, 12. Termenii centrali sunt 7 i respectiv 8.
Mediana va fi: Me=
78
=7,5
2
Calculul algebric:
f
Me l
i
i S k
n f
2
(5.15)
unde:
li
f
2
Sn
k
fm
Intervalul median este acel interval care cuprinde varianta central a irului ordonat al
variantelor seriei.
Nr. salariai
fi
Frecvene cumulate
fiec
11
5
32
14
8
7
3
80
11
16
48
62
70
77
80
Mediana este valoarea ce mparte irul ordonat al seriei n dou pri egale. Cum seria are 80
de termeni, rezult c median se gsete practic ntre varianta de pe poziia 40 i cea de pe poziia
fi
41, deoarece semisuma frecvenelor este
=40.
2
Deci, [2,4; 2,6] va fi intervalul median, deoarece acestui interval i corespunde frecvena
cumulat 48 ceea ce implic faptul c variantele 40 i 41 din irul ordonat se gsesc i ele n acest
interval i implicit i mediana.
38
k
S
n f
2
0, 2
= 2,4 + 0,14 = 2,5 mil.lei
32
Se constat c aceast valoate se plaseaz n intervalul specificat, respectiv [2,4; 2,6].
Me l
i
Determinarea grafic:
Se construiete poligonul frecvenelor cumulate. De pe ordonat din dreptul lui f i / 2 se
duce paralel la abscis pn intersecteaz ogiva. Din aceast intersecie se coboar perpendicular
pe abscis, puncul gsit corespunznd valorii medianei.
De reinut!
Mediana este una dintre variantele seriei statistice. Ea se bazeaz pe toate variantele seriei,
dar numai sub aspectul numrului i poziiei acestora;
Mediana poate fi folosit n locul mediei; Are utilizri largi n calculul unor indicatori ai
asimetriei i mai ales este folosit pentru aprecierea semnificaiei mediei;
Cu ct diferena x Me este mai mic cu att media este mai reprezentativ.
Modul este nivelul caracteristicii care are frecvena cea mai mare. Este cunoscut i sub
numele de dominant i se calculeaz numai pentru seriile de distribuie.
n cazul seriilor de distribuie unidimensionale se dispune, ca i n cazul medianei, de dou
modaliti de calcul:
- Calculul algebric:
Se determin modul conform relaiei:
1 k
Mo l
(5.16)
i
1
2
unde:
li - limita inferioar a intervalului modal;
1 - diferena dintre frecvena intervalului modal i frecvena precedent;
2 - diferena dintre frecvena modal i frecvena urmtoare;
k - mrimea intervalului de variaie.
39
Intervalul modal este intervalul cruia i corespunde frecvena cea mai mare.
Exemplu: Se d seria:
Gr.dup
salariul
lunar
ncasat
2,0-2,2
2,2-2,4
2,4-2,6
2,6-2,8
2,8-3,0
3,0-3,2
3,2-3,4
Total
Nr. salariai
fi
11
5
32
14
8
7
3
80
Frecvene
cumulate
fiec
11
16
48
62
70
77
80
Intervalul modal este[2, 4; 2, 6]. (Intervalul corespunztor celei mai mari frecvene)
32 5
1 k
Mo l
.0, 2 = 2,4 + 0,12 = 2,5
=
2,4
+
i
(32 5)(32 14)
1 2
- Determinarea grafic:
Are la baz histograma prin dreptunghiuri. Pentru determinarea modului se unesc punctele
de inciden a coloanelor adiacente cu vrfurile superioare opuse coloanei modale i din intersecia
celor dou segmente se coboar perpendiculara pe abscis. Valoarea corespunztoare punctului gsit
prin intersecia perpendicularei cu abscisa este chiar modul.
41
TEMA6
INDICATORII VARIAIEI
1. Indicatorii simpli i sintetici ai variaiei
Indicatorii simpli ai variaiei servesc pentru a caracteriza gradul de mprtiere a unitilor
purttoare ale caracteristicilor nregistrate. Se calculeaz pentru a msura amplitudinea variaiei i
mrimea abaterilor valorilor individuale de la media lor. Aceti indicatori se pot exprima att n
mrimi absolute - folosind aceleai uniti de msur ca i pentru caracteristica studiat - ct i n
mrimi relative, calculate n raport cu valoarea medie.
a) Amplitudinea absolut a variaiei (A). Se calculeaz ca diferen ntre nivelul maxim
(xmax) i nivelul minim (xmin) al caracteristicii:
A= xmax - xmin
(6.1)
n cazul unei serii de distribuie de frecvene amplitudinea variaiei se calculeaz ca
diferen ntre limita maxim a intervalului superior i limita inferioar a intervalului inferior. Dac
intervalele sunt deschise atunci amplitudinea variaiei se determin dup ce s-au nchis n mod
convenional intervalele extreme. Fiind legat de unitatea de msur a caracteristicii, amplitudinea
variaiei nu poate fi folosit ca msur a variaiei dect pentru seriile care se refer la aceeai
caracteristic nregistrat pentru aceeai unitate de timp, dar n uniti de spaiu diferite, sau pentru
aceeai unitate de spaiu, dar pentru perioade de timp diferite.
b) Amplitudinea relativ a variaiei ( A% ). Se exprim de regul n procente i se
calculeaz ca raport ntre amplitudinea absolut a variaiei i nivelul mediu al caracteristicii:
A%
A
100
x
(6.2)
n analiza variaiei intereseaz n special abaterile maxime ntr-un sens sau altul:
- n mrimi absolute:
d max xmin x sau d
xmax x
max
(6.4)
(6.5)
42
- n mrimi relative:
x
x
d max min
100
x
sau
x
x
d max max
100
x
(6.6)
De reinut!
Gradul de variaie al unei caracteristici nu depinde ns numai de abaterile maxime care
apar ntr-un sens sau altul, ci de toate abaterile variantelor nregistrate i de frecvenele lor de
apariie. Numai n cazul distribuiei perfect simetrice abaterea absolut maxim pozitiv coincide
cu abaterea maxim negativ, iar n interiorul seriei abaterilor egale n mrimi absolute le
corespund frecvene egale de apariie, ceea ce asigur o compensare a abaterilor nu numai pe total
ci si la nivelul centralizat al unitilor.
Rezult deci c indicatorii simpli ai variaiei fiind calculai pe baza relaiilor dintre doi
termeni ai seriei sau ntre fiecare termen i media lor, nu pot exprima ntreaga variaie a unei
caracteristici nregistrate. De aceea este necesar s se calculeze i indicatorii sintetici ai variaiei
care iau n consideraie toate abaterile caracteristicii.
Pentru a sintetiza ntr-o singur expresie numeric ntreaga variaie a unei caracteristici
trebuie s se recurg tot la valoarea medie calculat din abaterile individuale ale variantelor de la
media lor.
Indicatorii sintetici ai variaiei sunt: abaterea medie liniar, abaterea medie ptratic,
dispersia i coeficientul de variaie.
a) Abaterea medie liniar ( d ). Se calculeaz ca o medie aritmetic simpl sau ponderat
din abaterile termenilor seriei de la media lor, luate n valoare absolut. Abaterile termenilor seriei
de la media lor aritmetic se iau n valoare absolut, deoarece suma algebric a tuturor abaterilor
este egal cu zero ( xi x 0 pentru seria simpl i xi x f i 0 pentru seria de
frecvene).
Formulele de calcul al abaterii medii liniare sunt:
Pentru o serie simpl:
n
xi x
1 n
d i 1
x x
n
ni 1 i
(6.7)
k
x x fi
k
1
d i 1
xi x f i
n
k
i 1
fi
fi
i 1
i 1
(6.8)
x x f %
i
100
100 i 1 i
(6.9)
Dac frecvenele relative sunt exprimate sub form de coeficieni, atunci abaterea medie
liniar va fi:
k
d x x f
i
i
i 1
43
(6.10)
De reinut!
Abaterea medie liniar prezint dezavantajul c nu ine seama de faptul c abaterile mai
mari n valoare absolut influeneaz n mai mare msur gradul de variaie a unei caracteristici,
n comparaie cu abaterile mai mici. n acelai timp, din punct de vedere algebric, nu este indicat
s se renune n mod arbitrar la semnul valorilor din care se calculeaz o valoare medie. Din
aceste considerente se folosete ca principal indicator sintetic al variaiei abaterea medie patratic.
b) Abaterea medie ptratic (abatere standard), ( ). Se calculeaz ca o medie patratic
din abaterile tuturor variantelor seriei de la media lor aritmetic:
- Pentru o serie simpl:
n
xi x 2
1 n
i 1
x x 2
n
n i 1 i
(6.11)
k
x x 2f
i
i
k
1
i 1
x x 2 f
i
i
k
k
f
f i 1
i
i
i 1
i 1
(6.12)
k
xi x 2 f i* %
(6.13)
1 k
i 1
xi x 2 f i * %
100
100 i 1
k
x x2 f *
i
i 1
(6.14)
La abaterea medie patratic calculat ca o medie patratic, prin ridicarea la ptrat se d mai
mare importan abaterilor mai mari n valoare absolut i n consecin, abaterea medie ptratic va
fi ntotdeauna mai mare dect abaterea medie liniar, calculat pentru aceeai serie de date.
Abaterea medie patratic este un indicator de baz care se folosete n analiza variaiei la
estimarea erorilor de selecie, n calcule de corelaie. Alturi de valoarea medie, abaterea medie
ptratic reprezint un parametru ce definete diferitele tipuri de distribuii normale.
Abaterea medie patratic, ca i abaterea medie liniar, se exprim n aceleai uniti ca i
caracteristica a crei variaie o prezint. Din acest motiv, aceti indicatori se pot folosi la
compararea gradului de variaie numai pentru seriile care se refer la aceeai caracteristic statistic.
Pentru compararea gradului de variaie pentru dou sau mai multe caracteristici statistice
diferite se folosete coeficientul de variaie.
c) Coeficientul de variaie (v). Se calculeaz ca raport ntre abaterea medie patratic i
nivelul mediu al seriei. De obicei se exprim sub form de procente.
Formula de calcul a coeficientului de variaie este:
v
100
(6.15)
Dac se cunoate numai abaterea medie liniar, atunci se poate calcula coeficientul de
variaie i pe baza formulei:
44
d
100
x
(6.16)
Coeficientul de variaie poate s ia valori ncepnd cu zero. Cu ct are o valoare mai mic,
cu att seria statistic este mai omogen i deci media este mai reprezentativ. Se apreciaz c n
cazul unui coeficient de peste 35 - 40% media nu mai este reprezentativ i datele trebuie regrupate.
Acest indicator este cel mai expresiv fiind folosit la aprecierea gradului de semnificaie al
mediei pentru o serie de distribuie precum i a omogenitii colectivitii statistice din punctul de
vedere al caracteristicii cercetate.
2
d) Dispersia ( ). Dispersia este un alt indicator sintetic al variaiei cu o larg utilizare n
analiza statistic a fenomenelor.
Se calculeaz ca o medie aritmetic simpl sau ponderat a ptratelor abaterilor termenilor
fa de media lor, deci se mai poate numi i ptratul mediu al abaterilor termenilor fa de media lor.
pentru o serie simpl:
n
x x 2
i
1 n
2 i 1
x x 2
n
n i 1 i
k
xi x 2 f i
2 i 1
k
f
i
i 1
x x 2 fi %
100
100 i 1 i
(6.17)
(6.18)
(6.19)
k
2 x x 2 f *
i
i
i 1
(6.20)
Calculul simplificat al dispersiei prin procedeul originii arbitrare ntr-o serie de repartiie,
utilizat i n determinarea mediei, se bazeaz pe urmtoarea formul:
2
k xi a
k
i
2
k 2 x a 2
k
f
i
i 1
(6.21)
xi a
fi
2 fi 2 x a 2
2
adic,
x a 2 f
i
i x a 2
fi
(6.22)
2. Dispersia calculat din abaterile variantelor de la media lor micorate prin mprire la o
45
f
i 2
k
fi
k2
xi x
f
i
adic,
2
f
(6.23)
k2
fi
11
5
32
14
8
7
3
80
Rezolvare:
Cum xmax = 3,4 i xmin = 2,0, avem:
Amplitudinea absolut a variaiei: A = 3,4 2,0 = 1,4 mil.lei, respectiv amplitudinea
1, 4
.100 53,8%
relativ: A% =
2, 6
Se construiete tabelul:
Gr.dup val.realiz.
(mld.lei)
2,0-2,2
2,2-2,4
2,4-2,6
2,6-2,8
2,8-3,0
3,0-3,2
3,2-3,4
Total
Unde: x
x f
f
i i
i
xi
fi
xi f i
di
di%
2,1
2,3
2,5
2,7
2,9
3,1
3,3
11
5
32
14
8
7
3
80
23,1
11,5
80
37,8
23,2
21,7
9,9
207,2
-0,5
-0,3
-0,1
0,1
0,3
0,5
0,7
-19,2
-11,5
-3,8
3,8
11,5
19,2
26,9
207,2
2,59 2,6 mld.lei
80
fi
xi
xi fi
xi x f i
x x
11
5
32
14
2,1
2,3
2,5
2,7
23,1
11,5
80
37,8
5,5
1,5
3,2
1,4
0,25
0,09
0,01
0,01
x x
. fi
2,75
0,45
0,32
0,14
46
8
7
3
80
Abaterea standard:
2,9
3,1
3,3
23,2
21,7
9,9
207,2
2,4
3,5
2,1
19,6
0,09
0,25
0,49
0,72
1,75
1,47
7,6
k
x x fi
19,6
d i 1
0,245 mld.lei
n
80
f
i
i 1
k
xi x 2 fi
7,6
i 1
0,095 0,3
k
80
f
i
i 1
k
x x2 f
i
i 7 ,6
2 i 1
0,095
Dispersia:
k
80
fi
i 1
0,3
v 100
100 11,58%
Coeficientul de variaie:
x
2,59
v
d
0,24
100
100 9,26%
x
2,59
k
i 1
2
k
f
i
i 1
2
f
k 2 x a2
47
Gr.dup val.realiz.
-mld.lei-
fi
2,0-2,2
2,2-2,4
2,4-2,6
2,6-2,8
2,8-3,0
3,0-3,2
3,2-3,4
Total
11
5
32
14
8
7
3
80
xi
x a
i
k
2
xi a
f
i
2,1
2,3
2,5
2,7
2,9
3,1
3,3
-2
-1
0
1
2
3
4
44
5
0
14
32
63
48
206
k x a
k
i
2
k
f
i
i 1
2
f
k 2 x a 2
206
2
0,04 2,59 2,5 0,095
80
48