Sunteți pe pagina 1din 91

UNIVERSITATEA ANDREI AGUNA

CONSTANA
INFORMATIC I STATISTIC
- nC1L uL Cu8S -
Aslst. unlv. urd.
PARTEA II
Statistic Aplicat
1
1 Introducere
Statistica reprezint tiina colectrii datelor, a prezentrii lor ntr-o form
sistematic, a analizrii acestora i a interpretrii informaiilor numerice obinute.
Practic, dac ar fi s gsim un limbaj comun al tuturor stiintelor, putem spune c
statistica este un numitor comun al acestora. deopotriv, un set de instrumente ce poate fi
aplicat n toate domeniile cercetrii, dar i arta de mnuire corect a acestor instrumente.
n viaa de zi cu zi, statistica ne ofer o palet larg de tehnici cu aplicabilitate n cele
mai variate domenii de interes care ne ajut s rezolvm problemele practice i ne nva s
raionm corect. Pentru unii, statistica nseamn numrul de goluri, de lovituri libere sau de
kornere nscrise ntr-un meci de fotbal, pentru alii nseamn nivelul Produsului Intern Brut,
numrul omerilor, rata de ocupare a forei de munc, indicele preurilor sau rata inflaiei,
alturi de alte asemenea date regsite ntr-o publicaie de specialitate, aa cum pentru alii
statistica poate nsemna o ramur a tiinei, o tiin de sine stttoare sau o disciplin de
nvmnt. Instrumentarul acestei tiine se poate aplica, practic n toate celelalte tiine, fie
c este vorba de psihologie, de medicin, fizic, chimie, meteorologie sau istorie.
Rolul ei nu estes acela de a emite decizii, ci de a orienta decidentul pe o baz
fundamentat asupra deciziei optime pe care o va adopta.
Dei etimologia cuvntului statistic este de origine latin, de la termenul status,
ceea ce reprezint o stare, o situaie, un fapt, astzi, statistica reprezint un ansamblu de
principii i metode cu ajutorul crora putem obine informaii utile despre un set de date.
2 Concepte de baz
Domeniul statisticii este subdivizat n dou arii:
- statistica descriptiv
- statistica inferenial.
- De obiecei, statistica descriptiv este sensul mai cunoscut, mai uzual al
colectrii, organizrii, sintetizrii, prezentrii i descrierii datelor numerice i
nenumerice, ntr-o form convenabil, n timp ce termenul de inferen se
refer la tehnicile de interpretare a rezultatelor obinute prin metodele statisticii
descriptive, utilizate apoi la luarea deciziilor. Deseori, decidenii sunt nevoii
s adopte decizii pe baza datelor care nu provin de la toate unitile
colectivitii investigate, ci de la o parte a acestora i, cu ajutorul statisticii
infereniale, ei pot formula concluzii valabile, n anumii termeni probabilistici,
pentru ntreaga colectivitate.
Exemplul 1
Metodele statisticii descriptive pot ajuta pe managerul unei reele de
magazine de articole de birotic s compare vnzrile sptmnale din
ultimul an n dou puncte de vnzare diferite, astfel: sunt sintetizate
vnzrile sptmnale n cteva niveluri numerice:
- nivelul mediu al vnzrilor sptmnale,
gradul devariaie al vnzrilor fa de media lor.
Tabelele i graficele ajut la prezentarea mai facil, mai clar i mai uor de
reinut a informaiilor obinute, astfel nct s poat fi repede identificate
diferenele eseniale ntre vnzrile celor dou puncte de vnzare.
n cazul n caremanagerul doreatedeschiderea a nc unui punct de vnzare
ntr-o zon a unui ora; el poate organiza o cercetare statistic selectiv n
Statistic Aplicat
2
cadrul creia s afle dac cetenii inclui ntr-un eyuntlon apreciaz ca
pozitiv aceast iniiativ i dac ar fi interesai a-i face cumprturile n
noul punct de vnzare. Managerul va extinde rezultatele cercetrii
eantionului la nivelul ntregii populaii i astfel spunem c el face o
lnferen( xtutlxtlc.
Fenomenele care constituie obiectul de studiu al statisticii sunt fenomene de mas.
Acestea prezint urmtoarele caracteristici:
- se ntlnesc la un numr mare de uniti;
- variaz ca nivel de la o unitate la alta;
- sunt entitti distincte circumscrise n timp, n spaiu i ca structur organizatoric.
Pentru a putea cunoate aceste fenomene este necesar s avem viziunea ntregului
ansamblu. Acestea sunt fenomene nedeterministe.
n antitez cu fenomenele stochastice, exist fenomene deterministe care apar sub
influena unui numr restrns de cauze i care se manifest cu aceeai valoare/nivel, dac i
cauzele care le-au generat sunt aceleai.
Diferenta major dintre Ienomenele deterministe si cele nedeterministe este aceea c
cele din cea dea a doua categorie pot fi cunoscute, identificate i cercetate doar pe cale
experimental. Iar, valabilitatea lor poate fi probat la nivelul fiecrui caz individual n parte.
Astfel, statistica, ca orice tiin i-a elaborat procedee i metode speciale de cercetare,
cum sunt cele ale observrii de mas, ale centralizrii i gruprii, procedee i modele de
analiz i de interpretare statistic.
Metoda statisticii este constituit din totalitatea operaiilor, tehnicilor,
procedeelor i metodelor de investigare statistic a fenomenelor ce aparin unor procese
de tip stochastic.
Pentru a efectua o cercetare statistic asupra unui fenomen i pentru a comunica
rezultatele i concluziile studiului, sau pentru a nelege concluziile la care au ajuns ali
specialiti n cercetrile lor, trebuie s avem cu toii un limbaj statistic comun. Vocabularul de
baz al statisticii cuprinde urmtorii termeni:
2.1 Populaia statistic (colectivitatea statistic)
Reprezint totalitatea elementelor de acelai fel, cu trsturi observabile comune,
studiate atunci cnd vrem s iniiem un demers statistic.
O populaie se consider integral definit, specificat dac s-a elaborat lista complet a
unitilor care o compun. Unele populaii statistice, avnd foarte multe elemente i fiind, deci,
foarte numeroase, pot fi considerate cu caracter infinit.
Exemplul 2
Populaia tuturor absolvenilor unei instituii de nvmnt superior
economic este infinit, deoarece ea poate include absolvenii din trecut,
prezent i viitor.
Dac facem nsanumiteprecizri, delimitri (circumscrieri n timp, n spaiu
i ca organizare), populaiile infinite pot cpta caracter infinit.
Popula;ia absolveu;ilor Jiu Coustau(a, Jiu auul uuiversitar 2012-201S, Je la
0uiversitatea AuJrei Saquua, Iacultatea Je Stiiu(e Fcouomice, Specializarea:
Harketiuq, Auul l.
De remarcat un lucru: cu ct o colectivitatea este mai numeroas, cu att devine mai
dificil cercetarea tuturor elementelor ei. Pentru a evita costurile materiale i pentru a evita
Statistic Aplicat
3
timpul necesar pentru o astfel de cercetare putem extrage o subcolectivitate din colectivitatea
general. Aceasta poart numele de colectivitate parial, eantion sau colectivitate de
selecie.
Eantionul reprezint un subset de elemente selectate dintr-o colectivitate
statistic.
2.2 Unitatea statistic
Este elementul unei populaii statistice care are o serie de trsturi caracteristice ce i
confer apartenena la populaia studiat.
Se pot ntlni dou tipuri de uniti statistice:
- simple: un student, un slariat, un agent economic, un obiect, o prere;
- complexe: o grup de studeni sau o echip de salariai, o familie sau o
gospodrie, o categorie de mrfuri.
2.3 Variabila statistic (caracteristic statistic)
Reprezint o nsuire, o proprietate msurabil a unei uniti statistice, ntlnit la
toate unitile care aparin aceleiai colectiviti (popula(ii) yi care prezint variabilitate
de la o unitate statistic la alta.
Clasificarea variabilelor statistice
I. dup dimensiunea n care sunt definite:
- de timp;
- de spaiu;
- atributive.
II. dup natura variabilelor i modul lor de exprimare:
- variabile cantitative sau numerice;
- variabile calitative sau nenumerice
III. dup tipul variaiei:
- cu variaie continu - cnd pot lua, practic, orice valoare ntr-un interval din
domeniul lor de valori;
- cu variaie discontinu (discrete), atunci cnd pot lua doar anumite valori, strict
determinate ntr-un interval din domeniul lor de valori.
IV. dup numrul de variante pe care l poate avea o variabil, ntlnim:
- variabile alternative, binare sau dihotomice, de tipul variabilelor logice
(adevrat/fals), care pot avea doar dou variante de rspuns (exemplu:
stagiul militar satisfcut/nesatisfcut, starea civil cstorit/necstorit,
genul masculin/feminin etc.)
- variabile nealternative, sunt cele care pot avea cel puin trei variante de
rspuns, de manifestare (exemplu: salariul 1.500 lei, 1.700 lei, 2.000 lei).
Variabilele nealternative se pot transforma n variabile alternative printr-un proces de
dihotomizare (prin impunerea unei limite, a unui prag n cazul variabilelor numerice, sau
prin regrupri ale variantelor n cazul variabilelor nenumerice). Exemplu: nota: mai mic
dect 5 i mai mare sau egal cunota 5; profesia: economist i alte profesii).
Statistic Aplicat
4
V. dup modul de obinere:
- variabile primare;
- variabile derivate.
VI. dup relaia de cauzalitate:
- variabile independente;
- variabile dependente (exemplu: dac pentru 30 de magazine s-au nregistrat:
suprafaa comercial i valoarea vnzrilor, atunci suprafaa comercial este
variabila independent, cauzal, iar valoarea vnzrilor reprezint variabila
dependent, rezultativ).
2.4 Varianta statistic
Nivelul sau valoarea unei variabile, indiferent de natura/tipul acestei variabile,
ntlnit la o anumit unitate se numete variant.
Exemplul 3
Un angajat al unei companii are o vechime de 7 ani n munc.
Angajatul reprezint unitatea statistic, vechimea n munc este variabila
urmrit, iar 7 este varianta acestei variabile.
2.5 Frecvena unei variante
Exemplul 4
2 angajai ai unei companii sunt de profesie analiti financiari, atunci: angajatul
este unitatea statistic, profesia este variabila studiat, analist financiar
reprezint o varianta acestei variabile, iar 2 este frecvenaacestei variante.
2.6 Date statistice
Clasificarea datelor statistice n functie de tipul variabilelor ale cror valori le
reprezint:
- temporale, spaiale sau atributive dac se refer la o caracteristic de spaiu, de
timp sau atributiv);
- cantitative sau calitative dac se refer la o variabil numeric sau nenumeric;
- datele cantitative pot fi continue sau discrete. n cazul n care datelor calitative li se
acord coduri numericeacestea pot fi exprimate numeric.
Clasificarea datelor statistice n functie de numrul variabilelor la care se refer:
- date univariate datele statistice analizate se refer la o singur variabil sau
caracteristic statistic;
- date bivariate datele statistice se refer la dou variabile; n acest caz, se poate
studia separat fiecare caracteristic n parte, sau se poate analiza una dintre variabile,
n relaie cu cealalt variabil, punndu-se n eviden posibila legtur dintre ele;
- date multivariate atuci cnd datele statistice se refer la trei sau mai multe variabile
statistice; i n acest caz se pot analiza separat datele, pentru fiecare variabil statistic
n parte, sau interdependena dintre mai multe caracteristici.
Statistic Aplicat
5
Clasificarea datelor statistice de Dup momentul sau perioada de timp la care se refer
datele nregistrate, putem ntlni:
- date dinamice batunci cnd datele se refer la mai multe momente sau perioade de
timp succesive;
- date statice atunci cnd ele se refer la acelai moment / perioad de timp.
3 Scale de msurare a datelor statistice
Pentru ca datele statistice s poat fi supuse prelucrrii prin metode statistice, ele trebuie
msurate, adic exprimate cantitativ, cu ajutorul numerelor. Modalitatea prin care se atribuie
aceast valoare numeric, precum i semnificaia ei depinde de nivelul de msurare.
Fiecrui nivel de msurare i corespunde o anumit scal de msurare, care poate fi
identificat n funcie de operaiile matematice ce pot fi efectuate cu datele statistice. De
remarcat c toate operaiile matematice permise pentru o anumit scal sunt valabile i pentru
toate scalele inferioare ei, dar nu i pentru cele urmtoare.
3.1 Scala nominal (categorial)
Este scala cu cel mai sczut nivel al preciziei, utilizat pentru a atribui variantelor
caracteristicii msurate nsuiri, cu scopul de a stabili diferene calitative ntre observaii.
Rolul scalei nominale este acela de a ncadra unitile statistice n grupe/clase/categorii
diferite, dup un anumit criteriu, fr a indica dac o categorie este mai bun sau mai puin
bun dect alta, dac o categorie este mai larg sau mai restrns dect alta.
Operaiile admise pe scala nominal sunt echivalena i non-echivalena. Astfel, o
unitate statistic poate avea caracteristica definitorie pentru o anumit clas (=) sau nu ().
Putem spune, de exemplu, masculin () feminin, dar nu i masculin > feminin.
Exemplul 5
Pentru uurarea procesului de prelucrare a datelor, aceste variante/categorii
nominative se pot codifica numeric, sub forma: (0 = masculin, 1 = feminin); (1 =
inginer, 2 = informatician, 3 = profesor etc.).
Aceste numere nu sunt purttoare ale vreunei informaii cantitative, ci doar separ
subiecii n clase/categorii distincte din punctul de vedere al statutului civil, al
sexului, al profesiei etc. La fel cum numerele de pe tricourile unor juctori dintr-o
echipa din sport nu reflect importana juctorilor sau nivelul la care evolueaz n
timpul unui meci, ci n principal au rolul de a identifica juctorii.
De re: cu aceste coduri numerice nu se pot determina medii sau ali indicatori
statistici i nu se pot efectua comparaii, dar se pot determina frecvenele de
apariie ale ficrei categorii.
3.2 Scala ordinal (categorial)
Ofer un plus de precizie n msurare, fa de scala nominal, deoarece ea nu numai
c mparte unitile colectivitii studiate n clase/grupe omogene diferite, din punct de vedere
al unei caracteristici, ci permite i stabilirea unei relaii de ordine ntre aceste clase/grupe.
Exemplul 6
Evaluarea anual unui profesor de catre studentii (1 = deloc popular, 10 = foarte
popular); preferinele consumatorilor fa de o marc de buturi rcoritoare (1 =
nu este deloc bun; 5 = foarte bun); ordinea n care sosesc ciclitii dintr-o curs
(primul, al doilea, al treilea etc., fr a putea spune cu cte minute i secunde a
Statistic Aplicat
6
sosit primul clasat mai repede dect al doilea); calificativele obinute de colarii
claselor I-IV la o materie (insuficient, sufficient, bine, foarte bine); autopercepia
unor persoane privind greutatea lor corporal (sub greutatea normal, cu greutate
normal, peste greutatea normal); salariul obinut de angajaii unei companii (sub
salariul mediu, egal cu salariul mediu, peste salariul mediu); temperatura
nregistrat ntr-o staiune montan n 10 zile din luna august (sub cea normal,
normal, peste cea normal sau foarte sczut, sczut, normal, ridicat, foarte
ridicat).
Scala ordinal indic poziia unui element ntr-o serie ordonat, nu i
magnitudinea sau mrimea diferenei existente ntre dou poziii ale scalei, dar nu
ne permite s afirmm cu cte uniti de msur difer o categorie de categoria
nvecinat
3.3 Scala de interval (cardinal)
Caracteristici:
- este prima scal numeric (se aplic variabilelor numerice);
- permite, pe lng stabilirea unei relaii de ordine ntre variantele numerice ale acestei
scale i determinarea i interpretarea diferenelor dintre acestea;
- valorile numerice acordate pe aceast scal au semnificaie cantitativ, de aceea este
permis nsumarea sau scderea lor;
- fixarea punctului de origine (zero) poate fi fcut arbitrar (originea nu este fix);
- unitatea de msur poate fi aleas arbitrar.
Exemplul 7
S presupunem c avem caracteristica temperatura medie zilnic ntr-o localitate
n 20 de zile consecutive din luna decembrie. Dac n una din zile s-a nregistrat
o temperatur de 0 grade Celsius, acest lucru nu nseamn c n acea zi nu a
existat temperatur., ci acesta este nivelul temperaturii nregistrat n acea zi.
3.4 Scala de raport (proporional)
Caracteristici:
- se aplic variabilelor numerice, avnd cel mai nalt nivel de precizie;
- dou valori, msurate pe aceast scal se afl, indiferent de unitatea de msur
folosit, n acelai raport una fa de alta;
- pe aceast scal sunt permise i operaiile de multiplicare i de divizare;
- punctul de origine (zero) este unul fix, rigid, este zero absolut, matematic i reprezint
absena caracteristicii;
- unitatea de msur poate fi aleas arbitrar.
Exemplul 8
n practic este posibil ca o aceeai variabil s se msoare cu ajutorul mai multor
scale de msurare. Alegerea scalei adecvate se face, n funcie de variantele acelei
caracteristici.
Dac avem caracteristica salariu, ne gndim imediat la o scal numeric scala
de raport, de exemplu. Acest lucru este adevrat dac variantele sunt: 750 RON,
Statistic Aplicat
7
1200 RON, 500 RON etc. Dac variantele utilizate sunt: sub salariul mediu,
egal cu salariul mediu, peste salariul mediu, atunci vom utiliza o scal
calitativ scala ordinal.
DENUMIREA
SCALEI
CARACTERISTICI
ALE SCALEI
EXEMPLE
DE UTILIZARE
NOMINAL Absena relaiei de ordine Sex, stare civil, stagiul militar,
profesia, culoarea prului, culoarea
ochilor
ORDINAL Relaie de ordine Calificative pentru activitatea colar,
ordinea sosirii alergtorilor dintr-o
curs, preferinele consumatorilor
pentru un produs,
INTERVAL
(CARDINAL)
Relaie de ordine
Diferene (intervale) semnificative
Origine arbitrar
Valoarea 0 nu nseamn absen
Temperatura
Timpul calendaristic
Punctajul obinut la un test de
verificare a cunotinelor
RAPORT
(PROPORIONAL)
Relaie de ordine
Diferene (intervale) semnificative
Origine fix, valoarea 0 nseamn
absen
Operaii de multiplicare / divizare
Vrsta, greutatea corporal, salariul,
profitul, cifra de afaceri, numr de
angajai
4 Surse de date statistice
n scopul aplicrii metodelor statistice de analiz a fenomenelor i proceselor social-
economice este necesar s avem la dispozitie date statistice. Sursele de date statistice se pot
clasifica n: surse primare i surse secundare de date.
Dac datele statistice sunt obinute direct prin organizarea unei observri statistice,
indiferent dac acestea sunt totale (recensmnt) sau pariale (sondaj statistic), atunci
persoana sau instituia care a realizat o astfel de observare este o surs primar de date
statistice.
Dac datele sunt deja prelucrate n tabele i grafice i publicate de persoane sau
instituii specializate, ele vor fi surse secundare de date.
Exemplul 9
Spre exemplu, Direcia General de Statistic Regional Bucureti a publicat, n
septembrie 2012, n Buletinul statistic pentru trimestrul II al anului 2012,
micarea natural a populaiei oraului n semestrul I al anului 2012, veniturile
personalului salariat, numrul omerilor la 30 iunie 2012, producia principalelor
produse industriale fabricate n Municipiul Bucureti, dinamica cifrei de afaceri
pentru ntreprinderile cu activitate principal de comer cu amnuntul i servicii de
pia etc.
Toate aceste informaii publicate se constituie n surse secundare de date
statistice.
Statistic Aplicat
8
5 Observarea statistic: coninut, necesitate, obiective.
Orice proces de investigaie statistic ncepe cu observarea statistic, modul n care
este ea organizat i realizat influeneaz, n continuare celelalte etape ale procesului de
cercetare statistic, deoarece obinerea unor date autentice, reale, exacte determin calitatea
etapelor de prelucrare, analiz i intepretare a rezultatelor.
Observarea statistic este prima etap a investigaiei statistice, care const n
culegerea i nregistrarea n mod sistematic i unitar a datelor statistice, de la unitile
colectivitii, referitoare la toate caracteristicile include n programul cercetrii.
Indiferent de amploarea observrii, totale sau pariale, culegerea datelor se poate face
prin:
- observri curente nregistrare permanent (evenimentele demografice: natalitate,
mortalitate etc.);
- observri periodice datele se nregistreaz la intervale de timp precizate;
- observri directe datele sunt nregistrate de ctre operator sau cercettor direct de
la unitile statistice;
- observri indirecte datele se nregistreaz din diverse surse care au consemnat
anterior fenomenul studiat (documentele contabile).
Observarea trebuie fie corespunztoare sub aspect cantitativ i calitativ.
- ndeplinirea condiiei de cantitate obinerea n timpul prestabilit a ntregului volum
de date necesar pentru atingerea tuturor obiectivelor investigaiei statistice;
- ndeplinirea condiiei de calitate presupune asigurarea autenticitii, a caracterului
real al datelor, astfel nct rezultatele obinute prin prelucrarea acestor date s fie ct
mai exacte i s duc la adoptarea unor decizii ct mai pertinente.
n cazul n care pentru obinerea datelor statistice este necesar organizarea unei
cercetrii statistice, atunci ea trebuie fcut dup anumite etape:
- observarea statistic - etap n care se obin date de la unitile colectivitii studiate,
pentru toate caracteristicile urmrite;
- prelucrarea statistic - etap n care datele obinute sunt agregate/sistematizate i
sunt calculai indicatorii statistici adecvai tipului de date i tipului de analiz solicitat;
- analiza i interpretarea rezultatelor - etap n care sunt verificate ipotezele de lucru,
sunt formulate concluziile i fundamentate procesele decizionale.
6 Planul observrii statistice
Observarea statistic nu se desfoar la ntmplare, deoarece culegerea datelor
implic anumite costuri, dac vrem s obinem date autentice. Ea se desfoar pe baza unui
plan (program), elaborat n funcie de scopul cercetrii statistice.
6.1 Scopul observrii
Este subordonat scopului general al cercetrii statistice i influeneaz n continuare
toate celelalte elemente din programul observrii. Stabilirea obiectivelor ce trebuie atinse prin
investigarea organizat este punctul de pornire al elaborrii programului i depinde de scopul
general al investigaiei statistice.
6.2 Delimitarea populaiei studiate
Acest lucru se realizeaz cu ajutorul nomenclatoarelor, al clasificrilor existente, sau
se apeleaz la studiile anterioare efectuate n domeniul de interes (dac exist). Gradul de
ntindere a colectivitii de observare este n funcie de metoda de observare ce va fi utilizat:
Statistic Aplicat
9
- dac este vorba de o metod de observare total, atunci obiectul observrii va fi format
din toate unitile colectivitii,
- dac va fi aplicat o metod de observare parial, vor fi nregistrate date doar de la o
parte a unitilor colectivitii i doar ele vor forma obiectul observrii.
n ambele cazuri ns, pentru identificarea corect i complet a colectivitii ce va fi
supus observrii este necesar determinarea coordonatelor de spaiu, timp i de organizare
ale colectivitii de interes.
6.3 Unitatea de observare
Uneori, unitatea de observare nu este totdat i unitate raportoare. De exemplu, n
cazul unei cercetri efectuate n cadrul unui agent economic, unitatea raportoare va fi agentul
economic, iar unitatea de observare poate fi angajatul,un departament, o echip sau un produs.
6.4 Timpul i locul observrii
Locul observrii este, de regul, locul unde se produce, unde are loc fenomenul
urmrit i studiat. Stabilirea acestora impune precizarea a dou aspecte:
- timpul la care se refer datele nregistrate (care poate fi un moment, numit moment
critic, sau o perioad, un interval de timp; n primul caz fenomenul este surprins
static, iar n cel de-al doilea caz - dinamic).
- timpul cnd se efectueaz nregistrarea datelor care este, de regul, un interval de
timp, bine precizat; este de dorit ca acesta s fie ct mai scurt, astfel nct nregistrarea
datelor s se realizeze cu o ct mai mare operativitate.
Exemplul 10
De exemplu,la Recensmntul populaiei i locuinelor din octombrie 2012,
momentul critic a fost ora 0 a zilei de 20 octombrie, iar perioada n care au fost
nregistrate datele a fost 20-31 octombrie 2011. Unitatea de observare a fost
gospodria (unitate complex).
6.5 Lista caracteristicilor urmrite,
Lista caracteristicilor urmrite formeaz, aa cum am vzut, programul (planul)
observrii n sens restrns; presupune stabilirea tuturor variabilelor care trebuie nregistrate,
astfel nct s se asigure studierea fenomenului de interes sub toate aspectele prevzute n
scopul cercetrii, evitnd, n acelai timp, redundana informaiilor.
Caracteristicile pot apare sub diferite forme:
- sub forma unor indicatori n raportrile statistice pe care le completeaz agenii
economici;
- sub forma rspunsurilor la ntrebrile dintr-un chestionar n cazul investigaiilor
statistice special organizate.
6.6 Formularele de nregistrare
Formularele reprezint suportul material pe care se vor nregistra datele culese.
Acestea pot fi de dou tipuri: formulare tip fi sau formulare tip list.
- fia este un formular individual, completat de ctre o singur unitate de observare;
- lista este un formular colectiv, completat cu date pentru mai multe uniti de
observare.
Statistic Aplicat
10
Exemplul 11
La recensmntul populaiei i locuinelor din octombrie 2011 s-a folosit fia
pentru a nregistra datele referitoare la o gospodrie i lista pentru a consemna
datele privind militarii n termen dintr-o unitate militar sau persoanele care
triesc ntr-un cmin de btrni, sau elevii/studenii dintr-un cmin de
elevi/studenesc.
6.7 Msuri organizatorice
Cu ajutorul lor, se pot prentmpina i rezolva diversele obstacole, dificulti ce s-ar
putea ivi n realizarea observrii. Aceste msuri pot cuprinde:
- ntocmirea unor liste ale unitilor ce vor fi supuse observrii;
- folosirea hrilor i planurilor cu localizarea unitilor statistice;
- sectorizarea teritoriului;
- recrutarea i instruirea personalului participant la colectarea datelor;
- proiectarea, elaborarea i tiprirea formularelor de nregistrare;
- popularizarea cercetrii statistice (prin mass-media, pres, afie etc.).
Exemplul 12
La organizarea unui recensmnt, aciunea trebuie popularizat pentru a atrage
buna credin a populaiei, astfel nct aceasta s s furnizeze date corecte i reale.
De aceea, pentru identificarea i soluionarea tuturor problemelor ce ar putea
apare, n prealabil, se organizeaz un recensmnt de prob.
7 Metode de observare statistic
Exist o gam variat de metode de observare, utilizate mpreun sau separat, pentru a
obine o informaie statistic ct mai real, complet i neredundant. Metodele de observare
se clasific dup urmtoarele criterii:
I. dup frecvena nregistrrii n timp a datelor despre fenomenele i
procesele economico-sociale:
- observri curente fenomenele i procesele sunt urmriate n mod continuu,
iar datele ce le caracterizeaz sunt nregistrate permanent (fenomenele
demografice: natalitatea, mortalitatea, nupialitatea, divorialitatea care se
regsesc n statistica strii civile; rezultatele obinute de agenii economici
etc.);
- observri periodice atunci cnd datele referitoare la fenomene sau procese
economico-sociale se nregistreaz cu o frecven aproximativ regulat, la
intervale egale de timp (recensminte ale populaiei, recensminte agricole
etc.);
- observri ocazionale atunci cnd datele referitoare la fenomenele sau
procesele economico-sociale se nregistreaz discontinuu, ocazional, cu un
prilej sau scop special, n mod unic, motiv pentru care se mai numesc special
organizate (o anchet de opinie privind atitudinea cetenilor referitoare la un
nou act normativ recent intrat n vigoare; o anchet de opinie privind
preferinele participanilor la o expoziie de mod etc.).
II. dup gradul de cuprindere a populaiei de observare delimitate, ntlnim:
- observri totale, atunci cnd vor fi supuse observrii toate unitile populaiei
statistice (recensmntul populaiei i locuinelor);
- observri pariale atunci cnd vor fi supuse observrii doar o parte a
Statistic Aplicat
11
unitilor populaiei statistice (anchete, sondaje statistice);
III. dup modul de obinere a datelor, avem:
- observri primare, n care datele se obin prin culegerea, nregistrarea lor
direct de la unitile statistice (recensmntul populaiei, o anchet de opinie);
- observri secundare n care se obin datele secundare, care se preiau din
documentele existente (datele preluate din evidenele contabile).
7.1 Recensmntul statistic
Recensmntul statistic, este o metod de observare total, periodic, prin care
un fenomen este surprins n mod static, nregistrndu-se valorile caracteristicilor din
programul observrii referitoare la un moment de referin numit moment critic, de
la toate unitile populaiei statistice.
Recensmntul este ntlnit din timpuri strvechi, nc din antichitate, cnd romanii,
egiptenii efectuau recensminte ale populaiei; din sfera populaiei, recensmntul s-a extins
i n sfera locuinelor, animalelor, unitilor din industrie, agricultur, comer (recensmnt
economic).
n domeniul populaiei recensmntul are o periodicitate de 10 ani, iar n domeniul
economic de 5 ani.
Recensmntul este un tip de nregistrare foarte laborios, necesitnd un volum mare de
cheltuieli, personal numeros, msuri organizatorice detaliate, precum i o prelucrare complex
a informaiilor nregistrate.
Exemplul 13
La Recensmntul populaiei i locuinelor din 20 0ctombrie 2011, momentul
critic a fost ora zero a zilei de 20 octombrie, iar nregistrarea datelor s-a realizat n
perioada 20-31 octombrie 2011.
Pe baza Recensmntului populaiei obinem indicatori de volum i structur
statici, afereni momentului critic. O cercetare n domeniul populaiei are ns, ca
obiectiv i surprinderea, determinarea modificrilor de volum i a mutaiilor de
structur de la un Recensmnt la altul, impunndu-se a fi respectat principiul
comparabilitii datelor att n plan temporal, ct i n plan teritorial.
Perioada de pregtire a recensmntului este de mare amploare i rspundere,
fiind necesar o investigare a modalitilor de pregtire a recensmintelor din
perioadele trecute, att n Romnia, ct i n alte ri, o mediatizare puternic a
aciunii, uneori chiar i organizarea unui recensmnt de prob (n perioada 7-16
mai 2011).
7.2 Sondajul statistic
Sondajul statistic (selecia statistic) este o metod de observare parial, special
organizat, una din cele mai des utilizate metode de observare statistice moderne,
deoarece realizeaz o economie de resurse materiale, financiare i umane, nlocuind o
observare total, de mare extindere, mai dificil de organizat i efectuat, cu cheltuieli
considerabile.
n cazul cercetrii statistice prin sondaj, se selecteaz un eantion, format dintr-o parte
a unitilor populaiei totale.
Eantionul poate fi selectat aleator sau non-aleator.
Sondajele pot fi repetate sau nerepetate, dup cum exist posibilitatea revenirii unei
aceleai uniti n cadrul aceluiai eantion.
Avantaje ale utilizrii sondajului statistic:
- costuri materiale i umane reduse;
Statistic Aplicat
12
- programul cercetrii este amplu;
- sondajul statistic devine absolut necesar cnd prin cercetarea statistic se
distrug unitile statistice supuse analizei, ca de pild n controlul statistic al
calitii produciei;
- sondajul statistic poate fi utilizat pentru verificarea programului unei observri
totale i pentru verificarea i testarea unei ipoteze statistice.
Sondajul statistic implic un grad de incertitudine referitor la cunoaterea situaiei din
colectivitatea general
Folosirea seleciei aleatoare (eantionarea probabilist), n care fiecare unitate
statistic din colectivitatea general are ansa calculabil i diferit de zero s fie
selecionat n eantion, permite calcularea mrimii erorii i stabilirea prealabil a acestei
mrimi.
Sondajele pot fi repetate sau nerepetate, dup cum exist posibilitatea revenirii unei
aceleai uniti n cadrul aceluiai eantion.
Pentru populaiile de volum foarte mare, considerate populaii infinite, deosebirea
dintre sondajul repetat i sondajul nerepetat dispare.
Procedee de selecie
Procedeul urnei cu bile
Dac selecia se face cu revenire eantionul se numete eantion aleator repetat.
La fiecare extragere, probabilitatea ca o unitate s fie extras este 1/ , iar dup ultima
extragere, n baza de seleie rmn uniti statistice. Numrul eantioanelor distincte, de
volum , ce pot fi extrase n sondajul cu revenire este .
Dac selecia se face fr revenire eantionul se numete eantion aleator nerepetat.
Dup extragerea primei uniti n baza de selecie rmn ( 1) uniti, dup a doua
extragere ( 2) uniti, astfel nct dup ultima extragere, n urn rmn uniti
statistice.
Numrul eantioanelor distincte, de volum n, ce pot fi extrase n sondajul aleator
simplu fr revenire este .
Procedeul mecanic
Procedeul mecanic de selecie a eantionului presupune prelevarea unitilor din
colectivitatea general dup un interval predeterminat, denumit frecvent pas de numrare
aplicat bazei de sondaj.
Pasul de numrare se calculeaz dup formula = ; de exemplu, pentru a selecta 50 de
uniti dintr-o colectivitate general de 1000 uniti, se va alege tot a 20-a unitate.
Asigurarea caracterului aleator al eantionului este dependent de caracterul ntmpltor
al includerii unitilor colectivitii generale n baza de sondaj, dup un criteriu ce nu are
legtur cu cercetarea efectuat.
Numrul iniial de la care se ncepe citirea se alege aleator ntre 1 i , dup care se
selecteaz tot a -a unitate, pn la completarea eantionului de n uniti statistice.
7.3 Ancheta statistic
Ancheta statistic este o metod de observare parial, cu caracter mai mult
ocazional.
Este asemntoare sondajului statistic, ns difer de acesta prin:
- neobligativitatea ndeplinirii condiiei de reprezentativitate a eantionului;
- admiterea unei rate mai mari a non-rspunsurilor la formularele nmnate
Statistic Aplicat
13
direct, telefonic, prin e-mail sau prin pot, ntruct completarea chestionarelor
este benevol.
Ancheta statistic va conduce, din aceste motive, la erori mai mari dect sondajul
statistic.
n cazul sondajului statistic, neobinerea datelor solicitate de la unitile incluse n
eantion (persoane, de regul), din diferite motive, precum: nu cunosc limba oficial, i-au
schimbat domiciliul, nu sunt acas atunci cnd sunt cutai, refuz s coopereze etc. pot
duce la afectarea reprezentativitii eantionului.
O categorie deosebit de ntlnit a anchetelor statistice o formeaz anchetele de opinie,
ce au drept scop studierea preferinelor, atitudinii oamenilor fa de diferite probleme (anchete
n sfera sociologiei, marketingului, politicii, culturii etc.).
7.4 Alte metode de observare statistic.
Panelul
Panelul este o metod de observare parial, realizat pe baza unui eantion fix,
stabil, format din aceleai uniti care rspund la aceleai ntrebri, la mai multe
momente succesive, diferite de timp. n acest fel cercetarea se concentreaz pe
identificarea, pe determinarea modificrilor survenite de-a lungul timpului asupra
fenomenului studiat.
Aceast metod prezint ns, i unele dezavantaje, precum:
- respondenii se implic, treptat, n cercetare i, tiindu-se vizai, sub observaie,
i-ar putea schimba comportamentul i rspunsurile lor ar putea fi influenate;
- odat cu trecerea timpului, o parte dintre respondeni prsesc panelul
(mortalitate), iar cei rmai sunt mai puin reprezentativi n populaia total.
Observarea prii principale (metoda masivului principal de date)
Este o metod de observare parial, special organizat (cu caracter ocazional),
ce presupune formarea unui eantion nereprezentativ, prin selectarea, dintr-o populaie
mprit pe grupe de importan diferit, a unitilor mai semnificative. nregistrnd i
prelucrnd datele de la unitile incluse n masivul principal de date se pot estima
suficient de corect valorile unor indicatori pentru ntreaga colectivitate statistic.
Monografia
Este o metod de observare parial, special organizat, care presupune
caracterizarea detaliat, sub multiple aspecte, ale unei singure uniti statistice
complexe (se elaboreaz monografia unui unei ntreprinderi, a unui jude, a unei
localiti etc.).
Monografia include, pe lng culegerea i nregistrarea datelor i aspecte legate de
prelucrarea lor i de analiz i intepretare a rezultatelor, toate cele trei etape ale investigaiei
statistice putnd fi realizate de o echip complex de specialiti.
8 Erori de observare
Orice msurare statistic conine erori!
Eroarea reprezint diferena dintre rezultatul obinut prin nregistrare i mrimea real
a caracteristicilor observate i se poate determina n expresie absolut sau relativ.
Erorile pot fi de nregistrare i de calcul.
Clasificarea erorilor:
- erori de observare statistic;
o erori sistematice;
Statistic Aplicat
14
o erori ntmpltoare;
o erori grosiere (greeli);
- erori de prelucrare;
- erori de reprezentativitate;
- erori de modelare.
8.1 Erori de observare (sau de nregistrare)
Apar n etapa de observare statistic i sunt definite ca diferenele care apar ntre
valorile reale ale caracteristicilor urmrite (studiate) i cele nregistrate (culese).
Erori sistematice
- rezult din aciunea unui factor ce determin devierea variabilei studiate
ntotdeauna n acelai sens;
- surse de astfel de erori: nclcarea regulilor de delimitare a colectivitii, a
unitii statistice, de construire a chestionarelor, de selecie a eantionului;
- distorsiunile pot fi introduse de rspunsuri incorecte ale persoanelor anchetate
din motive psihologice, economice etc.
Erori ntmpltoare
- se produc n ambele sensuri i difer ca mrime;
- influenele lor se compensez reciproc pe total i nu afecteaz rezultatele;
- sunt generate de cauze obiective i nu pot fi evitate ci doar minimizate.
Erori grosiere
- sunt cauzate de lipsa de experien, incompeten etc.
- trebuie depistate i eliminate.
8.2 Erori de reprezentativitate
Se ntlnesc n cazul utilizrii sondajului statistic, atunci cnd selectarea unitilor n
eantion nu se face n mod aleator, ci dup un criteriu subiectiv, preferenial i, la rndul lor,
se mpart n sistematice i aleatoare.
Aceste erori nu pot fi eliminate n totalitate, dar pot fi diminuate i controlate.
8.3 Erori de prelucrare
Apar n etapa de prelucrare a datelor statistice, datorit utilizrii greite a unor
metodolgii erori metodologice, (reprezentarea datelor statistice cu ajutorul unor tipuri
neadecvate de grafice, gruparea sau clasificarea greit, utilizarea unor formule de calcul
nepotrivite, care vor duce la obinerea unor rezultate eronate etc.), utilizarea greit a unor
modele statistice (erori de modelare apar n procesul de elaborare, de alegerea greit a
modelelor).
Pentru obinerea unor rezultate corecte ale cercetrii, este bine ca dup fiecare etap a
investigaiei statistice, datele statistice s fie supuse unor operaii de control, n vederea
identificrii i eliminrii (sau mcar a minimizrii) unor eventuale erori. n etapa de
observare, se poate aplica asupra datelor culese un control cantitativ i calitativ.
Controlul cantitativ al datelor presupune verificarea completitudinii datelor culese i
nregistrate, prin:
- verificarea primirii tuturor chestionarelor la centrul de prelucrare;
- verificarea completrii tuturor rubricilor din chestionare.
Controlul calitativ al datelor se refer la asigurarea unui nivel calitativ corespunztor
al datelor culese. Poate mbrca dou forme:
- controlul aritmetic, care presupune aplicarea prin sondaj, a unor relaii de
calcul ntre diferiii indicatori nscrii n chestionare, de tipul egalitilor de
Statistic Aplicat
15
balan sau a altor chei de verificare;
- controlul logic presupune verificarea corectitudinii datelor nregistrate pe baza
unor legturi, identiti logice ntre mai multe valori ale aceleiai caracteristici
sau ntre valorile unor caracteristici diferite.
9 Sistematizarea datelor statistice (gruparea/clasificarea)
Datele statistice sunt supuse unor operaii de prezentare sistematic, de organizare, de
ordonare dup unul sau mai multe criterii, ntr-un cuvnt de sistematizare.
Sistematizarea datelor statistice cuprinde operaiile de prezentare sistematic, de
organizare, de ordonare a acestor date dup unul sau mai multe criterii.
Sistematizarea este parte a prelucrrii primare a datelor statistice.
Sistematizarea datelor se realizeaz prin gruparea (variabile numerice) i clasificarea
datelor statistice (variabile nenumerice).
Gruparea/clasificarea datelor statistice presupune mprirea unitilor
populaiei statistice observate n grupe sau clase distincte omogene, dup unul sau mai
multe criterii.
Gruparea datelor trebuie s se fac dup principiile:
- omogenitate n sensul c unitile statistice care au aceeai valoare sau valori
apropiate ale caracteristicii dup care se efectueaz sistematizarea vor fi
incluse n aceeai clas; n felul acesta, se dorete ca variaia valorilor
caracteristicii incluse n aceeai grup/clas s fie ct mai mic;
- unicitate n sensul c o unitate statistic trebuie inclus ntr-o singur clas
sau grup, ea nu se poate regsi simultan n dou sau mai multe clase/grupe;
- completitudine n sensul c toate unitile statistice s fie incluse n
grupe/clase, s nu fie exclus vreo unitate din operaia de sistematizare.
9.1 Clasificarea datelor statistice
Sistematizarea datelor efectuat dup o variabil ne-numeric se numete
clasificare. Ea presupune mprirea unitilor n clasele/categoriile variabilei
nenumerice considerate.
Se construiete un numr de clase egal cu numrul categoriilor existente, iar prin
numrarea unitilor statistice incluse n fiecare clas obinem frecvenaacelei clase.
n cazul n care datele sunt sistematizate dup o variabil nominal, ordinea claselor
este lsat la ndemna cercettorului.
Exemplul 14
Distribuia studenilor unei grupe dup calificativul obinut la un proiect este:
Domeniu
Numr de absolveni
( )
Insuficient 3
Satisfctor 2
Bine 10
Foarte bine 6
Excelent 2
Total 23
Statistic Aplicat
16
9.2 Clasificarea datelor statistice
Gruparea reprezint sistematizarea datelor dup o variabil (caracteristic)
numeric.
n funcie de tipul variabilei de grupare (discret sau continu) i de plaja valorilor pe
care le poate lua caracteristica, grup area se poate face pe variante sau pe intervale de variatie.
Gruparea datelor statistice pe variante
Se realizeaz atunci cnd grupm datele dup o variabil discret sau cnd plaja
valorilor pe care le poate lua caracteristica nu este foarte mare maxim 10.
n acest caz, se va forma un numr de grupe egal cu numrul de variante. Prin
numrarea unitilor incluse n fiecare grup se obine frecvena grupei, numit i frecven
absolut.
Exemplul 15
Pentru 20 de familii s-a nregistrat numrul de copii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3, 2, 2, 0,
2, 1, 3, 1, 2, 4, 2. S se realiezeze o sistematizare a datelor.
Numr de copii
( )
Numr de familii
( )
0 3
1 5
2 8
3 3
4 1
Total 20
Observm c variabila de grupare este numrul de copii, variabil discret cu puine
variante (cinci variante), deci s-a realizat o grupare pe variante.
Gruparea pe intervale de variaie
Gruparea pe intervale de variaie o realizm atunci cnd sistematizm datele dup o
variabil continu, care are o plaj larg de valori. Se poate efectua pe intervale de mrime
egal sau diferit.
a) se determin amplitudinea variaiei caracteristicii, ca diferen ntre valoarea maxim i
valoarea minim a caracteristicii:
=
b) se stabilete numrul de grupe. n acest caz pot exista dou situaii:
- numrul de grupe (r) este prestabilit;
- numrul de grupe (r) nu este prestabilit; n acest caz, dac unitile se repartizeaz
aproximati normal dup caracteristica studiat, se poate utiliza pentru determinarea
numrul de grupe relaia lui Sturges:
=1+3,322lg( ), unde n este numrul total de uniti ale colectivitii.
c) se determin mrimea intervalului de grupare (h), ca raport ntre amplitudinea
caracteristicii i numrul de grupe:
= ;
Statistic Aplicat
17
d) se formeaz intervalele de grupare, prin precizarea limitelor exacte ale acestora.
+
( + ) +2
.
+( 1) +
Limitele intervalelor vor avea acelai grad de precizie ca i datele grupate (acelai
numr de zecimale), primul interval putnd ncepe chiar de la valoarea minim a
caracteristicii, sau de la o valoare uor inferioar acesteia, aleas n mod convenabil. Este
Pentru a fi respectat conditia de unicitate este bine s nu existe suprapuneri la limitele
intervalelor.
Exemplul 16
n vederea analizei oportunitii deschiderii unui magazin ce vinde aparatur
electrocasnic, un analist financiar este interesat n cunoaterea nivelului vnzrilor
zilnice ale magazinelor de profil.
Pentru 50 de astfel de magazine alese ntmpltor, nregistreaz valoarea facturilor
emise zilnic. Datele sunt urmtoarele (mii lei):
10,5 8,0 8,2 9.6 7,1 9,7 11,5 9,5 9,4 5,6
8,4 7,9 8,0 7,2 5,2 6,6 9,9 8,2 10,5 11,7
10,5 6,8 7,7 8,8 7,7 10,6 6,9 6,9 6,9 6,0
9,0 9,5 7,4 11,3 5,9 10,1 7,5 7,2 6,5 7,8
9,2 8,1 6,5 8,5 5,2 7,1 11,1 8,2 7,5 6,5
S se sistematizeze datele, grupndu-se pe intervale egale de variaie.
Rezolvare
Se noteaz cu X caracteristica de grupare (valoarea facturilor emise zilnic).
- se calculeaz amplitudinea variaiei caracteristicii (A
x
):
A
x
= x
max
- x
min
=11,75,2=6,5 mii lei;
- se stabilete numrul de grupe (r):
r=1+3,32 lg (50)=6,64~7 (formula lui Sturges);
- se stabilete mrimea intervalului de grupare (h): h = A
x
/r =6,5/7~1 mii lei;
- se stabilesc intervalele de variaie i se efectueaz gruparea;
Statistic Aplicat
18
Varianta I Varianta II
Intervale de variaie a valorii
facturilor emise zilnic (mii lei)
Nr.
magazine
(n
i
)
Intervale de variaie a valorii
facturilor emise zilnic (mii lei)
Nr.
magazine
(n
i
)
5,0 6,0 4 5,0 6,0 5
6,0 7,0 9 6,0 7,0 8
7,0 8,0 11 7,0 8,0 13
8,0 9,0 9 8,0 9,0 8
9,0 10,0 8 9,0 10,0 7
10,0 11,0 5 10,0 11,0 5
11,0 - 12,0 4 11,0 - 12,0 4
Total 50 Total 50
Not: limita inferioar inclus n interval. Not: limita superioar inclus n interval.
Varianta III
Intervale de variaie a valorii facturilor emise
zilnic (mii lei)
Nr. magazine
(n
i
)
5,0 5,9 4
6,0 6,9 9
7,0 7,9 11
8,0 8,9 9
9,0 9,9 8
10,0 10,9 5
11,0 11,9 4
Total 50
Not: intervale discontinue.
Se recomand utilizarea intervalelor continue (varianta I sau varianta II).
10 Modaliti de prezentare i reprezentare a datelor statistice
10.1 Serii statistice
Seriile statistice se pot clasifica dup urmtoarele criterii:
Seria statistic reprezint un mod organizat de prezentare a datelor, sub forma a dou
iruri: primul se refer la criteriul de sistematizare iar al doilea cuprinde datele numerice sau
frecvenele de apariie i depinde de ordinea de apariie din primul ir.
I. n funcie de coninutul variabilei dup care se face sistematizarea:
- serii cronologice (se refer la o variabil de timp);
- serii teritoriale (se refer la o variabil de spaiu);
- serii de distribuie de frecvene (sau repartiii de frecvene, care se refer la o
variabil atributiv).
II. dup natura variabilei:
- distribuii heterograde (dup o variabil cantitativ);
- distribuii homograde (dup o variabil calitativ);
III. dup numrul variantelor:
- distribuii pe variante sau valori;
- distribuii pe grupe de variante (n cazul distribuiilor homograde) sau pe intervale
de valori (n cazul distribuiilor heterograde).
Statistic Aplicat
19
IV. n funcie de numrul variabilelor dup care se face sistematizarea:
- distribuii de frecvene unidimensionale (cnd sistematizarea datelor s-a efectuat
dup o singur variabil);
- distribuii de frecvene bidimensionale (cnd sistematizarea datelor s-a efectuat n
funcie de dou variabile);
- distribuii multidimensionale (cnd sistematizarea datelor s-a efectuat n funcie de
trei sau mai multe variabile);
10.2 Serii de distribuie de frecvene (repartiii de frecvene)
A. Serii de distribuie de frecvene unidimensionale
Seria de distribuie de frecvene unidimensional reprezint o serie n care primul ir cuprinde
variantele/valorile sau intervalele de variaie ale unei variabile, iar al doilea ir frecvenele de
apariie ale variantelor sau volumul grupelor.
A1. Distribuii heterograde (dup o variabil numeric)
Se pot reprezenta sub forma:
- pentru o caracteristic discret (repartiii de frecvene pe variante/valori):

.
|

\
|
r i
r i
n n n n
x x x x
X
... ...
... ...
:
2 1
2 1
,
unde n
i
( r i , 1 = ) sunt frecvenele de apariie ale variantei x
i
.
- pentru o caracteristic continu (repartiie de frecvene pe intervale de valori):

.
|

\
|
< < < < < < < <
r i
r r i i
n n n n
x X x x X x x X x x X x
X
... ...
... ...
:
2 1
sup inf sup inf sup
2
inf
2
sup
1
inf
1
sau

.
|

\
|
r i
r i
n n n n
x x x x
X
... ...
... ...
:
2 1
2 1
unde x
i
, r i , 1 = sunt centrele intervelor de variaie.
Serii de repartiie de frecvene pe intervale de variaie
Se prezint sub forma:
Intervale de variaie ale
caracteristicii de grupare
Numr de uniti statistice (n
i
)
sup
1
inf
1
x x
n
1
sup
2
inf
2
x x
n
2
... ...
sup inf
i i
x x
n
i
... ...
sup inf
r r
x x
n
r
Total

=
=
r
i
i
n n
1
Statistic Aplicat
20
unde:
sup inf
,
i i
x x reprezint limita inferioar, respectiv superioar, a intervalului de variaie
i.
Vom considera doar cazul intervalelor egale i continue.
Centrul intervalului este determinat ca medie aritmetic simpl a limitelor
intervalului i este considerat reprezentativ pentru datele din acel interval. Se determin cu
una din relaiile:
2
sup inf
i i
i
x x
x
+
= sau
2
inf i
i i
h
x x + = , unde h
i
este mrimea intervalului.
Frecvena absolut a grupei (n
i
) este egal cu numrul de uniti statistice care au
valoarea caracteristicii mai mare (sau egal) cu limita inferioar a intervalului i mai mic
(sau egal) cu limita superioar a acesteia. Suma frecvenelor absolute este notat cu n i
reprezint numrul total de uniti sau volumul eantionului.

=
=
r
i
i
n n
1
Frecvena relativ a unei grupe (
*
i
n ) reprezint ponderea unitilor statistice n
volumul total al colectivitii care au valoarea caracteristicii cuprins ntre limita inferioar i
cea superioar a grupei respective. Se determin ca raport ntre frecvena absolut a grupei i
volumul eantionului (eventual nmulit cu 100).
n
n
n
n
n
i
r
i
i
i
i
= =

=1
*
i se exprim n coeficieni,
sau
100 100
1
*
%
= =

=
n
n
n
n
n
i
r
i
i
i
i
i se exprim n procente.
Suma frecvenelor relative este 1 sau 100, dup cum sunt exprimate n coeficieni sau
n procente.
1
1
*
=

=
r
i
i
n sau 100
1
*
%
=

=
r
i
i
n
Frecvenele cumulate
Sunt de dou tipuri: cumulate cresctor i cumulate descresctor.
Frecvena absolut cumulat cresctor a unei grupe este egal cu numrul unitilor
care au valoarea variabilei mai mic (sau egal) cu limita superioar a grupei (mai exact ntre
inf
1
x i
sup
i
x ).

=
=
i
k
k i
n Fc
1
Frecvena absolut cumulat cresctor a ultimei grupe este egal cu volumul colectivitii (cu
n).
Frecvena absolut cumulat descresctor a unei grupe este egal cu numrul
unitilor pentru care valoarea caracteristicii este mai mare (sau egal) cu limita inferioar a
grupei (mai exact ntre
inf
i
x i
sup
r
x ):

=
=
r
i k
k i
n Fd
Statistic Aplicat
21
Frecvena absolut cumulat descresctor a primei grupe este egal cu numrul total
de uniti statistice (cu n):
Asemntor se determin i frecvenele relative cumulate cresctor i descresctor,
conform relaiilor:

=
=
i
k
k i
n Fc
1
* *
,

=
=
r
i k
k i
n Fd
* *
Frecvenele absolute, relative i cumulate ofer o imagine de ansamblu asupra tendinei de
distribuie a valorilor n colectivitate, asupra normalitii, simetriei ori asimetriei repartiiei de
frecvene.
Serii de repartiie de frecvene pe variante (discrete)
Se prezint astfel:
Variantele/valorile
caracteristicii de grupare (x
i
)
Numr de uniti statistice
(n
i
)
x
1
n
1
x
2
n
2
... ...
x
i
n
i
... ...
x
r
n
r
Total

=
=
r
i
i
n n
1
unde: n
i
reprezint numrul unitilor care prezint valoarea x
i
a caracteristicii de grupare (se
mai numesc frecvene absolute);
Prin nsumarea frecvenelor grupelor (n
i
) se obine volumul total al colectivitii (n).
i pentru aceast serie se determin toate tipurile de frecvene prezentate anterior.
A2. Distribuii homograde (dup o variabil nenumeric)
i pentru distribuiile homograde, n care sistematizarea datelor este realizat dup o
variabil calitativ, se pot calcula frecvene absolute i relative (vezi exemplul 1).
Dac sistematizarea s-a efectuat dup o variabil ordinal, se pot calcula i frecvene
cumulate.
B. Serii de distribuie de frecvene bidimensionale
Forma general a unei distribuii de frecvene bidimensionale, n care s-au luat n
considerare dou variabile statistice X i Y este prezentat n tabelul urmtor.
Distribuia de frecvene bidimensional
Variante sau centre de
interval pt. variabila X
Variante sau centre de interval pt.
variabila Y
Total
uniti
y
1
y
2
... y
j
... y
p
x
1
n
11
n
12
... n
1j
... n
1p
n
1.
x
2
n
21
n
22
... n
2j
... n
2p
n
2.
... ... ... ... ... ... ... ...
x
i
n
i1
n
i2
... n
ij
... n
ip
n
i.
... ... ... ... ... ... ... ...
x
r
n
r1
n
r2
... n
rj
... n
rp
n
r.
Total uniti n
.1
n
.2
... n
.j
... n
.p
n..
Statistic Aplicat
22
Tabelul de mai sus reprezint un tabel de corelaie, n care avem:
- x
i
, r i , 1 = este varianta sau centrul de interval pentru grupa i, format dup valorile
variabilei X;
- y
j
, p j , 1 = este varianta sau centrul de interval al grupei j, format dup valorile
variabilei Y;
- n
ij
, r i , 1 = ; p j , 1 = reprezint numrul unitilor statistice la care ntlnim simultan
valoarea x
i
a caracteristicii X i valoarea y
j
a caracteristicii Y;
-

=
=
p
j
ij i
n n
1
.
este numrul de uniti statistice care au valoarea x
i
a caracteristicii X,
indiferent de valoarea caracteristicii Y;
-

=
=
r
i
ij j
n n
1
.
este numrul de uniti statistice care au valoarea y
j
a caracteristicii Y,
indiferent de valoarea caracteristicii X;
-

= = = =
= = = =
p
j
j
r
i
i
r
i
p
j
ij
n n n n n
1
.
1
.
1 1
.. este volumul total al colectivitii.
10.3 Tabele statistice
Tabelul statistic cuprinde una sau mai multe serii statistice, ai cror termeni sunt nscrii
ntr-o reea de linii i coloane.
Pentru ca un tabel statistic s fie corect elaborat i s-i ating scopul, trebuie s conin
un set de elemente obligatorii sau opionale i s respecte unele reguli:
- titlul tabelului este un element obligatoriu plasat naintea tabelului, care descrie clar i
concis coninutul datelor pe care le cuprinde;
- macheta tabelului este o reea de linii ce alctuiesc rubricile tabelului;
- subiectul tabelului este format din populaia la care se refer datele nscrise n tabel;
- predicatul tabelului este format din sistemul de indicatori redai n tabel;
- rubricile tabelului sunt spaiile create la ntretierea liniilor orizontale cu cele verticale, n
care sunt nscrise datele;
- datele statistice nscrise n tabel pot fi sub form numeric sau textual;
- unitatea de msur trebuie precizat pentru fiecare din indicatorii nscrii n tabel (dac
toi indicatorii sunt exprimai n aceeai unitate de msur, atunci aceasta se poate trece
deasupra tabelului);
- sursa datelor;
- numrul tabelului este necesar mai ales atunci cnd se folosesc mai multe tabele;
- note explicative, metodologice.
10.4 Grafice statistice
Alegerea tipului de grafic depinde de tipologia datelor pe care vrem s le reprezentm.
Astfel, putem utiliza:
- grafice ntr-un sistem de coordonate;
- grafice cu ajutorul unor figuri geometrice;
- grafice cu ajutorul hrior sau al altor figuri naturale sau simbolice.
Statistic Aplicat
23
Pentru ca un grafic s-i ating scopul pentru care a fost proiectat, el trebuie s fie
corect ntocmit, s respecte anumite reguli generale, s cuprind o serie de elemente
obligatorii sau opionale i anume:
- titlul graficului;
- sistemul de coordonate;
- scara de reprezentare;
- reeaua graficului;
- legenda;
- note explicative, sursa datelor etc.
10.5 Tipuri de reprezentri graficeutilizate n cazul seriilor de distribuie de frecvene
A. Histograma
Histograma conine o succesiune de dreptunghiuri, cu bazele corespunztoare lungimii
in-tervalelor i nlimile egale cu numrul de observaii din fiecare interval (sau cu ponderea
lor). Dac intervalele au mrime egal, atunci i coloanele vor avea lime egal.
Permite vizualizarea distribuiei de frecvene absolute sau relative, dup o variabil
numeric continu (pe intervale).
B. Poligonul frecvenelor
Poligonul frecvenelor este i el utilizat pentru reprezentarea grafic a distribuiilor de
frecvene absolute sau relative, atunci cnd sistematizarea datelor s-a fcut dup o
caracteristic numeric continu sau discontinu. Pentru construirea lui, din fiecare valoare a
caracteristicii sau din fiecare centru de interval se ridic cte o perpendicular i se marcheaz
pe ea punctul aflat la o distan egal cu frecvena variantei sau intervalului respectiv. Unind
toate punctele astfel gsite rezult un poligon numit poligonul frecvenelor.
Poligonul frecvenelor se poate suprapune peste histogram n cadrul aceluiai grafic,
sau se poate trasa ntr-un grafic separat.
C. Curbele frecvenelor cumulate
Curbele frecvenelor cumulate (ogivele), numite i curbele cumulative ale
frecvenelor se traseaz att pentru distribuii de frecvene absolute, ct i pentru distribuii
de frecvene relative.
n cazul distribuiilor de frecvene dup o variabil continu:
- reprezentarea grafic a frecvenelor cumulate cresctor: pe axa Ox se reprezint limitele
superioare ale intervalelor, iar pe axa Oy frecvenele cumulate cresctor; prin unirea
punctelor astfel obinute se traseaz o curb ascendent;
- reprezentarea grafic a frecvenelor cumulate descresctor: pe axa Ox se reprezint limitele
inferioare ale intervalelor, iar pe axa Oy frecvenele cumulate descresctor; prin unirea
punctelor astfel obinute se traseaz o curb descendent.
n cazul distribuiilor de frecvene dup o variabil discret reprezentarea grafic a
frecvenelor cumulate cresctor va avea, de aceast dat, aspectul unei scri (nici o unitate
statistic nu poate avea valoarea caracteristicii situat ntre variantele stabilite).
D. Graficul (diagrama) prin coloane sau benzi (bare)
Este folosit pentru reprezentarea distribuiilor de frecvene absolute sau relative, n
care sistematizarea s-a fcut dup o variabil categorial, calitativ, msurat pe scal
nominal.
Graficul se traseaz n sistemul de axe ortogonale Ox i Oy, pe Ox se reprezint
categoriile variabilei calitative, iar pe Oy frecvenele sau nivelul indicatorului.
Graficul const dintr-o succesiune de coloane de lime egal, cte o coloan pentru
fiecare categorie/variant a variabilei nominale, egal distanate ntre ele i cu nlimea
proporional cu frecvenele sau nivelul indicatorului corespunztor categoriei respective.
Statistic Aplicat
24
Dac dreptunghiurile sunt rsturnate cu 90% (i au baza situat pe axa vertical) atunci
reprezentarea grafic este o diagram prin benzi, cu axele inversate fa de diagrama prin
coloane.
E. Diagrama de structur
Diagrama de structur este folosit pentru a reprezenta grafic structura unei
colectiviti, sistematizate dup valorile unei variabile cantitative sau calitative.
Graficul arat, aadar, modul n care ntregul se subdivide n pri componente.
De obicei, diagrama se traseaz cu ajutorul cercului, a crui arie reprezint ntregul;
acesta se mparte n mai multe buci (felii), unghiul la centru corespunztor acestei pri de
cerc este proporional cu raportul dintre frecvena absolut i volumul total al colectivitii
(adic cu frecvena relativ) a acelei clase/grupe.
11 Noiuni generale privind indicatorii tendinei centrale
Indicatorul statistic reprezint expresia numeric concret sau dimensiunea unei
colectiviti sau fenomen. Poate fi definit ca rezultat numeric al unei numrri, al unei
msuri statistice a fenomenelor i proceselor de mas sau al unui model de calcul
statistic pe baza datelor nregistrate.
Pentru o variabil numeric, folosind indicatorii statistici, putem analiza trei
proprieti majore:
- tendina central
- variabilitatea
- forma distribuiei
I. dup modul de determinare distingem:
- indicatorii primari se obin n etapa de sistematizare a datelor statistice prin
centralizarea acestora.
- indicatori derivai reprezint rezultatul prelucrrii indicatorilor primari prin diferite
modele de calcul statistic.
II. dup gradul de cuprindere se disting:
- indicatori sintetici reprezint expresii numerice ale categoriilor economice de sintez ce
caracterizeaz rezultatele economice la nivel macroeconomic.
- indicatorii analitici exprim structura unei colectiviti i influena factorilor care
acioneaz asupra acesteia
III. dup forma de exprimare se disting:
- indicatori exprimai n mrimi absolute adic n uniti concrete de msur aceleai cu ale
caracteristicii analizate i cu acelai coninut ca i caracteristica analizat.
- indicatori exprimai sub form de mrimi relative adic exprimai n coeficieni, procente,
promile, prodecimile, etc. i care s-au obinut prin raportarea a doi indicatori cu acelai
coninut sau cu coninut diferit, dar aflai n relaie de interdependen.
IV. indicatorii fundamentali ai tendinei centrale sunt:
- media aritmetic (x)
Statistic Aplicat
25
- mediana (M )
- modul (M )
Cuvntul medie este prezent n conversaiile persoanelor aproape n fiecare zi,
folosindu-se n expresii ca: durata medie de via a oamenilor, durata medie de funcionare
a unei baterii, greutatea medie a pachetelor de zahr.
Media este o valoare tipic sau central a unei distribuii.
Mrimile medii utilizate n analiza seriilor de distribuie de frecvene sunt:
- media aritmetic (x) ;
- media armonic (x );
- media ptratic x ;
- media geometric x
11.1 Media aritmetic( )
Media se calculeaz nsumnd toate valorile individuale i mprind suma la
numrul lor, ea reprezentnd acea valoare care nlocuind toi termenii unei serii nu
modific nivelul lor totalizator.
=

;
- x valorile individuale ale caracteristicii;
- n numrul unittilor;
- x valoarea centralizat (nivelul totalizat) al caracteristicii.
ntr-o colectivitate statistic se ntlnesc foarte rar cazuri n care numrul valorilor
caracteristicii coincide cu numrul unitilor. n general se nregistreaz de mai multe ori
aceeai valoare a caracteristicii pentru mai multe uniti i n acest caz media se va calcula ca
o medie aritmetic ponderat:
x=

;
- x valorile individuale ale caracteristicii;
- k numrul de intervale (grupele);
- x valoarea centralizat (nivelul totalizat) al caracteristicii.
Dac exist o serie de distribuie de frecvene pe intervale, atunci x
i
reprezint centrul
de interval.
Propriet(i
1. Dac pentru toate unitile se nregistreaz aceeai valoare a caracteristicii atunci media
este egal cu acea valoare:
x
1
= x
2
= = x
n
= x
x=

=

= ;
2. Media aritmetic are ntotdeauna valoare cuprins ntre valoarea minim a caracteristicii
(x
min
) i valoarea maxim (x
max
):
Statistic Aplicat
26
x
n cazul seriilor de distribuie pe intervale, media este cuprins ntre limita inferioar a
primului interval i limita superioar a ultimului interval.
3. Suma abaterilor valorilor individuale ale caracteristicii de la media lor este nul, adic
distanele fa de centru se compenseaz reciproc:
pentru seria simpl:
( x) = x x = x

=0;
pentru seria de frecvene:
( x) = x n x n = x n

n =0;
4. n cazul seriilor de frecven, media oscileaz n jurul termenului cruia i corespunde
frecvena maxim;
5. Dac toi termenii unei serii statistice se mresc sau se micoreaz cu o constant a,
atunci i media se va mri sau se va micora cu respectiva constant a:
=
6. Dac toi termenii unei serii statistice se nmulesc sau se mpart cu o constant h, atunci
i media se va multiplica sau se va reduce de h ori:
=
7. Dac frecvenele unei serii de repartiie se multiplic sau se mpart cu o constant a,
atunci media nu se va modifica.
8. Media aritmetic este sensibil la valorile extreme, care pot afecta semnificaia i
reprezentativitatea mediei ca valoare central. Pentru ca media s fie reprezentativ trebuie
ca datele din care se calculeaz s fie ct mai omogene;
9. Media general calculat pentru o serie de repartiie de frecven corespunztoare
colectivitii generale este egal cu media aritmetic ponderat a mediilor pariale calculate
pe baza seriilor de repartiie componente:
=

= media seriei de repartiie component j;


n
j
= volumul seriei componente j.
10. Media aritmetic calculat pentru o serie simpl i media aritmetic calculat pentru
aceeai serie cu datele grupate pe intervale (utiliznd centrul de interval), pot s fie sau nu
egale. Cele dou medii sunt egale dac frecvenele din seria de repartiie de frecvene sunt
normal distribuite pe fiecare interval.
11. Pentru o variabil alternativ (binar) media aritmetic se calculeaz astfel:
Varianta de
rspuns
x
i
Frecvena
(n
i
)
Frecvene relative
(n
i
*)
DA
NU
1
0
m
n m
=
1
Total - n 1
Statistic Aplicat
27
!!! Media caracteristicii alternative (binare) are caracter de greutate specific sau pondere.
!!! Media caracteristicii alternative se exprim n coeficieni, deci nu are unitatea de msur a
caracteristicii.
11.2 Media armonic( )
Media armonic se calculeaz mprind frecvena absolut total (numrul total al
unitilor) la suma inverselor valorilor caracteristicii:
media armonic simpl:
x =

, pentru o serie simpl;


media armonic ponderat:
x =


, pentru o serie pe frecvente;
Dac ntre dou variabile interdependente exist o relaie de invers proporionalitate,
aceast relaie se pstreaz i n cazul mediilor calculate.
!!! Dac pentru calculul uneia se folosete media aritmetic pentru calculul celeilalte
se va folosi n mod obligatoriu media armonic.
Media aritmetic poate fi substituit de media armonic ponderat care folosete drept
ponderi x
i
n
i
:media armonic simpl:
x =


;
Aceast relaie se folosete la calculul indicelui mediu de grup al preurilor dac nu
avem informaii privind cantitatea de mrfuri, ci doar informaii privind valoarea i preurile.
11.3 Media geometric
Media geometric se bazeaz pe relaia de produs ntre termenii seriei:
pentru o serie simpl:
x =
pentru o serie de frecvene:
x =

Pentru a putea fi calculate cele dou medii trebuie s se logaritmeze relaiile:
lgx =
lgx
,
lgx =
1
n
n lgx
S-au obinut mediile aritmetice ale logaritmilor termenilor seriei.
Statistic Aplicat
28
Media geometric are o valoare mai mic dect media aritmetic i nu se poate calcula
dac un termen al seriei este negativ sau egal cu zero.
Media geometric se utilizeaz n cazul seriilor de distribuie atunci cnd termenii
seriei prezint diferene mari ntre ei sau seria prezint o asimetrie pronunat.
Prin logaritmare abaterile dintre termeni se micoreaz.
11.4 2.4 Media ptratic
Media ptratic se calculeaz ca radical din media aritmetic a ptratelor termenilor
seriei:
pentru o serie simpl:
x =

;
pentru o serie de frecvene:
x =
x n
n
;
Media ptratic se utilizeaz n cazul n care ntr-o serie de repartiie predomin
valorile mari ale caracteristicilor sau dac dorim s le acordm acestora o importan mai
mare.
11.5 Cuantilele
Cuantilele (percentile, n engl.) reprezint niveluri ale variabilei care caracterizeaz
poziia relativ a unui nivel individual n setul de date.
Cuantilele au aceeai unitate de msur ca i caracteristica studiat.
Cuantilele realizeaz o divizare a distribuiei ntr-un numr de k pri egale.
Cuantilele pot fi folosite pentru a analiza forma distribuiei
n caracterizarea unui set de date, cele mai uzuale cuantile sunt:
Cuantila de ordin 2 ( mediana ).
Cuantilele de ordin 4 (cuartile, notate , , , care mpart seria n patru pri
egale, delimitnd cte 25% din observaii, = ).
Cuantilele de ordin 10 (decile, notate , ...., i care delimiteaz cte 10% din
observaii, = Me).
Cuantilele de ordin 100 (centile, care delimiteaz cte 1% din observaii).
Cuantilele de ordin mai mare dect 2 se folosesc n cazul seturilor de date de volum
mare ( 30).
Statistic Aplicat
29
11.6 Mediana
Mediana face parte din categoria cuantilelor alturi de quartile, decile.
Cuvntul median provine din cuvntul latin medius care nseamn mijloc.
Mediana reprezint acea valoare a unei serii ordonate cresctor sau descresctor care
mparte seria n dou pri egale, aa nct 50% din termenii seriei au valori mai mici dect
mediana, iar 50% mai mari dect mediana.
Un avantaj al medianei fa de medie este acela c poate fi utilizat n caracterizarea
tendinei centrale pentru o serie de date msurate pe o scar ordinal.
Mediana ia n consideraie doar poziia termenilor n serie, nu i mrimea acestor
valori, deci mediana nu este supus influenei valorilor foarte mari sau foarte mici care sunt
lsate n afara seriei.
Calculul medianei:
pentru o serie simpl (pentru date negrupate):
- seria are un numr impar de termeni atunci mediana este egal cu termenul central al
seriei ordonate cresctor sau descresctor.
Se cunoate urmtorul set de valori ale unei caracteristici:
5 7 4 9 12 3 10
Ordonm seria cresctor:
3 4 5 7 9 10 12
Me
Pentru date ordinale mediana este varianta situat n centrul seriei.
- seria are un numr par de termeni, atunci mediana este egal cu media aritmetic simpl a
celor 2 termeni centrali ai seriei ordonate cresctor sau descresctor.
Fie urmtorul set de valori:
3 1 5 7 9 4
1 3 4 5 7 9
= =4,5
Pentru un ir de date ordinale format din numr par de termeni, mediana este egal cu
una din cele dou variante din centrul seriei dac aceste variante sunt egale, iar dac
variantele nu sunt egale mediana ia 2 valori deoarece nu se poate face media lor.
Pentru o serie de distribuie de frecvene pe variante calculul medianei comport
urmtoarele etape:
Etapa 1: se determin locul medianei n cadrul seriei:
= +
Etapa 2: se cumuleaz cresctor frecvenele absolute i se determin acea frecven cumulat
cresctor care este imediat mai mare sau egal cu locul medianei (L
Me
). Varianta care
corespunde frecvenei absolute cumulate ce ndeplinete condiia de mai sus este mediana.
Pentru o serie de frecvene pe intervale de variaie, mediana se poate determina
numai n ipoteza n care valorile sunt distribuite uniform n cadrul intervalului de grupare.
Etapa 1: se determin locul medianei n cadrul seriei:
= +
Statistic Aplicat
30
Etapa 2: se cumuleaz cresctor frecvenele absolute i se determin acea frecven cumulat
cresctor care este imediat mai mare sau egal cu L
Me
. Intervalul care corespunde frecvenei
absolute cumulate ce ndeplinete condiia de mai sus este intervalul median.
Etapa 3: se calculeaz mediana cu relaia:
= +

- x
0
= limita inferioar a intervalului median;
- h = mrimea intervalului median;
- npMe = suma frecvenelor absolute pn la intervalul median;
- nMe = frecvena absolut a intervalului median.
Mediana poate fi determinat i pentru variabilele nenumerice msurate pe scala ordinal.
Pentru o variabil nenumeric, determinarea medianei este mai uoar dac datele sunt
sistematizate
Se parcurg urmtorii pai:
- calcularea frecvenelor cumulate cresctor, (Fci);
- determinarea locului medianei cu formula (n+1)/2;
- determinarea Me ca fiind valoarea (varianta) corespunztoare primei frecvene cumulate
mai mare dect (n+1)/2.
11.7 Modulul
Modul (dominanta unei serii) este valoarea cea mai des ntlnit sau creia i
corespunde cea mai mare frecven de apariie.
Calculul algebric al modului:
- pentru o serie simpl: reprezint valoarea cel mai des ntlnit.
- pentru o serie de distribuie pe variante, modul este egal cu varianta creia i corespunde
frecvena absolut sau relativ maxim.
- pentru o serie de distribuie de frecvene pe intervale de variaie modul se calculeaz cu
relaia:
= +
+
- x
0
= limita inferioar a intervalului modal;
- h = mrimea intervalului modal;
- A
1
= diferena dintre frecvena intervalului modal i a celui anterior;
- A
2
= diferena dintre frecvena intervalului modal i a celui urmtor.
Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim.
Valoarea modal se poate determina pentru orice tip de variabil (nenumeric sau
numeric), indiferent de scala de msurare.
Modul este singurul indicator ce poate fi determinat pentru variabilele msurate pe
scala nominal, iar grafic, ntr-o histogram ori poligon al frecvenelor, modul reprezint
valoarea de pe abscis, corespunztoare vrfului reprezentrii.
O serie de date statistice poate s aib una sau mai multe valori modale. O distribuie
cu un singur mod se numete unimodal (a), o distribuie este bimodal (b) dac are dou
valori dominante i multimodal (c) dac are mai mult de dou valori modale.
Statistic Aplicat
31
Figura 1 a) distribu(ie unimodal; b) distribu(ie bimodal; c) distribu(ie multimodal
12 Indicatorii variaiei i asimetriei
Pentru analiza variabilitii unei serii de date numerice se utilizeaz:
- indicatori simpli (msoar mprtierea valorilor individuale ale seriei, una fa de
alta, ori fa de o valoare tipic)
- indicatori sintetici (utilizati pentru sintetizarea, ntr-o singur expresie, a
mprtierii tuturor valorilor din seria statistic analizat).
!!! Dou serii statistice pot s difere prin tendina central, prin mprtierea datelor
sau prin amndou.
12.1 Amplitudinea absolut a variaiei (Ax)
A
x
se determin ca diferen ntre valoarea maxim (x
max
) i valoarea minim (x
min
) a
caracteristicii i arat cmpul maxim de mprtiere a valorilor caracteristicii.
=
Are unitatea de msur a valorilor caracteristicii;
Nu poate fi folosit la compararea seriilor dup caracteristici exprimate n uniti de
msur diferite;
Se utilizeaz n etapa de grupare a datelor (la construirea intervalelor de variaie i la
construirea graficelor);
Este foarte sensibil la valorile extreme: cu ct acestea sunt mai ndeprtate cu att
cmpul de mprtiere a valorilor este mai mare.
12.2 Amplitudinea relativ a variaiei (Ax (%))
A
x(%)
se obine prin raportarea amplitudinii absolute la medie.
(%)
=

100
Se exprim n coeficient sau procente, deci pot fi comparate serii dup caracteristici
exprimate n uniti de msur diferite.
12.3 Abaterile individuale absolute
Ne arat mprtierea fiecrei valori de la valoarea medie:
=
n practic se utilizeaz mai mult abaterea absolut maxim i abaterea absolut
minim:
= 0
n
i
x
i
Mo
x
i
n
i
Mo
1
Mo
2
Mo
1
Mo
2
Mo
3
n
i
x
i
a) b)
c)
n
i
x
i
Mo
x
i
n
i
Mo
1
Mo
2
Mo
1
Mo
2
Mo
3
n
i
x
i
a) b)
c)
Statistic Aplicat
32
= 0
Abaterile individuale absolute se exprim prin aceeai unitate de msur ca i
caracteristica studiat i pot lua valori negative sau pozitive dup cum valoarea individual
este mai mic sau mai mare ca media.
Dac d
i
n valoare absolut au valori mari putem concluziona c datele sunt
mprtiate, adic exist o variaie mare n interiorul seriei.
Suma valorilor abaterilor individuale absolute este nul:
= ( ) =0
12.4 Abaterile individuale absolute
Suma abaterilor maxime i minime luate n modul este egal cu amplitudinea absolut
a variaiei:
+| | =
Dac n cazul unei serii, abaterea maxim absolut difer mult de valoarea abaterii
minime absolute luat n modul, atunci pentru seria respectiv trebuie calculai pe lng
indicatorii variaiei i indicatorii de asimetrie.
ntr-o serie simetric:
=| |
12.5 2.4 Abaterile individuale relative
Se exprim n coeficieni sau procente i se calculeaz raportnd abaterile individuale
absolute la medie:
(%)
=

100
(%)
=

100
(%)
=

100
12.6 Abaterea liniar medie ( )
n cazul n care seria de distribuie de frecvene este pe intervale, atunci x
i
este centrul
intervalului.
Pentru o serie de distribuie de frecvene relative:
d =
| |

, dac n

sunt exprimate n procente;


d = |x x| n

, dac n

sunt exprimate n coeficieni


n locul mediei, pot fi folosii i ali indicatori ai tendinei centrale.
Dezavantaje ale abaterii medii liniare:
- se exprim n aceeai unitate de msur ca i caracteristica analizat, deci nu poate fi utilizat
la compararea a dou sau mai multe serii dup caracteristici exprimate n uniti de msur
diferite;
- nu ine seama de semnul algebric;
- nu ine seama de faptul c abaterile mai mari n valoare absolut influeneaz n mai mare
msur gradul de variaie al unei caracteristici comparativ cu abaterile mici.
Abaterea medie liniar, , se calculeaz ca o medie aritmetic simpl (n cazul seriilor
simple) sau ponderat (n cazul seriilor de distribuie de frecvene) a abaterilor termenilor seriei
de la media lor n valoare absolut.
Statistic Aplicat
33
Pentru o serie simpl:

=
| |
Pentru o serie de distribuie de frecvene absolute:
d =
|x x|

12.7 Dispersia ( )
Dispersia se calculeaz ca medie aritmetic simpl (n cazul seriilor simple) sau
ponderat (n cazul seriilor de distribuie de frecven) a ptratelor abaterilor termenilor
seriei de la tendina central (cel mai adesea media aritmetic).
Pentru o serie simpl:
=
( )
Pentru o serie de distribuie de frecvene absolute:
=
( )

Pentru o serie de distribuie de frecvene relative:


=
( )

, dac n

sunt exprimate n procente;


= (x x) n

, dac n

sunt exprimate n coeficieni


n locul mediei, pot fi folosii i ali indicatori ai tendinei centrale.
Dac datele provin din eantioane de volum redus i le folosim pentru extinderea rezultatelor
la nivelul colectivitii generale, atunci n calculul dispersiei la numitor se va folosi (n-1) i nu
n fiind astfel dispersia eantionului un estimator mai bun al dispersiei n colectivitatea
general:
=
(x x)
n1
Dispersia reprezint dezavantajul c este un indicator abstract care nu are o unitate
concret de msur.
Ea arat modul n care graviteaz termenii seriei n jurul tendinei centrale (de obicei
media).
Dac dispersia unei serii este egal cu 0, atunci acea serie nu prezint variaie, toi
termenii ei fiind egali. Cu ct valoarea dispersiei crete fa de zero, cu att mprtierea
termenilor seriei crete i ea.
Este un indicator deosebit de util n studiile statistice, fiind utilizat n calculul
asimetriei, excesului, boltirii unei serii, precum i n calculul altor indicatori statistici.
Varianta x
i
Frecvena
n
i
Frecvene relative
DA
NU
1
0
M
n m
n
m
w 1
n
m n
=

Total - N 1
Statistic Aplicat
34
Dispersia caracteristicii alternative este egal cu produsul dintre cele dou frecvene
relative.
12.8 Abaterea medie ptratic (abatere medie standard sau tip) ( )
Abaterea medie ptratic (abatere standard, abatere tip sau ecart tip) se calculeaz ca
o medie ptratic a abaterilor termenilor seriei de la media lor sau ca radical din dispersie.
Abaterea medie ptratic ne arat cu ct n medie se abat termenii unei serii de la tendina
central (de obicei media):
Pentru o serie simpl:
= =
(x x)
n
Pentru o serie de distribuie de frecvene absolute:
= =
(x x) n
n
Abaterea medie ptratic are aceeai unitate de msur cu a caracteristicii studiate, de
aici provenind dezavantajul c nu pot fi comparate colectiviti dup caracteristici exprimate
prin uniti de msur diferite.
<

<
n cazul unei serii de distribuie de frecvene simetric sau uor asimetric, adic
pentru o serie cu tendin de normalitate ntre abaterea medie liniar i abaterea medie
ptratic exist relaia:

0.8
Abaterea medie ptratic este un indicator care ne ofer informaii privind modul de
mprtiere a termenilor unei serii cu tendin de normalitate. O regul empiric spune:
- 68,37% din termenii unei serii se situeaz n intervalul (x;x+);
- 98,45% din termenii unei serii se situeaz n intervalul (x2;x+2);
- 99,73% din termenii unei serii se situeaz n intervalul (x3;x+3);
- 99,94% din termeni se gsesc n intervalul (x4;x+4)
Abaterea medie ptratic este un indicator deosebit de util la estimarea erorilor de
selecie, la calcule de corelaie precum i la orice comparaie statistic n timp i spaiu.
12.9 Coeficientul de variaie ( )
Coeficientul de variaie este cel mai utilizat i mai semnificativ indicator pentru
analiza variaiei. Se calculeaz ca raport ntre abaterea medie ptratic sau liniar i medie.
=

100 sau =

100; >
Coeficientul de variaie se exprim procentual, deci putem aprecia c el reprezint
exprimarea relativ a lui sau a lui

.
- = seria este perfect omogen, toi termenii seriei sunt egali ntre ei i sunt egali cu
media: n acest caz nu exist variaie.
Statistic Aplicat
35
- % seria este foarte omogen, variaia este foarte mic, media este foarte
reprezentativ, iar gruparea a fost foarte bine executat (n cazul seriilor de distribuie de
frecvene).
- % seria este omogen.
- % seria este eterogen, variaia este foarte mare, media nu este
reprezentativ, iar gruparea trebuie refcut.
13 Indicatorii de asimetrie
Asimetria unei serii de distribuie empirice poate fi determinat att prin metoda
grafic ct i prin calculul indicatorilor de asimetrie.
Reprezentarea grafic cea mai utilizat pentru aprecierea asimetriei este poligonul
frecvenelor, dar graficul ne ofer doar o imagine sugestiv asupra gradului de asimetrie, fr
a putea s-l msoare printr-o valoare exact.
x
Pentru distribuii moderat asimetrice, ntre x , Me, Mo exist urmtoarea relaie:
, , x Me 3 x Mo =
Indicatorii asimetriei sunt:
- asimetrie absolut:
Mo x As = sau , , Me x 3 As =
Aceti indicatori au unitatea de msur a caracteristicii analizate, deci prezint
dezavantajul c nu pot fi comparate din punct de vedere al asimetriei serii dup caracteristici
exprimate prin uniti de msur diferite. Aceti indicatori pot fi pozitivi (n cazul asimetriei
de stnga) sau negativi (n cazul asimetriei de dreapta).
- asimetrie relativ:
De aceea se calculeaz coeficientul de asimetrie propus de Pearson (statistician
englez 1857-1936):
j 1 , 1
Mo x
Cas e
o

=
- Dac Cas = 0 seria este perfect simetric:
Mo Me x = =
- Dac Cas > 0 seria prezint asimetrie pozitiv sau de stnga:
Mo Me x > > (predomin valorile mici)
n
i
x
i
n
i
x
i
Mo
Me
n
i
x
i
Mo
Me
Serie perfect simetric
(Clopotul lui Gauss)
Serie asimetric cu
asimetrie de stnga sau
pozitiv, predomin
valorile mici
Serie asimetric cu
asimetrie de dreapta sau
negativ, predomin
valorile mari
Statistic Aplicat
36
- Dac Cas < 0 seria prezint asimetrie negativ sau de dreapta:
Mo Me x < < (predomin valorile mari)
Cu ct Cas este mai apropiat de 1 seria este mai asimetric.
Dac Cas e [-0,3; 0,3] seria este uor sau moderat asimetric.
Acest coeficient este recomandat numai pentru serii de repartiie uor asimetrice.
Dac se cunoate mediana seriei, coeficientul de asimetrie se poate calcula cu relaia:
, ,
j 3 , 3
Me x 3
Cas e
o

=
Acest indicator este recomandat numai pentru serii de repartiie uor asimetrice cnd
ntre cei trei indicatori ai tendinei centrale exist relaia:
, , x Me 3 x Mo =
Cu ct Cas este mai apropiat de 0 cu att seria este mai simetric, iar cu ct se apropie
de extremitile intervalului, asimetria devine mai pronunat.
Aceti doi indicatori ai asimetriei sunt cei mai utilizai n practic, dar n afar de
acetia se mai utilizeaz i ali indicatori.
14 Inferen(a statistic. Sondajul statistic
Cercetarea statistic se poate desfura n 2 modaliti:
- cercetare statistic total cnd realizam o cercetare statistic total descriem
colectivitatea printr-un sistem de indicatori statistici numii parametrii. Acetia sunt
obinui cu o probabilitate de 100%.
- cercetare statistic parial a unui eantion reprezentativ;
- etapa descriptiv;
- etapa inferenial.
n cadrul etapei descriptive caracterizm eantionul printr-un sistem de indicatori.
Etapa de inferen statistic/inferenial n care generalizm rezultatele din eantion
pentru colectivitatea general. Se poate realiza n 2 moduri:
- estimm parametrul necunoscut pe baza indicatorilor din eantion;
- testm ipoteze pentru colectivitatea general pe baza evidenelor din eantion.
n colectivitatea general indicatorii se numesc parametrii i se noteaz cu litere
greceti:
=

, media
=
( )
, dispersia
n eantion obinem estimatori cu ajutorul crora realizm estimaii asupra
parametrilor:
=

, media
=
( )
, dispersia
Un indicator obinut pentru un eantion este o estimaie a parametrului.
Modelul de baz folosit n sondajul statistic selecia aleatoare simpl numrul
eantioanelor diferite ce se pot extrage dintr-o colectivitate de volum N este .
Avantajele acestei metode sunt numeroase. Printre acestea sunt:
Statistic Aplicat
37
- costuri mai mici
- erori de observare reduse
- un plan al cercetrii care poate fi mai amplu
- posibilitatea utilizrii atunci cnd cercetarea conduce la distrugerea obiectului cercetat.
Principalul dezavantaj este c ntotdeauna vom avea erori de reprezentativitate. Asta
nseamn c un eantion nu poate imita perfect situaia din colectivitatea general dect n
mod cu totul ntmpltor. ns dac vom cunoate distribuia variabilei aleatoare, media de
selecie, vom putea msura erorile de reprezentativitate, le vom putea diminua i ine sub
control.
Paii pentru determinarea intervalului de ncredere pentru medie sunt urmtorii
(selecie aleatoare simpl repetat, variabil numeric):
1. Pentru eantionul cu care lucrm calculm: ,
2. Determinm eroarea medie probabil de reprezentativitate:

=

=
3. n funcie de probabilitatea dorit vom determina eroarea maxim admisibil: =z s ,
unde z=argumentul funciei de repartiie;
4. Parametrul necunoscut se situeaz pentru probabilitatea dorit n urmtorul interval:


+

1. Nivelul total al variabilei va fi cuprins ntre
(

) ( +

)
14.1 Tipuri de sondaje
Exista mai multe criterii de clasificarea sondajelor. Dup procedeul de selecie,
aleatoare sau nealeatoare, eantioanele sunt:
- eantioane bazate pe judecata cercettorului orice eantion care este format pe baza
experienei i expertizei cercettorului, ca de exemplu sondajul pe cote;
- eantioane aleatoare - realizate dup scheme probabilistice.
SONDAJE ALEATOARE
- Sondaj simplu aleator: sanse egale acordate unitatilor de fi cuprinse in esantion
o fiecare unitate din populaia mam are aceeai probabilitate de a face parte din
eantion;
o fiecare unitate din eantion are aceeai ans de apariie;
o folosete numere aleatoare dup schema cu bila revenit (sondaj cu
NLOCUIRE) sau cu bila nerevenit (sondaj FR NLOCUIRE);
- Sondaj stratificat pe GRUPE, straturi formate dupa anumite variabile independente
(de forma M/F de exemplu).
Eantionul aleator stratificat este obinut prin separarea populaiei pe straturi, grupe, ce
se exclud reciproc, doar dup aceast operaiune se extrage un eantion aleator din
fiecare strat.
Criterii de separe a populaiei pe straturi, variabile independente sunt de exemplu: gen;
varsta; ocupatie; venitul gospodariei; religie; numar de copii sub 18 ani din gospodarie;
locatia; brand-ul
- Sondajul sistematic alegerea se face dupa un pas de numarare
Statistic Aplicat
38
- Sondaj cluster pe GRUPURI
Eantionul cluster eantion aleator de grupuri sau elemente. Se utilizeaz cnd nu se
poate produce lista membrilor populatiei datorita necunoasterii tutror sau a dispersiei
teritoriale, de exemplu se formeaza clustere de ACTIONARI.
- Metoda sondajului cuprinde dou etape:
- etapa descriptiv, n care se culeg date i se calculeaz indicatorii ce caracterizeaz
eantionul analizat;
- etapa inferenial, n care rezultatele obinute pentru eantion se extind, n termeni
probabilistici, la populaia statistic.
Selecia statistic reprezint operaia de extragere a unei pri dintr-o populaie
statistic numit eantion.
Notm volumul populaiei statistice cu N i volumul eantionului cu n, 1 s n s N
Inferena statistic este procesul prin care formulm concluzii despre populaia
statistic, pe baza indicatorilor calculai n eantion
Exist dou modaliti principale pentru realizarea inferenei:
- estimaiapunctual sau pe interval de ncredere
- testarea de ipoteze statistice.
Estimaia nseamn determinarea valorii aproximative a parametrului din populaia
statistic folosind eantionul statistic
Estimaia asupra mediei, pe interval de ncredere, presupune:
- calculul indicatorilor de sondaj
o mediei de sondaj
o dispersiei de sondaj
o erorii medii de reprezentativitate
o erorii maxime admise
- extinderea rezultatelor sondajului asupra populaiei statistice presupune determinarea
unui interval de ncredere, pe baza estimatorului punctual, pentru media populaiei statistice.
Calculul erorilor pentru selecia aleatoare simpl repetat
1. Eroarea standard (eroarea medie de reprezentativitate)
- Pentru o variabil cantitativ, nealternativ, pentru estimarea parametrului media populaiei
statistice ( ) este necesar s calculm media de sondaj ( x ).
- Media mediilor de selecieeste egal cu media populaiei
- Dispersia mediilor de selecieeste de n ori mai mic dect dispersia variabilei considerate n
populaia statistic i, de regul, aproximat pe baza dispersiei eantionului:
n
s
s
x
x
2
2
=
Eroarea medie de reprezentativitate (abaterea standard a mediei de sondaj) se determin
pe baza datelor din eantion ca:
Statistic Aplicat
39
n
s
n
s
s
x
x
x
= =
2
Deoarece am extras un eantion de volum n dintr-o populaie statistic de N uniti, nu
putem fi siguri 100% n privina valorii adevrate a mediei populaiei.
Cu toate acestea, dac eantionul este de volum mare (n > 30), pe baza teoremei limit
central, putem construi un interval de ncredere, cu o probabilitate de 100(1-o)% de
garantare a rezultatelor, pentru parametrul media populaiei statistice.
2. Eroarea maxim admis
Pentru probabilitatea cu care garantm rezultatele 100(1-o)%, eroarea maxim
admisibil este:
n
s
z s z
x
x x
* *
2 / 2 /
= = A
, unde
2 /
z

este argumentul functiei Gauss-


Laplace i depinde de probabilitatea de garantare a rezultatelor (valorile lui z sunt tabelate
pentru diverse niveluri de semnificatie)
Aceasta nseamn c n 100(1-o)% din cazuri, media de sondaj ( x ) se abate de la
media colectivitii generale ( ) cu mai puin sau cel mult z
o/2
ori eroarea medie de
reprezentativitate
x
s .
Intervalul de ncredere pentru media
n
s
z x
2 /

care va conine adevrata valoare a mediei din populaia statistic (



), n 100(1-o)% din
cazuri.
Cea mai folosit probabilitate de garantare a rezultatelor este de 95%, adic: z
0,025
=1.96.
Se cere gsirea unui echilibru ntre mrimea intervalului de ncredere (un interval mai
mic nseamn o precizie crescut) i probabilitatea de cuprindere a parametrului din populaie
(o probabilitate crescut de garantare a rezultatelor poate fi preferat).
Interval de ncredere pentru 1-o=0,999
Interval de ncredere pentru 1-o=0,99
Interval de ncredere pentru 1-o=0,95
Interval de ncredere pentru 1-o=0,90
Mrimea relativ a intervalului de ncredere
pentru un eantion de volum mare
Se observ c, pe msur ce nivelul de ncredere (probabilitatea cu care garantm
rezultatele crete), intervalul de ncredere devine mai mare pentru a acoperi aceast
cerin, iar exactitatea estimaiei scade.
Statistic Aplicat
40
Extinderea rezultatelor sondajului la ntreaga colectivitate statistic se va face pentru
media caracteristicii numerice analizat pe baza erorii limit admisibil i a intervalului
de ncredere:
x x
x x A + < < A .
Deseori suntem interesai s estimm pe baza sondajului nu doar nivelul mediu al
caracteristicii, ci i nivelul total al caracteristicii n colectivitatea general (exemplu:
estimarea pe interval de ncredere a fondului de salarizare, a produciei totale obinute etc.).
Intervalul de ncredere pentru nivelul total al caracteristicii este:
) ( ) (
1
x
N
i
i
x
x N x x N A + < < A

=
.
Exemplul 17
Directorul unui hotel dorete s cunoasc durata medie a sejurului turitilor cazai n
hotel. n acest scop el selecteaz aleator date din registrul hotelului, pentru un numr
de 80 de turiti i calculeaz durata medie a sejurului
, 8 , 4 zile x =
cu o abatere
standard
zile s
x
7 , 2 =
.
Pentru o probabilitate de garantare a rezultatelor de 95%, durata medie a sejurului
pentru turitii cazai n hotel se determin astfel:
96 , 1 , 80 , 7 , 2 , 8 , 4
025 . 0 2 /
= = = = = z z n zile s zile x
x
zile
n
s
s
x
x
30 , 0
94 , 8
7 , 2
= = =
(eroarea standard a mediei)
zile s z
x x
59 , 0 30 , 0 96 , 1
2 /
= = = A

x x
x x A + s s A
59 , 0 8 , 4 59 , 0 8 , 4 + s s
zile 39 , 5 21 , 4 s s
Alegerea volumului eantionului
Precizia cerut, asociat cu mrimea intervalului de ncredere pentru media populaiei
( ) poate fi exprimat:
- pe baza erorii limite maxime (
x
A )
- prin precizarea lungimii totale a intervalului de ncredere, L=2
x
A
.
Volumul necesar al eantionului se determin rezolvnd una din urmtoarele ecuaii n n:
x
x
n
s
z A =
2 /
sau
2
2 /
L
n
s
z
x
=

.
Soluia poate fi scris ca:
2
x
2
x
2
2 /
s ) z (
n
A

=

sau
2
2
x
2
2 /
L
s ) z ( 4
n

=

- s
x
2
se folosete ca o estimaie a lui
2
x
, n general necunoscut.
- s
x
2
poate fi cunoscut dintr-o cercetare prin sondaj anterioar.
- s
x
poate fi aproximat pe baza amplitudinii mprtierii A
x
i sub presupunerea
tendinei de normalitate a distribuiei: 4 /
x x
A s ~ (pentru o distribuie cu tendin de normalitate
Statistic Aplicat
41
aproximativ 95% din observaii se ncadreaz ntr-un interval de 4 ori abaterea standard, iar
aproximativ 99,73% din observaii sunt cuprinse ntr-un interval de 6 ori abaterea standard).
Exemplul 18
Vacana de iarn este perioada cea mai important pentru activitatea de schi, deoarece
muli copii, studeni i aduli sunt dispui s-i petreac un timp considerabil la munte,
practicnd acest sport. Pentru a-i dimensiona activitatea, managerul unei staii de
telecabine dorete s estimeze timpul mediu de ateptare la staie pentru clieni, de la
sosire pn la servire. Dintr-o cercetare anterioar, el tie c timpul de ateptare are o
distribuie aproximativ normal, cu o abatere medie ptratic
x
s =18 min. Ci
clieni trebuie s selecteze pentru a estima timpul mediu de ateptare, cu o
probabilitate de 95%, pe un interval de ncredere cu o lungime de 10 minute (

5
minute)?
. min 5 2 / 10 2 / , 96 , 1 ., min 18
025 . 0 2 /
= = = A = = = L z z s
x
x
50 78 , 49
25
324 96 , 1
2
2
2 2
~ =

=
A
=
x
s z
n
turiti.
15 Noiuni introductive privind legturile statistice dintre variabile
Legturile ce se pot forma sunt legturi stohastice, n care un fenomen este factor de
influenta, iar cellalt este efect. Statistica, printr-o gam larg de procedee i metode
specifice, poate studia manifestarea concret a acestor legturi, le poate exprima cantitativ i
msura intensitatea cu care se produc. Legtura (dependena) statistic se caracterizeaz prin
faptul c, la modificarea unui factor de influen, factorul influenat rspunde cu o distribuie
de valori.
Legturile statistice se pot clasifica astfel:
I. dup natura relaiei de cauzalitate:
- legturi funcionale. Acestea se manifest ntre dou fenomene n care unul este
cauza iar cellalt efectul. Se ntlnesc n natur, tehnic etc. Dac se noteaz fenomenul cauz
cu x i fenomenul efect cu y atunci relaia matematic este: y = f(x)
- legturi statistice (stohastice) apar atunci cnd fenomenul efect este rezultatul
combinrii influenei mai multor cauze, care pot aciona n condiii egale sau diferite. Relaia
matematic este: y = f(x
1
,x
2
,..,x
n
), unde: x
1
, x
2
, ..., x
n
sunt valorile fenomenelor
cauz care au fost nregistrate; y = valorile fenomenului efect.
II. dup numrul de caracteristici incluse n modelul de corelaie:
- legturi simple. Acestea au la baz dou caracteristici: una factorial, iar cealalt
rezultativ (celelalte caracteristici factoriale chiar dac sunt nregistrate se consider cu
aciune constant).
- legturi multiple. Acestea au n vedere dependena unei caracteristici rezultative n
funcie de mai muli factori nregistrai sau dependena mai mulor variabile rezultative (y
1
, y
2
,
.. , y
n
) de o variabil factorial (x
i
). Ecuaiile de estimare sunt: y = f(x
1
, x
2
, x
3
,...,x
n
) i y
1
,
y
2
,..., y
i
,...y
n
= f(x
i
).
III. dup direcia legturii:
Statistic Aplicat
42
- legturi directe (pozitive): exist atunci cnd, pe msur ce se modific nivelul de
dezvoltare al caracteristicii factoriale, se modific n acelai sens i nivelul caracteristicii
rezultative.
- legturi inverse (negative): au n vedere modificri n sens contrar nivelului de
dezvoltare (o variabil crete iar cealalt scade).
IV. dup forma de exprimare a variabilelor corelate distingem:
- legturi de asociere. Acestea exprim relaia dintre dou sau mai multe caracteristici
exprimate calitativ (prin cuvinte) sau ntr-o caracteristic calitativ i una cantitativ
(exprimat numeric).
- legturi de corelaie. Exprim relaia de interdependen dintre dou sau mai multe
caracteristici statistice exprimate numeric.
V. dup forma de realizare a legturii distingem:
- legturile liniareexprimate printr-o funcie liniar, de gradul intai;
- legturile neliniareexprimate printr-o curb (exponenial, parabol, hiperbol etc.);
VI. dup timpul n care se realizeaz:
- legturi sincrone: au loc n acelai timp i se pot urmri n dinamic pentru aceeai perioad.
- legturi asincrone: influena caracteristicilor factoriale asupra variaiei caracteristicii
rezultative apare dup trecerea unei perioade de timp. Forma de realizare a legturii
corespunde funciei matematice de regresie (de estimare) care se alege pe baza graficului de
corelaie (corelogramei).
Metode simple de stabilire a existenei i a formei de legtur dintre fenomenele i
procesele economico-sociale
Pentru a caracteriza legtura dintre fenomene, se pot folosi mai multe procedee ce se
ncadreaz n categoria metodelor simple de caracterizare a legturilor. Aceste metode sunt
uor de aplicat i se bazeaz pe analiza calitativ a variabilelor corelate, oferind informaii
asupra naturii i trsturilor eseniale ale legturii cercetate.
Metodele simple de caracterizare a legaturilor stohastice
1) Metoda seriilor paralele interdependente are la baz serii paralele de date,
obinute prin operaia de centralizare la nivelul unitilor simple sau complexe, fr a fi
grupate. Se pot folosi serii: de timp, de spaiu i atributive. Aceast metod ne ofer
posibilitatea de a stabili existena legturii i direcia de realizare a acesteia, prin analiza
valorilor perechii x, y.
Aceast metod este mai puin sugestiv n cazul seriilor formate dintr-un numr
foarte mare de termeni i implic ntr-o msur important subiectivismul analistului.
2) Metoda gruprilor este o metod de sistematizare a datelor pe baza creia se pot
cerceta legturile (conexiunile) statistice. Se poate folosi gruparea simpl sau gruparea
combinat.
3) Metoda tabelului de corelaie presupune utilizarea unui tabel combinat cu dubl
intrare care ne sugereaz existena legturii, direcia de realizare a ei i unele aprecieri
empirice privind intensitatea legturii prin analiza modului n care frecvenele comune (n
ij
) se
distribuie n rubricile interioare ale tabelului. Dac frecvenele n
ij
tind a se concentra ctre
Statistic Aplicat
43
I
-
l
e
g

tu
r

d
i
r
e
c
t

I
I
-
l
e
g

tu
r

i
n
v
e
r
s

cele dou diagonale trasate n tabelul urmtor, legtura ntre x


i
i y
j
va fi intens. n schimb,
dac se mprtie la ntmplare n reeaua tabelului, legtura este slab sau poate lipsi. n
concluzie, procedeul tabelului de corelaie este o combinare a metodei gruprii cu
principiile de construire i interpretare a unei reprezentri grafice.
x
i
\ y
j
y
1
, y
2
, .... y
j
... y
p
Total
x
r
x
r-1
:
x
i
:
x
2
x
1
n
ij
n
r
n
r-1
:
n
i
:
n
2
n
1
Total n
1
, n
2
, .... n
j
... n
p

4) Metoda grafic. Graficul de corelaie se mai numete corelogram. Pentru
construcia acestuia se utilizeaz sistemul de axe rectangulare, unde pe axa OX se nscriu
valorile caracteristicii principale de grupare (x), iar pe axa OY valorile caracteristicii
secundare de grupare (y). Intersecia abscisei cu ordonata se concretizeaz printr-un numr de
puncte ce se dispun sub form de nor, numrul punctelor fiind egal cu numrul de uniti
statistice luate n calcul.
Metoda grafic se utilizeaz ca metod empiric pentru alegerea funciei matematice ce
se analizeaz n cazul regresiei i corelaiei statistice.
Metode analitice de msurare a legturilor dintre fenomene
Metoda grafic se utilizeaz ca metod empiric pentru alegerea funciei matematice ce se
analizeaz n cazul regresiei i corelaiei statistice.
Metodele analitice iau n consideraie valorile reale ale varibilelor corelate i parametrii
corespunztori acestora. Acestea poart denumirea de metode parametrice i sunt:
1) metoda regresiei;
2) metoda covarianei;
3) metoda raportului de corelaie;
4) metoda coeficientului de corelaie;
5) metoda analizei dispersionale.
1) Metoda regresiei reprezint o metod statistic de analiz a legturii dintre variabile cu
ajutorul unor funcii, numite funcii de regresie. Funcia de regresie se alege printr-o
modalitate empiric folosind graficul de corelaie (corelograma) si prin aplicarea testelor de
semnificaie (de exemplu: testul F de analiz dispersional). n funcie de numrul de
variabile incluse n model, distingem: regresie unifactorial (o varibil factorial x
i
i o
variabil rezultativ y
i
) i regresie multifactorial (mai multe variabile factoriale i o singur
variabil rezultativ).
a) Regresia unifactorial liniar are la baz ecuaia dreptei (funcia de gradul nti):
i x
bx a y
i
+ =
Statistic Aplicat
44
De menionat c dependena liniar dintre y
i
i x
i
se consider o dependen
stohastic n care unei valori x
i
i pot corespunde mai multe valori y
i
. Funcia y
xi
=
valorile ajustate ale lui y
i
dup ecuaia dreptei i presupune nlocuirea valorilor empirice cu
valori teoretice obinute prin calcul n urma aplicrii unei metode sau unui model de calcul
statistic; x
i
= variabila factorial; y
i
= variabila rezultativ; a, b = parametrii ecuaiei de
regresie care pot fi interpretai n sens geometric i n sens statistic. Parametrul a
exprim n sens geometric ordonata la origine i poate lua att valori pozitive, ct i valori
negative. Are caracter de mrime medie, n sensul c valoarea sa arat la ce nivel ar fi ajuns
valoarea caracteristicii y
i
dac toi factorii mai puin cel nregistrat x
i
ar fi avut o
aciune constant. Parametrul b exprim n sens geometric panta liniei drepte i poart
denumirea de coeficient de regresie. Msoar cu ct se modific n medie variabila rezultativ
(y
i
) dac variabila factorial (x
i
) se modific cu o unitate (semnul lui b ne indic direcia
legturii). Parametrii a i b se determin din sistemul de ecuaii normale obinut prin metoda
celor mai mici ptrate, care se bazeaz pe minimizarea ptratelor abaterilor dintre valorile
individuale nregistrate i valorile teoretice (corespunztoare funciei). Aceast funcie
obiectiv presupune identificarea punctului de extrem (are n vedere determinarea parametrilor
funciei) si verificarea dac punctul de extrem este minim sau maxim (se realizeaz prin
semnul derivatei de ordinul II dac este pozitiv (semnific minim) dac este negativ
(semnific maxim).
Relaia de minimizare este:


2
x i
) y y (
i
= minim.
Pentru tendina liniar a legturii avem:

=
2
i i
) bx a y ( f = minim. In functia de mai
sus condiia de minim a unei funcii de dou derivabile se anuleaz cnd derivatele pariale, n
raport cu cei doi parametri (a, b), sunt: 0 ) 1 )( bx a y ( 2
da
df
i i
= =

i
0 ) x )( bx a y ( 2
db
df
i i i
= =

= +
= +


i i
2
i i
i i
y x x b x a
y x b na
; i = n , 1 .
Rezolvand sistemul se calculeaza termenul liber, a, si panta dreptei, b, dupa metoda
determinantilor, astfel:





= =
A
A
=
2
i
2
i
i i i
2
i i
2
i i
i
2
i i i
i i
) x ( x n
y x x x y
x x
x n
x y x
x y
a
a
;i= n , 1





= =
A
A
=
2
i
2
i
i i i i
i i i
i
i i i
i
) x ( x n
y x y x n
y x x
x n
y x x
y n
b
b
; i = n , 1
Interpretarea pantei:
- dac b > 0 legtura de corelaie este direct (pe msur ce cresc valorile lui x
i
cresc
i valorile ecuaiei de regresie calculate);
- dac b < 0 legtura de corelaie este invers (pe msur ce crete valoarea
caracteristicii factoriale (x
i
) scade valoarea caracteristicii rezultative (y
i
) si
Statistic Aplicat
45
- dac b = 0 cele dou variabile sunt independente i y
x
i
= 0.
Funcia de regresie exprim statistic modul n care caracteristica rezultativ (y
i
) se
modific, dac ar influena numai caracteristica factorial (x
i
), iar ceilali factori sunt
considerai cu aciune constant.
a) y b) y
y
x
i
= -a +b
x
i
y
x
i
= a - b
x
i
tg x tg x
a < 0 i b > 0 legtur direct a > 0 i b < 0 legtur invers
figura 1.1 figura 1.2
c) y d) y
y
x
i
= a y
x
i
= b
x
i
a > 0 i b = 0 lipsa legturii a = 0 i b > 0 legtur funcional
figura 1.3 figura 1.4
Figura 2 Interpretarea geometric a parametrilor
Regresia unifactorial liniar se utilizeaz n urmtoarele cazuri: pentru un numr mic
de informaii negrupate, dar prezentate sub forma a dou serii paralele interdependente (x
i
i
y
i
) caz prezentat anterior si pentru un numr mare de informaii sistematizate prin grupare
simpl(x
i
, y
i
, n
i
valori cunoscute) si grupare combinat(y
j
, n
i
, n
j
, n
ij
, x
i
valori cunoscute).
Pentru cazul (1) (grupare simpl) sistemul de ecuaii normale se determin prin
analogie cu cel prezentat anterior, cu deosebirea c se va ine seam de frecvenele comune
(n
i
) pentru cele dou varibile x
i
i y
i
. Sistemul de ecuaii normale este:

= +
= +


i i i i
2
i i i
i i i i i
n y x n x b n x a
n y n x b n a
2
i i i
2
i i
i i i i i i i i
2
i
) n x ( n x n
n y x n x n y n x
a




=
2
i i i
2
i i
i i i i i i i i
) n x ( n x n
n y n x n y x n
b




=
Pentru cazul (2) (grupare combinat) rezultatele se prezint ntr-un tabel combinat cu
dubl intrare, iar sistemul de ecuaii se determin prin analogie cu cel de la cazul (1):
Statistic Aplicat
46

= +
= +


K
i
m
j
ij j i
K
i
i
2
i
K
i
i i
m
j
j j
K
i
i i
K
i
m
j
ij
n y x n x b n x a
n y n x b n a
Din rezolvarea sistemului de ecuaii normale se obin formulele uzuale de calcul al
parametrilor a i b. Legturile dintre fenomene nu se bazeaz mereu pe modele simple de
regresie pentru c pot exista mai multe variabile factoriale i o singur variabil rezultativ de
forma: y = f(x
1
, x
2
,,x
i
, , x
n
).
Asemenea legturi poart denumirea de modele de regresie multifactoriale care au la
baz funcia: liniar, exponenial, hiperbolic, parabolic.
2) Metoda covarianei se utilizeaz pentru msurarea intensitii legturilor de tip
statistic ntre dou sau mai multe variabile la nivelul ntregii colectiviti.
!!!!Covariana este un indicator sintetic de corelaie simbolizat prin cov(x,y), se obine
ca o medie aritmetic a produselor abaterilor variabilelor fa de media lor conform relaiei:
y x
n
1 i
i i
) y , x cov(
) y y )( x x (
n
1
) y , x cov(
o o s
=

=
.
Semnul indicatorului arat direcia legturii: plus (legtura direct), minus
(legtura indirect), iar covariana nul ne indic lipsa legturii de corelaie (variabilele
sunt independente). Covariana are ca neajuns faptul c depinde de unitile n care se
msoar variabilele aleatoare.
3) Metoda raportului de corelaie
Pentru stabilirea intensitii legturii dintre dou varibile (x
i
, y
i
) se calculeaz un
indicator sintetic de corelaie numit raport de corelaie simbolizat cu R
x/y
. Acesta permite
msurarea gradului de intensitate a realizrii legturii dintre caracteristica considerat factor
de influen (x
i
) i caracteristica rezultativ (y
i
), indiferent de forma legturii: liniar sau
neliniar. Calculul se bazeaz pe descompunerea variaiei totale (dispersiei) a caracteristicii
rezultative y astfel:
) y y (
0 i
=
) y y (
i
x i

+
) y y (
0 x
i

!
abaterea ntmpltoare
!
abaterea sistematic
Prin nsumare i ridicare la ptrat se obine:

= + =
2
0 x x i
2
0 i
)] y y ( ) y y [( ) y y (
i i
+ +
2
0 0
2
) ( ) )( ( 2 ) (
0
y y y y y y y y
i i i i
x x x i x i

n
) y y (
) y y (
2
0 i
2
0 i

=
=
!

n
) y y (
) y y (
2
x i
2
x i
i
i
+
+
!

n
) y y (
) y y (
2
0 x
2
0 x
i
i

2
y
o
=
2
r
y
o
+
2
x
y
o
!
Dispersia total: arat
influena tuturor factorilor
eseniali i ntmpltori
care determin
!
Dispersia rezidual: arat
acea parte din variaia
variabilei rezultative y
i

datorat aciunii factorilor


!
Dispersia sistematic:
arat influena factorului
x
i
asupra variaiei
caracteristicii
Statistic Aplicat
47
variaia total a variabilei
rezultative y
i

ntmpltori rezultative y
i

Raportul de corelaie se determin pornind de la regula de adunare a dispersiilor


(prezentat anterior), utiliznd coeficientul de determinaie (
2
x / y
R ) i coeficientul de
nedeterminaie (
2
x / y
K ):
100 R
2
y
2
x / y
2
x / y

o
o
= si 100 K
2
y
2
r / y
2
r / y

o
o
= .
Raportul de corelaie se calculeaz ca rdcin ptrat din coeficientul de determinaie
astfel:
=
/

=
o
o
=
o
o o
=
o
o
= =

n
) y y (
n
) y y (
1
) 2 (
1
) 1 (
R R
2
0 i
2
x i
2
y
2
r / y
2
y
2
r / y
2
y
2
y
2
x / y
2
x / y x / y
i



) 3 (
2
0
2
) (
) (
1

y y
y y
i
x i
i
; i = n , 1
Formula de calcul simplificat a raportului de corelaie se determin astfel:
n
) y (
y
y x b y a y
1 R
2
i 2
i
i i i
2
i
x / y


=
; i = n , 1 . Raportul de corelaie ia valori n intervalul [0,1]
= 0 lips de legtur (varibilele sunt necorelate)
0 legatur foarte slab sau poate lipsi
R
y/x
e[0,1] = 1 legtur de tip funcional, variabila y
i
depinde n
exclusivitate de variabila x
i

1 legtur puternic, intens


n cazul legturilor de tip invers, semnul raportului de corelaie este dat de ctre
semnul coeficientului de regresie (b). n funcie de informaiile folosite n calcul i de modelul
lor de sistematizare, raportul de corelaie se calculeaz n urmtoarele dou cazuri:
1) Numr mic de informaii, n care se dau valorile x
i
, y
i
, caz n care R
y/x
se calculeaz
dup formulele 1,2,3, explicitate anterior;
2) Numr mare de informaii:
a) se dau valorile lui x
i
, y
i
i n
i
frecvenele lor comune:

=
i
2
i
i
2
x i
x / y
n ) y y (
n ) y y (
1 R
i
; i = n , 1


=
i
2
i i
i
2
i
i i i i i i
2
i
n
) n y (
n y
n y x b n y a n y
1 ; i = r , 1
b) se dau valorile lui x
i
, frecvenele dup variabila x
i
(n
i
), frecvenele dup variabila
y
j
(n
j
) i frecvena comun n
ij
:
=

j
2
0 j
ij
2
x j
x / y
n ) y y (
n ) y y (
1 R
i
Statistic Aplicat
48
=

j
2
j j
j
2
j
ij j i j j j
2
j
n
) n y (
n y
n y x b n y a n y
1 ; j = m , 1 ; i = K , 1
4) Metoda coeficientului de corelaie
Coeficientul de corelaie este un indicator sintetic prin care se msoar legtura dintre
dou variabile (x
i
, y
i
) statistice a cror distribuie este asimptotic normal sau normal.
Calculul coeficientului de corelaie se bazeaz n forma iniial pe produsul abaterilor normale
normate (pentru un numr de date individuale negrupate):
y
i
y
x
i
x
y y
Z
x x
Z
o

=
o

=
Coeficientul de corelaie se calculeaz ca o medie a produselor abaterilor normale
normate:
y x
i i
y
i
x
i
x / y
n
) y y )( x x (
n
y y x x
r
o o

=

.
|

\
|
o

.
|

\
|
o

; i = n , 1
Dac n relaia (1) vom nlocui:
n
x
x
i

= ;
n
y
y
i

= ; i = n , 1 ;
n
) x x (
2
i
x

= o
i
n
) y y (
2
i
y


= o se obine relaia: r
y/x
=




] ) y ( y n ][ ) x ( x n [
y x y x n
2
i
2
i
2
i
2
i
i i i i
; i = n , 1 (2)
Folosind covariana: r
y/x
=
i i
y x
i i
) y , x cov(
o o
Interpretare:
1) r
y/x
e [-1,1] apreciem din punct de vedere al semnului direcia legturii i din
punct de vedere al mrimii intensitatea legturii.
Dac: r
y/x
= 0 legtura lipsete i variabilele x
i
i y
i
sunt independente;
r
y/x
0 legtura dintre cele dou varibile este slab;
r
y/x
= 1 legtur de tip funcional (fie direct dac semnul coeficientului este pozitiv, fie
invers dac semnul coeficientului este negativ);
r
y/x
1 variabilele sunt puternic corelate, legtura fiind intens.
2) r
y/x
= R
y/x
se aprecieaz c legtura de corelaie este de forma liniar, ceea ce
nseamn c se poate folosi fie coeficientul, fie raportul de corelaie.
3) Valoarea coeficientului de corelaie depinde de forma liniei de regresie, motiv pentru
care acest indicator este semnificativ pentru corelaiile de tip liniar i mai puin semnificativ
pentru corelaiile de tip neliniar (n cazul din urm folosindu-se raportul de corelaie).
4) n cazul legturii liniare se mai poate calcula ca o medie geometric a coeficienilor
de regresie (b) astfel:
y / x x / y x / y
b b r =
Statistic Aplicat
49
unde:
2
i
2
i
i i i i
y / x
2
i
2
i
i i i i
x / y
) y ( y n
y x y x n
b
) x ( x n
y x y x n
b



=
; i = n , 1
Coeficientul de corelaie se calculeaz n funcie de datele folosite n analiz i de modul
n care au fost sistematizate informaiile. Astfel:
a) - numr mic de informaii n care se dau valorile lui x
i
, y
i
sub forma a dou serii paralele; r
y/x
se
calculeaz dup formula (1), (2) i (3) prezentate anterior.
b) - numr mare de informaii, cunoscndu-se x
i
, y
i
i frecvenele lor comune (n
i
)

o o

=
y x i
i i i
x / y
n
n ) y y )( x x (
r ; i = n , 1
unde:


= o

= o = =
i
i
2
i
y
i
i
2
i
x
i
i i
i
i i
n
n ) y y (
;
n
n ) x x (
;
n
n y
y ;
n
n x
x ; i = n , 1
nlocuind n formula (1) a lui r
y/x
se obine:
] ) n y ( n y n ][ ) n x ( n x n [
n y n x n y x n
r
2
i i i
2
i i
2
i i i
2
i i
i i i i i i i i
x / y




= ; i = n , 1
c) se cunosc valorile lui x
i
, y
j
, n
i
, n
j
, n
ij
, obinute prin gruparea combinat, rezultatul
fiind prezentat ntr-un tabel combinat cu dubl intrare i atunci relaia de calcul devine:
] ) n y ( n y n ][ ) n x ( n x n [
n y n x n y x n
r
2
j j j
2
j j
2
i i i
2
i i
j j i i ij
i
j i
j
ij
x / y


=
;
m , 1 j
n , 1 i
=
=
5) Metoda analizei dispersionale. Raportul de determinare
O modalitate eficient folosit n caracterizarea conexiunilor este metoda analizei
dispersionale (metoda coeficientului de determinare), care se poate folosi n mai multe cazuri
i anume: la verificarea independenei unui fenomen comercial sau turistic, la verificarea
stabilitii mediei i dispersiei pentru mai multe eantioane succesive, la verificarea
dependenei unui fenomen comercial sau turistic de factorii si de influen . Dac analiza
dispersional se utilizeaz dup aplicarea corelaiei statistice, atunci aceasta este considerat o
metod prin care se testeaz semnificaia curbei (funciei) de regresie explicitate.Analiza
dispersional are la baz metoda gruprii, prin care unitile observate se separ n grupe dup
variaia caracteristicii de grupare (considerat factor de influen). Aplicarea acesteia are la baz
gruparea combinat (dup cele dou variabile x
i
i y
j
). Poate fi utilizat att ca metod simpl
de caracterizare a corelaiilor, prin care se stabilete dac variabila factorial influeneaz
semnificativ variabila rezultativ, dar i ca metod analitic de combinare a acesteia cu
analiza regresiei. Analiza dispersional se poate utiliza n urmtoarele situaii: nainte de
aplicarea metodei corelaiei, caz n care se poate verifica gradul de semnificaie a factorului
considerat principal pentru producerea variaiei caracteristicii rezultative si dup utilizarea
metodei regresiei i corelaiei, caz n care se poate verifica corectitudinea funciei matematice
cu ajutorul creia s-au estimat valorile caracteristicii rezultative n raport cu variaia
caracteristicii factoriale.
Pentru prezentarea modelului analizei dispersionale prin care se testeaz forma de
legtur, pornim de la variaia total a varibilei (Y) care se descompune n urmtoarele trei
elemente: (y
j
-
0
y ) = (y
j
-
i
y ) + (
i
y - y
x
i
) + (y
x
i
-
0
y ),
unde:
0
y = media total a variabilei Y
Statistic Aplicat
50
y
j
= valorile variabilei Y
i
y = mediile condiionate ale variabilei Y
Y
x
i
= valorile ajustate ale variabilei Y n funcie de X
Calculul raportului de determinare se bazeaz pe descompunerea variaiei seriei de
date y
1
,,y
T
n funcie de influena factorilor inclui n modelul de regresie i factori aleatori
nenregistrai:

=
2
) ( y y SST
i
; relaia anterioara cuantific dispersia seriei valorilor variabilei
endogene sub aciunea tuturor factorilor de inferen.
Influena factorilor de regresie este dat de:

= =
A
2 2
) (
i i
e y y SSE .
Pe baza abaterilor menionate se calculeaz dispersiile medii corelate ale variabilei Y,
respectiv dispersia total S
2
y, dispersia n postura de estimaii ale dispersiei totale, adic:
Pentru msurarea dependenei legturii ntre variabila endogen i factorii de regresia se
calculeaz raportul de determinare (R
2
).
SST
SSE
SST
SSR
R = = 1
2
Calculele necesare determinrii lui R
2
sunt realizate din cadrul unei analize dispersionale
(ANOVA).
Tabel ANOVA pot fi folosite pentru modelul de regresie
Sursa variabilei Suma ptratelor Grade de libertate Media sumei
ptratelor
Regresia rezidual SSR
SSE
K-1
T-K
MSSR=SSR/K-1
MSSE=SSE/T-K
TOTAL SST T-1
Rezultatele ANOVA pot fi folosite pentru construirea testului F
MSSE
MSSR
F =
F urmeaz o distribuie Fisher cu K-1 i T-K grade de libertate. Pentru un prag de semnificaie
se stabilete valoarea teoretic F
;K-1;T-K
Dac:
F cal < F
;K-1;T-K
influena regresiei difer semnificativ de cea a factorilor reziduali;
deci modelul este valid.
F cal > F
;K-1;T-K
modelul este invalid.
De asemenea dac:
F
calc
> F
teoretic
atunci apreciem c legtura dintre X, Y este semnificativ i se pot aplica n
continuare i alte metode de calcul statistic pentru a cuantifica legtura dintre X i Y.
F
calc
< F
teoretic
legtura nu este semnificativ, variabilele sunt necorelate.
Metode neparametrice de msurare a legaturilor dintre fenomenele economico-sociale
Aceste metode, pe lng faptul c pot stabili intensitatea legturii fcnd abstracie de
tipul de distribuie, permit msurarea intensitii legturii nu numai pentru caracteristicile
cantitative, dar i pentru cele calitative. Poart denumirea de metode neparametrice deoarece
nu iau n calcul ntotdeauna valorile variabilelor corelate i nici parametrii lor corespunzatori.
Se folosesc n urmtoarele situaii:
- cnd distribuia variabilelor corelate nu e normal sau asimptotic normal;
Statistic Aplicat
51
- cnd nu este cunoscut forma de distribuie a variabilelor; cnd variabilele corelate
sunt asimetrice, deci prezint asimetrie pronunat
- cnd avem de-a face cu variabile calitative i cantitative care n prealabil necesit o
anumit cuantificare.
Metodele neparametrice uzuale sunt:
1) Coeficientul de asociere a lui Yule presupune ntocmirea tabelului de asociere, care
este un tabel combinat cu dubl intrare utilizat pentru variabilele de tip alternativ (DA/NU;
F/M; etc.). Tabelulul de asociere este format din dou rnduri i dou coloane:
n
11
n
12
n
21
n
22
n care n captul rndurilor se trec valorile celor dou caracteristici asociate, iar n interiorul
tabelulului se trec frecvenele corespunztoare lor.
Exemplul 19
Dac avem n vedere dou variabile statistice xi i yi i considerm c sunt
variabile de tip alternativ, atunci asocierea dintre xi i yi se prezint astfel:
y
i
x
i
DA NU Total
DA
NU
n
11
n
21
n
12
n
22
n
11
+ n
12
n
21
+ n
22
Total n
11
+ n
21
n
12
+ n
22

(n interiorul tabelului se consemneaz concomitent rspunsurile privind cele dou
variabile corelate x
i
i y
i
). Pentru stabilirea valorii numerice a coeficientului de
asociere care s indice existena i intensitatea legturii, se calculeaz coeficientul lui
Yule conform relaiei:
12 21 22 11
12 21 22 11
n n n n
n n n n
Q
+

=
; unde Q
e
[-1,1]
Dac: Q = 0 lipsa de asociere ntre x
i
i y
i
Q

0 asociere redus ntre x
i
i y
i
Q

1 asociere puternic ntre x
i
i y
i
Q = 1 asociere perfect ntre x
i
i y
i
Produsul n
11
n
22
= arat gradul de realizare a legturii ntre caracteristicile corelate x
i

i y
i
si produsul n
12
n
21
= arat lipsa legturii dintre cele dou variabile. Avantajul
utilizrii: se poate calcula cu mult rapiditate, utilizndu-se i n cazul cnd datele
provin de la uniti statistice complexe.
2) Coeficienii de corelaie a rangurilor
Coeficienii de corelaie se calculeaz nlocuind valorile individuale ale variabilelor cu
numrul lor de ordine numit RANG. Rangurile se atribuie dup ce n prealabil s-au ordonat
datele individuale ale celor dou variabile n ordine cresctoare, astfel nct va trebui s
vedem dac exist concordan ntre rangurile caracteristicii factoriale de la 1 n i rangurile
caracteristicii rezultative de la 1 n. Avantajul utilizrii acestora:
1) pot fi utilizai cu succes i n cazul unor distribuii asimetrice;
2) pot fi utilizai pentru un numr restrns de uniti pentru care nu se poate verifica
reprezentativitatea datelor pariale.
Statistic Aplicat
52
a) Coeficientul de corelaie a rangurilor Spearman este o aplicaie a coeficientului de
corelaie liniar simpl la distribuiile celor dou iruri de ranguri. [3]
Acesta se calculeaz parcurgnd urmtoarele etape:
1) se identific cele dou variabile corelate xi i yi;
2) se acord ranguri de regul cresctoare n aceeai manier att pentru variabila xi ct i
pentru variabila yi;
Rangurile sunt numere de ordine care evolueaz n progresie aritmetic cu raia egal cu 1.
3) se determin diferena dintre ranguri (di) i se ridic la ptrat;
4) se aplic formula de calcul:
n n
d 6
1 r
3
2
i
S

=

e
[-1,1] ce msoar intensitatea legturii dintre
rangurile celor dou variabile corelate, unde: d
i
= diferena dintre rangurile variabilei x
i
i
rangurile variabilei y
i
: R
x
-R
y
si n = numrul perechilor de valori corelate.
Dac: r
S
= 0 ntre rangurile lui x
i
respectiv y
i
nu exist legtur (independen, statistic);
r
S
0 legtur foarte slab sau poate lipsi;
r
S
1 legtur puternic;
r
S
= 1 legtur funcional.
b) Coeficientul de corelaie a rangurilor Kendall; pentru a-l determina se folosesc
valorile variabilelor corelate pentru care se acord ranguri. Etapele de lucru sunt:
1) se identific variabilele corelate x
i
i y
i
;
2) se ordoneaz cresctor variabila x
i
i, n coresponden cu aceasta, se trec valorile
corespunzatoare variabilei y
i
;
3) se acord ranguri cresctoare n aceeai manier ca i la coeficientul Spearman;
4) se determin concordana notat cu P i discordana notat cu Q;
5) se calculeaz scorul sau diferena (S = P Q);
6) se aplic formula de calcul:
) 1 n ( n
S 2
r
k

=
unde: S = P Q
e
[-1, 1]
Concordana (P) este mereu pozitiv i reprezint numrul de ranguri superioare
fiecarui rang considerat al variabilei y
i
. Discordana (Q) este mereu negativ i reprezint
numrul de ranguri inferioare fiecrui rang considerat al variabilei y
i
.
Coeficientul rangurilor calculat dup formula lui Kendall este de obicei mai mic dect
cel calculat dup formula lui Spearman, avnd aceeai interpretare.
16 Analiza statistic a seriilor cronologice
Seriile cronologice sunt formate din dou iruri de date, n care primul ir ne arat
variaia timpului, iar cel de-al doilea ir cuprinde valorile fenomenului sau procesului
economic analizat la momentele sau pe intervalele de timp respective.
Forma general a unei serii cronologice este:

.
|

\
|
n i 2 1
n i 2 1
y ... y ... y y
t ... t ... t t
n , 1 i =
Trendul sau tendina general a unei serii cronologice poate fi descris prin relaia:
, , n , 1 i t f y
i
= =
Criterii de clasificare a seriilor cronologice:
Statistic Aplicat
53
Exist trei criterii principale dup care se poate face clasificarea seriilor cronologice:
I. dup variaia timpului:
- serii cronologice de intervale denumite i serii de fluxuri, n care fiecare termen al
seriei arat evoluia fenomenului sau procesului analizat pe o perioad de timp.
Forma general a unei serii cronologice de intervale este:
Caracteristica principal a acestor serii de timp este aceea c termenii seriei se pot
nsuma, obinndu-se astfel un indicator totalizator pe ansamblul perioadei analizate (ex.:
producia total de aluminiu pe parcursul perioadei analizate, investiiile imobiliare totale).
- serii cronologice de momente n care fiecare termen al seriei arat nivelul la care a
ajuns fenomenul sau procesul analizat la un anumit moment de timp.
Forma general a unei astfel de serii este:
Caracteristica principal a unei serii de momente este aceea c termenii seriei nu se
pot nsuma pentru c s-ar produce multiple nregistrri.
II. dup natura termenilor seriei cronologice, adic dup modul de exprimare al
termenilor seriei, distingem:
- serii cronologice formate din indicatori absolui (evoluia profiturilor anuale ale unei
bnci comerciale, evoluia numrului de salariai ai unei firme n perioada 2000-2006).
Termenii seriei se exprim prin uniti concrete de msur.
- serii cronologice formate din indicatori relativi (evoluia lunar a ratei dobnzii,
evoluia anual a ratei profitului, evoluia lunar a ratei inflaiei). Termenii unei serii se
exprim de regul prin procente.
- serii cronologice formate din mrimi medii (evoluia lunar a salariului mediu,
evoluia anual a profitului mediu, evoluia anual a nzestrrii medii a muncii cu capital fix).
Termenii seriei se exprim prin uniti compuse de msur deoarece se obin prin raportarea
ntre doi indicatori absolui ntre care exist o relaie de interdependen.
III. dup numrul de termeni, seriile cronologice pot fi:
- serii cronologice de lungime mic;
- serii cronologice de lungime medie;
- serii cronologice de lungime mare.
Proprietile temenilor unei serii cronologice
Seriile cronologice se caracterizeaz printr-o serie de proprieti:
- variabilitatea termenilor seriilor cronologice se refer la modificarea valorii
caracteristicii (variabilei) la care se refer seria cronologic de la un moment de timp la altul
sau de la o perioad (interval) de timp la alta.
t
1
t
2
t
n
y
1
y
2
y
n
t
t
1
t
2
t
n
y
1
y
2
y
n
t
Statistic Aplicat
54
- omogenitatea termenilor seriilor cronologice se refer la faptul c toi termenii seriei
trebuie s fie de acelai tip i s fie rezultatul aciunii acelorai legi. Pentru a se asigura
omogenitatea termenilor seriilor cronologice trebuie s se in cont de modul de exprimare al
acestora (care trebuie s fie unitar), ct i de coninutul lor (adic, toi termenii s aib aceeai
unitate de msur, termenii trebuie s fie compatibili din punct de vedere al culegerii i
prelucrrii datelor). Deci, omogenitatea termenilor implic comparabilitatea acestora.
- periodicitatea termenilor unei serii cronologice se refer la forma de manifestare a
fenomenelor n timp cu o anumit regularitate;
- interdependena n timp a termenilor unei serii cronologice provine din omogenitatea
termenilor unei serii cronologice. Aceast proprietate presupune c fiecare termen al seriei
depinde ntr-o oarecare msur de valorile anterioare nregistrate, adic depinde de termenii
precedeni. Aceast proprietate ne conduce la ideea c fenomenele i procesele social-
economice sunt rezultatul unor legi obiective ce au caracter de tendin, tendin ce poate fi
urmrit pe o perioad lung de timp.
Reprezentarea grafic a seriilor cronologice
1. Cronograma este utilizat pentru reprezentarea grafic a seriilor cronologice de intervale
sau a seriilor cronologice de momente cu intervale egale ntre momente.
Cronograma este un tip de grafic care are ca scop evidenierea variaiei unui fenomen n
timp n vederea desprinderii tendinei fenomenului respectiv.
Pentru construirea cronogramei se folosete sistemul de axe rectangulare, pe axa OX se
trece timpul sub form de intervale de timp (timpul se nscrie ntre dou diviziuni succesive)
sau sub form de momente de timp (timpul se nscrie n dreptul diviziunii), iar pe axa OY se
trec valorile fenomenului analizat n timp (y
t
). Intersecia abscisei cu ordonata se face prin
puncte, al cror numr trebuie s fie egal cu numrul termenilor seriei cronologice. Prin
unirea punctelor succesive prin segmente de dreapt se obine cronograma.
Cronograma constituie o metod de analiz empiric a trendului (tendinei de evoluie)
adic ea ne permite s alegem funcia matematic cu ajutorul creia ajustm fenomenul
(funcia de trend sau de ajustare).
2. Diagrama prin coloane
Diagrama prin coloane se utilizeaz pentru reprezentarea grafic a seriilor cronologice
de momente cu intervale neegale ntre momente.
Diagrama prin coloane se construiete utiliznd sistemul de axe rectangular. Ea este
format din dreptunghiuri cu latura mare vertical, iar bazele egale sunt pe axa OX.
Att n cazul cronogramei, ct i al diagramei prin coloane avem scar de reprezentare
doar pe axa OY.
3. Diagrama polar (radial)
Are la baz o reea polar format din cercuri concentrice, iar raza este proporional cu
nivelul mediu al indicatorilor de reprezentat. Cercul se mparte n attea sectoare de cerc ci
termeni are seria. Dac variaia fenomenului analizat este lunar pe parcursul unui an avem 12
sectoare de cerc. Dac valoarea unui indicator depete media valorilor individuale, atunci se
vor prelungi cele dou raze n afara cercului. Dac valoarea indicatorului este mai mic dect
media, atunci ea se va situa n interiorul cercului.
Dup reprezentarea punctelor pe reeaua polar, acestea se unesc prin segmente de
dreapt sau printr-o curb.
Diagrama polar este un grafic utilizat n analiza i interpretarea sezonalitii.
Statistic Aplicat
55
Prelucrarea seriilor cronologice de momente
Seriile cronologice de momente pot fi:
a) cu intervale egale ntre momente;
b) cu intervale neegale ntre momente.
a) n cazul seriilor cronologice de momente cu intervale egale ntre momente se pot
calcula toi indicatorii care vor fi prezentati la seriile cronologice pe intervale, excepie
fcnd media care n acest caz se va calcula ca o medie cronologic simpl:
1 n
2
y
y ... y y
2
y
y
n
1 n 3 2
1

+ + + + +
=

b) n cazul seriilor cu intervale neegale ntre momente singurul indicator care se poate
calcula este media cronologic ponderat:
1 n 2 1
1 n
n
1 n 2 n
1 n
3 2
3
2 1
2
1
1
d ... d d
2
d
y
2
d d
y ...
2
d d
y
2
d d
y
2
d
y
y

+ + +
+
+
+ +
+
+
+
+
=
Schema pentru calculul mediilor:
Indicatorii obinui prin prelucrarea unei serii cronologice constituie un sistem de
indicatori n cadrul cruia fiecare indicator scoate n eviden un aspect al modului de
dezvoltare a fenomenelor i proceselor economice studiate.
Aceti indicatori sunt cu att mai concludeni cu ct seria cronologic este mai bine
alctuit, cu ct este mai bine aleas perioada de analiz (aspecte legate de lungimea seriei i
de omogenitatea termenilor).
Este bine ca numrul termenilor s fie suficient de mare pentru a putea satisface legea
numerelor mari a lui Bernoulli, lege care spune: ntr-un numr suficient de mare de cazuri
individuale, abaterile ntmpltoare tind s se compenseze astfel nct se poate determina o
valoare tipic, sintetic, pe ansamblul colectivitii.
t
1
t
2
t
n
d
1
d
2
d
n-1
t
t
3
t
4
t
n-1
d
3
Nivelul
mediu
- pentru serii
cronologice
de intervale
media aritmetic
simpl
- pentru serii
de momente
cu intervale
egale ntre
momente
cu intervale
neegale ntre
momente
media cronologic
simpl
media cronologic
ponderat
Statistic Aplicat
56
n cazul seriilor cronologice neomogene, indicatorii vor trebui calculai pe etape, ca
indicatori pariali, n caz contrar, dac se calculeaz indicatori pe ansamblul seriei, acetia
conduc la concluzii greite i nu pot fi folosii n calculele de prognoz.
Prelucrarea seriilor cronologice pe intervale (Sistemul de indicatori)
Prelucrarea seriilor cronologice se face cu indicatorii seriilor cronologice.
Indicatorii seriilor cronologice:
- indicatori absolui:
- nivelul absolut:
nivelurile individuale ale seriilor cronologice: y
t
, t-1, t;
nivelul totalizat al seriilor cronologice:

=
n
1 i
t
y ;
- modificarea absolut:
cu baz fix;
cu baz n lan;
- valoarea absolut a unui procent de modificare:
cu baz fix;
cu baz n lan;
- indicatori relativi:
- indicele:
cu baz fix;
cu baz n lan;
- ritmul:
cu baz fix;
cu baz n lan;
- indicatori medii:
- modificarea absolut medie;
- indicele mediu;
- ritmul mediu;
- nivelul mediu.
Indicatorii seriilor cronologice sunt indicatori primari (nivelul absolut) sau indicatori
derivai (obinui prin raportare sau diferen).
Dac compararea se face cu primul termen din serie, atunci indicatorii derivai obinui
se numesc indicatori cu baz fix.
Dac compararea se face cu termenul precedent din serie atunci indicatorii derivai
obinui se numesc indicatori cu baz n lan (mobil).
Indicatorii cu ajutorul crora se caracterizeaz seriile cronologice de intervale sunt:
- indicatori absolui;
- indicatori relativi;
- indicatori medii.
Indicatori absolui:
- nivelurile individuale ale seriei cronologice: , , n , 1 t , y
t
=
- nivelul totalizat al seriei cronologice:

=
n
1 t
t
y
- modificarea absolut se calculeaz ca diferen ntre doi termeni ai seriei cronologice i
Statistic Aplicat
57
ne arat cu cte uniti concrete de msur s-a modificat fenomenul analizat de la o unitate
de timp la alta:
- cu baz fix:
n , 2 t y y
1 t 1 / t
= = A
- cu baz n lan:
n , 2 t y y
1 t t 1 t / t
= = A

1 / n
n
2 t
1 t / t
A = A

=

valoarea absolut a unui procent de modificare:
- cu baz fix:
, , 100
y
100 1
y
y
y y
1 I
y y
R
A
1
1
t
1 t
1 / t
1 t
1 / t
1 / t
1 / t
=

.
|

\
|

=
A
= , dac
1 t
y y =
Dac 0 A y y
1 / t 1 t
= =
- cu baz n lan:
, , 100
y
100 1 I
y y
R
A
1 t
1 t / t
1 t t
1 t / t
1 t / t
1 t / t

=
A
= ,
1 t t
y y

=
Dac 0 A y y
1 t / t 1 t t
= =

Indicatori relativi:
- indicele se calculeaz ca raport ntre doi termeni ai seriei cronologice i ne arat de cte
ori s-a modificat fenomenul analizat de la o perioad la alta:
- cu baz fix:
1
t
1 / t
y
y
I = , n , 2 t =
- cu baz n lan:
1 t
t
1 t / t
y
y
I

= , n , 2 t =
1 / n
n
2 t
1 t / t
I I =
[
=

- ritmul (rata, procent de modificare, modificare relativ) arat cu cte % s-a modificat
indicatorul analizat de la un interval de timp la altul:
- cu baz fix: , , 100 1 I R
1 / t 1 / t
= , n , 2 t =
- cu baz n lan: , , 100 1 I R
1 t / t 1 t / t
=

, n , 2 t =
Indicatori medii caracterizeaz seria cronologic n ansamblu:
- nivelul mediu al termenilor seriei:
n
y
y
n
1 t
t
=
=
- modificarea absolut medie este media aritmetic a modificrilor absolute de la o
perioad la alta n succesiunea lor de-a lungul intervalului de timp analizat. Se cheam
spor mediu pentru serii cu tendin cresctoare i respectiv, scdere medie pentru serii
cu tendin de scdere. Modificarea absolut medie arat diferena medie dintre
ultimul i primul termen al seriei i este semnificativ doar dac modificrile absolute
cu baz n lan sunt apropiate ntre ele:
Statistic Aplicat
58
1 n 1 n
y y
n
2 t
1 t / t
1 n

A
=

= A

=

- indicele mediu ne arat de cte ori s-a modificat n medie fenomenul analizat de
la o perioad la alta pe parcursul ntregii perioade. Se calculeaz ca o medie
geometric a indicilor cu baz n lan.
1 n
n
2 t
1 / n
1 n
1 / n
I I I
=

[
= =
Dac 1 I < atunci indicele mediu semnaleaz scderea fenomenului analizat.
Dac 1 I > atunci indicele mediu semnaleaz creterea fenomenului analizat.
Dac 1 I = atunci indicele mediu arat c fenomenul analizat nu s-a modificat.
- ritmul mediu (procentul mediu de modificare) este un indicator derivat i ne arat
cu ct la sut s-a modificat n medie fenomenul analizat de la o subperioad la alta
pe parcursul perioadei de analiz:
, , 100 1 I R =
Indicele i ritmul mediu sunt foarte sensibili la valorile extreme ale seriei (y
1
i y
n
).
Dac una din cele dou valori (y
1
sau y
n
) este nereprezentativ pentru evoluia fenomenului
analizat este suficient pentru a nu obine indicatori medii.
Ajustarea seriilor cronologice
Ajustarea seriilor cronologice nseamn nlocuirea termenilor reali ai seriei cronologice
cu valori teoretice care exprim legitatea matematic de evoluie a fenomenului considerat.
A. Procedee de ajustare
Exist mai multe procedee prin care se poate realiza ajustarea:
A.1. Ajustarea prin metoda grafic se reprezint grafic seria de date empirice (cronograma)
i apoi se traseaz dreapta sau curba care unete punctele extreme ale graficului astfel nct s
aib abateri minime fa de poziia valorilor reale n grafic:
Cronograma:
A.2. Metode de ajustare mecanice:
1) Metoda modificrii absolute medii: se utilizeaz atunci cnd modificrile
absolute cu baz n lan au valori apropiate ceea ce indic o tendin de evoluie sub forma
unei progresii aritmetice, a crei raie este aproximat prin modificarea absolut medie:
, , 1 t y y
1 t
A + = ; n , 1 t =
1 1
y y =
n n
y y =
-
-
-
-
-
-
-
-
OY
OX t
y
t
Statistic Aplicat
59
2) Metoda indicelui mediu se utilizeaz atunci cnd indicii cu baz n lan au
valori apropiate, ceea ce arat c fenomenul analizat tinde s varieze n progresie geometric,
a crei raie este aproximat prin indicele mediu:
, ,
1 t
1 t
I y y

= ; n , 1 t =
1 1
y y =
n n
y y =
A.3. Metode analitice
Metoda celor mai mici ptrate
Metoda celor mai mici ptrate este o metod analitic de ajustare deoarece utilizeaz
funciile matematice. Alegerea celei mai potrivite funcii pentru ajustare se face pe baza
graficului i a indicatorilor absolui i relativi.
Parametrii funciei de ajustare se determin cu ajutorul metodei celor mai mici ptrate
care spune c suma ptratelor abaterilor valorilor reale de la valorile ajustate este minim.
Fie: Y
i
sau
i
y = valorile ajustate
y
i
= valorile reale
Metoda celor mai mici ptrate spune c: , , min Y y
n
1 i
2
i i
=
.
Metoda celor mai mici ptrate a mai fost utilizat la estimarea parametrilor funciilor de
regresie, numai c n cazul seriilor cronologice n locul variabilei independente X de la
regresie utilizm variabila timp (t).
Valorile variabilei timp (t) se msoar cu ajutorul scalei de interval, n cadrul creia
originea scalei i unitatea de msur pot fi alese arbitrar.
Pentru uurina calculelor valorile lui t se aleg astfel nct 0 t
i
i
=

.
Putem distinge dou situaii:
- dac seria are un numr impar de termeni, atunci originea scalei va fi termenul
central:
- dac seria cronologic are un numr par de termeni, atunci originea scalei (t = 0)
se va gsi ntre cei doi termeni centrali ai seriei. Cei doi termeni centrali vor primi
valorile 1 i respectiv 1, iar ceilali termeni ai seriei cronologice vor fi distribuii
simetric fa de cei doi termeni centrali la distan de dou uniti (pentru c distana
dintre fiecare doi termeni succesivi trebuie s fie egal):
2001 2002 2003 2004 2005
- 2 - 1 0 1 2 - 3 3
2006 2007
t
2001 2002 2003 2004 2005 2006 2007 2000
Statistic Aplicat
60
Cea mai utilizat funcie analitic pentru determinarea trendului este:
Funcia liniar:
bt a Y + =
Metoda celor mai mici ptrate spune:
, , , , min bt a y min Y y
2
t
2
t t

derivatele sumei n raport cu parametrii a i b se anuleaz

= +
= +


t
2
t
ty t b t a
y t b na
Deoarece 0 t =

:
y
n
y
a
t
= =

;

=
2
t
t
ty
b
a reprezint media variabilei y
t
calculat ca o medie aritmetic simpl a termenilor
seriei;
b reprezint panta dreptei de tendina (de trend), iar valoarea sa arat cu ct se
modific n medie fenomenul analizat dac variabila timp se modific cu o
unitate (an, lun, trimestru).
2. Procedee de apreciere a calitii ajustrii
Atunci cnd se utilizeaz mai multe procedee diferite pentru ajustarea aceleiai serii
cronologice, n final trebuie s alegem cea mai bun metod de ajustare comparnd rezultatele
teoretice cu valorile reale:
1) se reprezint pe acelai grafic valorile reale i valorile teoretice obinute prin
diferite procedee de ajustare. Comparnd valorile de pe grafic alegem valorile
teoretice cele mai apropiate de valorile reale;
2) compararea sumei valorilor reale cu suma valorilor teoretice:

= =
n
1 i
i
n
1 i
i
Y y
3) calcularea sumei ptratelor abaterilor valorilor ajustate de la cele reale:
, , min Y y
n
1 i
2
i i

=
4) se calculeaz coeficientul de variaie al valorilor teoretice fa de cele reale pentru
fiecare metod de ajustare folosit:
- 3 - 1 1 3 5 - 5 7
t
- 7
Statistic Aplicat
61
min
y n
Y y
v
n
1 i
i i

=

=
Cu ct v este mai mic cu att metoda de ajustare este mai bun.
17 Indicii statistici
n urma parcurgerii acestei uniti de nvare studentul va dobndi urmtoarele competene:
va nelege ce este un indice statistic i la ce se utilizeaz;
va afla de cte feluri sunt indicii statistici i pentru ce tipuri de date se calculeaz;
va aprofunda metodologia de calcul a indicilor ca msur a variabilitii fenomenelor, la
nivel individual i total, precum i regulile de construire a indicilor de grup;
cum se poate identifica i msura efectul influenei factorilor ce acioneaz asupra
fenomenelor complexe
17.1 Coninutul, funciile i clasificarea indicilor
Indicele statistic este o mrime relativ, ce compar, sub form de raport, mrimea
aceluiai fenomen nregistrat n dou uniti de timp, de spaiu sau de program diferite, la o
unitate statistic, la o grup sau la nivelul ntregii colectiviti.
Numrtorul indicelui reprezint nivelul fenomenului studiat n unitatea de timp /
spaiu care se compar, iar numitorul acestuia nivelul fenomenului n unitatea de timp /
spaiu aleas ca baz de comparaie. n alte cazuri, indicii pot compara nivelul realizat cu cel
programat, propus al fenomenului.
Indicele este adimensional, nu depinde de unitatea de msur a fenomenului pentru
care s-a calculat. El se exprim n coeficieni sau n procente.
Indicele arat de cte ori (de ct la sut) nivelul comparat al fenomenului este mai
mare sau mai mic dect nivelul ales ca baz de comparaie al fenomenului.
Uneori, indicii au i un caracter de mrime medie, atunci cnd sunt calculai la nivelul
ntregului ansamblu sau al unei grupe a acestuia
Indicii se clasific dup urmtoarele criterii:.
a) Dup sfera de cuprindere indicii sunt:
- indici individuali (elementari) calculai la nivelul unei uniti statistice
- indici de grup (sintetici) determinai la nivelul unei grupe a colectivitii sau la
nivelul ntregii colectiviti;
b) Dup dimensiunea de raportare a fenomenului:
- indici cronologici (de dinamic): raport ntre nivelurile unui fenomen, nregistrate n
momente sau perioade de timp diferite;
Statistic Aplicat
62
- indici teritoriali (spaiali): raport ntre nivelurile unui fenomen, nregistrate n dou
uniti de spaiu diferite;
- indici de coordonare: raport ntre nivelurile unui fenomen, nregistrate pentru dou
grupe diferite ale aceleiai colectiviti, sau pentru dou colectiviti diferite;
- indici ai prevederilor: raport ntre nivelurile prevzute i nivelurile efectiv nregistrate
ale unui fenomen.
c) Dup natura variabilelor indexate:
- indici ai variabilelor cantitative
- indici ai variabilelor calitative.
d) Dup modul de calcul, indicii de grup pot fi:
- indici agregai
- indici calculai ca medie a indicilor individuali
- indici calculai ca raport a dou medii.
e) Dup natura ponderilor folosite, indicii de grup pot fi:
- cu ponderi fixe (constante) - cnd se folosesc aceleai ponderi n ntreaga serie;
- cu ponderi variabile - cnd ponderea folosit se schimb odat cu schimbarea bazei
de raportare.
f) Dup baza de raportare indicii cronologici pot fi:
- cu baz fix
- cu baz mobil sau n lan
g) Dup natura fenomenului pentru care se calculeaz:
- indici ai valorii
- indici ai volumului fizic
- indici ai preurilor
- indici ai productivitii muncii
- indici ai salariului, etc.
Statistic Aplicat
63
17.2 Indici individuali
Fie Y o variabil complex,
Indicele individual al variabilei complexe:
0
1
0 1
y
y
i
y
= sau 100
0
1
0 1
=
y
y
i
y
unde: 1 perioada curent
0 perioada de baz
y
1
nivelul variabilei complexe n perioada curent;
y
0
nivelul variabilei complexe n perioada de baz.
Pentru o perioad curent k, fa de perioada de baz, indicele devine:
0
0
y
y
i
k y
k
=
Pentru cele dou variabile factoriale (x i f) se pot scrie doi indici individuali conform
relaiilor:
0
1
0 1
x
x
i
x
= , iar pentru o perioad curent k:
0
0
x
x
i
k x
k
=
0
1
0 1
f
f
i
f
= , iar pentru o perioad curent k:
0
0
f
f
i
k f
k
=
Indicele individual al variabilei complexe y se mai scrie:
f x y
i i
f
f
x
x
f x
f x
y
y
i
0 1 0 1
0
1
0
1
0 0
1 1
0
1
0 1
= = = =
Sau, mai general:
f
k
x
k
k k k k k y
k
i i
f
f
x
x
f x
f x
y
y
i
0 0
0 0 0 0 0
0
= = = =
Condiia de reversibilitate a factorilor: produsul indicilor individuali ai celor doi factori
este egal cu indicele individual al variabilei complexe
Determinarea contribuiei factorilor la modificarea indicatorului complex se poate face i ntr-
o form absolut:
0 0 1 1 0 1 0 / 1
f x f x y y
y
= = A
17.3 Indici de grup (sintetici)
Au ca rol reflectarea variaiei medii relative la nivelul ntregii colectiviti sau al unei
grupe a acesteia. Se noteaz de regul cu litere mari (I).
Dup modul de calcul, indicii de grup se mpart n trei categorii:
- indici agregai
Statistic Aplicat
64
- indici calculai ca medie a indicilor individuali
- indici calculai ca raport a dou medii
I ndici sintetici construii ca indici agregai. Sisteme de ponderare folosite n construirea
indicilor sintetici.
Indici sintetici sunt calculai ca indici agregai. La nivelul ntregii colectiviti,
volumul total al variabilei complexe se obine prin nsumarea (agregarea) valorilor nregistrate
la nivelul fiecrei uniti statistice.
Prin raportarea nivelului agregat al fenomenului din perioada comparat (curent) (
1
y )
la cel din perioada de baz (
0
y ) se obine indicele agregat.
0 0 0
f x y L = L
Indicele de grup al caracteristicii complexe y este:

= =
j
j
j
j y
f x
f x
y
y
I
0 0
1 1
0
1
0 1
Pentru o perioad curent k":

= =
j
j
k k
j
j
k
y
k
f x
f x
y
y
I
0 0 0
0
- Pentru a determina nivelul agregat al valorilor celor doi factori identificai ai variabilei
complexe (factorul cantitativ i calitativ) se pune problema nsumabilitii valorilor lor
individuale.
- De cele mai multe ori, elementele din care se compun fenomenele din natur i societate
sunt eterogene, de aceea ele nu pot fi nsumate direct. Pentru a face nsumabile aceste
elemente se apeleaz la un comsurtor, etalon, numit i pondere Ponderea este ntlnit
att n numrtorul ct i numitorul indicelui de grup, cu aceeai valoare.
- Pentru variabila cantitativ(f) se pot ntlni urmtoarele situaii:
o Este exprimat n uniti fizice, naturale de acelai fel: se poate determina , , f L .
o Este exprimat n uniti fizice, naturale diferite: valorile individuale ale factorului
extensiv nu pot fi nsumabile. n acest caz pentru a le face nsumabile - se
nmulesc valorile factorului extensiv cu ponderile.
Statistic Aplicat
65
- Pentru variabila calitativ (x) n majoritatea cazurilor aceasta are valori neaditiv se
aplic ponderea.
Rolul de pondere l poate juca factorul pereche al factorului ce trebuie agregat. n
continuare prezentm sistemele de ponderare folosite n construcia indicilor agregai.
Sisteme de ponderare folosite n construirea indicilor sintetici
Exist mai multe sisteme de ponderare n funcie de perioada de referin a factorului ce
joac rolul de pondere. Astfel, identificm urmtoarele sisteme de ponderare utilizate n
construcia indicilor de grup.
a) Sistemul de ponderare propus de statisticianul german Etienne Laspeyres n 1864, care
folosete ponderi din perioada de baz.
n aceste condiii, indicii factoriali se vor scrie:
indicele variabilei cantitative:
0 0
1 0 f
0 1
f x
f x
I
L
L
=
- pentru o perioad curent k:
0 0
0
0
f x
f x
I
k f
k
L
L
=
indicele variabilei calitative:
0 0
0 1 x
0 1
f x
f x
I
L
L
=
- pentru o perioad curent k:
0 0
0
0
f x
f x
I
k x
k
L
L
=
b) Sistemul de pondere propus de statisticianul german Hermann Paasche n 1874 are la
baz utilizarea ponderilor din perioada curent.
Indicii factoriali construii conform acestui sistem de ponderare vor fi:
pentru variabila cantitativ:
0 1
1 1 f
0 1
f x
f x
I
L
L
= ;
- pentru o perioad curent k:
0
0
f x
f x
I
k
k k f
k
L
L
=
pentru variabila calitativ:
1 0
1 1 x
0 1
f x
f x
I
L
L
=
Statistic Aplicat
66
- pentru o perioad curent k:
k
k k x
k
f x
f x
I
0
0
L
L
=
n practica statistic, cel mai adesea se utilizeaz cea de-a doua variant de ponderare
ncruciat, adic

) x ( y
0 / 1 P
I i

) f ( y
0 / 1 L
I , ceea ce nseamn c, n general, pentru factorul cantitativ
se folosesc ponderi din perioada de baz (0) sistem Laspeyres, iar pentru factorul
calitativ se folosesc ponderi din perioada curent (1) sistem Paasche.
Avantajele indicilor Laspeyres i Paasche
- Formulele sunt relativ simple, uor de neles;
- Sunt perfect definite;
- Aceste formule se pot prelucra algebric (pot fi scrise ca medii de indici) ;
- Aceti indici au proprietatea de agregare : adic, de exemplu, indicele Laspeyres al unui
ansamblu de mrimi este egal cu un indice Laspeyres al indicilor Laspeyres ai fiecrui
grup de mrimi ; idem pentru indicii Paasche. Plecndu-se de la indicii grupelor i
subgrupelor, se pot calcula indicii globali.
- Avantajul esenial este acela c au semnificaie economic.
- Calculul indicelui Laspeyres este uor, odat ce au fost determinate ponderile. Aceast
determinare necesit, n general, o anchet dificil, dar ea este necesar doar n perioada
de baz. Din contr, pentru indicele Paasche, trebuie determinate bugetele de consum
pentru fiecare an de calcul, ceea ce este mai dificil.
Dezavantajele indicilor Laspeyres i Paasche:
- Nu ndeplinesc condiia de reversibilitate
- Dac vrem s schimbm baza de comparaie, trebuie refcute calculele (inconvenient
pentru utilizatori) ;
- Pentru una sau alta din formule, apare o problem atunci cnd vrem s calculm un indice
pe perioad mai lung.
- Indicele Paasche are un defect: acela c necesit cunoaterea bugetelor de consum pentru
fiecare an de calcul
- Formulele lui Laspeyres i Paasche nu conduc la acelai rezultat, atunci cnd sunt aplicate
Statistic Aplicat
67
acelorai indici elementari, observndu-se, uneori, diferene semnificative ntre ei.
3) Indicele propus de Edgeworth
Folosete ca pondere pentru variabila calitativ (preul) fie suma ponderilor din cele dou
perioade, fie media aritmetic simpl a acestor ponderi. Are urmtoarea form:
, ,
, ,

.
|

\
| +
L

.
|

\
| +
L
=
+ L
+ L
=
2
f f
x
2
f f
x
f f x
f f x
I
0 1
0
0 1
1
0 1 0
0 1 1 x
0 1
Acest sistem de ponderare prezint dezavantajul c el se poate aplica numai la con-
struirea indicelui de grup al factorului calitativ.
I ndici sintetici calculai ca medie a indicilor individuali
Aceast metod se aplic n calculul indicilor de grup ori de cte ori nu exist
suficiente informaii pentru calculul indicilor agregai. Dac ar exista posibilitatea aplicrii
ambelor metode, ar trebui ca valoarea indicelui de grup calculat ca medie a indicilor
individuali s fie egal cu valoarea indicelui de grup calculat sub form agregat. Indicii de
grup se pot forma fie ca medie aritmetic ponderat, fie ca medie armonic ponderat a
indicilor individuali, n funcie de datele iniiale cunoscute.
A. Indici de grup calculati ca medie aritmetic (ponderat):
- pentru variabila complex (aditiv), indicele agregat al acesteia este:

= = = =
y y
y y y
y
g i
g i
y
y i
y
y
I
0 0 / 1
(%)
0 0 / 1
0
0 0 / 1
0
1
0 / 1
100
(cunoatem nivelurile individuale ale variabilei complexe nsumabile- din perioada de baz
(y
0
) i indicii individuali ai variabilei nsumabile)
Este un indice calculat sub form de medie aritmetic din indicii individuali, ponderai cu
nivelul din perioada de baz y
0
. Se observ c indicele agregat sub form de medie se poate
calcula i folosind mrimea relativ de structur a variabilei complexe n perioada de baz:
100
0
0 (%)
0

=
y
y
g
y
pentru variabila cantitativ aditiv
0
0
0
1
0 1 0 1
0 / 1
f
f i
f
f
I I
f
f
f
L
L
=
L
=

=

(dac se cunosc
f
i
0 / 1
i f
0
)
Statistic Aplicat
68
pentru variabila cantitativ non-aditiv, ponderatLaspeyres:
, ,
y f
f f
f y
f
g i
y
y i
f x
f x i
f x
f x
I I
0 0 / 1
0
0 0 / 1
0 0
0 0 0 / 1
0 0
1 0
0 1 0 1
L =
L
L
=
L
L
=
L
=

=

(dac se cunosc
f
i
0 / 1
i y
0
)
pentru variabila calitativ non-aditiv, ponderatLaspeyres:
, ,
y x
x x
x y
x
g i
y
y i
f x
f x i
f x
f x
I I
0 0 / 1
0
0 0 / 1
0 0
0 0 0 / 1
0 0
0 1
0 1 0 1
L =
L
L
=
L
L
=
L
=

=

(dac se cunosc
x
i
0 / 1
i y
0
)
B. Indici de grup calculai ca medie armonic (ponderat):
- pentru variabila complex (aditiv), indicele agregat al acesteia este:

= =

y
y y
y
g
i
y
i
y
y
y
I
1
0 / 1
1
0 / 1
1
0
1
0 / 1
1
1
1
(dac se cunosc
y
i
0 / 1
i
1
y )
Reprezint o medie armonic din indicii individuali, ponderai cu nivelurile din perioada
curent (y
1
) sau cu structura variabilei complexe (nsumabile) din perioada curent.
unde

=
1
1
1
y
y
g
y
pentru variabila cantitativaditiv
1
0 / 1
1
0
1
0 1 0 1
1
f
i
f
f
f
I I
f
f
f
L
L
= =

(dac se cunosc
f
i
0 / 1
i f
1
)
pentru variabila cantitativnon-aditiv , ponderat Paasche
, ,
y
f
y
f f
f y
f
g
i
g
y
i
y
f x
i
f x
f x
f x
I I
1
0 / 1
1
1
0 / 1
1
1 1
0 / 1
1 1
0 1
1 1
0 1 0 1
1 1 1
L
L
=
L
L
=
L
L
L
L
=

= (dac se cunosc
f
i
0 / 1
i y
1
)
pentru variabila calitativ (non-aditiv), ponderat Paasche:
, ,
y
x
y
x x
x y
x
g
i
g
y
i
y
f x
i
f x
f x
f x
I I
1
0 / 1
1
1
0 / 1
1
1 1
0 / 1
1 1
1 0
1 1
0 1 0 1
1 1 1
L
L
=
L
L
=
L
L
=
L
L
=

= (dac se cunosc
x
i
0 / 1
i y
1
)
Indicii valorii, volumului fizic i preurilor
Analiza la nivel individual, pentru fiecare marfa: indicii individuali
S-au folosit notaiile: v
0
, v
1
, q
0
, q
1
, p
0
, p
1
.
Pentru a studia dinamica la nivelul fiecrui produs, se calculeaz indicii individuali ai
valorii:
Statistic Aplicat
69
p q v
i i
p q
p q
v
v
i = = =
0 0
1 1
0
1
0 / 1
unde: i
q
=
0
1
q
q
= indicele individual al cantitilor produse (sau vndute)
i
p
=
0
1
p
p
= indicele individual al preurilor unitare ale produselor.
Indicii agregati, construiti pentru grupul marfurilor sau categoriilor de marfuri:
Pentru o viziune de ansamblu sintetic a variaiei relative a valorii produciei (la nivelul
tuturor produselor), se calculeaz indicele de grup al valorii produciei:

= =

0 0
1 1
0
1
0 / 1
p q
p q
v
v
I
v
care este un indice n form agregat.
Indicele sintetic al factorului cantitativ (Laspeyres):
, ,

= =

0
1 0
0 0
1 0
0 / 1
v
q p
q p
q p
I
q v
Indicele sintetic al factorului calitativ (Paasche):
, ,

= =

1 0
1
1 0
1 1
0 / 1
q p
v
q p
q p
I
p v
Condiia de reversibilitate:
, ,
, ,
=

v p v
I I I
q v
0 / 1 0 / 1
0 / 1
Pe baza indicilor calculai se pot determina i modificrile relative (ritmul):
, ,

=

v
v
R I
0 / 1
100 1
0 / 1
, ,
, ,
, ,
=
q v q
R I
v
0 / 1 0 / 1
100 1
, ,
, ,
, ,
=

p v
R I
p
v
0 / 1
0 / 1
100 1
Prin diferena ntre numrtorul i numitorul indicilor de grup obinem modificrile
absolute ale valorii: pe cea a valorii totale i pe cele datorate influenei celor doi factori.
= = A
0 0 1 1 0 1
q p q p v v v
, , = A
0 0 1 0
q p q p q v
, , = A
1 0 1 1
q p q p p v
Cumulnd modificrile absolute ale valorii datorate influenei factorilor obinem mo-
dificarea absolut total a valorii.
, , , , A + A = A p v q v v
Statistic Aplicat
70
Daca calculam indicii de grup ai valorii, volumului fizic si preturilor ca medie aritmetica si
armonica, formulele acestora devin:

= = = =
v v
v v v
v
g i
g i
v
v i
v
v
I
0 0 / 1
(%)
0 0 / 1
0
0 0 / 1
0
1
0 / 1
100
ca medie aritmetic ponderat

= =

v
v v
v
g
i
v
i
v
v
v
I
1
0 / 1
1
0 / 1
1
0
1
0 / 1
1
1
1
ca medie armonic ponderat
, ,
v q
q q
q v
q
g i
v
v i
q p
q p i
q p
q p
I I
0 0 / 1
0
0 0 / 1
0 0
0 0 0 / 1
0 0
1 0
0 1 0 1
L =
L
L
=
L
L
=
L
=

=

ca medie aritmetic ponderat
, ,
v
p
v
p x
p v
p
g
i
g
v
i
v
q p
i
q p
q p
q p
I I
1
0 / 1
1
1
0 / 1
1
1 1
0 / 1
1 1
1 0
1 1
0 1 0 1
1 1 1
L
L
=
L
L
=
L
L
=
L
L
=

= ca medie armonic ponderat


Indicele preurilor de consum (IPC)
Indicele preurilor de consum (IPC) este un indicator economic, ce msoar evoluia de
ansamblu a preurilor mrfurilor cumprate i a tarifelor serviciilor utilizate ntre dou
perioade de timp date (perioad curent i perioad de baz).
I ndicele preurilor de consum (I PC) msoar schimbrile, n timp, intervenite n nivelul
general al preurilor bunurilor i serviciilor, pe care o populaie de referin le folosete sau
le pltete pentru consum. (Sursa: International Labour ILO, 1998; Current International
Recommendations on Labour Statistics, Geneva, 1988). Prin urmare, IPC nu este un indice al
costului vieii, acesta din urm implicnd schimbarea continu a coului de bunuri i servicii
cuprinse n indice, prin faptul c el msoar comportamentul consumatorilor n vederea
meninerii constante a unui anumit standard de via (maximizarea utilitii consumatorilor).
Indicele are utilizri multiple. El este folosit la :
- determinarea puterii de cumprare a veniturilor, salariilor, pensiilor; calculul indicatorilor
privind nivelul de trai i srciei;
- fundamentarea calculului dobnzii reale;
- deflatarea unor indicatori valorici din domeniile comerului cu amnuntul, serviciilor, al
agregatelor macroeconomice utilizate la calculul Produsului Intern Brut (consumul final
individual efectiv al gospodriei populaiei);
- negocierea salariilor, pensiilor, alocaiilor; realizarea de comparaii internaionale i altele.
Statistic Aplicat
71
Mod de calcul: IPC este un indice sintetic de tip Laspeyres care msoar media
schimbrilor de pre pltite de consumatori pentru un co fix de bunuri i servicii, utiliznd
ponderi din perioada de baz a indicelui. (Este un indice pur de pre). Determinarea IPC sub
forma unui indice agregat de tip Laspeyres, cu baz fix, are raionamente de ordin practic.
Indicele preurilor de consum se calculeaz numai pentru elementele care intr n consumul
direct al populaiei, fiind excluse: consumul din resurse proprii, cheltuielile cu caracter de
investiii i acumulare, dobnzile pltite la credite, ratele de asigurare, amenzile, impozitele
etc., precum i cheltuielile aferente plii muncii pentru producia agricol a gospodriilor
individuale.
IPC se determina cu formula:
unde reprezint structura cheltuielilor (de consum) medii lunare, efectuate de o
gospodrie, n perioada de baz.
Principalele variabile care concur la calculul indicelui preurilor de consum sunt
ponderile i preurile.
Ponderile se calculeaz dup structura cheltuielilor efectuate de gospodrii pentru
cumprarea bunurilor i pentru plata serviciilor de consum conform formulei:
unde: ch
0i
este cheltuiala pentru produsul i cumprat n perioada de referin 0;
c p
p
g i
c
c i
q p
q p
p
p
q p
q p
IPC
0 0 / 1
0
0 0 / 1
0 0
0 0
0
1
0 0
0 1
=

= =

c
g
0

=
=
n
i
i
i
i
c
ch
ch
g
1
0
0
0
Statistic Aplicat
72
18 Probleme rezolvate
Problema 1
Un cercettor este interesat s compare salariul de ncadrare pentru brbaii i femeile
care intr n serviciu imediat dup absolvirea facultii. Sunt cercetai 50 de brbai i 50 de
femei:
a) descriei populaia;
b) descriei eantionul;
c) descriei inferena care intereseaz.
Rezolvare:
a) dou populaii - cea a femeilor si cea a brbatilor care s-au ncadrat pe un post
imediat dup absolvirea facultii;
b) eantioanele cei 50 de brbai i cele 50 de femei;
c) inferenele salariile medii de ncadrare pentru brbai i pentru femei.
Problema 2
Frecvena absolut cumulat cresctor a unei grupe reprezint:
a) ponderea unitilor care se ncadreaz n grupa respectiv;
b) ponderea unitilor care au valoarea caracteristic mai mic sau eventual egal cu
limita superioar a grupei;
c) numrul unitilor care au valoarea caracteristicii mai mic sau egal cu limita
inferioar a grupei;
d) numrul unitilor care au valoarea caracteristicii mai mic sau egal cu limita
superioar a grupei;
e) numrul unitilor care au valoarea caracteristicii mai mare sau egal cu limita
inferioar a grupei.
Rspuns:
d)
Problema 3
Frecvena relativ cumulat cresctor a ultimei grupe este egal cu:
a) numrul unitilor statistice din grupa respectiv;
b) ponderea unitilor statistice din grupa respectiv n total colectivitate;
c) 100%;
d) numrul total de uniti statistice din colectivitate;
e) 1,00.
Rspuns:
c) e)
Statistic Aplicat
73
Problema 4
Se cunosc datele urmtoare:
Numr de piese realizate zilnic (buci) Muncitori (%)
10 5
15 20
17 45
20 15
22 15
Tabelul prezint:
a) o distribuie heterograd de frecvene absolute;
b) o distribuie homograd de frecvene absolute;
c) o distribuie heterograd de frecvene relative, pe variante;
d) o distribuie homograd de frecvene relative;
e) nici una dintre variantele de mai sus.
Rspuns:
c)
Problema 5
O firm aloc un buget fix B n fiecare dintre trimestrele unui an pentru derularea unei
campanii publicitare prin intermediul afielor.
n primul trimestru, preul unui afi a fost de 35 RON.
n cel de-al doilea trimestru, preul unui afi a fost de 38 RON.
n cel de-al treilea trimestru, preul unui afi a fost de 42 RON.
n cel de-al patrulea trimestru, preul unui afi a fost de 44 RON.
Care este preul mediu al unui afi?
Rspuns:
39.44 RON
Problema 6
80 de apartamente dintr-un bloc au fost sistematizate dup numrul de camere rezultnd
urmtoarea distribuie de frecvene:
Nr. Camere (x
i
) Nr. Apartamente (n
i
)
1
2
3
4
13
25
28
14
Total 80
Calculai mediana.
Rezolvare:
< = =
.
|

\
|
+ =

=
66 5 , 40 81
2
1
1
2
1
1
k
i
i Me
n L
Statistic Aplicat
74
Me = 3 camere 50% dintre apartamente au mai puin de 3 camere, iar 50% mai
mult de 3 camere.
Problema 7
Repartiia sucursalelor unei bnci comerciale n funcie de volumul depozitelor bancare atrase
ntr-o lun este:
Volum depozite bancare
(mii euro) (x
i
)
Nr. Bnci (n
i
)
20 40
40 60
60 80
80 100
100 - 120
12
14
20
18
16
Total 80
Rezolvare:
j 80 , 60 Me 46 5 , 40
2
81
1 n
2
1
L
5
1 i
i Me
e < = =

.
|

\
|
+ =

=
euro mii 5 , 74
20
26 5 , 40
20 60 Me =

+ =
Deci 50% dintre sucursale au atras depozite n valoare de 74,5 mii euro, iar 50% peste
74,5 mii euro.
Problema 8
Repartiia salariailor unei ntreprinderi dup prima obinut la sfritul anului este prezentat
n tabelul urmtor:
Prima (lei)
Nr. salariai
n
i
sub 100
100 200
200 300
300 400
peste 400
15
20
30
25
10
Total 100
Statistic Aplicat
75
Rezolvare:
Prima (lei)
Nr. salariai
n
i
Centrul
x
i
x
i
n
i
x x
i

i i
n x x
sub 100
100 200
200 300
300 400
peste 400
15
20
30
25
10
50
150
250
350
450
750
3.000
7.500
8.750
7.500
+195
+95
5
105
205
2.925
1.900
150
2.625
2.050
Total 100 - 24.500 - 9.650
salariat lei
n
n x
x
i
i
i
i i
/ 245
100
500 . 24
5
1
5
1
= =

=
=
salariat lei
n
n x x
x
i
i
i
i i
/ 5 , 96
100
650 . 9
5
1
5
1
= =

=

=
=
Prima unui salariat se abate n medie de la prima medie cu 96,5 lei.
Problema 9
Distribuia salariailor unui magazin n funcie de numrul de zile de concediu de odihn
dintr-un an se prezint astfel:
Zile concediu 14 15 16 17 18 19 20
Nr. salariai 2 6 10 15 8 5 4
Se cere:
a) s se calculeze indicatorii sintetici ai variaiei;
b) s se caracterizeze gradul de asimetrie;
c) s se calculeze media i dispersia caracteristicii salariai care au avut un numr de
zile de concediu mai mare sau egal cu 17.
Rezolvare:
a) Pentru a calcula indicatorii sintetici ai variaiei, va trebui s calculm mai nti media care
se calculeaz ca o medie aritmetic ponderat:
Statistic Aplicat
76
concediu zile 04 , 17
50
852
50
4 20 5 19 8 18 15 17 10 16 6 15 2 14
n
n x
x
7
1 i
i
7
1 i
i i
= =
=
+ + + + + +
= =

=
=
Indicatorii sintetici ai variaiei sunt:
- abaterea medie liniar:
zile 1728 , 1
50
64 , 58
50
4 04 , 17 20 5 04 , 17 19 8 04 , 17 18 15 04 , 17 17
50
10 04 , 17 16 6 04 , 17 15 2 04 , 17 14
n
n x x
d
7
1 i
i
7
1 i
i i
= =
=
+ + +
+
+
+ +
=

=

=
=
Numrul de zile de concediu al unui salariat se abate n medie de la numrul mediu de
zile de concediu cu 1,1728 zile.
- dispersia:
, ,
, , , ,
, , , , , ,
, , , ,
3184 , 2
50
92 , 115
50
4 04 , 17 20 5 04 , 17 19
50
8 04 , 17 18 15 04 , 17 17 10 04 , 17 16
50
6 04 , 17 15 2 04 , 17 14
n
n x x
2 2
2 2 2
2 2
7
1 i
i
7
1 i
i
2
i
2
= =
+
+
+
+ +
+
+
+
=

= o

=
=
- abaterea medie ptratic:
zile 5226 , 1 3184 , 2
2
= = o = o
Numrul de zile de concediu al unui salariat se abate n medie de la numrul mediu de
zile de concediu cu 1,5226 zile.
- coeficientul de variaie:
% 93 , 8 100
04 , 17
5226 , 1
100
x
v = =
o
=
% 88 , 6 100
04 , 17
1728 , 1
100
x
d
' v = = =
Deoarece v, v s 35% seria este omogen, variaia este mic, media este
reprezentativ.
b) Aprecierea asimetriei:
026 , 0
5226 , 1
17 04 , 17 Mo x
Cas =

=
o

=
Statistic Aplicat
77
Deoarece Cas > 0 avem asimetrie pozitiv sau de stnga, adic mediana i modul se
gsesc n stnga mediei pe grafic, deci n aceast serie predomin valorile mici ale
caracteristicii.
Cas e [-0,3; 0,3] seria este uor asimetric (Cas este foarte apropiat de zero).
c) Avem o caracteristic alternativ:
- salariai care au avut un concediu > 17 zile;
- salariai care au avut un concediu < 17 zile.
Varianta x
i
Frecvenele absolute
n
i
DA (peste 17 zile)
NU (sub 17 zile)
1
0
m = 32
n m = 18
Total - n = 50
Media caracteristicii alternative:
64 , 0
50
32
n
m
w = = =
64% dintre salariai au avut un concediu > 17 zile
Dispersia caracteristicii alternative:
2304 , 0 ) 64 , 0 1 ( 64 , 0 ) w 1 ( w
2
w
= = = o
Problema 10
Se cunosc datele despre distribuia a 50 de candidai admii la o facultate din Bucureti dup
media la examenul de admitere (candidaii au fost alei din listele de admitere) aleatoriu si
nerepetat:
Grupe de candidai dup media la examenul
de admitere
Numr candidai
7,75-8,07 5
8,07-8,39 12
8,39-8,71 11
8,71-9,03 9
9,03-9,35 4
9,35-9,67 9
Total 50
Se cere:
1) S se verifice reprezentativitatea eantionului candidailor dup media la examenul de
admitere tiind c media la admitere pe total colectivitate ( 0 = 8,02).
2) S se calculeze eroarea medie probabil de selecie.
3) Eroarea maxim admis dac rezultatele se garanteaz cu o probabilitate de 95,45%
pentru care z = 2 tiind c volumul colectivitii totale a fost de 655 candidai.
4) S se estimeze limitele ntre care se va ncadra media la admitere a tuturor
candidailor.
Statistic Aplicat
78
5) S se determine noul volum de selecii care va fi necesar, dac eroarea limit admis
se reduce de 1,5 ori, iar probabilitatea cu care se garanteaz rezultatele rmne neschimbat
(respectiv
z = 2).
6) S se determine dac argumentul funciei Gauss Laplace va rmne neschimbat prin
micorarea erorii limit admis de la punctul anterior.
Rezolvare:
Notaii:
N = volumul colectivitii generale
n = volumul eantionului
X
0
= media colectivitii generale
X = media de selecie a eantionului
o
i
2
= dispersia de selecii a eantionului.
1) Pentru verificarea reprezentativitii eantionului este necesar s determinm media
de selecie i apoi coeficientul de reprezentativitate al eantionului.
- Media ( X):
- prin calcul simplificat: X =


.
|

\
|
=
=
m
i
i
m
i
i
n
k
a x
1
1
k + a =
50
72
0,32 + 8,23 =
= 8,69 puncte/candidat
unde: a = 8,23 (centrul de interval cruia i corespunde frecvena maxim)
k = 0,32 (pasul de numrare indic mrimea intervalului de grupare)
Algoritmul de calcul necesar determinrii indicatorilor de selecie este prezentat n
tabelul urmtor:
Media de
admitere
Numr
candidai
Centrul
interval
k
a x
i

i
i
n
k
a x

.
|

\
|
i
i
n
k
a x

.
|

\
|
2
7,75-8,07 5 7,91 -1 -5 5
8,07-8,39 12 8,23 0 0 0
8,39-8,71 11 8,55 1 11 11
8,71-9,03 9 8,87 2 18 36
9,03-9,35 4 9,19 3 12 36
9,35-9,67 9 9,51 4 36 144
Total 50 - - 72 232
- Coeficientul de verificare a reprezentativitii
d
c/0
=
0
0
X
X X
100 =
62 , 8
62 , 8 69 , 8
100 = 0,81%
Statistic Aplicat
79
Deoarece d
c/0
< +5% se consider c eantionul este reprezentativ. Din punct de vedere
al semnului coeficientul e pozitiv deci putem afirma c media eantionului este mai mare
dect media tuturor candidailor cu 0,06 puncte.
2) Eroarea medie probabil de selecie

.
|

\
|
=
.
|

\
|
=
655
50
1
50
2635 , 0
1
2
N
n
n
i
X

= 0,069 puncte/candidat.
3) Eroarea maxim admis (limit):
A
X
= zo
X
= 2 0,069 = 0,138 puncte/candidat.
4) Estimarea intervalului de ncredere a mediei la admitere a tuturor candidailor se
determin dup relaia:
X - A
X
s X
0
s ( X + A
X
)
0,69 0,139 s X
0
s 8,69 + 0,19
8,55 puncte s 8,62 s 8,82 puncte
n cazul seleciei aleatoare simple fr revenire erorile sunt mai mici dect n cazul
seleciei cu revenire, deci estimarea medie la admitere a tuturor candidailor este corect.
Media tuturor candidailor se va ncadra ntre nota cea mai mic 8,55 puncte i nota cea mai
mare d e8,82 puncte.
5) Volumul noului eantion este dat de relaia:
n =
655
2635 , 0 2
) 092 , 0 (
2635 , 0 2
'
2
2
2
2 2
2
2 2

+ A

N
z
z
i
X
i

= 105,4 ~ 105 candidai


unde: A
X
=
5 , 1
139 , 0
5 , 1
=
A
X
= 0,092 puncte/candidat
Dac eroarea limit admis se micoreaz de 1,5 ori, atunci volumul eantionului va
trebui s creasc cu (105 50 = 55 candidai).
Se observ c volumul noului eantion n cazul seleciei aleatoare simple fr revenire
este mai mic dect volumul noului eantion n cazul seleciei aleatoare simple cu revenire
deoarece nsi procedeul de formare a eantionului conduce la erori mai mici dect procedeul
seleciei aleatoare cu revenire.
6) z =
069 , 0
092 , 0 '
=
A
X
X

= 1,31 C
(z)
= C
(1,31)
= 0,8098 sau 80,98% rezultat din tabelele
funciei Gauss Laplace.
Statistic Aplicat
80
Problema 11
n vederea estimrii cheltuielilor lunare pentru alimentaia public,
s-a efectuat o cercetare prin sondaj, pe baza unui eantion de 15%, selectat ntmpltor i
nerepetat din numrul total de persoane. Persoanele chestionate au fost mprite n cinci
grupe tipice, dup veniturile medii lunare nete. n urma nregistrrii i prelucrrii datelor, s-au
obinut rezultatele:
Colectivitate general Colectivitate de selecie
Grupe tipice
de persoane dup
venituri lunare
(zeci mii u.m.)
Numrul
persoanelor
Cheltuieli medii
lunare pentru
alimentaie public
(zeci mii u.m.)
Coeficientul
de variaie
al cheltuielilor
pentru alimentaie
public (%)
Numrul
persoanelor plasate
peste media
cheltuielilor pentru
alimentaie public
pe grupe
sub 70 1000 8 25 50
70-74 1500 7 18 100
74-78 2000 11 20 150
78-82 1200 15 15 95
peste 82 800 18 22 70
Total 6500 - - 465
Se cere considernd c media cheltuielilor lunare pentru cele 6500 de persoane este 11,8 zeci
mii u.m.:
1. Precizai dac veniturile lunare reprezint un factor semnificativ al cheltuielilor medii
pentru alimentaia public; folosind a) regula de adunare a dispersiilor; b) testul F de
analiz dispersional, tiind c pentru P = 0,99;
2. S se msoare intensitatea legturii dintre veniturile lunare i cheltuielile medii pentru
alimentaie public pentru persoanele din eantion, folosind un indicator de corelaie adecvat.
Rezolvare:
Calculam media generala si dispersiile din fiecare grupa aplicand regula de adunare a
dispersiilor:
zecimiiUM 11 11,2
11,8
120 18 180 15 300 11 150 7 150 8
i
n
i
n
i
y
y ~ =
+ + + +
=

=
Deoarece d
y%
= -5%; n = 975 persoane este reprezentativ.
Regula de adunare a dispersiilor
2 2
0
2
0
+ = ; = + = 4 , 19 06 , 14 34 , 5
2
0

% 72 100
4 , 19
06 , 14
100
2
0
2
2
= = =

R
Dispersiile de grup: , , 4
2
1
2 2
= = =
i i
; 6 , 1
2
2
= ; 1 , 5
2
4
= ; 7 , 15
2
5
=
Media dispersiilor de grup , , i
34 , 5
975
120 7 , 15 180 1 , 5 300 8 , 4 225 6 , 1 150 4
2
2
1 =
+ + + +
= =

i
i i
n
n

Statistic Aplicat
81
Dispersia dintre grupe: , ,
, ,
, , , , , ,
+
+ + +
=

975
300 11 11 225 11 7 150 11 8
2 2
2
2
i
i i
n
n y y

, , , ,
06 , 14
975
120 11 18 180 11 15
2 2
=
+ +
+
Dac % 72
2
= R , adic % 28
2
= k . Pentru ca
2 2
k R > ; % 28 % 72 > veniturile lunare
constituie factor semnificativ pentru cheltuielile cu alimentaia public. Pentru certitudine, se
va folosi testul F de analiz dispersional.
b) =
A A
= =
z
z y
x
x y
z y
x y
calc
n n S
S
F
2
/
2
/
2
/
2
/
:
, ,
:
1
2

r
n y y
i i
=

r n
n
i
i i
2

638
970
5 , 5206
:
4
5 , 13708
= = , Deoarece
teoretic calc
F F > ; 62 , 4 638 > , veniturile lunare
influeneaz semnificativ cheltuielile pentru alimentaia public.
Problema 12
Despre o societate comercial cu profil de comer se cunosc urmtoarele date:
Marfa
Valoarea vnzrilor (u.m.) Dinamica preului din
per. curent fa de per.
de baz
Perioada de baz Perioada curent
A 50 192 3,7
B 72 210 2,8
C 80 250 3,0
1. Caracterizai dinamica vnzrilor de mrfuri
a) pe fiecare marf.
b) pe total societate comercial.
2. Calculati i interpretai indicii de grup ai volumului fizic i preurilor
Rezolvare:
Notaii:
0 = perioada de baz;
1 = perioada curent; v = valoarea vnzrilor de mrfuri, v = p q;
p = preurile de vnzare (caracteristica calitativ);
q = cantitile vndute (caracteristica cantitativ).
1. a) Algoritmul de calcul necesar determinrii indicilor individuali
i de grup ai valorii, volumului fizic i ai preurilor:
Statistic Aplicat
82
Marfa
Valoarea vnzrilor (u.m.) n: Indicii individuali ai:
perioada de
baz (p
0
q
0
)
perioada
curent
(p
1
q
1
)
p. curent cu p
0
(p
0
q
1
=
= col.1 col.6)
p. baz cu p
1
(p
1
q
0
=
= col.1 col.7)
Valorii
0
1
0 / 1
i
v
v
=
v
Vol. Fizic
0
1 q
0 / 1
q
q
i =
Preului
0
1 p
0 / 1
p
p
i =
A 50 192 51,89 185 3,84 1,037 3,7
B 72 210 74,98 201,6 2,916 1,041 2,8
C 80 250 83,33 240 3,125 1,041 3,0
Total 202 652 210,2 626,6
Dinamica vnzrilor de mrfuri se determin pe fiecare marf cu ajutorul indicilor
individuali calculai n tabelul de mai sus.
Valoarea vnzrilor pentru marfa A n perioada curent fa de perioada de baz se
tripleaz ca urmare a creterii preurilor cu 270% n timp ce cantitile vndute au crescut cu
numai 3%. Pentru celelalte dou mrfuri, se constat c valoarea vnzrilor este mai mare de
2,92 ori datorat creterii preurilor cu 180% n timp ce volumul fizic pentru marfa B a crescut
cu 4%, iar pentru marfa C creterea valorii vnzrilor de 3,12% se datoreaz creterii
preurilor cu 200%, iar a cantitilor vndute numai cu 4%. Deci, conform relaiei dintre indici
avem:
P q v
i i i
0 / 1 0 / 1 0 / 1
=
1 b) i 2. pe total societate comerciala - indici de grup ai:
valorii mrfurilor vndute
% 7 , 322 227 , 3
202
652
0 0
1 1
0
1
0 / 1
sau
q p
q p
I
v
= =
L
L
=
L
L
=

volumului fizic calculai ca indici de tip Laspeyres (L) i Paasche (P):


, ,
, ,
% 06 , 104 0406 , 1
202
2 , 210
% 05 , 104 0405 , 1
6 , 626
652
0 0
1 0
0 / 1
0 1
1 1
0 / 1
sau
q p
q p
I
sau
q p
q p
I
L q
P q
= =
L
L
=
= =
L
L
=
preurilor calculai ca indici de tip Laspeyres (L) i Paasche (P):
, ,
, ,
% 198 , 310 10198 , 3
202
6 , 626
% 18 , 310 1018 , 3
2 , 210
652
0 0
0 1
0 / 1
1 0
1 1
0 / 1
sau
q p
q p
I
sau
q p
q p
I
L p
P p
= =
L
L
=
= =
L
L
=
Din produsul celor doi indici factoriali se obine nivelul relativ al variabilei complexe
pe ansamblul mrfurilor analizate:
q p
I I I
0 / 1 0 / 1 0 / 1
=

, , , ,
, , , ,

= =
= =

) 2 . (var 0405 . 1 10198 , 3 227 , 3


) 1 . (var 0406 , 1 1017 , 3 227 , 3
0 / 1 0 / 1 0 / 1
0 / 1 0 / 1 0 / 1
P q L p
L q P p
I I I
I I I

Statistic Aplicat
83
Vnzrile totale pentru societatea comercial analizat din perioada curent fa de
perioada de baz cresc de 3,227 ori, cu o cretere relativ de 222,7%.
Cantitile comparativ cu preurile scad, motiv pentru care dinamica lor este
nesemnificativ, iar preurile se observ c au o tendin de cretere care devanseaz creterea
cantitilor.
La nivelul societii comerciale, valoarea vnzrilor a crescut cu 222% ca urmare a
faptului c preurile de vnzare au fost cu 210,198% superioare n perioada curent fa de
perioada de baz, iar cantitile vndute au crescut cu 4,05%.
Problema 13
De la un punct de desfacere s-au cules urmtoarele date:
Marfa
Valoarea vnzrilor per.
de baz (mii. RON)
Procent de modificare a
volumului fizic din
p. curent/p. baz
Dinamica preurilor din
p. curent/p. baz
A 38 +3 1,8
B 25 -5 2,5
C 15 -2 3,0
Calcula(i: dinamica valorii, volumului fizic i preurilor pe fiecare marf i pe total.
Rezolvare:
Avem urmtoarele relaii:

=
=
100
0 / 1 0 / 1
0
1
0 / 1
q q
p
i r
P
P
i
Dinamica valorii i volumului fizic
a) pe fiecare marf:

= + =
= + =
= + =
+ =
98 , 0 % 98 100 2
95 , 0 % 95 100 5
03 , 1 % 103 100 3
100
2
0 / 1 10 / 1
sau C
sau B
sau A
r i
q

= =
= =
= =
=
94 , 2 0 , 3 98 , 0
375 , 2 5 , 2 95 , 0
854 , 1 8 , 1 03 , 1
0 / 1
2
0 / 1 10 / 1
C
B
A
i i i
p
p
v
b) Dinamica valorii, volumului fizic i a preurilor pe total punct de desfacere:
, ,
$ 98 , 222 2298 , 2
78
927 , 173
78
15 94 , 2 25 375 , 2 38 854 , 1
0 0
0 0
0 0
1 1 ,
0 / 1
0 / 1
sau
q p
q p
q p
q p
I
v
i q p v
=
= =
+ +
=
L
L
=
L
L
=
Statistic Aplicat
84
, ,
, ,
% 3 , 224 243 , 2
994 , 0
2298 , 2
% 4 , 99 994 , 0
78
59 , 77
78
15 98 , 0 25 95 , 0 38 03 , 1
0 / 1
0 / 1
0 / 1
0 0
0 0 0 / 1
0 0
1 0
0 / 1
sau
I
I
I
sau
q p
q p i
q p
q p
I
q
v
p v
q
q v
= = =
=
= =
+ +
=
L
L
=
L
L
=
Problema 14
Se cunosc urmtoarele date privind efectivul anual al populaiei n perioada 2000-2005:
Data Efectivul populaiei din mediul urban
1 iulie 2000
1 iulie 2001
1 iulie 2002
1 iulie 2003
1 iulie 2004
22.435.205
22.408.393
21.794.793
21.733.556
21.673.328
Sursa: Anuarul Statistic al Romniei 2005
S se reprezinte grafic seria i s se calculeze efectivul mediu la populaiei n perioada 2000-
2004.
Rezolvare:
Avem o serie de momente cu intervale egale ntre momente, deci se reprezint grafic
prin cronogram:
1 cm OY = 200.000 locuitori
Efectivul mediu al populaiei (media) se determin ca o medie cronologic simpl:
1 n
2
y
y ... y y
2
y
y
n
1 n 3 2
1

+ + + + +
=

21600000
21800000
22000000
22200000
22400000
22600000
1 iulie
2000
1 iulie
2001
1 iulie
2002
1 iulie
2003
1 iulie
2004
t
yt
Statistic Aplicat
85
n = numrul de momente de timp = 5
loc. 753 . 997 . 21 5 , 752 . 997 . 21
4
87991009
4
2
y
y y y
2
y
y
5
4 3 2
1
~ = =
+ + + +
=
Problema 15
Se cunosc urmtoarele date privind stocul de pcur al unei centrale termice:
Data
Stocul de pcur
(tone)
01.01
01.02
01.03
31.03
01.06
15.07
01.09
31.12
10
8
14
10
16
14
10
14
Se cere:
a) s se reprezinte grafic stocul de pcur pentru tot anul;
b) s se calculeze stocul mediu de pcur pe toat perioada;
c) s se calculeze stocul mediu de pcur pe primul trimestru al anului.
Rezolvare:
a) Avem o serie de momente cu intervale neegale ntre momente, deci seria se va
reprezenta grafic prin diagrama prin coloane:
b)
1 cm OY = 2 tone
6
8
10
12
14
16
18
01.01. 01.02. 01.03. 31.03. 01.06. 15.07. 01.09. 31.12
t
yt
Statistic Aplicat
86
b) Stocul mediu de pcur pe toat perioada se determin ca o medie cronologic
ponderat:
tone 2 , 12
12
5 , 146
12
2
4
14
2
4 5 , 1
10
12
2
5 , 1 5 , 1
14
2
5 , 1 2
16
2
2 1
10
2
1 1
14
2
1 1
8
2
1
10
d ... d d
2
d
y ...
2
d d
y
2
d d
y
2
d
y
y
1 n 2 1
1 n
n
3 2
3
2 1
2
1
1
= =
+
+

+
+
+
+
+
+
+
+
+
+
+
+
=
=
+ + +
+ +
+
+
+
+
=

01.01 01.02 01.03 31.03 01.06 15.07 01.09 31.12


d
1
= 1 lun d
2
= 1 lun d
3
= 1 lun d
4
= 2 luni d
5
= 1,5 luni d
6
= 1,5 luni d
7
= 4 luni
c) n primul trimestru avem o serie de momente cu intervale egale ntre momente, iar
stocul mediu se va determina ca o medie cronologic simpl:
Primul trimestru cuprinde datele: 01.01; 01.02; 01.03; 31.03.
1 n
2
y
y ... y y
2
y
y
n
1 n 3 2
1

+ + + + +
=

tone 66 , 10
3
32
3
2
10
14 8
2
10
1 4
2
y
y y
2
y
y
4
3 2
1
= =
+ + +
=

+ + +
=
Statistic Aplicat
87

1 Introducere ................................................................................................................................................... 1
2 Concepte de baz.......................................................................................................................................... 1
2.1 Populaia statistic (colectivitatea statistic) ......................................................................................... 2
2.2 Unitatea statistic................................................................................................................................... 3
2.3 Variabila statistic (caracteristic statistic) .......................................................................................... 3
2.4 Varianta statistic .................................................................................................................................. 4
2.5 Frecvena unei variante.......................................................................................................................... 4
2.6 Date statistice......................................................................................................................................... 4
3 Scale de msurare a datelor statistice......................................................................................................... 5
3.1 Scala nominal (categorial).................................................................................................................. 5
3.2 Scala ordinal (categorial) ................................................................................................................... 5
3.3 Scala de interval (cardinal) .................................................................................................................. 6
3.4 Scala de raport (proporional) .............................................................................................................. 6
4 Surse de date statistice ................................................................................................................................. 7
5 Observarea statistic: coninut, necesitate, obiective. ............................................................................... 8
6 Planul observrii statistice........................................................................................................................... 8
6.1 Scopul observrii ................................................................................................................................... 8
6.2 Delimitarea populaiei studiate .............................................................................................................. 8
6.3 Unitatea de observare ............................................................................................................................ 9
6.4 Timpul i locul observrii ...................................................................................................................... 9
6.5 Lista caracteristicilor urmrite, .............................................................................................................. 9
6.6 Formularele de nregistrare.................................................................................................................... 9
6.7 Msuri organizatorice .......................................................................................................................... 10
7 Metode de observare statistic .................................................................................................................. 10
7.1 Recensmntul statistic........................................................................................................................ 11
7.2 Sondajul statistic.................................................................................................................................. 11
7.3 Ancheta statistic................................................................................................................................. 12
7.4 Alte metode de observare statistic. .................................................................................................... 13
8 Erori de observare...................................................................................................................................... 13
8.1 Erori de observare (sau de nregistrare) ............................................................................................... 14
8.2 Erori de reprezentativitate ................................................................................................................... 14
8.3 Erori de prelucrare............................................................................................................................... 14
9 Sistematizarea datelor statistice (gruparea/clasificarea) ........................................................................ 15
9.1 Clasificarea datelor statistice ............................................................................................................... 15
9.2 Clasificarea datelor statistice ............................................................................................................... 16
10 Modaliti de prezentare i reprezentare a datelor statistice ............................................................. 18
10.1 Serii statistice....................................................................................................................................... 18
10.2 Serii de distribuie de frecvene (repartiii de frecvene) ..................................................................... 19
10.3 Tabele statistice ................................................................................................................................... 22
10.4 Grafice statistice .................................................................................................................................. 22
10.5 Tipuri de reprezentri grafice utilizate n cazul seriilor de distribuie de frecvene............................. 23
Statistic Aplicat
88
11 Noiuni generale privind indicatorii tendinei centrale ...................................................................... 24
11.1 Media aritmetic ............................................................................................................................... 25
11.2 Media armonic .............................................................................................................................. 27
11.3 Media geometric ........................................................................................................................... 27
11.4 2.4 Media ptratic ......................................................................................................................... 28
11.5 Cuantilele............................................................................................................................................. 28
11.6 Mediana ............................................................................................................................................... 29
11.7 Modulul ............................................................................................................................................... 30
12 Indicatorii variaiei i asimetriei........................................................................................................... 31
12.1 Amplitudinea absolut a variaiei (Ax)................................................................................................ 31
12.2 Amplitudinea relativ a variaiei (Ax (%)) .......................................................................................... 31
12.3 Abaterile individuale absolute ............................................................................................................. 31
12.4 Abaterile individuale absolute ............................................................................................................. 32
12.5 2.4 Abaterile individuale relative ........................................................................................................ 32
12.6 Abaterea liniar medie ( )................................................................................................................... 32
12.7 Dispersia ( ) ..................................................................................................................................... 33
12.8 Abaterea medie ptratic (abatere medie standard sau tip) ( ) ........................................................... 34
12.9 Coeficientul de variaie ( ).................................................................................................................. 34
13 Indicatorii de asimetrie.......................................................................................................................... 35
14 Inferen(a statistic. Sondajul statistic .................................................................................................. 36
14.1 Tipuri de sondaje ................................................................................................................................. 37
Calculul erorilor pentru selecia aleatoare simpl repetat .................................................................... 38
Intervalul de ncredere pentru media ................................................................................................ 39
15 Noiuni introductive privind legturile statistice dintre variabile ..................................................... 41
Metode simple de stabilire a existenei i a formei de legtur dintre fenomenele i procesele economico-
sociale ................................................................................................................................................................... 42
Metode analitice de msurare a legturilor dintre fenomene ......................................................................... 43
Metode neparametrice de msurare a legaturilor dintre fenomenele economico-sociale............................. 50
16 Analiza statistic a seriilor cronologice................................................................................................ 52
Proprietile temenilor unei serii cronologice................................................................................................... 53
Reprezentarea grafic a seriilor cronologice .................................................................................................... 54
17 Indicii statistici ....................................................................................................................................... 61
17.1 Coninutul, funciile i clasificarea indicilor........................................................................................ 61
17.2 Indici individuali ................................................................................................................................. 63
17.3 Indici de grup (sintetici) ...................................................................................................................... 63
18 Probleme rezolvate................................................................................................................................. 72
Problema 1........................................................................................................................................................ 72
Problema 2........................................................................................................................................................ 72
Problema 3........................................................................................................................................................ 72
Problema 4........................................................................................................................................................ 73
Problema 5........................................................................................................................................................ 73
Problema 6........................................................................................................................................................ 73
Statistic Aplicat
89
Problema 7........................................................................................................................................................ 74
Problema 8........................................................................................................................................................ 74
Problema 9........................................................................................................................................................ 75
Problema 10...................................................................................................................................................... 77
Problema 11...................................................................................................................................................... 80
Problema 12...................................................................................................................................................... 81
Problema 13...................................................................................................................................................... 83
Problema 14...................................................................................................................................................... 84
Problema 15...................................................................................................................................................... 85
Statistic Aplicat
90
Lista exemple
Exemplul 1 ....................................................................................................................................................... 1
Exemplul 2 ....................................................................................................................................................... 2
Exemplul 3 ....................................................................................................................................................... 4
Exemplul 4 ....................................................................................................................................................... 4
Exemplul 5 ....................................................................................................................................................... 5
Exemplul 6 ....................................................................................................................................................... 5
Exemplul 7 ....................................................................................................................................................... 6
Exemplul 8 ....................................................................................................................................................... 6
Exemplul 9 ....................................................................................................................................................... 7
Exemplul 10 ..................................................................................................................................................... 9
Exemplul 11 ................................................................................................................................................... 10
Exemplul 12 ................................................................................................................................................... 10
Exemplul 13 ................................................................................................................................................... 11
Exemplul 14 ................................................................................................................................................... 15
Exemplul 15 ................................................................................................................................................... 16
Exemplul 16 ................................................................................................................................................... 17
Exemplul 17 ................................................................................................................................................... 40
Exemplul 18 ................................................................................................................................................... 41
Exemplul 19 ................................................................................................................................................... 51

S-ar putea să vă placă și