Sunteți pe pagina 1din 151

UNIVERSITATEA ȘTEFAN CEL MARE DIN SUCEAVA

Facultatea de Științe Economice și Administrație Publică


___________________________________________________________________________________________________________________

Str. Universității nr.13, 720 229, Suceava


Tel: Decanat – 0230 52 02 63, Secretariat: 0230 216 147 / 309, 315
Cont IBAN: RO40TREZ59120F330500XXXX
Cod fiscal: 4244423

Forma de învăţământ: ID
Program de studiu : Contabilitate și informatică de gestiune
Anul I, sem I

STATISTICĂ

Curs pentru învăţământ la distanţă

Prof. univ. dr. Valentin HAPENCIUC

2017
INTRODUCERE

Cursul de Statistică se adresează studenților înscriși la specializările ID, organizate de


către Facultatea de Științe Economice și Administrație Publică din cadrul Universității Ștefan
cel Mare din Suceava.

Obiectivele principale ale acestui curs sunt concretizate în competentele pe care le veți
dobândi după parcurgerea și asimilarea sa:
- însușirea conceptelor de bază ale statisticii, a metodelor și procedeelor de observare,
prelucrare și analiză statistică.
- însușirea de cunoștințe și formarea de deprinderi la studenți, care să le permită
realizarea cercetărilor statistice în domeniul economic.
- formarea deprinderilor necesare utilizării metodelor și procedeelor statistice la
elaborarea unor lucrări de cercetare fundamentale și aplicative.

Prin conținutul său aplicativ și profund științific, cursul de statistică oferă o logică clară
care privește culegerea, prelucrarea și interpretarea rezultatelor obținute în contextul
desfășurării unei cercetări statistice.

Metodele statistice expuse sunt de utilitate directă pentru elaborarea lucrărilor de


cercetare fundamentală și aplicativă precum și pentru fundamentarea unor decizii de natură
managerială la nivelul organizațiilor economice. Utilizarea metodelor statistice în cercetare
asigură garanția unor rezultate și concluzii viabile, răspunde imperativelor de cunoaștere în
condiții de detaliere a cauzelor și factorilor care explică o anumită stare social-economică.

Cursul Statistică este structurat în cinci unități de învățare (capitole), fiecare dintre
acestea indicând următoarele elemente: timp estimativ de studiu pentru asimilarea informației;
competente specifice unității de învățare; cuprins al unității de învățare.

Evaluarea cunoștințelor se va realiza prin intermediul:


 Celor două teme de control programate pe parcursul semestrului;
 Examenului susținut în perioada de sesiune.
Notele obținute la cele două componente de evaluare vor fi ponderate cu un coeficient
de 0,5.

La întâlnirile tutoriale și, de asemenea, la examen se recomandă utilizarea unui


calculator de buzunar în vederea parcurgerii cat mai rapide a etapelor de calcul.

2
Cuprins

UNITATEA DE ÎNVĂȚARE NR. 1: NOȚIUNI INTRODUCTIVE PRIVIND STATISTICA.............. 4


1.1 ETAPE PRINCIPALE ÎN EVOLUȚIA STATISTICII .......................................................................4
1.2 METODA ȘI LEGILE STATISTICII ................................................................................................6
1.3 DEFINIȚIA STATISTICII ................................................................................................................9
1.4 CONCEPTE DE BAZĂ UTILIZATE ÎN STATISTICĂ .................................................................. 11
1.5 APLICAȚII ................................................................................................................................... 19

UNITATEA DE ÎNVĂȚARE NR. 2: METODOLOGIA INVESTIGAȚIEI STATISTICE ................ 22


2.1 ASPECTE PRIVIND ORGANIZAREA CERCETĂRILOR STATISTICE ..................................... 22
2.2 OBSERVAREA STATISTICĂ ..................................................................................................... 26
2.3 PRELUCRAREA STATISTICĂ PRIMARĂ ................................................................................. 27
2.4 APLICAȚII ................................................................................................................................... 35

UNITATEA DE ÎNVĂȚARE NR. 3: INDICATORII STATISTICI .................................................. 45


3.1 DEFINIREA, TIPOLOGIA, NECESITATEA UTILIZĂRII INDICATORILOR ÎN ANALIZA
ACTIVITĂȚILOR ECONOMICO-SOCIALE ........................................................................................... 45
3.2 MĂRIMILE RELATIVE ................................................................................................................ 49
3.3 MĂRIMI MEDII DE CALCUL (PROPRIU – ZISE) ...................................................................... 57
3.4 MĂRIMI MEDII DE POZIȚIE ....................................................................................................... 69
3.5 APLICAȚII ................................................................................................................................... 81

UNITATEA DE ÎNVĂȚARE NR. 4:INDICATORII VARIAȚIEI, CONCENTRĂRII ȘI FORMEI


DISTRIBUȚIILOR ................................................................................................................................ 91
4.1 INDICATORII VARIAȚIEI............................................................................................................ 91
4.2 CONCENTRAREA .................................................................................................................... 100
4.3 FORMA DISTRIBUȚIILOR ....................................................................................................... 105
4.4 APLICAȚII ................................................................................................................................. 109

UNITATEA DE ÎNVĂȚARE NR. 5: CERCETAREA SELECTIVĂ ............................................ 120


5.1 NOȚIUNI SPECIFICE CERCETĂRII SELECTIVE, AVANTAJELE SELECȚIEI, DOMENII DE
APLICARE ........................................................................................................................................... 121
5.2 REPREZENTATIVITATEA EȘANTIONULUI, ERORILE CERCETĂRII SELECTIVE .............. 124
5.3 INDICATORII PRINCIPALELOR TIPURI DE SELECȚIE UTILIZATE ÎN CERCETAREA
ACTIVITĂȚII SOCIO-ECONOMICE .................................................................................................... 128
5.4 EXTINDEREA REZULTATELOR SELECȚIEI ASUPRA COLECTIVITĂȚII GENERALE ........ 139
5.5 APLICAȚII ................................................................................................................................. 140

3
Unitatea de învățare nr. 1: NOȚIUNI INTRODUCTIVE
PRIVIND STATISTICA

Timpul de studiu individual estimat: 3 h

Competențele specifice unității de învățare


La sfârșitul parcurgerii unității de învățare, studenții trebuie:
 să înțeleagă care este obiectul si metoda statisticii;
 să cunoască conceptele de baza ale statisticii;
 să cunoască structura metodologica a cercetării statistice.

Cuprinsul unității de învățare:


1.1 ETAPE PRINCIPALE ÎN EVOLUȚIA STATISTICII
1.2 METODA ȘI LEGILE STATISTICII
1.3 DEFINIȚIA STATISTICII
1.4 CONCEPTE DE BAZĂ UTILIZATE ÎN STATISTICĂ
1.4.1 Colectivitatea statistică
1.4.2 Unitatea statistică
1.4.3 Caracteristica statistică
1.4.4 Frecvența de apariție
1.4.5 Indicatorii statistici
1.4.6 Scalarea variabilelor
1.5 APLICAȚII

1.1 ETAPE PRINCIPALE ÎN EVOLUȚIA STATISTICII

Utilizarea statisticii ca instrument de cunoaștere a


vieții sociale datează de mult timp. Ca formă de
evidență a populației și a bunurilor materiale,
statistica a fost folosită din cele mai vechi timpuri.
Ca activitate practică istoricește atestată, statistica
are o vechime de aproximativ șase milenii, iar ca
teorie a statisticii – ca știință – de peste trei secole.
Încă din antichitate statistica a fost utilizată
pentru descrierea statelor din punct de vedere
geografic, economic și politic. Originea unei asemenea concepții despre statistică se află în
opera lui Aristotel, un reprezentat de seamă al acelei perioade, cu deosebire în lucrarea sa
Politica. Depășirea stadiului de statistică practică sau materială s-a produs în momentul în care
au apărut interese de ordin științific, de cunoaștere critică, de aprofundare, generalizare și
sistematizare a cunoașterii practice, empirice.
În Evul Mediu printre cele mai reprezentative lucrări de descriere a statelor sunt cele
elaborate de Francesco Sansovino, Del governo e amministrazione di diversi regni e republiche
și Giovani Botero, Le relazioni umiversali, care au meritul de a fi luat în considerare la
descrierea statelor: bogățiile, populația, comerțul, industria și finanțele lor.
Mai târziu descrierea statelor a devenit disciplină de învățământ academic, în Germania
formându-se o adevărată școală, denumită Școala descriptivă germană, având ca fondator pe
profesorul Hermann Conring de la Universitatea din Helmstadt.

4
În același timp cu Școala germană a statisticii descriptive a luat ființă și s-a dezvoltat
în Anglia (secolele XVII-XVIII) o altă remarcabilă școală de statistică numită Aritmetica politică
după titlul lucrării fundamentale a acestei școli Political Arithmetick or a Discourse concerning
the Extend and Value of Lands, People, Buildings, elaborată de William Petty. În concepția
reprezentanților de frunte ai școlii Aritmeticii Politice – John Graunt, Edmund Halley, Gregory
King – fenomenele sociale în general, cele economice în special sunt fenomene măsurabile și
pot fi supuse unor prelucrări matematice pe baza cărora se pot desprinde prin analiză
regularitățile care le guvernează.
În Țările Române, sub influența Școlii descriptive germane, prima și cea mai
reprezentativă lucrare a genului este monografia cărturarului și domnitorului Moldovei,
Dimitrie Cantemir, intitulată Descriptio antiqui et hodierni status Moldaviae.
O contribuție românească remarcabilă la dezvoltarea statisticii descriptive o reprezintă
activitatea în domeniul acestei științe a primului economist și a primului statistician român, om
politic în același timp, Nicolae Șutu, membru al Royal Statistical Society din Londra. Nicolae
Șutu și-a asumat sarcina deosebit de complexă și dificilă de a culege, sistematiza și interpreta
științific informațiile statistice veridice provenind din surse diferite în scopul obținerii unei
descrieri statistice adecvate a situației economice din Moldova și România. În aceste lucrări se
află și importante considerații teoretice ale lui Șutu cu privire la caracterul științific al statisticii
și la rolul deosebit al acesteia în activitatea de conducere a statelor, ca unul dintre cele mai
puternice instrumente de cunoaștere a realității social-economice.
În concepția sa, formată sub influența școlilor de specialitate franceză și engleză,
statistica este o știință socială descriptivă, care studiază starea fizică, morală, intelectuală și
politică a societății, îmbrățișând toate domeniile vieții sociale, știința care încearcă să descrie
„faptele variabile” care sunt determinate de cauze variabile.
Alături de Nicolae Șutu, în Moldova secolului al XIX-lea s-a afirmat și agronomul,
economistul și statisticianul Ion Ionescu de la Brad, personalitate complexă, care și-a înscris
definitiv numele în galeria oamenilor de știință români, ca unul dintre întemeietorii statisticii
moderne românești. El și-a expus pentru prima dată concepțiile sale în domeniul statisticii în
lucrarea Povățuiri pentru facerea catagrafiei Moldovei precedate de oarecari elemente de
statistică, publicată în anul 1859. Prima parte a acestei lucrări, Elemente de statistică, constituie
primul manual de statistică elaborat de un autor român, în care savantul expune obiectul și
sarcinile statisticii, metodele, activitatea practică de statistică, organizarea statisticii oficiale,
mijloacele de culegere a informațiilor statistice și utilitatea statisticii în cunoașterea realităților
social-economice ale unui stat.
Deși influențat în mare măsură de concepția monografică a lui Nicolae Șutu, Ion Ionescu
de la Brad a adus importante contribuții creatoare și în domeniul cercetărilor monografice
pentru studierea vieții social-economice. El elaborează monografiile județelor Dorohoi, Putna
și Mehedinți, care au ca scop completarea informațiilor obținute dintr-o cercetare totală.
Contemporan cu Nicolae Șutu și cu Ion Ionescu de la Brad, la mijlocul secolului XIX,
în Muntenia s-a afirmat în domeniul statisticii și economiei, proeminenta personalitate a lui
Dionisie Pop Marțian, care a organizat și condus primul Oficiu Central de Statistică al acestei
provincii în anul 1859 și ulterior, pe cel al Principatelor Unite, fiind și inițiatorul și
conducătorul primei reviste de specialitate din România, apărută în anul 1860 și intitulată
Analele statistice.
Obiectivul fundamental al statisticii ca știință este generalizarea experienței
acumulate de practică, elaborarea și examinarea critică a indicatorilor folosiți și a
metodelor de calcul și analiză a acestora, precum și perfecționarea lor continuă în vederea
îmbunătățirii practicii în acest domeniu.
Principalul rezultat al activității științifice în domeniul statisticii îl constituie indicatorii
statistici, fundamentați din punct de vedere științific, care reflectă veridic realitatea și care

5
trebuie folosiți întotdeauna în cercetarea și determinarea realității concrete, când atât conținutul,
cât și forma de manifestare cantitativă a fenomenelor și proceselor cercetate au un caracter
specific și apar în anumite condiții bine determinate. Prin urmare, indicatorii statistici sunt
noțiuni teoretice elaborate ca rezultat al măsurării și abstractizării, care trebuie să
reflecte cât mai precis anumite trăsături ale realității obiective.
Ceea ce caracterizează în mod specific obiectul statisticii este faptul că ea studiază
fenomenele și procesele de masă sub formă de mulțimi sau colectivități, care s-au constituit ca
rezultat al acțiunii unui mare număr de cauze cu caracter esențial, asociate cu cele
întâmplătoare, ale căror influențe depind de condițiile concrete de spațiu și timp în care se
produc. Datorită faptului că fenomenele și procesele colective depind de un mare număr de
factori, forma lor individuală de manifestare poate varia în mare măsură de la o unitate la alta,
în funcție de modul de asociere a influenței factorilor esențiali cu cei întâmplători, de
intensitatea, stabilitatea, durata și sensul acestor influențe.
Legitățile care se manifestă în cadrul fenomenelor și proceselor de masă, în mișcarea
lor continuă, nu pot fi scoase în relief, nu pot fi cunoscute și caracterizate de statistică, decât
dacă se iau în studiu toate cazurile individuale sau o parte suficient de mare a lor, care să
prezinte la scară redusă trăsăturile principale ale ansamblului, întrucât manifestările individuale
sunt extrem de variate.

1.2 METODA ȘI LEGILE STATISTICII

Știința realizează o unitate indestructibilă a celor două componente esențiale ale ei:
teoria și metoda științifică. Dacă teoria unei științe constă din fondul de cunoștințe acumulate,
transpuse într-o formă raționalizată de concepte și idei, metoda reprezintă modul de cercetare,
de cunoaștere a realității obiective sau modalitatea de a opera cu fondul de cunoștințe existent
pentru o dezvoltare continuă a cunoașterii.
În activitatea de cercetare, fiecare disciplină științifică folosește un ansamblu de metode
și tehnici. Unele îi sunt specifice, iar altele sunt preluate de la disciplinele înrudite. Ansamblul
metodelor folosite într-o anumită știință reprezintă metodologia particulară a științei
respective. Aceasta se situează la un nivel subordonat metodologiei generale a oricărei științe.
Însușirea și perfecționarea metodologiei științifice este de o importanță deosebită pentru fiecare
știință particulară.
Ceea ce caracterizează sub aspect metodologic statistica este exprimarea fenomenelor
și proceselor colective sub formă cantitativă, numerică.
Conceptul de număr a apărut în antichitate în urma procesului de abstractizare a
rezultatelor unor observații empirice a ființelor și lucrurilor, a faptelor și evenimentelor care se
iveau în câmpul receptivității omului. Introducerea simbolurilor literale, deci a unităților
imaginare, în locul numerelor a reprezentat o nouă treaptă ascendentă în procesul de
abstractizare care a contribuit în mod hotărâtor la constituirea statisticii ca știință.
Conceptul de număr l-a generat pe cel de numărare, iar acesta a determinat apariția
șirurilor de numere în matematică și mai târziu a conceptelor de grupuri, colectivități, variabile,
serii și distribuții în statistică.
Abstractizarea este o cale a gândirii conceptuale care se bazează pe analiza trăsăturilor
calitative, pe ierarhizarea și trierea acestora în scopul separării și luării în considerare numai a
unei proprietăți determinate a lor, neglijând pe toate celelalte. Abstractizarea contribuie la
descoperirea trăsăturilor comune ale ființelor și lucrurilor, faptelor și evenimentelor, care se
constituie în acte de cunoaștere, având o semnificație deosebită. Conceptualizarea se
întemeiază pe procesul abstractizării și permite relevarea a ceea ce este echivalent între
fenomene, deoarece egalitatea lor deplină, absolută, nu apare în realitate niciodată.

6
Raportul dintre un fenomen și structura sa de bază este deosebit de complex și nu poate
fi urmărit cu precizie în fiecare caz individual, particular. Se poate aprecia că până în prezent
doar științele naturii au reușit într-o măsură mai mare clarificarea relației dintre conceptele cu
care se descriu fenomenele naturii și acelea simplificatoare, care apar în formularea legilor
naturii.
Caracteristicile cantitative sunt transformate în studiu statistic sub formă cantitativă prin
cuantificare. Acest fapt creează posibilitatea prelucrării și analizei cantitative a fenomenelor
colective, simplificării și caracterizării în mod sintetic și generalizat a particularităților lor
calitative.
Măsurarea și, pe această bază, obținerea indicatorilor cantitativi și calitativi ai
fenomenelor sociale și economice, descoperirea și stabilirea legăturilor dintre ei, permite
trecerea la o etapă superioară a cunoașterii și anume, la modelarea statistică a realității.
Practica a arătat că măsurările, indiferent de natura lor și oricât de corect s-ar efectua,
sunt afectate în mod obligatoriu de erori, datorită variației în timp și spațiu a obiectului sau
fenomenului măsurat, imperfecțiunii organelor noastre de simț, aparaturii și metodelor de
măsurare, precum și influenței condițiilor exterioare. Evident, prin perfecționarea aparaturii și
a metodelor de măsurare se pot obține aproximații din ce în ce mai bune ale entităților observate,
însă mărimea preciziei măsurării este limitată.
Diferența dintre rezultatul obținut prin măsurarea unui anumit obiect sau fenomen și
valoarea lui reală poartă denumirea de eroare de măsurare.
Erorile de măsurare intervin în orice proces de măsurare, indiferent dacă aceasta se face
în natură sau societate. În general, se consideră că erorile de măsurare sunt mai mari în cazul
fenomenelor sociale decât cele corespunzătoare fenomenelor naturii, datorită unei variabilități
și a unei diversități mai mari ale acestora, cât și datorită inexistenței unor mijloace de măsurare
adecvate.
Statistica și-a elaborat metode specifice de estimare a erorilor de măsurare.
În orice cercetare științifică concretă și completă se pot identifica mai multe etape
(Figura 1-1):

Observarea
Pregătirea statistică date Prelucrarea Analiza
cercetării (culegerea statistică statistică
datelor)

Figura 1-1 Etapele cercetării statistice


Sursa: Wagner P. – Bazele Statisticii, Editura Universității Titu Maiorescu, București, 2005, p.5.

În contextul detalierii elementelor din Figura 1-1 se vor contura mult mai bine aspectele
care prezintă cunoașterea proceselor care se derulează în cadrul activităților economico-sociale
și politice.
Derularea unei analize statistice vizează pregătirea cercetării, ca o primă etapă care
trebuie parcursă și care presupune o definire a:
 obiectivului cercetării;
 scopului cercetării;
 indicatorilor prin intermediul cărora se poate îndeplini obiectivul stabilit pentru
cercetare;
 variabilelor ca date individuale necesare derulării cercetării;
 unitățile utilizate pe parcursul desfășurării cercetării;

7
 modalităților de obținere a datelor individuale (unele răspund obiectivului de
cunoaștere; apare necesitatea unei înregistrări; alteori, se impune culegerea unor date pentru
toate unitățile colectivității, iar în alte condiții numai pentru un eșantion).
Observarea statistică, a doua etapă parcursă în derularea unei analize statistice, vizează
o înregistrare după reguli unitare ale caracteristicilor unităților colectivității și se concretizează
în materialul faptic.
A treia etapă, prelucrarea statistică urmărește derularea procesului de sistematizare a
datelor individuale, de prezentare a datelor sub formă de serii, tabele și grafice statistice, precum
și de calculare a indicatorilor derivați care permit o caracterizare a tendinței centrale, a variației
valorilor, a intensității corelației și a tendinței de evoluție.
Ultima etapă a cercetării statistice constă în analiza statistică ce presupune compararea
și confruntarea datelor, apoi o formulare și prezentare a concluziilor ca urmare a stabilirii
indicatorilor derivați în procesul de formulare și verificare a ipotezelor.
Statistica privită ca știință care cercetează diverse fenomene de masă este tratată în
general din două puncte de vedere:
- ca statistică descriptivă – acea parte a statisticii care urmărește prezentarea cât mai
sugestivă a datelor empirice care sunt rezultatul etapei observării, constituind volumul,
structura, evoluția în timp a fenomenului analizat.

Observație:
Informațiile furnizate de statistica descriptivă se referă numai la masa
unităților la care s-au observat valorile variabilelor.

– ca statistică inductivă sau inferența statistică, are ca obiectiv estimarea parametrilor


unei populații pe baza valorilor unui eșantion - presupune măsurarea incertitudinii rezultatelor
și calcularea riscurilor pe care le implică luarea unei decizii bazate pe informații ce nu sunt
exhaustive. Calculul probabilităților conduce la estimarea parametrilor întregii colectivități și
verificarea ipotezelor, proces care este întâlnit sub denumirea de inferență.
Se știe că legile științifice nu exprimă cu certitudine felul cum se comportă natura sau
societatea în general, ci ele descriu pur și simplu modul cum se comportă natura sau societatea
între anumite limite și modul cum probabil se vor comporta din nou în condiții similare.
Statistica, cu ajutorul metodelor proprii, determină care sunt aceste limite, într-un context
special de condiții delimitative și stabilește probabilitatea de repartiție a oricărui ansamblu de
evenimente date, pe baza frecvenței și regularității cu care acestea au apărut în trecut.
Esența statisticii ca știință, ca teorie, constă în capacitatea ei de a generaliza trăsăturile
și relațiile dintre fenomenele și procesele colective din viața economică și socială, care există
în mod obiectiv și în reflectarea lor în noțiuni generale, regularități, legități și legi.
Legea statistică este una din formele manifestării legăturilor generale ale fenomenelor
din natură și societate. Legea statistică exprimă legătura necesară dintr-un ansamblu de
fenomene sau procese, care se găsesc într-o anumită interacțiune, aparent întâmplătoare, și nu
dintre două fenomene oarecare sau două laturi ale unui fenomen. În cazul legilor statistice,
fiecare unitate sau fenomen din cadrul ansamblului are o comportare întâmplătoare în raport cu
întregul. Legea statistică nu determină mișcarea fiecărui element, ea apare ca rezultantă medie
a numeroaselor acțiuni individuale ale ansamblului de fenomene, ca tendință predominantă, ca
medie a unui număr mare de abateri întâmplătoare.
Între legile statistice și legile dinamicii există o legătură care determină manifestarea
fenomenelor, mișcarea lor, tendințele lor de dezvoltare. Se poate afirma că legile dinamicii sunt
cazuri particulare, limită, ale legilor statistice și anume, atunci când numărul fenomenelor
studiate n este egal cu unitatea.

8
Una dintre cele mai cunoscute și utilizate legi în statistică este legea numerelor mari
care presupune că într-un număr suficient de mare de cazuri individuale, a căror variație este
întâmplătoare, influența factorilor într-un sens este egal probabilă cu influența factorilor de sens
contrar și de aceea se compensează reciproc, în așa fel încât se obține o anumită valoare tipică,
caracteristică întregii colectivități.
Un alt exemplu de lege statistică este cea conform căreia la naștere, proporția copiilor
pe sexe nu este întâmplătoare, ci urmează o distribuție care la nivel național și pe o perioadă
îndelungată de timp, face ca la fiecare 100 de fete să se nască 105-106 băieți. Legea a fost
descoperită de englezul John Graunt în anul 1662, publicată în lucrarea Natural and Political
Observations upon the Bills of Mortality și observată ulterior la aproape toate popoarele lumii.

1.3 DEFINIȚIA STATISTICII

Termenul statistică derivă din latinescul status cu sensul pe care l-a avut în latina
medievală de stare politică.
Accepțiunea actuală a cuvintelor statistică, statistician, statistic datează de peste 100 de
ani. Totuși, aceste cuvinte au o vechime mult mai mare și sensul lor a suferit modificări în timp.
Semnificațiile actuale ale cuvântului statistică sunt următoarele:
a) Date numerice cu privire la unul sau mai multe fenomene din natură sau societate,
culese, sistematizate, centralizate și uneori publicate în anuare statistice, culegeri de date
statistice etc.;
b) Activitate de culegere, prelucrare și valorificare a informațiilor statistice, organizată
de stat sau individual de către cercetători;
În sensul prezentat mai sus, statistica a apărut ca răspuns la nevoia de cunoaștere în
expresie numerică a realității. Statistica ca activitate practică are drept obiectiv obținerea datelor
statistice exprimate numeric, referitoare la colectivități statistice. Înțeleasă în acest fel, statistica
are cel mai adesea forma unor tabele, construirea cărora presupunând ca regulă culegerea
datelor, sistematizarea și prelucrarea lor.

Exemplul 1.1
În ceea ce privește analiza statisticii populației, unitățile care fac obiectul
cercetării sunt reprezentate de persoanele înregistrate la recensământ care sunt
sistematizate pe sexe, vârstă, nivel de pregătire, domenii de activitate etc.

Activitatea practică în domeniul statisticii are ca fundament procesele desfășurate în


instituțiile statistice organizate la nivel teritorial, național și internațional. În România, instituția
statistică este reprezentată la nivel național de Institutul Național de Statistică și Studii
Economice (INSSE) și de Direcțiile Județene de Statistică (DJS) în plan teritorial.
c) Totalitatea metodelor, procedeelor și tehnicilor statistice sau metodologia statistică;
În această accepțiune desemnează totalitatea metodelor folosite în cercetarea
fenomenelor de masă. În calitate de metodă de cercetare, statistica este utilizată și de alte
discipline științifice în vederea determinării regularităților din domeniul respectiv de studiu,
precum și a tendințelor manifestate ca elemente de previziune.
Datorită legilor științifice care sunt legi cu caracter statistic, aplicabilitatea statisticii
domină aproape toate domeniile de activitate. Totodată, aceste legi manifestându-se numai la
nivelul ansamblului, exprimă valoarea medie (normală), predominantă, purtată de majoritatea
elementelor unui ansamblu și nu se manifestă, nu pot fi verificate la nivelul fiecărui element, ci
numai la nivelul întregului.

9
Luând în considerare că cele mai multe fenomene și procese nu sunt de tip determinist,
sau certe, ele se produc și se modifică în timp și spațiu ca rezultat al combinării complexe a mai
multor factori de influență. Rezultatul influenței acestor factori care se modifică în timp și în
spațiu se evidențiază sub forma unei mulțimi de manifestări individuale aparent întâmplătoare.
Realitatea reflectă faptul că, în mulțimea factorilor de influență există unii care imprimă tuturor
manifestărilor o esență comună, insesizabilă la nivelul fiecărui element, astfel încât fiecare
manifestare individuală (yi) a fenomenului (Y) este rezultat al combinării influențelor esențiale
(sistematice) cu cele neesențiale (întâmplătoare) sub a căror acțiune ia naștere și determină o
variație a fenomenului analizat.
În acest context, ceea ce este normal, esențial, regulă, se evidențiază prin cercetarea unei
mulțimi a acestor manifestări individuale (masă, colectivitate), eliminându-se ceea ce este
întâmplător, neesențial, prin simplificări și abstractizări succesive.
Concluziile cercetării furnizează informații utile privind astfel de fenomene care se
numesc fenomene de masă sau de tip colectiv, cunoașterea lor necesitând cercetarea
ansamblului de manifestări individuale.
d) Știință de sine stătătoare
Statistica tratată ca știință, are un obiectiv de studiu, o metodă particulară și un scop
bine precizat. Din această perspectivă, se susține frecvent că statistica este știința metodelor
pentru cercetarea în expresie numerică a fenomenelor de masă, metode de cercetare folosite și
de alte discipline științifice.
În literatura de specialitate se întâlnesc numeroase definiții ale statisticii, dar una unanim
acceptată lipsește. Cu toate acestea, se poate identifica o explicitare a noțiunii de statistică ca
o știință metodologică a cărui obiectiv este studierea fenomenelor și proceselor colective din
natură și din societate pe baza observării lor științifice, a culegerii și prelucrării detaliate a
informațiilor statistice cu scopul de a formula și explica legile, legitățile și regularitățile ce le
guvernează.
În condițiile actuale are loc o lărgire considerabilă a cadrului de aplicare a metodelor
statistice moderne în toate domeniile de cercetare științifică, ca și în rezolvarea unor probleme
practice ale etapei de tranziție spre economia de piață și nu numai. De aici rezultă că sfera celor
interesați în cunoașterea noțiunilor fundamentale ale statisticii și a metodelor, care își găsesc
aplicații eficiente în activitatea practică de producție, se lărgește din ce în ce mai mult
cuprinzând, pe lângă statisticieni și economiști, pe demografi, sociologi, ingineri, tehnicieni
etc., care lucrează în cele mai variate domenii ale vieții sociale și economice.
La nivel de întreprindere, Statistica reprezintă un instrument util pentru îmbunătățirea
administrării activității acesteia, permițând exercitarea unui control permanent asupra
procesului productiv de bunuri sau servicii, ca și în fundamentarea unor măsuri corespunzătoare
în cazul unor perturbații importante care pot să apară în timp, cum ar fi: variații importante ale
cererii sau ofertei, insuficiența temporară a unor resurse materiale, de energie etc. Statistica este
aceea care permite administratorului să-și structureze și sintetizeze informațiile potențial
disponibile și să le utilizeze în fundamentarea deciziilor celor mai adecvate.
Volumul informațiilor disponibile în întreprinderi este important și se referă la
specializarea diferitelor lor compartimente ca și relațiile acestora cu alte unități economice care
necesită numeroase schimburi reciproce de informații utilizate în scopuri de coordonare: note
de comandă, note de livrare, facturi, note contabile, fișe ale utilajelor, fișe de salarii etc., ținute
pe suporturi fizice sau informatice. Toate aceste forme de evidență sunt întocmite cu scopul
precis de a determina drepturile și obligațiile legale ale întreprinderii față de furnizori, de clienți
și de proprii salariați.
În funcție de sursa lor, informațiile necesare administratorului se pot împărți în două
categorii și anume în informații interne arhivate temporar, care, după ce au fost utilizate se
distrug sau sunt centralizate pentru a servi o durată mai mare de timp și informații externe

10
întreprinderii, ținute de instituții specializate precum cea amintită deja și anume Institutul
Național de Statistică și Studii Economice (www.insse.ro).
Se poate afirma că în epoca contemporană metoda caracteristică a cercetării științifice
moderne, aproape în toate domeniile, este metoda statistică. Aceasta asigură baza sistemului
informațional modern, iar deciziile de ordin politic, social și economic pe plan național, regional
și local, ca și în întreprinderi se bazează pe informația statistică.

1.4 CONCEPTE DE BAZĂ UTILIZATE ÎN STATISTICĂ

În cercetarea statistică se utilizează un set de concepte de bază, indiferent de domeniul


la care se referă fenomenul sau procesul studiat. Principalele concepte sunt:
 colectivitatea (populația) statistică;
 unitatea statistică;
 caracteristica (variabila) statistică;
 frecvența;
 indicator statistic.

1.4.1 Colectivitatea statistică

Colectivitatea statistică utilizată și sub denumirea de populație statistică, este


reprezentată de un sistem, alcătuit din unități statistice sub forma entităților sau manifestărilor
cu aceleași trăsături fundamentale, prin intermediul căruia se derulează procesul investigației
statistice.
Ca element esențial pentru statistică și alte domenii de activitate, colectivitatea statistică
se caracterizează pe de o parte prin obiectivitate, iar pe de altă parte prin omogenitate și strictă
delimitare a mulțimii elementelor componente, astfel:
- obiectivitatea rezultă din manifestarea independentă de dorințele cercetătorului, a
fenomenului identificat și cuantificat statistic;
- omogenitatea este reprezentată de proprietatea respectivelor elemente componente ale
mulțimii care conturează colectivitatea, de a conține în esență aceeași factură calitativă, în
aceeași unitate teritorială și același timp;
- frontierele delimitării trebuie foarte clar precizate atât din punct de vedere al
conținutului și al formei de organizare, cât și în timp, respectiv în spațiu.

Exemplul 1.2:
 la nivel macroeconomic, cercetarea statistică a unei colectivități
statistice ar putea cuprinde: populația României la data de ...; rezervele de grâu
ale statului român la data de....; producția viticolă pe regiuni de dezvoltare
economică, în perioada...
 la nivel microeconomic, procesul investigației statistice poate include: stocul
calculatoarelor aflate în depozitul unui supermarket la data de....; studenții înscriși la o
facultate în perioada 1990-2012, turiștii sosiți într-o pensiune în lunile anului 2012 etc.

Procesul derulării cercetării statistice se confruntă cu problema clarificării tipului


colectivității (statică sau dinamică), a cărei rezolvare conduce la ridicarea calității prelucrării și
interpretării rezultatelor în vederea adoptării celor mai corecte decizii manageriale.

11
Colectivitatea statică prezintă o stare la un moment dat (oră, zi etc) a entităților
componente a fenomenului ce urmează a fi cercetat. Ansamblul creat este cunoscut în
investigația statistică și sub denumirea de colectivitate de stoc.

Exemplul 1.3: mulțimea salariaților unei organizații economice la 31/01/2012;


stocul de materiale la data de ...; populația României la data de ... etc.

Colectivitatea dinamică este reprezentată de elementele componente observate și


înregistrate într-un interval de timp (lună, trimestru, semestru...etc), fapt ce-i conferă și
denumirea de colectivitate de flux.

Exemplul 1.4: exporturile României în anul ..., încasările unei firme în luna ...,
colectivitatea copiilor născuți vii în Suceava în anul ....

Unei colectivități de stoc îi corespund colectivități de flux, care descriu intrările și


ieșirile în și din colectivitatea de stoc. Populația orașului Suceava la un moment dat, care este
o colectivitate de stoc, are drept colectivități de flux corespondente: nașterile, decesele, imigrări
și emigrări într-o anumită perioadă etc.
Dacă cunoașterea statistică a unei colectivități de flux presupune o culegere/observare/
înregistrare continuă, datele unei colectivități de stoc se înregistrează la anumite momente de
timp. Intervalul dintre două înregistrări succesive depinde de volumul colectivității (numărul
unităților componente), de costurile implicate, de obiectivul cunoașterii. În cazul populației,
intervalul dintre două înregistrări succesive (ca în cazul recensământului) este, de regulă, de 10
ani, în timp ce înregistrarea efectivului animalelor se face anual etc.

1.4.2 Unitatea statistică

Unitatea statistică reprezintă cel de-al doilea concept de bază utilizat în statistică, fiind
considerat elementul constitutiv al sistemului care alcătuiește colectivitatea statistică.
Fiind purtătoarea trăsăturilor prin intermediul cărora se caracterizează colectivitatea
statistică, unitatea statistică trebuie clar stabilită deoarece, în funcție de conținutul acesteia se
pot lua deciziile corespunzătoare privind procesul prelucrării statistice.
Clasificarea unităților statistice se prezintă astfel:
a. În funcție de structura acestora:
 unități simple – acestea sunt alcătuite dintr-un singur element;
 unități complexe – structurate pe baza a două sau mai multor unități simple,
în raport cu modul lor de organizare.
b. În raport cu modul de înregistrare:
 unități active – reprezentate de acele entități care transmite informațiile
necesare cercetării atât despre ele cât și despre cele pe care le reprezintă;
 unități pasive – exprimate prin elementele despre care se comunică datele.

Exemplul 1.5:
 unitate simplă: angajatul, persoana, firma, produsul etc.
 unitate complexă: secția de producție, gospodăria, ramura de activitate.

12
 unitate activă: profesorii care dau detalii atât despre ei, cât și despre elevi; la un
recensământ, reprezentantul familiei transmite date atât despre el, cât și despre
membrii familiei;
 unitate pasivă: calculatoare; producție mașini.

Totalitatea unităților care compun colectivitatea conturează volumul sau efectivul


acesteia.
În cazul unei investigații statistice, în raport cu obiectivele cunoașterii, se are în vedere
alegerea între unitatea simplă și cea complexă, respectiv între cea activă și unitatea pasivă. Spre
exemplu, în cazul recensământului populației se folosește ca unitate statistică „persoana” și
„menajul/gospodăria”, cu ajutorul cărora se obțin informații care vizează:
 obținerea datelor necesare cunoașterii unor elemente privind numărul, structura
pe sexe, medii, nivel de instruire etc,
 condițiile de locuit, nivelul de trai etc.

1.4.3 Caracteristica statistică

Caracteristica sau variabila statistică este reprezentată de dimensiunea care exprimă


proprietățile, însușirile și trăsăturile esențiale, prin intermediul căreia se observă și se măsoară
fiecare unitate din colectivitatea supusă cercetării.

Observație:
Se impune a se face distincție între caracteristici de înregistrare și
caracteristici de identificare. Corespunzător primelor se culeg date pentru
toate unitățile colectivității, iar ultimele servesc la identificarea, delimitarea
unităților care formează colectivitatea.

Este important ca variabilele sub forma caracteristicilor de înregistrare să fie aceleași,


simultan, tuturor unităților colectivității, ele diferențiindu-se de la una la alta atât prin valoarea
înregistrată, cât și prin modul de manifestare. Schematic, clasificarea caracteristicilor se
prezintă astfel (figura 1-2):

Cantitative Calitative
Alternative Nealternative
(numerice) (nenumerice)))

Variabile
Variabile

Conținut Modul de manifestare


Modul de exprimare Natura variației

Variabile
Variabile cantitative

de timp de spațiu atributive


discrete continue

Figura 1-2 Tipuri de variabile statistice

Criteriile prezentate au un rol important în procesul clasificării variabilelor, influențând


calitativ alegerea metodelor statistice de prelucrare aplicate în procesul cercetării.

13
Cel mai semnificativ criteriu are în vedere clasificarea variabilelor statistice după modul
de exprimare, astfel:
 variabile cantitative - reprezentând rezultatele înregistrate ca urmare a procesului
de numărare, măsurare sau determinare prin calcul;
 variabile calitative – exprimate prin cuvinte corespunzătoare clasificărilor din
nomenclatoare sau prin coduri și simboluri ale diferitelor categorii analizate.

Exemplul 1.6:
 variabile cantitative: venitul, cifra de afaceri, vârsta, valoare export etc.
 variabile calitative: mediul de proveniență, domeniul de activitate, zona de
amplasare, sexul

Importantă este și clasificarea variabilelor statistice după natura variației, după cum
urmează (acest criteriu se aplică exclusiv variabilelor de tip cantitativ):
 variabile discrete – acele variabile care au o variație discontinuă, reprezentate de
valori, de regulă, numere întregi, pozitive de forma: x1, x2 ,..., xn ( x1  x2  ...  xn );
 variabile continue – sunt variabile cu variație continuă redate prin valori numărabile
divizibile la infinit, care se pot transpune matematic prin intermediul intervalelor egale/neegale,
închise/ deschise de forma: x0 , x1 , x1 , x2 ,..., ( xi1 , xi ) , unde Ii  xi1, xi  este un interval
geometric, reprezentat printr-un segment de dreaptă.

Exemplul 1.7:
 variabile discrete: număr angajați, producție de ouă (bucăți), număr hoteluri
 variabile continue: câștig salarial, greutate corporală, valoare import

Clasificarea variabilelor după conținut conduce la stabilirea următoarelor tipuri:


 variabile de timp – redau apartenența unităților la un moment sau interval de timp;
 variabile de spațiu (teritoriale) – indică teritoriul în care există și se manifestă
unitățile colectivității;
 variabile atributive – reprezintă categoria celor care nu se încadrează în primele
două tipuri (de timp și de spațiu).

Exemplul 1.8:
 variabile de timp: data de fabricație a unui produs; vechimea în muncă; dată
înregistrare contract;
 variabile de spațiu: zona de amplasare a unei agenții de turism; domiciliul;
regiune de dezvoltare;
 variabile atributive: PIB, număr bilete vândute de Agenția de transport feroviar, număr
mașini.

În funcție de modul de manifestare, variabilele se clasifică astfel:


 variabile alternative (binare) – reprezentate de acele entități care nu pot avea decât
una din două valori posibil existente;
 variabile nealternative – sunt cele care au o valoare dintr-o mulțime de posibilități.

14
Exemplul 1.9:
 variabile alternative (binare): sexul (masculin, feminin), răspuns binar (da,
nu), rezultat examen (admis, respins), mediul de proveniență (rural, urban);
 variabile nealternative: categorii de confort, vârstă, stare civilă

După importanța lor, cercetarea statistică utilizează următoarele tipuri de caracteristici:


 variabile esențiale – reflectă natura internă aparținând tuturor unităților
colectivității;
 variabile neesențiale – cărora le corespunde caracterul întâmplător, fiind întâlnite
numai la unele unități ale colectivității.
În raport cu modul de obținere a datelor, variabilele pot fi:
 variabile primare – exprimă datele primare înregistrate în etapa de culegere a
informațiilor;
 variabile derivate – reflectă datele sub forma valorilor obținute printr-o prelucrare
prealabilă a informațiilor culese în vederea derulării cercetării.

Exemplul 1.10:
 variabile primare: cantități produse, număr de angajați;
 variabile derivate: PIB/locuitor, rata inflației, rata profitului

Caracteristica unei unități statistice este reprezentată de o valoare observată denumită


valoare empirică. Astfel, ca urmare a parcurgerii etapei de observare și înregistrare, pentru
fiecare caracteristică X se va stabili un număr de valori empirice ( xi ) egal cu cel al unităților
care compun colectivitatea.
Luând în considerare că variabila (caracteristica) este reprezentată de o funcție X ale
căror valori sunt reale, totalitatea valorilor empirice formează domeniul (câmpul) de variație
prezentat astfel:

X : xi  adică X : xi , x2 ,..., xn  (1.1)


unde:
xi - valori individuale corespunzătoare unităților colectivității
i  1, n poziția valorii în șir
Probabilitatea ca variabila X analizată să ia o valoare xi se poate stabili prin relația:

P X  xi   f xi  (1.2)

1.4.4 Frecvența de apariție

În studiile statistice s-a stabilit că fiecare unitate statistică poate avea o valoare empirică
diferită sau aceeași ca și a altei unități. În acest context, se poate vorbi despre frecvența de
apariție a valorilor, care poate fi mai mare sau egală cu 1, fiind denumită frecvență relativă sau
absolută.
Frecvența absolută (ni) arată de câte ori a fost înregistrată o variantă distinctă, iar cea
relativă (fi) exprimă ponderea, greutatea specifică sau cota parte în totalul elementelor unei
colectivități ( fi = ni / ni).

15
În raport cu mulțimea unor perechi de tipul xi , ni  , respectiv xi , fi  , distribuția de
frecvențe a variabilei X poate fi prezentată astfel:
 pentru o caracteristică ce include valori empirice absolute ( ni ), perechea xi , ni 
conduce la o distribuție de forma:
 xi 
X :   (1.3)
 ni 
ni
 pentru caracteristică ale căror valori empirice relative ( f i  ) aparțin combinației
n
xi , fi  , distribuția va apărea de forma:
 xi 
X :   (1.4)
 fi 
Pe parcursul cercetării, caracteristicii statistice îi corespunde o distribuție statistică ce
reprezintă baza fundamentală pentru procesul prelucrării și interpretării rezultatelor obținute.

1.4.5 Indicatorii statistici

Diferite aspecte ale fenomenelor și proceselor de masă se pot cuantifica prin aplicarea
indicatorilor statistici.
Indicatorul statistic reprezintă acea noțiune în care se întrepătrund două elemente
componente: o componentă rațională care definește conținutul indicatorilor și una sub forma
unei expresii numerice concretizată în timp și în spațiu, astfel fiind considerat expresia numerică
ce corespunde unor măsurări statistice sau unor calcule realizate asupra datelor obținute ca
urmare a înregistrărilor statistice.
Acest context impune ca procesul determinării și aplicării indicatorilor să cuprindă
următoarele etape:
 elaborarea conceptuală și metodologică privind tipul indicatorilor statistici aplicabili
fenomenului analizat;
 calcularea indicatorilor statistici stabiliți a se aplica, pe baza datelor observate.

Exemplul 1.11:
PIB-ul României a fost în anul 2011 de 1.152.000 miliarde lei; rata inflației a
fost în România în decembrie 2011 față de decembrie 2010 de 17,8%.

1.4.6 Scalarea variabilelor

Procesul măsurării în statistică este reflectat prin intermediul acțiunii de acordare a unor
valori pentru trăsăturile unităților statistice, în raport cu aplicarea unor reguli precise. Astfel,
între valorile incluse în procesul prelucrării apar diferențe care pot fi măsurate cu ajutorul unor
scale.
Variabilele calitative se pot transforma în variabile cantitative ca urmare a înlocuirii
cuvintelor prin numere, proces denumit scalare.
În practica statistică se folosesc diverse tipuri de scale, cele mai semnificative fiind:
scala nominală, scala ordinală, scala interval și scala raport, la care se adaugă și scările de
intensitate, respectiv de opinie, utilizate în special pentru cercetările de marketing.
Scala nominală este utilizată pentru variabile calitative, ale căror valori empirice sunt
cuvinte ce nu pot fi ordonate. Aplicabilitatea acesteia constă în măsurarea prin înlocuire a

16
cuvintelor cu numere ca urmare a codării sau a determinării frecvențelor de apariție, fără a
diferenția unitățile statistice ale colectivității investigate.

Exemplul 1.12:
În cazul variabilei de promovare cu variantele de răspuns: admis și respins
codate cu (0) și (1), nu se admit nici un fel de operații aritmetice.

Indicatorii aplicabili în cazul acestui tip de scală sunt: modul, coeficientul de contingență,
testul  .
2

Scala ordinală sau cu ranguri este aplicată tot variabilelor calitative, numai că
valorilor empirice sub forma cuvintelor le sunt acordate numere sau ranguri prin intermediul
cărora se stabilește o anumită ordine (crescătoare sau descrescătoare), dar fără a cuantifica
distanța (diferența) dintre două numere.

Exemplul 1.13:
În cazul scalei gradelor didactice acordate (1, 2, ..., 10), scalei categoriilor de
confort ale structurilor de primire turistică din mediul rural (1 floare, 2 flori,...,5
flori), numerele atribuite sub forma rangurilor nu admit operații aritmetice și nu
pot cuantifica distanța (diferența) dintre două numere.

Utilizarea acestui tip de scală permite determinarea modului, a quantilelor, a


coeficienților rangurilor.
Variabilele cantitative se măsoară prin intermediul următoarelor două scale:
Scala interval (cardinală): este reprezentată de valorile empirice care fiind numerice
nu numai că evidențiază intensitatea și ordinea variantelor dar și compară, prin comensurare,
diferența a câte două dintre acestea. Specificul acestei scale este proprietatea de independență
în alegerea unității de măsură și a punctului de origine.

Exemplul 1.14:
Măsurarea temperaturii după cele două tipuri de scale se prezintă astfel:

Tabel 1-1
0
Scala Celsius -18 10 30 100
punct de origine
0
Scala Farenheit 32 50 86 212
punct de origine

Specificul scalei interval:


 Raportul diferențelor dintre temperaturi (R) este același, evidențiind independență în
alegerea unității de măsură, după cum se demonstrează:
100  30 212  86
RC   3,5 , iar RF   3,5
30  10 86  50
 Punctul de origine al celor două scale (Celsius și Farenheit) este diferit, independent
stabilit.

Principalii indicatori aplicați în cazul scalei interval sunt: indicatorii tendinței centrale,
indicatori ai variației, indicatori ai corelației și regresiei etc.

17
Scala raport (metrică): este aplicabilă valorilor empirice care în afara trăsăturilor
corespunzătoare celor de la scala interval, mai posedă încă una prin intermediul căreia se
impune stabilirea unei origini reale, fixe (ca punct de referință).

Exemplul 1.15:
Măsurarea valorilor următoarelor variabile: dimensiunile fizice (înălțime,
greutate), preț, viteză

Nota:
Unele softuri statistice precizează o singura scala numerica (ex: SPSS), fără
a mai face deosebirea între scala de interval și cea de raport.

În vederea aprofundării posibilităților de aplicare a noțiunilor privind scalele și


metodologia scalării, este prezentat în continuare un exemplu (exemplul 1.16) mai detaliat:

Exemplul 1.16:

Tabel 1-2

Nr.
Variabila Variante înregistrate Scale aplicabile
variabilă
1. Sexul: masculin, feminin Scala nominală
căsătorit, necăsătorit, divorțat,
2. Starea civilă: Scala nominală
văduv
Performanțe
3. foarte bune, bune, satisfăcătoare Scala ordinală
profesionale:
4. Înălțime corporală: x cm Scala raport
5. Numărul copiilor: 0,1,2,3,.... Scala raport

În cazul primelor două variabile calitative (sex, stare civilă) variantele înregistrate
sunt cuvinte care nu se obțin prin numărare sau măsurare, ci fiecare unitate are sau nu are o
anumită însușire. Situația prezentată evidențiază imposibilitatea ordonării sau stabilirii
distanțelor / rapoartelor variantelor prezentate, ceea ce conduce spre utilizarea scalei
nominale.
Pentru a treia variabilă (performanțe profesionale) se poate menționa posibilitatea
aranjării variantelor înregistrate după o ordine prestabilită sau un rang acordat, deci se aplică
scala ordinală.
Celorlalte două variabile (înălțime corporală, numărul copiilor) le corespund variante
numerice obținute prin măsurare sau numărare, ceea ce permite stabilirea unor distanțe și
rapoarte, iar pentru că se impune stabilirea unei origini reale, fixe (ca punct de referință),
atunci se aplică scala raport.
Investigarea opiniilor și comportamentelor persoanelor intervievate conduce la o
măsurare a datelor înregistrate prin intermediul a două scale: scala de intensitate și scala de
opinie.

Scala de intensitate permite măsurarea gradului de intensitate a opiniei persoanelor


intervievate, prin intermediul a două variante opuse (+, -; maxim, minim; contra, pentru) față
de un punct de referință care semnifică inexistența opiniei.

18
Exemplul 1.17:
Scala de opinie al lui Ilse Krasemann1:

-10 0 + 10

Minim de intensitate Abținere Maxim de intensitate


“contra” “pentru”

Scala de opinie denumită în marketing și scala de Rating, reprezintă o scală


cvasimetrică pentru că, față de punctul de referință care semnifică inexistența opiniei, apar între
4 și 10 gradații, fiecăreia asociindu-i-se o cifră.

Exemplul 1.18:
Scală privind măsurarea gradului de mulțumire față de locul de muncă:

1 2 3 4 5

Foarte Nemulțumit Așa și așa Mulțumit Foarte


Nemulțumit Mulțumit

Concluzia este că procesul de prelucrare a datelor variabilelor nu permite aplicarea


aceleiași metode, astfel încât fiecăreia dintre acestea îi corespunde un anumit tip de variabilă
(de exemplu se permite calcularea greutății medii a mai multor persoane, dar nu are sens să se
determine sexul mediu).

1.5 APLICAȚII

Aplicație rezolvată

În vederea analizei productivității obținute în cadrul unei colectivități de salariați


formată din 250 de persoane, s-a extras aleatoriu un eșantion format din 50 de
salariați. Datele referitoare la producția zilei precedente momentului desfășurării
sondajului și vechimea în cadrul societății sunt prezentate în tabelul următor (producția este
exprimată în bucăți iar vechimea în ani).

Tabel 1-3
Nr. Producție Vechime Nr. Producție Vechime Nr. Producție Vechime
salariat - buc. - - ani - salariat - buc. - - ani - salariat - buc. - - ani -
1. 43 14 18. 42 13 35. 67 28
2. 32 7 19. 47 16 36. 45 15
3. 49 17 20. 46 13 37. 40 12
4. 60 24 21. 49 13 38. 53 20
5. 59 23 22. 42 13 39. 42 13
6. 61 27 23. 61 25 40. 54 20
7. 21 1 24. 45 15 41. 30 6

1
E. Jaba – Statistica, Ed. Economică, București, 2002, p. 26

19
8. 43 14 25. 49 14 42. 31 10
9. 58 23 26. 40 12 43. 29 5
10. 34 8 27. 68 29 44. 42 13
11. 38 11 28. 56 22 45. 46 15
12. 27 4 29. 70 30 46. 46 15
13. 26 3 30. 39 11 47. 49 13
14. 35 9 31. 68 26 48. 70 30
15. 37 10 32. 28 5 49. 25 4
16. 25 2 33. 52 19 50. 38 11
17. 40 12 34. 56 22
Să se precizeze noțiunile de bază cu care se operează.

Rezolvare:

Colectivitatea statistică analizată este formată din 250 de salariați ai unei întreprinderi,
din rândul acestora s-a extras un eșantion format din 50.
Unitatea statistică este reprezentată de către un salariat și reprezintă o unitate statistică
simplă.
Pentru colectivitatea menționată s-au analizat două caracteristici statistice:
- Producție (exprimată în bucăți): variabilă atributivă, numerică, discontinuă,
nealternativă, primară, măsurată pe scala de raport;
- Vechime (exprimată în ani): variabilă atributivă, numerică, discontinuă, nealternativă,
primară, măsurată pe scala de raport.
Notă: Pentru a exista o continuitate a prezentării noțiunilor, această aplicație va
fi actualizată cu noi cerințe pe parcursul următoarelor capitole.

De reținut!
Statistica are ca obiect cercetarea fenomenelor social-economice cu existență
concretă, trecând de la date individuale numeroase si variate ca forma de
manifestare, la dimensionarea prin indicatori specifici, sintetici și analitici, a
trăsăturilor esențiale ale fenomenelor.
Cu ajutorul generalizărilor și abstractizărilor cu care operează,
statistica ilustrează viața economică și socială în mărimi cifrice denumite generic, indicatori

20
Aplicații propuse

Aplicația 1.1
Pentru caracterizarea unei grupe de studenți din anul I al Facultății de Științe Economice
și Administrație Publică, în funcție de media la admitere, unitatea de observare este:
a) grupa;
b) studentul;
c) media la admitere.

Aplicația 1.2
Pentru următoarele exemple, arătați unitatea statistică, variabila statistică, tipul
variabilei și scala ei de măsurare:
a) numărul de piese din 10 depozite;
b) temperatura înregistrată pe perioada unei luni calendaristice la o stație meteo;
c) localitatea unde își au înregistrate sediile sociale 100 de organizații economice;
d) profitul obținut în anul 2012 de către 350 de societăți comerciale;
e) culoarea preferată de către copiii din cadrul a 20 de familii.

Aplicația 1.3
Un cercetător este interesat să compare durata medie de căutare a unui loc de muncă
pentru bărbații și femeile care absolvă cursurile unei facultății. Sunt cercetați 100 de bărbați și
100 de femei.
a) descrieți populația;
b) descrieți eșantionul;
c) descrieți inferența care interesează.

Aplicația 1.4
În cadrul unui chestionar, printre întrebările formulate se află și următoarea: „Ce vârstă
aveți?”, la care respondentul va preciza valoarea într-o rubrică deschisă sau persoanele
intervievate sunt rugate să bifeze în căsuța corespunzătoare vârstei care se grupează astfel:
 18 - 28 ani
 28 – 38 ani
 38 – 48 ani
 48 – 58 ani
 peste 58 ani
Se cere:
a) Care este unitatea statistică cercetată?
b) Precizați tipul variabilei în raport cu criteriile stabilite în clasificare;
c) În funcție de fiecare formulare a întrebării, să se stabilească scala de măsurare.

Aplicația 1.5
La nivelul unei facultăți cu profil economic, în decursul unui an trebuie să se desfășoare
două cercetări. Precizați două teme de cercetare, pentru fiecare specificându-se și
caracterizându-se: colectivitatea și unitatea statistică, două variabile cantitative, două variabile
calitative și scalele de măsurare aplicabile acestora.

21
Unitatea de învățare nr. 2: METODOLOGIA
INVESTIGAȚIEI STATISTICE
Timpul de studiu individual estimat: 5 h

Competențele specifice unității de învățare


La sfârșitul parcurgerii unității de învățare, studenții trebuie:
 să cunoască structura metodologica a cercetării statistice;
 sa cunoască tipurile de erori care pot afecta rezultatele unei cercetări statistice;
 să cunoască principalele modalități de prezentare a datelor statistice;
 sa înțeleagă care sunt obiectivele și tipologia grupărilor statistice;
 sa cunoască metodologia de elaborare a grupărilor statistice;
 sa identifice tipurile și utilitatea seriilor statistice.

Cuprinsul unității de învățare:


2.1 ASPECTE PRIVIND ORGANIZAREA CERCETĂRILOR STATISTICE
2.1.1 Tipuri de înregistrări statistice
2.1.2 Verificarea autenticității informațiilor statistice
2.2 OBSERVAREA STATISTICĂ
2.3 PRELUCRAREA STATISTICĂ PRIMARĂ
2.3.1 Serii statistice
2.3.2 Tabelele statistice
2.3.3 Reprezentări grafice
2.4 APLICAȚII

2.1 ASPECTE PRIVIND ORGANIZAREA CERCETĂRILOR STATISTICE

Obținerea informațiilor statistice are o importanță deosebită


pentru buna desfășurare și reușita oricărei cercetări
statistice. De modul cum este pregătită și se desfășoară
această etapă a cercetării depind toate celelalte etape și chiar
rezultatul final. Prin urmare, cunoașterea problemelor și
particularităților acestei etape este indispensabilă pentru
orice statistician (cercetător sau practician) în înțelegerea și
utilizarea informațiilor statistice.

2.1.1 Tipuri de înregistrări statistice

Parcurgerea cu succes a etapei de obținere a informațiilor statistice în cadrul procesului


de cunoaștere a fenomenelor de masă se bazează pe un plan judicios întocmit, care trebuie să
se refere la scopul înregistrării materialului faptic, la obiectul înregistrării, la unitatea de
înregistrare, la programul înregistrării și la o serie de probleme organizatorice (personal,
organizare etc.). Informațiile obținute în urma înregistrării fiecărei unități a colectivității
cercetate constituie materialul statistic inițial pe baza căruia se înfăptuiește cunoașterea
științifică.
Înregistrarea statistică mai poartă denumirea de observare statistică.

22
În teoria statistică se cunosc și în practică se utilizează numeroase tipuri și forme de
înregistrări care se pot sistematiza prin clasificarea după criterii diferite:
a) Din punct de vedere al gradului de cuprindere a colectivităților studiate în procesul
de înregistrare deosebim:
 Înregistrarea totală (exhaustivă) care înseamnă consemnarea într-o formă unitară a
tuturor unităților componente ale unei colectivități statistice cu caracteristicile lor, care
interesează o anumită cercetare.
 Înregistrarea parțială care se efectuează asupra unei părți din unitățile care compun
colectivitatea cercetată, cu caracteristicile cuprinse în studiu, în așa fel încât partea înregistrată
să fie reprezentativă pentru ansamblul colectivității respective.
Indiferent de forma de înregistrare (totală sau parțială), informația obținută trebuie să
servească pentru caracterizarea colectivității generale.
b) Din punct de vedere al timpului de înregistrare se disting:
 Înregistrarea curentă se efectuează cu caracter continuu, sistematic și operativ
asupra faptelor și fenomenelor în timpul, la locul și pe măsura apariției lor. Înregistrarea curentă
oferă posibilitatea urmăririi operative a îndeplinirii programelor de dezvoltare, a descoperirii
rezervelor nefolosite și ajută la conducerea operativă a unităților economice. Ea îmbracă, în
general, forma documentației primare, care stă la baza evidenței tehnico-operative, a evidenței
contabile și a celei statistice (exemplu: înregistrarea fenomenelor demografice).
 Înregistrările periodice (înregistrări la un moment dat) a colectivităților de stări ce
se fac la anumite intervale de timp, dinainte stabilite, egale (de obicei) sau neegale. În statistică,
înregistrările periodice îmbracă forma recensămintelor populației, locuințelor, animalelor,
inventarierilor statistice efectuate cu scopul evaluării și reevaluării mijloacelor fixe din
economie, inventarierii mijloacelor circulante etc.
 Înregistrările ocazionale (unice) se utilizează în cazul unor colectivități de fapte și
evenimente discontinue, ocazionale, neobișnuite, cum ar fi de exemplu, înregistrarea clădirilor
efectuată în luna martie 1977 pentru localitățile din România care au fost afectate de distrugerile
cauzate de cutremurul din 4 martie 1977.
Aceste trei feluri de înregistrări se utilizează în mod combinat în statistică, iar în cadrul
lor rolul principal îl are înregistrarea curentă, care servește ca bază documentară pentru
întocmirea evidenței statistice.
c) Din punct de vedere al procedeului folosit înregistrările pot fi:
 Înregistrare directă, ce presupune consemnarea nemijlocită a fenomenelor în
documente se efectuează prin contactul direct al cercetătorului cu fiecare unitate a colectivității,
determinându-i nivelurile de dezvoltare ale caracteristicilor și înregistrându-le în formulare
(recensămintele populației, recensămintele animalelor, inventarierile statistice, toată
documentația primară, cercetările prin sondaj ale calității producției etc.).
 Înregistrare pe bază de documente se face pe baza unor înscrisuri oficiale în care au
fost consemnate fenomenele în timpul producerii lor, de exemplu, întocmirea evidenței
statistice pe baza evidenței primare, a evidenței tehnice operative și a evidenței contabile.
Înregistrarea pe bază de documente înseamnă consemnarea datelor din documentele anterioare
și transcrierea lor în formulare speciale. În condițiile unei evidențe primare bine organizate,
înregistrarea pe bază de documente este tot atât de exactă ca și înregistrarea directă, dar este
mai puțin costisitoare.
 Înregistrare prin interogare se efectuează pe baza chestionării de către cercetător a
persoanelor supuse cercetării sau a celor care au fost de față la producerea fenomenului cercetat.
Înregistrarea prin interogare se mai utilizează și în următoarele momente:
- când cercetătorul nu poate lua contact direct cu unitățile colectivității cercetate;
- când fenomenele s-au produs anterior, fără a fi fost consemnate în documente;

23
- când, deși cercetătorul are posibilitatea unui contact direct cu unitățile cercetate, nu
este în măsură să stabilească singur nivelul de dezvoltare al anumitor caracteristici.
Precizia informațiilor obținute dintr-o înregistrare prin interogare depinde de o serie de
factori subiectivi, cum ar fi: exactitatea cu care faptele petrecute anterior s-au reflectat în
conștiința celui interogat, corectitudinea punerii întrebărilor și buna credință a recenzorului și a
celui recenzat.
Înregistrarea prin interogare se poate efectua și prin corespondență.
 Autoînregistrarea poate fi socotită o formă specială de înregistrare prin interogare,
în care înregistrarea propriu-zisă se efectuează de către persoana cercetată, pe formulare
speciale primite de la cercetător, de exemplu, anchetele statistice. În acest caz, cercetătorul
înmânează sau trimite prin poștă formularele cu instrucțiunile de completare a lor celui interogat
și apoi le ridică după ce verifică în prealabil exactitatea datelor consemnate. Această formă de
înregistrare a informațiilor statistice este mai puțin costisitoare, dar și rezultatele ei sunt supuse
unei probabilități sporite de producere a erorilor de înregistrare.

2.1.2 Verificarea autenticității informațiilor statistice

În urma înregistrărilor informațiilor statistice cu privire la fenomenele colective pot să


apară diferențe între nivelurile înregistrate ale unor anumite caracteristici și nivelurile lor reale,
diferențe care poartă denumirea de erori de înregistrare. Cum putem verifica dacă o informație
este veridică?
Cauzele producerii erorilor de înregistrare sunt numeroase: lipsa de experiență a
personalului care efectuează înregistrarea, neglijența, insuficienta precizie a formularelor de
înregistrare, ținerea inexactă a evidențelor care stau la baza înregistrărilor statistice, erorile
măsurate etc. Se poate afirma deci, că nici o înregistrare statistică nu poate fi considerată exactă
în sensul absolut al cuvântului. Acest fapt a determinat să se manifeste o anumită neîncredere
din partea nespecialiștilor față de informațiile statistice, ca și față de statistică în general. Uneori
asemenea date sunt utilizate, în mod nejustificat, ca argumente pentru anumite idei, alteori sunt
folosite pentru a susține o afirmație numai aparent adevărată. Puține sunt metodele care au o
arie așa de largă de utilizare ca cele statistice și nici o altă metodă nu necesită mai multă grijă
în aplicarea ei.
Statistica este una din acele științe ai cărei reprezentanți trebuie să dea dovadă de
discernământ în momentul prezentării informațiilor, să cunoască tipurile de erori care pot să
apară cu ocazia înregistrărilor statistice, cauzele care determină apariția lor, măsurile care pot
fi luate pentru a le preveni, cum pot fi descoperite și înlăturate pentru a asigura în final
autenticitatea datelor.
Erorile de înregistrare sunt rezultatul consemnării nejuste sau neprecise a variantelor
unei anumite caracteristici, cu ocazia înregistrării diferitelor unități ale colectivităților cercetate.
Acestea se pot referi numai la o parte sau la toate unitățile unei colectivități și pot fi:
 Erori de înregistrare premeditate sau intenționate, când se datorează fie intenției de
denaturare a realității, de exagerare sau diminuare a proporțiilor unui anumit fenomen de către
persoanele înregistrate sau chiar de ambele părți;
Datorită naturii lor, erorile premeditate pot fi prevenite, se pot chiar înlătura, prin
convingerea persoanelor supuse înregistrării ca și a celor care efectuează această operațiune,
asupra caracterului ei științific și aplicativ general.
 Erori de înregistrare nepremeditate sau neintenționate în cazul neatenției, lipsei de
memorie, înțelegerii greșite a formularelor și instrucțiunilor de completare a lor.
Erorile de înregistrare nepremeditate, după natura lor, se împart în două categorii:
 Erori întâmplătoare care intră sub acțiunea legii numerelor mari și nu influențează
în mod esențial rezultatele medii, deoarece, acțiunile lor într-un anumit sens sunt egal probabile

24
cu acțiunile lor în sens contrar și se compensează reciproc la nivelul colectivității. De exemplu,
la efectuarea controlului statistic al calității producției când se măsoară o anumită caracteristică
se comit erori de măsurare în plus sau în minus față de valorile reale ale caracteristicii diferitelor
unități, dar pe ansamblu – dacă numărul variantelor este suficient de mare – abaterile într-un
sens se compensează cu abaterile în sens contrar, iar valoarea medie va tinde spre valoarea reală
a caracteristicii măsurate.
 Erori sistematice care acționează într-o anumită direcție bine determinată și
denaturează întotdeauna realitatea. Cele mai frecvente erori de înregistrare sistematice se
produc cu ocazia înregistrărilor totale.
Erorile de înregistrare apar atât în cazul înregistrărilor totale, cât și în cazul
înregistrărilor parțiale. De regulă, ele vor fi mai mari în cazul înregistrărilor totale și mai mici
în cazul celor parțiale datorită, printre altele, și volumului mai redus de muncă care determină
un risc mai mic de comitere a erorilor. Aceasta nu însemnă că informațiile provenite dintr-o
înregistrare parțială sunt mai exacte decât cele care provin dintr-o înregistrare totală, datorită
faptului că primele, sunt afectate și de un tip special de erori – erori de reprezentativitate.
Erorile de reprezentativitate se exprimă ca diferențe între mărimea unui indicator
sintetic (nivelul mediu al unei variabile, gradul de împrăștiere al variantelor individuale în jurul
nivelului ei mediu, diferiți indicatori de structură etc.) obținut pe baza eșantionului și mărimea
aceluiași indicator determinată pe baza unei înregistrări totale, cu condiția ca eroarea de
înregistrare să fie la fel de mare în ambele cazuri. Aceste erori sunt determinate de
imposibilitatea reproducerii exacte în cadrul eșantionului a structurii colectivității generale.
Pentru a se asigura autenticitatea datelor statistice este necesar să se verifice în mod
sistematic, în toate etapele procesului de înregistrare, modul cum au fost înțelese programul și
formularele de înregistrare, instrucțiunile de completare a lor cu scopul de preveni producerea
erorilor.
Prevenirea producerii erorilor de înregistrare se poate face pe căi diferite, precum:
 testarea formularelor de înregistrare prin anchete test, recensăminte de probă etc.;
 alegerea judicioasă a personalului de înregistrare, mai ales pentru înregistrările totale;
 instruirea personalului care face înregistrarea și, pentru unele cercetări speciale, chiar
testarea aptitudinilor acestora;
 popularizarea lucrărilor statistice și formarea convingerilor în rândul populației cu
privire la însemnătatea științifică și aplicativă a recensământului populației, animalelor,
pomilor, precum și a diferitelor anchete statistice;
 efectuarea unui control riguros asupra activității personalului de înregistrare;
 verificarea modului cum sunt ținute evidențele ce stau la baza informațiilor statistice.
Erorile nepremeditate pot fi mai greu prevenite și de aceea datele statistice, înainte de fi
utilizate ca atare, trebuie analizate, controlate și corectate.
Controlul datelor statistice este o acțiune ulterioară înregistrării și se efectuează cu
scopul de a asigura volumul complet și calitatea datelor înregistrate. Acest control se poate
efectua fie la locul înregistrării, în mod operativ, fie la diferite organe teritoriale sau centrale
(Direcțiile Județene de Statistică, Institutul Național de Statistică și Studii Economice).
Independent de locul unde se efectuează, în primul rând se procedează la un control
cantitativ al datelor obținute prin înregistrare, pentru a se constata dacă au fost cuprinse toate
unitățile colectivității cercetate și dacă la fiecare unitate au fost înscrise toate caracteristicile
cuprinse în formulare. Astfel, în cazul diferitelor documente statistice se verifică dacă este
complet volumul informațiilor statistice.
Pe lângă controlul cantitativ se efectuează în practica statistică și un control calitativ cu
ajutorul căruia se verifică înregistrarea corectă a indicatorilor stabiliți. Controlul calitativ se
efectuează sub formă de control logic și sub formă de control aritmetic.

25
Controlul logic constă în a se verifica dacă legătura dintre diferite caracteristici
înregistrate corespunde unei legături reale. Compararea acestor legături se poate face în timp,
în spațiu sau din punct de vedere calitativ.
Controlul aritmetic constă în verificarea calculelor din care au rezultat totalurile
înregistrate.

2.2 OBSERVAREA STATISTICĂ

Etapa de bază a cercetării, observarea statistică constă în alegerea unor date (figura 2.1),
după o metodologie unitară, privind caracteristicile componentelor colectivității supuse
cercetării sub aspectul mărimii valorii și a formelor de manifestare.
Elementele care stau la baza derulării procesului de observare statistică se referă la:
a) planul observării;
b) felul observării;
c) erorile de observare.
Datele culese

Să fie autentice Să se refere numai la caracteristici Să se realizeze în


esențiale conform scopului propus condiții obiective
Figura 2-1 - Principiile observării statistice

Pregătirea și desfășurarea observării statistice implică multiple acțiuni care, de regulă,


sunt reunite în planul de observare statistică (figura 2.2).
Principalele elemente ale acestui plan sunt:
 Definirea scopului observării, care este subordonat scopului întregii cercetări;
 Definirea obiectului observării, respectiv delimitarea colectivității, a unităților care
urmează a fi studiate. Delimitarea se realizează din punct de vedere al conținutului, spațiului și
timpului;
 Definirea unităților de observare în concordanță cu scopul înregistrării. Aceasta
înseamnă a determina formele concrete sub care pot fi găsite în teren și identificarea pe teren a
tuturor elementelor ce fac obiectul cercetării statistice;
 Caracteristicile care urmează a fi înregistrate. Se cuprind numai acele caracteristici
care concordă cu scopul cercetării

Timpul și locul observării

Obiectivul investigației Unitatea de observare

Purtătorii de informații Programul observării

Probleme
METODOLOGICE
PLANUL
OBSERVĂRII Probleme
ORGANIZATORICE

Elaborarea și tipizarea Identificarea obiectivului și a


documentelor de înregistrare unităților de observare

Popularizarea observării Instruirea personalului ce va realiza


observarea

Figura 2-2 - Problemele planului observării

26
 timpul observării se referă la două aspecte: stabilirea timpului la care se referă toate
datele care urmează a fi înregistrate și timpul (perioada) în care trebuie realizată înregistrarea.
În cazul unei colectivități de stoc, toate datele înregistrate se referă la un moment dat (moment
critic), iar în cazul unei colectivități de flux timpul la care se referă datele este o perioadă (lună,
trimestru etc.);
 locul observării statistice coincide, de regulă, cu locul producerii fenomenului
înregistrat;
 măsuri organizatorice, respectiv măsurile prin care se asigură logistica desfășurării
observării statistice: elaborarea formularelor de înregistrare și a instrucțiunilor de completare,
recrutarea și instruirea personalului de înregistrare etc.
În funcție de natura fenomenelor studiate, scopul urmărit, modul de organizare a
activității economico-sociale și mijloacele tehnice de prelucrare, observarea statistică se
realizează în diverse forme.

2.3 PRELUCRAREA STATISTICĂ PRIMARĂ

În orice știință clasificarea prezintă o importanță metodologică deosebită, deoarece


facilitează trecerea de la „masa amorfă” de date înregistrate la informație.
Sistematizarea preliminară a datelor statistice constă în organizarea acestora, atât după
modul cum colectivitatea este împărțită pe unități sau grupe de unități, cât și după tipul
caracteristicilor înregistrate.

SISTEMATIZAREA contura o imagine sistematică


PRELIMINARĂ privind totalitatea datelor înregistrate
a datelor
înlesni prelucrările ulterioare
presupune
favoriza compararea, corelarea logică a
Organizarea datelor caracteristicilor
cu SCOPUL de a:
facilita vizualizarea datelor primare sau
derivate

obține nivelurile totalizatoare a


caracteristicilor înregistrate

Figura 2-3 - Scopul sistematizării preliminare a datelor

Sistematizarea reprezintă fundamentul agregării datelor cu scopul obținerii indicatorilor


statistici.
Funcțiile grupării statistice:
- determinarea structurii colectivității cercetate pe tipuri calitative diferențiate în
cadrul aceleiași colectivități;
- sesizarea mutațiilor produse în structura colectivității statistice, pe plan teritorial
și în dinamică;
- surprinderea tendințelor de manifestare a variației fenomenului studiat;
- stabilirea și interpretarea legăturilor dintre fenomene și a factorilor care le
influențează.
Clasificarea se efectuează printr-o structurare a unităților colectivității după variabile
nenumerice (calitative), de regulă având un caracter oficial bazat pe un act normativ.

27
Gruparea statistică presupune organizarea datelor primare după una sau mai multe
caracteristici, cu scopul relevării tipurilor calitative ale populației cercetate.

Grupări SIMPLE
(după a singură caracteristică)
Numărul
caracteristicilor Grupări COMBINATE
(după două sau mai multe caracteristici)

Forma exprimării Grupări după caracteristici numerice


Criterii de caracteristicilor
GRUPARE Grupări după caracteristici nenumerice
a datelor (exprimate prin cuvine)

Grupări teritoriale
(după caracteristici de spațiu)
Conținutul
Grupări de timp sau cronologice
caracteristicilor
(după caracteristici de timp)

Grupări după caracteristici atributive


Figura 2-4 - Criterii de grupare a datelor statistice

Grupările statistice după caracteristici numerice le putem întâlni atât sub forma
grupărilor simple cât și combinate.
Gruparea simplă poate fi: pe variante numerice și pe intervale de variație
Gruparea pe variante numerice presupune determinarea numărului de unități din
colectivitate la nivelul cărora sunt variantele înregistrate, precum și valoarea realizată a
caracteristicii, situație valabilă numai în cazul în care caracteristica de grupare presupune
prezența unui număr foarte mic de variante.

Tabel 2-1 - Distribuția numărului unităților după caracteristica x


Grupe după caracteristica x Număr de unități Valoare totalizată a caracteristicii
X1 n1 X1 n1
X2 n2 X2 n2
... ... ...
Xi ni Xi ni
... ... ...
Xk nk Xk n k
k k
Total  ni
i 1
X n
i 1
i i

Gruparea pe intervale de variație se utilizează când caracteristica de grupare prezintă în


colectivitatea de studiat un număr foarte mare de variante.
Ea presupune parcurgerea următoarelor etape:
a) Stabilirea numărului de grupe (intervale):
- Huntsberders stabilește relația
r=1+ 3,31 lg N (n) (2.1)
unde:
N= numărul de unități în colectivitatea generală;

28
n = numărul de unități în colectivitatea de selecție.

- Brooks și Carruthers stabilesc relația


r 5 lg N(n) (2.2)

- Croxton și Cowden stabilesc condiția conform căreia numărul de intervale este


indicat să se încadreze între:
6  r  16 (2.3)

b) Determinarea mărimii intervalelor de grupare:


b.1. - cazul intervalelor egale
În funcție de informațiile de care dispunem, calculele se pot efectua după următoarele
relații:
 dacă se cunoaște anticipat numărul grupelor ce trebuie formate:
A x  xmin
k1x  x  max (2.4)
r r
unde:
x = caracteristica de grupare;
kx = mărimea intervalului de grupare;
Ax = amplitudinea absolută a variației caracteristicii;
Ax = xmax – xmin, adică diferența dintre varianta maximă și minimă a
caracteristicii;
r = nr. grupelor (intervalelor) ce trebuie formate.
 dacă nu s-a stabilit numărul grupelor necesare prelucrării datelor, se folosește relația
lui H.D. Sturges:
Ax
k2x  (2.5)
1  3,322 lg n
Dacă k1x  k2x se apreciază că “r” este corect ales.
Dacă k1x  k2x în aplicațiile corecte de sistematizare se va lucra cu valoarea lui “k” cea
mai mare.
b.2. - cazul intervalelor neegale
Grupările pe intervale neegale de variație se utilizează în situația unor distribuții ce se
caracterizează print-un grad ridicat de variație.
La baza formării intervalelor neegale stau două variante (A și B) dintre care se va alege
cea care se presupune că ar reflecta cel mai bine realitatea în situația prezentă.

Varianta A.
Considerând că fenomenul studiat are o distribuție de tipul Gauss-Laplace, asimptotic
normală, gruparea se realizează în raportul mediu al caracteristicii încât numărul cel mai mare
de unități să se plaseze în grupa mijlocie, după cum urmează:
- Grupa a I-a cuprinde numărul de unităților cărora corespund valori mai mici decât
nivelul mediu al caracteristicii de grupare;
- Grupa a II-a cuprinde numărul unităților cu valori cât mai apropiate de nivelul mediu;
- Grupa a III-a cuprinde numărul unităților cu valori mult mai mari comparativ cu
nivelul mediu al respectivei caracteristici de grupare.

Varianta B.
Intervalele neegale se stabilesc în funcție de poziția termenilor tot față de nivelul mediu,
dar cu o distanță egală cu plus sau minus valoarea abaterii medii liniare. Astfel:

29
- grupa mică;
- grupa mijlocie;
- grupa mare.

c) Construcția intervalelor de grupare și repartizarea unităților statistice


După determinarea mărimii intervalelor de variație este necesar să se determine limitele
inferioare și superioare ale intervalelor de grupare. Stabilirea limitelor se poate face astfel:
 limita superioară a fiecărui interval să se preia ca limită inferioară a intervalului
următor. În felul acesta se obțin intervale cu limită repetabilă
𝑖𝑛𝑓
𝑥𝑖𝑠𝑢𝑝 = 𝑥𝑖+1
Gruparea fiind cu intervale de variație continuă, în etapa de repartizare a unităților
statistice pe intervalele de variație, trebuie stabilită care limită este inclusă în interval, alegând
una din variantele: limită inferioară cuprinsă în interval sau limită superioară cuprinsă în
interval.
 limitele inferioare și superioare ale intervalelor de grupare distincte, diferențiate
printr-o unitate
𝑖𝑛𝑓
𝑥𝑖+1 = 𝑥𝑖𝑠𝑢𝑝 + 1

Exemplul 2.1:
Vânzarea de bilete realizată de 20 agenții de turism din Suceava, înregistrată
pentru fiecare dintre acestea pe parcursul unei luni calendaristice din perioada
de extrasezon, se prezintă astfel: 20, 24, 26, 25, 23, 24, 25, 28, 28, 30, 26, 28,
28, 25, 24, 27, 25, 25, 20, 26.
Se cere să se grupeze agențiile de turism după numărul biletelor vândute, realizându-
se:
a) o grupare simplă pe variante;
b) o grupare simplă pe intervale de grupare egale.

Rezolvare:
Realizarea grupărilor simple atât pe variante, cât și pe intervale de grupare egale
presupune adoptarea unei metodologii după cum urmează:
a) Pentru stabilirea unei grupări simple pe variante se ia fiecare variabilă statistică
x (număr bilete) și frecvența de apariție corespunzătoare acesteia (numărul agențiilor care
realizează respectivul număr de vânzare al biletelor), după cum se prezintă în următorul tabel:

Tabel 2-2 Distribuția agențiilor de turism după numărul biletelor vândute


Număr bilete (xi) 20 23 24 25 26 27 28 30
Număr agenții de turism (ni) 2 1 3 5 3 1 4 1

b) Pentru stabilirea grupării simple pe intervale egale de grupare se parcurg


următoarele etape:
- se determină amplitudinea absolută a variației (Ax):
Ax  xmax  xmin  30  20  10 bilete
unde:
xmax – numărul maxim de bilete vândute;
xmin – numărul minim de bilete vândute.
- se stabilește mărimea intervalului de grupare (kx), aplicând relația lui Sturgers:
Ax 10
kx    1,88  2 bilete
1  3,322 lg n 1  3,322 lg 20

30
- se formează intervalele de grupare pornind de la valoarea minimă (x min) la care se
adaugă mărimea intervalului de grupare (kx), după cum se prezintă în următorul tabel (2-3):
Tabel 2-3 Distribuția agențiilor de turism pe grupe după numărul biletelor vândute
Grupe de agenții de turism Număr agenții de turism
după vânzare (ni)
(nr. bilete – x -)
20 – 22 2
22 – 24 1
24 – 26 8
26 – 28 4
28 – 30 4
30 – 32 1
Total 20
Limita inferioară este inclusă în interval

Aceeași metodologie este aplicată și în cazul în care entitățile supuse cercetării nu sunt
numerotate (după cum au fost agențiile de turism), ci sunt prezentate sub forma cuvintelor
cărora le corespund valorile corespunzătoare (Exemplul 2.2.- tabel 2.4.).

Exemplul 2.2:
Se cunosc datele privind repartiția utilizatorilor unei aplicații online pe țări, care
se prezintă astfel:
Tabel 2-4 Distribuția numărului utilizatorilor de internet pe țări
Nr. Nr. Nr. Nr. Nr. Nr.
Țara Țara Țara
țară utilizatori țară utilizatori țară utilizatori
Africa de
1. 90 16. Finlanda 839 31. Polonia 588
Sud
2. Argentina 304 17. Franța 32. Portugalia 486
3. Australia 720 18. Germania 795 33. Regatul Unit 832
4. Austria 735 19. Grecia 441 34. România 366
Federația
5. Belgia 752 20. India 53 35. 421
Rusă
6. Brazilia 392 21. Indonezia 87 36. Singapore 733
7. Bulgaria 448 22. Irlanda 684 37. Slovacia 750
8. Canada 777 23. Italia 485 38. Slovenia 636
Republica
9. 637 24. Japonia 777 39. Spania 612
Cehă
10. R.P. Chineză 288 25. Letonia 667 40. S.U.A 781
Republica S.U.
11. 809 26. Lituania 588 41. 265
Coreea Mexicane
12. Danemarca 859 27. Malaezia 576 42. Suedia 903
13. Egipt 200 28. Norvegia 918 43. Turcia 353
Noua
14. Elveția 709 29. 834 44. Ucraina 333
Zeelandă
15. Estonia 723 30. Olanda 900 45. Ungaria 616

Să se realizeze o grupare simplă a țărilor pe intervale egale în funcție de numărul


utilizatorilor aplicației.

Rezolvare:
Realizarea unei grupării simple pe intervale egale de grupare se parcurg următoarele etape:
- se determină amplitudinea absolută a variației (Ax):

31
Ax  xmax  xmin  903  53  850 utilizatori
unde:
xmax – numărul maxim de utilizatori;
xmin – numărul minim de utilizatori.

- se stabilește mărimea intervalului de grupare (kx), aplicând relația lui Sturgers:


Ax 850
kx    131 utilizatori
1  3,322 lg n 1  3,322 lg 45

- se formează intervalele de grupare pornind de la valoarea minimă (x min) la care se


adaugă mărimea intervalului de grupare (kx), după cum se prezintă în următorul tabel:

Tabel 2-5 Distribuția țărilor după numărul utilizatorilor de internet


Grupe țări după numărul Număr țări
utilizatorilor (ni)
(– x -)
53 – 184 3
184 - 315 4
315 – 446 6
446 – 577 4
577 – 708 8
708 – 839 15
839 - 970 5
Total 45
Limita inferioară este inclusă în interval

2.3.1 Serii statistice

Seria statistică, ca rezultat al sistematizării și /sau grupării, definește corespondența


dintre două șiruri de date statistice în care primul reprezintă variația caracteristicii urmărite, iar
al doilea șir cuprinde frecvențele de apariție a variantelor caracteristicii.
În forma cea mai generală o serie statistică cu o singură caracteristică se prezintă astfel:
𝑥1 𝑥2 … 𝑥𝑟
𝑋 (𝑛 𝑛 … 𝑛 ) (2.6)
1 2 𝑟
unde:
 x1, x2, …,xr sunt variante înregistrate pentru caracteristica x;
 n1,n2, …,nr reprezintă frecvențele de apariție ale variantelor caracteristicii x.
Forma generală a seriei statistice (2.6) impune unele observații și anume:
 seria trebuie să ofere informații cu privire la succesiunea și mărimea valorilor
înregistrate și a frecvențelor corespunzătoare;
 între cele două șiruri de date există o legătură univocă, în sensul că unei valori
individuale oarecare îi corespunde o anumită frecvență, respectiv un număr care
arată de câte ori se repetă valoarea individuală respectivă.
Seriile statistice pot fi de mai multe feluri în funcție de tipul caracteristicii de grupare
sau de forma practică de prezentare a datelor, astfel:
1. Serii simple enumerative - sunt seriile care prezintă o simplă înșiruire a datelor. De
exemplu, înșiruirea notelor obținute la examenele susținute de un student la finele unui
an de studii universitare.

32
2. Serii de repartiție, de frecvențe– se prezintă sub forma unor date paralele cu referire la
o caracteristică statistică de grupare numerică sau cantitativă și numărul unităților
colectivității statistice care revin pe variante ale caracteristicii sau pe intervale de
grupare. De exemplu, seria numărului salariaților care își desfășoară activitatea în cadrul
unei firme comerciale, grupați după mărimea salariului mediu lunar.
3. Seriile cronologice(de timp sau dinamice) prezintă evoluția în timp a unui fenomen sau
descrie un anumit proces. De exemplu, dinamica cifrei de afaceri obținută anual de un
agent economic într-o perioadă de cinci ani.
4. Seriile teritoriale (de spațiu) sunt acele serii statistice care rezultă din centralizarea
datelor condiționată de unitatea teritorială din care fac parte. Aceste serii se obțin cel
mai frecvent după criterii administrativ-teritoriale, ceea ce înseamnă că ele consideră
variabil spațiul (teritoriul) și constante timpul și structura organizatorică. De exemplu,
repartizarea numărului locuitorilor pe județe la o anumită dată calendaristică. Valorile
absolute ale caracteristicilor/indicatorilor dintr-o serie teritorială sunt însumabile.
Elaborarea seriilor și a tabelelor statistice reprezintă nu numai un mijloc eficient de
prezentare a datelor statistice dar și o operație premergătoare pentru reprezentare grafică.

2.3.2 Tabelele statistice

Tabelele statistice constituie o prezentare ordonată a datelor unei colectivități. Această


modalitate de prezentare se recomandă dacă producătorul de date statistice dispune de
informații din care să reiasă că utilizatorii intenționează să efectueze calcule pentru obținerea
unor indicatori derivați.
Un tabel statistic este mai expresiv decât o masă sistematizată de date, în condițiile în
care la construcția lui se respectă câteva reguli fundamentale, și anume:
- Să aibă un titlu clar și concis care să sugereze natura datelor prezentate, timpul și
spațiul la care se referă datele cuprinse în tabel;
- Să se indice unitatea de măsură. Dacă este comună pentru toate datele prezentate în
tabel, aceasta poate fi menționată în titlul general al tabelului. Dacă nu este comună, aceasta
trebuie indicată în fiecare caz în parte (în titlurile interioare);
- Să se menționeze sursa datelor (sub tabel);
- Toate rubricile tabelului să fie completate cu cifre sau simboluri;
- Dacă datele prezentate necesită scurte explicații metodologice privind conținutul și
compatibilitatea acestora, se recomandă folosirea unor note explicative, care apare fie în
subsolul paginii sau sub tabel, după sursa datelor.
- Dacă în tabel apar simboluri, este necesar să se explice semnificația acestora. Ca
regulă, semnificația simbolurilor și a semnelor convenționale se prezintă la începutul sau
sfârșitul cărții, publicației etc.

În practică se poate recurge la o varietate de tipuri de tabele statistice:


 tabele enumerative sau descriptive – se folosesc în etapa observării, și anume, pentru
înregistrarea datelor;
 tabele de prelucrare – se folosesc pentru aplicare unui algoritm de calcul al
indicatorilor derivați;
 tabele simple – servesc la prezentarea rezultatelor unei grupări după o singură
caracteristică;

33
 tabele pe grupe – se folosesc pentru prezentarea rezultatelor unei grupări simple și a
valorilor centralizate pe grupe corespunzătoare frecvențelor și caracteristicii;
 tabele cu dublă intrare – servesc la prezentarea rezultatelor grupării după două
caracteristici interdependente.

2.3.3 Reprezentări grafice

Graficul statistic reprezintă o modalitate de prezentare a datelor care permite sesizarea


a ceea ce este esențial în cazul fenomenului studiat, prin intermediul unor imagini spațiale cu
caracter convențional. O reprezentare grafică este o manieră simplificată de descriere a
realității, transpunând aspectele măsurabile în mărimi și figuri geometrice variate.
Graficele se folosesc frecvent ca modalitate de prezentare a datelor deoarece facilitează
formarea unei imagini vizuale privind: tendințele de evoluție în timp și în spațiu;
interdependențele dintre variabile; structura și mutațiile intervenite în timp și spațiu.
Reprezentarea grafică a datelor statistice este și un instrument ajutător de alegere a
metodelor și procedeelor de calcul statistic și de aproximare a unor mărimi statistice.
Reprezentările grafice pot însoți tabele statistice sau pot fi folosite de sine stătător. Se
recomandă prezentarea datelor numai sub formă grafică dacă se cunoaște faptul că utilizatorii
nu intenționează să efectueze calcule proprii.
Un grafic este o formă mai simplă, dar mai sugestivă de prezentare a datelor. Creșterea
sugestivității se realizează prin neglijarea informațiilor de detaliu.
Elementele unui grafic corespund în mare măsură cu cele menționate în cazul tabelelor
statistice:
- Titlul graficului – trebuie să indice, ca și în cazul tabelului statistic, conținutul datelor
care se prezintă, timpul și spațiul la care se referă;
- Axa sau axele graficului. În cazul majorității reprezentărilor grafice se folosesc axe în
sistemul de coordonate rectangulare;
- Scara de reprezentare – este elementul care indică echivalentul unei unități grafice,
deci servește la gradarea axei / axelor. Scările pot fi uniforme, când punctele cotate pe suportul
scării sunt echidistante, sau neuniforme, când distanțele dintre punctele cotate sunt variabile
(scara logaritmică, scara binomială etc.);
- Rețeaua graficului – este formată dintr-o rețea de linii paralele cu axele de coordonate
rectangulare. Uneori rețeaua graficului este formată dintr-o rețea de cercuri concentrice;
- Legenda graficului – explică semnele convenționale, liniile, culorile și hașurile
folosite în construirea graficului;
- Sursa datelor – se menționează sub rețeaua graficului.
Reprezentările grafice se constituie într-un mijloc care, prin intermediul imaginilor,
informează rapid asupra mărimilor numerice, asupra tendințelor și asupra interdependențelor
dintre variabile. Un grafic poate reflecta corect aceste aspecte dacă se respectă principiul
proporționalității, în sensul alegerii corecte a scării graficului și a tipului de grafic.

34
2.4 APLICAȚII

Aplicația rezolvată - continuare

Cerințe:
1. Să se grupeze salariații din eșantionul analizat după caracteristica
producție pe 5 intervale egale de variație;
2. Să se transforme caracteristica vechime într-o caracteristică de tip alternativ;
3. Să se grupeze eșantionul celor 50 de salariați într-o distribuție bidimensională,
utilizând rezultatele obținute la primele 2 cerințe;
4. Să se reprezinte grafic rezultatele primelor 3 cerințe;
5. Să se determine și să se interpreteze frecvențele relative și cele cumulate ce pot fi
determinate pentru distribuția salariaților grupată după caracteristica producție.

Rezolvare

Cerința nr. 1

1. Gruparea datelor statistice se realizează, în general, fie utilizând metoda grupării pe


variante de variație fie utilizând metoda grupării pe intervale de variație. Ținând cont de
numărul mare de variante de apariție ale producție, este oportună o grupare pe intervale egale
de variație.
Pentru a grupa cei 50 de salariați pe 5 intervale de variație a producției, așa cum apare
precizat în prima cerință, este necesar să parcurgem următoarele etape:

a. Determinarea mărimii intervalului de grupare, cu ajutorul relației


xmax  xmin
kx 
r
unde:
kx= mărimea intervalului de grupare;
xmax = varianta maximă a caracteristicii de grupare;
xmin = varianta minimă a caracteristicii de grupare;
r = numărul intervalelor de grupare.

Numărătorul relației solicită determinarea amplitudinii variației, ca diferență între


valoarea maximă a caracteristicii analizate și valoarea sa minimă.

Convenție:
În general, caracteristica analizată în cadrul unei distribuții unidimensionale
(utilizând o singură caracteristică de grupare), așa cum este prezentată situația
cerinței nr.1, se notează cu Xi.

Producția maximă obținută a fost de 70 de buc., iar cea minimă de 22 buc.; astfel,
amplitudinea variației este: 70-22=48 buc

Valoarea lui r este specificată în cerință și anume se solicită o grupare pe 5 intervale.


Dacă nu s-ar fi făcut o solicitare expresă în privința lui r, valoarea acestuia se putea estima cu
ajutorul relației lui H. Sturges, prezentată mai jos.

35
r=1+3,322lg N, unde N = numărul unităților colectivității cercetate.
48
În acest moment putem determina valoarea lui 𝑘 = = 9,6 ≈ 10 .
5

Convenție:
• Dacă raportul dintre amplitudinea variației și numărul de grupe nu este un
cât exact atunci se rotunjește în plus, la numărul întreg cel mai apropiat. E
important de precizat că sunt situații în care rotunjirea la întregul superior
este prea mare, și atunci se poate face o aproximare (rotunjire) prin adaos la un număr întreg
sau zecimal ales convenabil;
• Dacă rezultatul este un număr întreg, se deschide intervalul extrem corespunzător,
pentru a include și valoarea care coincide cu o limită a intervalului (cu limita superioară a
ultimului interval dacă intervalele sunt închise la stânga, respectiv cu limita inferioară a
primului interval dacă intervalele sunt închise la dreapta).

Astfel, mărimea intervalelor de grupare o vom alege 10.

b. În cea de-a doua etapă ne propunem să construim intervalele de grupare. Regula


de construcție a acestora presupune crearea intervalelor pornind de la valoarea minima a
caracteristicii analizate și adunarea de r ori a valorii lui k.
Astfel, intervalele de grupare sunt: 22-32; 32-42; 42-52; 52-62 și 62-72.
Dacă se dorește, se permit abateri într-o anumită măsură de la regula prezentată, atâta
timp cât se vor respecta următoarele condiții:
• completitudinea datelor;
• omogenitatea grupelor și subgrupelor;
• unicitatea includerii unităților într-o singură grupă dacă gruparea este simplă;
• continuitatea variației grupelor în cazul variabilelor numerice, ceea ce practic
înseamnă să nu existe grupe cu frecvențe nule care ar duce la întreruperea grupării.
Se propune în continuare inițierea construcției intervalelor de grupare începând de la
valoarea 20 și nu de la valoarea 22 (ce reprezenta minimul producției obținute).

Nota:
Acest artificiu este propus doar din rațiuni de estetică în ceea ce privește
prezentarea intervalelor de grupare.

Caracteristica analizată se va prezenta în continuare pe următoarele 5 intervale:

Tabel 2-6 Gruparea variabilei pe intervale de variație


Producție
- buc. -
Xi
20-30
30-40
40-50
50-60
60-70

Construcția acestor 5 intervale ne asigură includerea tuturor celor 50 de valori ale


producție, începând de la 22 și până la 70.

36
c. În cea de-a treia etapă se identifică frecvențele ce caracterizează fiecare interval,
adică trebuie să se precizeze câți salariați au o producție cuprinsă între 20-30, câți între 30-40
s.a.m.d.
Înainte de a putea face aceste precizări se observă că sunt 3 salariați ce au produs 40 de
buc., astfel, va trebui sa alegem unde încadrăm acești salariați având ca alternative intervalele
30-40, respectiv 40-50.
Pentru a avea un demers unitar, va trebui sa alegem una din următoarele 2 reguli: limita
inferioară inclusă în interval (ceea ce va face să includem cei 3 salariați în intervalul 40-50) sau
limita superioară inclusă în interval (ceea ce va face să includem cei 3 salariați în intervalul 30-
40).
Utilizând cele 2 reguli obținem:

Tabel 2-7 Prezentarea distribuției pe intervale de grupare


Producție Nr. Producție Nr.
- buc. - salariați - buc. - salariați
Xi ni Xi ni
20-30 7 20-30 8
30-40 9 30-40 11
40-50 19 40-50 16
50-60 7 50-60 8
60-70 8 60-70 7
TOTAL 50 TOTAL 50
*limită inferioară inclusă în interval *limită superioară inclusă în interval

Convenție:
Vom nota frecvențele absolute de apariție cu ni.

Ca regulă, dintre cele două alternative de grupare, se alege cea care oferă o distribuție
cât mai apropiată de cea normală.

Figura 2-5 Distribuția normală a unei variabile

Noțiunile prezentate până în acest moment nu permit aplicarea unui test de verificare a
normalității distribuțiilor. Astfel, arbitrar, pentru continuarea prezentărilor reținem varianta
obținută prin regula limită inferioară inclusă în interval.

Cerința nr. 2

În momentul de față, variabila vechime se prezintă ca o variabilă de tip nealternativ,


având mai mult de 2 variante de apariție. O modalitate simplă și practică de a o transforma într-
o variabilă de tip alternativ ar fi aceea de a crea două intervale de încadrare a vechimii, astfel:

37
salariați cu o vechime până în nivelul mediu al vechimii aferent eșantionului, respectiv salariați
cu o vechime ce depășește nivelul mediu al vechimii aferent eșantionului.
Nivelul mediu al vechimii îl putem determina cu ajutorul relației mediei aritmetice,
prezentată mai jos:
n

x i
737
x i 1
  15 ani/salariat
n 50

Ca atare, putem prezenta variabila vechime după modelul uneia de tip alternativ astfel:

Tabel 2-8 Distribuția variabilei de tip alternativ


Vechime Nr.
-ani- salariați
Xi ni
≤ 15 ani 33
> 15 ani 17
TOTAL 50

Cerința nr. 3

Gruparea combinată – presupune separarea unităților în grupe omogene după variația


simultană a două sau mai multe caracteristici de grupare.
Utilizând intervalele de grupare regăsite la cerințele anterioare, distribuția celor 50 de
salariați se va prezenta astfel:
Tabel 2-9 Gruparea de tip combinat
Vechime Producție - buc.
-ani- Yi Total
Xi 20-29 30-39 40-49 50-59 60-70
≤ 15 ani 7 9 17 - - 33
> 15 ani - - 2 7 8 17
Total 7 9 19 7 8 50

Cerința nr. 4

Distribuția salariaților după variabila producție reprezintă o serie calitativă cu atribut


cantitativ, ca atare pentru reprezentarea grafică a datelor putem utiliza:
- histograma;
- poligonul frecvențelor;
- curba frecvențelor.

38
Construcția
Distribuţia salariaţilor pe intervale de histogramei presupune
grupare ale producţiei realizarea unei diagrame prin
20 coloane. Pentru fiecare
interval de grupare se
15 construiește o coloană a cărei
lungime este dată de frecvența
10 de apariție ni corespunzătoare.
Nr. Salariaţi
Pe axa absciselor se
5 prezintă intervalele de grupare
7 9 19 7 8 ale caracteristicii Xi iar pe axa
0 ordonatelor se vor prezenta
20-30 30-40 40-50 50-60 60-70 valorile frecvențelor de
apariție ni
Figura 2-6
Poligonul frecvențelor
Distribuţia salariaţilor pe intervale de poate fi considerat ca o
grupare ale producţiei variantă a histogramei. Se
19
construiește unind cu o linie
20 frântă punctele ce marchează
mijlocul bazelor de sus a
15
coloanelor din histogramă.
9 Nr. Salariaţi Poligonul frecvențelor
10 8
7 7
Nr. Salariaţi tinde către Curba frecvențelor
5 atunci când numărul
variantelor sau al intervalelor
0 de grupare ale variabilei de
20-30 30-40 40-50 50-60 60-70 grupare este foarte mare.
Figura 2-7

Curba frecvențelor
Distribuţia salariaţilor pe intervale de este asemănătoare poligonului
grupare ale producţiei frecvențelor. Punctele din
19
20 plan însă nu se mai unesc prin
segmente de dreaptă, ci printr-
15 o curbă continuă, obținută
9 8 Nr. Salariaţi prin ajustarea punctelor.
10 7 7 Astfel reprezentată, curba
Nr. Salariaţi
5 frecvențelor aproximează
mult mai bine forma de
0 distribuție a colectivității
20-30 30-40 40-50 50-60 60-70 după caracteristica cercetată.
Figura 2-8

Distribuția salariaților în funcție de grupa de vechime, așa cum este ea prezentată, poate
fi asimilată unei serii calitative cu atribut calitativ, iar pentru reprezentarea sa grafică putem
utiliza o diagramă de structură.

39
Dreptunghiul de structură
Distribuţia salariaţilor în funcţie de presupune construirea unui
grupa de vechime dreptunghi și în interiorul acestuia se
60 construiesc dreptunghiuri mai mici,
50 suprapuse, cu suprafețe
40 17 proporționale cu ponderea părților în
30 > 15 ani colectivitate.
20 ≤ 15 ani
33
10
0
Nr. Salariaţi

Figura 2-9
Pentru surprinderea celor 2
Distribuţia producţiilor realizate în funcţie
variabile din cadrul grupării
de grupa de vechime a salariaţilor
combinate realizate anterior, într-un
40
sistem de axe se vor prezenta 2
30 60-70 dreptunghiuri de structură, pentru
20
17 50-59 care, pe axa absciselor se prezintă
8 40-49 cele 2 grupe de vechime iar pe axa
9
10 ordonatelor se prezintă gruparea
7 7 30-39
0 2 salariaților după producția realizată.
1-15 16-30 20-29
Grupe de vechime
Figura 2-10

Cerința nr. 5

O altă posibilitate de prezentare a frecvențelor de repartiție este cea relativă și se


recomandă a fi utilizată deoarece este mai expresivă decât frecvențele absolute, mai ales atunci
când populația statistică analizată este de volum mare și ca atare frecvențele absolute de
repartiție se prezintă ca valori absolute de ordin mare.
Frecvențele relative se determină cu ajutorul relației:
n
fi  n i 100
 ni
i 1

Astfel, putem alege între prezentările:


a) Între 20 si 30 de bucăți au produs 7 salariați, sau
b) Între 20 si 30 de bucăți au produs 14% din salariați

Tabel 2-10 Calculul frecvențelor


Producție Nr.
- buc. - salariați fi N↑ N↓ F↑ F↓
Xi ni
20-30 7 14% 7 50 14% 100%
30-40 9 18% 16 43 32% 86%
40-50 19 38% 35 34 70% 68%
50-60 7 14% 42 15 84% 30%
60-70 8 16% 50 8 100% 16%
TOTAL 50 100% - - - -

40
Frecvența cumulată a unei valori empirice xi a caracteristicii este egală cu suma
frecvențelor tuturor valorilor mai mici sau mai mari decât xi în funcție de sensul cumulării
(descrescător sau crescător).
Frecvențele cumulate pot fi determinate:
 în formă absolută, cu ajutorul relației Ni=ni+Ni-1 sau

 în formă relativă cu ajutorul relației Fi=fi+Fi-1.


Sensul cumulării este precizat în cadrul tabelului anterior cu ajutorul săgeților.
Interpretarea frecvențelor cumulate se face după modelul de mai jos:
Valorile marcate cu bold indică numărul salariaților ce au obținut o producție de până
în 50 de bucăți (50 este limita superioară a intervalului nr. 3) iar valorile marcate cu italic indică
numărul salariaților ce au obținut o producție de peste 40 de bucăți (40 este limita inferioară a
intervalului nr. 3)
Reprezentarea grafică a frecvențelor cumulate poartă denumirea de ogivă. Curba
cumulativă a frecventelor (ogiva) se folosește atunci când se dorește determinarea grafică a
valorilor mediilor de poziție (mediana, cvartilele, decilele etc). Se reprezintă pe același grafic
atât frecventele cumulate crescător cât și cele cumulate descrescător.

Curba cumulativă a frecvențelor

50 50
43 42
35
34

16 15

7 8

20-30 30-40 40-50 50-60 60-70


Frecvențe cum. crescător Frecvențe cum. descrescător

Figura 2-11

Dacă la construcția celor două curbe se pornește de la limita inferioară, respectiv, cea
superioară ale distribuției și dacă se coboară o perpendiculara din intersecția celor doua curbe
pe abscisă se poate identifica valoarea medianei, indicator mediu al tendinței centrale care
împarte seria în doua parți egale.

De reținut!

Gruparea datelor statistice este o operațiune de sistematizare a prezentării


materialului statistic obținut prin observare, care constă în separarea colectivității
cercetate în grupe omogene de unități după variația uneia sau mai multor
caracteristici din programul observării.

41
Seria statistica este un sir de valori ale unei caracteristici ordonate în funcție de șirul valorilor
unei alte caracteristici sau după un anumit principiu, cum ar fi ordinea alfabetica, ordinea de
mărime sau rangul unității statistice etc.

Seriile statistice pot fi de mai multe feluri în funcție de tipul caracteristicii de grupare sau de
forma practica de prezentare a datelor

Aplicații propuse

Aplicația 2.1
Conform seriilor de date statistice (TEMPO-Online), personalul didactic din
învățământul liceal în 2012 are următoarea repartiție pe medii de rezidență, pe regiuni de
dezvoltare și județe:
Tabel 2-11
Regiuni de Număr Regiuni de Număr
Medii de Medii de
dezvoltare, personal dezvoltare, personal
rezidență rezidență
Județe didactic Județe didactic
Regiunea NORD-
Urban 7377 Urban 1441
VEST Galați
Rural 612 Rural 72
Bihor Urban 1960 Urban 507
Tulcea
Rural 244 Rural 18
Bistrița-Năsăud Urban 693 Urban 805
Vrancea
Rural 179 Rural 33
Cluj Urban 1890 REGIUNEA SUD- Urban 6951
Rural 30 MUNTENIA Rural 790
Maramureș Urban 1291 Urban 1604
Argeș
Rural 30 Rural 158
Satu-Mare Urban 1036 Urban 629
Călărași
Rural 17 Rural 39
Sălaj Urban 507 Urban 1094
Dâmbovița
Rural 112 Rural 127
Urban 6432 Urban 363
Regiunea CENTRU Giurgiu
Rural 360 Rural 88
Urban 1010 Urban 589
Alba Ialomița
Rural 44 Rural 42
Urban 1479 Urban 1796
Brașov Prahova
Rural 63 Rural 257
Covasna Urban 635 Urban 876
Teleorman
Urban 941 Rural 79
Harghita
Rural 128 REGIUNEA Urban 5104
BUCUREȘTI-
Urban 1387 Rural 222
Mureș ILFOV
Rural 100 Urban 173
Ilfov
Urban 980 Rural 222
Sibiu
Rural 25 Municipiul București Urban 4931
Regiunea NORD- Urban 8894 REGIUNEA SUD- Urban 6009
EST Rural 946 VEST OLTENIA Rural 643
Urban 1551 Urban 1839
Bacău Dolj
Rural 98 Rural 221
Botoșani Urban 1038 Gorj Urban 1215
Rural 163 Rural 149

42
Regiuni de Număr Regiuni de Număr
Medii de Medii de
dezvoltare, personal dezvoltare, personal
rezidență rezidență
Județe didactic Județe didactic

Urban 2097 Urban 752


Iași Mehedinți
Rural 220 Rural 107
Urban 1283 Urban 1129
Neamț Olt
Rural 157 Rural 89
Suceava Urban 1965 Urban 1074
Vâlcea
Rural 167 Rural 7
Urban 960 Urban 5368
Vaslui REGIUNEA VEST
Rural 141 Rural 309
Urban 6554 Urban 1120
Regiunea SUD-EST Arad
Rural 509 Rural 68
Urban 839 Urban 1118
Brăila Caraș-Severin
Rural 14 Rural 76
Urban 1088 Urban 1257
Buzău Hunedoara
Rural 105 Rural 78
Urban 1874 Urban 1873
Constanța Timiș
Rural 267 Rural 87

Se cere:
a) Să se realizeze o grupare a regiunilor de dezvoltare după numărul personalului
didactic;
b) Grupați mediile de rezidență după personalul didactic;
c) Realizați o grupare a județelor după personalul didactic;
d) Grupați combinat personalul didactic după mediile de rezidență și regiunile de
dezvoltare.

Aplicația 2.2
Se consideră o distribuție cu valori cuprinse între 72 și 194. Dacă se dorește construirea
unei distribuții de frecvențe pe 10 intervale egale:
a) Determinați mărimea intervalului de grupare;
b) Propuneți valoarea minimă de la care se pornește construirea intervalelor;
c) Stabiliți limitele și centrul primului interval.

Aplicația 2.3
Luând în considerare că 40 de studenți ai Facultății de Științe Economice și
Administrație Publică au obținut următoarele rezultate la un test de statistică: 63; 88; 79; 92;
86; 87; 83; 78; 40; 67; 68; 76; 46; 81; 92; 77; 84; 76; 70; 76; 77; 75; 98; 81; 82; 81; 87; 78; 70;
60; 64; 79; 52; 82; 77; 81; 77; 70; 74; 61, se cere:
a) Construiți o serie de distribuție de frecvențe pe 6 intervale de variație de mărime
egală;
b) Construiți histograma și poligonul frecvențelor;
c) Calculați frecvențele cumulate și reprezentați-le grafic.

Aplicația 2.4
Referitor la cei 145 de angajați ai unei societăți comerciale se cunosc următoarele date:

Tabel 2-12
Intervale de variație a
Sub 5 5-10 10-15 15-20 20-25 Peste 25
vechimii în activitate (ani)
Ponderea angajaților (%) 6 11 33 75 90 100

43
a) Să se precizeze tipul frecvențelor redate în tabel;
b) Să se determine frecvențele absolute și să se reprezinte grafic;
c) Să se calculeze frecvențele absolute cumulate calculate crescător și descrescător
și să se reprezinte grafic;
d) Să se precizeze care este ponderea salariaților care au o vechime de peste 20 de
ani și câți salariați îndeplinesc această condiție;
e) Să se calculeze centrele de interval.

Aplicația 2.5
Un depozit farmaceutic aprovizionează 85 farmacii. Încasările medii lunare ale
farmaciilor au următoarea repartiție:
Tabel 2-13
Intervale de variație a Încasărilor medii lunare (unități Sub 60- 64- 68- Peste
monetare) 60 64 68 70 70
Număr farmacii cu încasarea medie lunară mai mică decât
10 22 46 68 85
limita superioară

Se cere:
a) Reprezentați grafic distribuția farmaciilor după încasările medii lunare;
b) Luând în considerare frecvențele absolute cumulate crescător ale încasărilor medii
lunare din tabel, să se cumuleze descrescător frecvențele absolute ale respectivelor încasări și
să se reprezinte grafic prin intermediul ogivei;
c) Stabiliți numărul farmaciilor cu valoarea încasărilor mai mică de 64 u.m.

TEMA DE CONTROL NR. 1

OBIECTIV: Prin intermediul TC1 studenții vor putea sa se familiarizeze cu termenii


specifici utilizați in cadrul cercetărilor de tip statistic.

CERINTE: Studiați cele 8 studii de caz cuprinse în lucrarea CERCETARE


SELECTIVĂ – studii de caz, proiecte, autor Valentin Hapenciuc s.a. Alegeţi un studiu de caz
din cele 8 și formulați răspunsuri la 5 întrebări, la alegere, regăsite începând cu pagina 445 în
lucrarea sus amintită.
Acest material poate fi procurat de la biblioteca USV (Cota depozit II 49683).

PRECIZARI:
• Referatul va fi redactat de mână.
• Referatul va fi predat prin intermediul platformei e-learning si ulterior, la data
examenului, in format fizic. Pe platforma e-learnig se va încărca o copie scanata a referatului.

44
Unitatea de învățare nr. 3: INDICATORII STATISTICI
Timpul de studiu individual estimat: 6 h

Competențele specifice unității de învățare


La sfârșitul parcurgerii unității de învățare, studenții trebuie:
 să cunoască tipologia mărimilor relative;
 să înțeleagă semnificația economică a unei mărimi relative;
 să cunoască care sunt formele și modalitatea de calcul a mărimilor medii;
 să înțeleagă semnificația economică a unei mărimi medii;
 să cunoască utilitatea si modalitatea de calcul a mărimilor medii de poziție.

Cuprinsul unității de învățare:


3.1 DEFINIREA, TIPOLOGIA, NECESITATEA UTILIZĂRII INDICATORILOR ÎN
ANALIZA ACTIVITĂȚILOR ECONOMICO-SOCIALE
3.1.1 Indicatorii absoluți
3.1.2 Indicatorii relativi
3.2 MĂRIMILE RELATIVE
3.2.1 Mărimi relative de structură
3.2.2 Mărimi relative de coordonare
3.2.3 Mărimi relative de intensitate
3.2.4 Mărimi relative de dinamică
3.3 MĂRIMI MEDII DE CALCUL (PROPRIU – ZISE)
3.3.1 Media aritmetică
3.3.2 Media armonică
3.3.3 Media geometrică
3.3.4 Media pătratică
3.3.5 Media cronologică
3.4 MĂRIMI MEDII DE POZIŢIE
3.4.1 Modul (Mo) sau Dominanta (Do)
3.4.2 Mediana (Me)
3.4.3 Cuantilele
3.4.4 Mediala
3.5 APLICAȚII

3.1 DEFINIREA, TIPOLOGIA, NECESITATEA UTILIZĂRII INDICATORILOR


ÎN ANALIZA ACTIVITĂȚILOR ECONOMICO-SOCIALE

Scopul analizei statistice a activităților desfășurate în


economie constă în studierea aspectelor cantitative ce
caracterizează natura sau calitatea acestora.
Însușirile cantitative și calitative se pot exprima cu
ajutorul unor expresii numerice stabilite printr-o cercetare
statistică. Această cercetare are în vedere caracteristici
statistice observate pe un fenomen, proces, sau pe o categorie
rezultată prin desfășurarea activităților economie, delimitată
în timp și spațiu.

45
Caracteristic procesului cunoașterii îi este utilizarea indicatorilor statistici, necesitatea
utilizării acestora având ca fond de bază funcțiile acestora, cele mai importante fiind: de
măsurare, de comparare, de sinteză, de estimare și de verificare a ipotezelor și testare a
semnificației parametrilor statistici utilizați.
În raport cu etapa cercetării statistice în care apar, indicatorii statistici pot fi:
 absoluți;
 derivați.

Indicatori de nivel Modificări absolute

Indicatori absoluți
INDICATORI
STATISTICI Indicatori derivați

Mărimi Mărimi Indicatorii Indicatorii Indicatorii


relative medii variației asimetriei corelației
Figura 3-1 – Clasificarea indicatorilor statistici în raport cu etapele cercetării statistice

Dacă indicatorii absoluți sunt reprezentați de mărimile absolute care apar în etapa de
culegere, centralizare și grupare a datelor statistice, indicatorii derivați sunt mărimile derivate
obținute prin prelucrarea mărimilor absolute, ca urmare a aplicării diferitelor metode și
procedee de calcul statistic.
Indicatorii derivați analizează aspectele calitative ale fenomenelor și proceselor
cercetate oferind informații privind:
 relațiile cantitative dintre diferitele părți ale unei colectivități și dintre diferitele
caracteristici;
 valorile tipice;
 gradul și forma variației caracteristicilor studiate;
 interdependența dintre variabile;
Principalii indicatori derivați care vor fi abordați pe parcursul capitolelor ce vor fi
prezentate sunt:
 indicatorii relativi;
 indicatori medii;
 indicatori ai variației;
 indicatori de asimetrie;
 indicatori de corelație și asociere etc.
Forma numerică de prezentare a datelor statistice obținute pe parcursul derulării etapelor
cercetării statistice are o mare relevanță în ceea ce privește interpretarea economică a acestora.
În acest mod se justifică importanța deosebită care trebuie acordată clasificării indicatorilor
statistici după etapele în care apar.

3.1.1 Indicatorii absoluți

Parcurgerea etapei de sistematizare primară a datelor statistice (prin înregistrare,


centralizare și grupare) determină obținerea indicatorilor absoluți.

46
Indicatorul absolut reprezintă acea mărime absolută prin care se exprimă direct
nivelul caracteristicii cercetate, în unități concrete de măsură, reflectând volumul unui
ansamblu sau valoarea unei caracteristici.
În raport cu metodologia lor de obținere, acești indicatori rezultă:
a) prin agregarea nivelelor individuale (indicatori de nivel).
Procesul de agregare presupune însumarea directă a valorilor individuale înregistrate cu
scopul determinării unui indicator absolut. Aplicarea metodologiei însumării presupune ca
elementele individuale să fie însumabile direct, adică să fie de aceeași natură și să fie exprimate
în aceeași unitate de măsură.
În funcție de nivelul la care se realizează agregarea, indicatorii pot fi:
- indicatori individuali – obținuți ca urmare a înregistrării statistice, exprimând valoarea
caracteristicii observate la nivelul fiecărei unități statistice ( xi , yi etc ); exemplu: numărul
sosirilor turiștilor la nivelul fiecărui tip de structură de primire turistică (pe hoteluri, moteluri
etc.).
- indicatori sintetici – rezultați prin centralizarea și gruparea unităților statistice la

nivelul întregii colectivități studiate (  xi ,  yi etc ); exemplu: numărul sosirilor turiștilor la


nivelul unei țări se obține prin însumarea sosirilor turiștilor aferente tuturor structurilor de
primire turistică din respectiva țară.
Ca o particularitate a acestui tip de indicatori absoluți, se poate evidenția situația în
care elementele individuale sunt exprimate în unități de măsură diferite, sau provin dintr-un
calcul statistic, caz în care se impune folosirea unor coeficienți de echivalență.

b) prin compararea sub formă de diferență a două nivele ale aceluiași indicator,
înregistrate pentru unități diferite de timp sau de spațiu, sau a două nivele a doi indicatori
diferiți.
Acești indicatori apar în statistică sub forma modificărilor absolute (sporului absolut),
determinate și ele sub forma:
- modificărilor individuale – determinate ca variație prin diferență la nivelul categoriilor
sau elementelor constitutive, prin relația:
X1 /i 0  xi1  xi 0 (3.1)
- modificărilor sintetice – rezultate ca diferență stabilită la nivelul colectivității
generale:
X1 /i 0   x i1   x i 0 (3.2)

3.1.2 Indicatorii relativi

Studierea statistică a problematicilor care vizează desfășurarea activităților din


economie presupune, de cele mai multe ori, stabilirea unor diferențe de nivel de la o unitate la
alta, de la o grupă la alta sau de la o colectivitate la alta. Explicarea acestor diferențe de nivel
presupune o comparare ce necesită determinarea unor indicatori ai căror rezultat se exprimă
prin intermediul mărimilor relative.
Indicatorii relativi reprezintă mărimi relative, ca indicatori derivați, ce
sintetizează rezultatele comparării datelor statistice în interiorul aceleiași colectivități de
la o grupă la alta sau de la o colectivitate la alta, într-o expresie numerică sub formă de
raport.
Aceștia reflectă câte unități din indicatorul de la numărător revin la o unitate a
indicatorului de la numitor, considerat baza de comparare.
Indicatorii implicați în determinarea indicatorilor relativi pot fi:

47
 de aceeași natură, înregistrați la unități diferite de timp/spațiu sau la grupe diferite ale
aceleiași colectivități,
 de natură diferită.
Problematica privind utilizarea indicatorilor relativi are în vedere:
a) Alegerea bazei de raportare, care vizează gradul de interdependență dintre
caracteristicile comparate sau scopul cercetării și presupune ca:
- în dinamică să se ia ca bază de comparare o perioadă considerată semnificativă sau
perioada precedentă;
- în plan teritorial, analiza se stabilește pe fiecare perioadă: baza de comparare se alege
în raport cu modificările teritoriale ale caracteristicilor social-economice care au ritmuri diferite
de dezvoltare.
b) Asigurarea comparabilității datelor care formează raportul presupune ca
indicatorii comparați să fie mărimi comparabile între ele prin sfera de cuprindere sau în sensul
că trebuie să existe o legătură de cauzalitate, logică, de condiționare permițând compararea în
timp și spațiu;
c) Stabilirea formei de exprimare a mărimilor relative are în vedere diferențele dintre
indicatorii comparabili, astfel încât rezultatul să fie ușor de înțeles și de interpretat. Cele mai
sugestive și utilizate forme de exprimare sunt: coeficienții și procentele.
Se recomandă exprimarea sub formă de coeficient în situația în care valorile
indicatorilor comparați sunt relativ apropiate. El arată câte unități din numărător revin la o
unitate a numitorului raportului.
Exprimarea sub formă procentuală (%) rezultă din înmulțirea coeficienților cu 100,
reflectând câte unități din numărător revin la 100 de unități ale numitorului.
Frecvent se face confuzie între „procent” și „punct procentual”. Spre exemplu, în cazul
creșterii cotei de T.V.A. de la 19% la 24%, frecvent s-a folosit expresia: „cota de T.V.A. a
crescut cu 5%, de la 19% la 24%”, ceea ce este greșit.
Exprimarea corectă este: „cota de T.V.A. a crescut cu 5 puncte procentuale, de la 19%
la 24%”.
O creștere cu 5 „unități de procent”, față de 19 procente, reprezintă o creștere cu
fracțiunea de 5⁄19 = 0,2632, sau, prin exprimarea acestui raport ca procent, înseamnă 26,32%.
Ori, între creșterea de 5%, calculată greșit, și creșterea de 26,32%, calculată corect, este o
diferență foarte mare.
Punctele procentuale rezultă din „diferența aritmetică dintre numerele mărimilor
exprimate în procente” și nu din „diferența aritmetică dintre mărimile exprimate în procente”.
În cazul creșterii cotei de T.V.A. de la 19% la 24%, „creșterea în punctele procentuale”
rezultă din:
 „diferența aritmetică dintre numerele mărimilor exprimate în procente”, respectiv dintre
24 – 19 = 5 puncte procentuale;
 nu din „diferența aritmetică dintre mărimile exprimate în procente”, nu din 24% – 19%
= 5% care nu exprimă nimic în acest caz.
Procentele(%) indică raporturi, nu diferențe sau, altfel spus, procentele (%) rezultă din
raporturi, nu din diferențe.
Important este a se reține faptul că în calculul punctelor procentuale nu se operează cu
mărimi exprimate procentual, ci numai cu numerele mărimilor exprimate procentual.
Există uneori situații în care trebuie să se sugereze cu claritate proporția reală dintre
datele supuse comparației (spre exemplu, dacă indicatorul din numărătorul raportului este cu
mult mai mic decât cel din numitor), ceea ce impune ca rezultatele să se exprime în promile,
prodecile, prodecimile. Rezultatul obținut va reflecta câte unități din indicatorul comparat revin
la 1000, 10000, respectiv 100000 de unități din baza de raportare.

48
În activitatea practică, indicatorii relativi au o largă aplicabilitate, ceea ce necesită o
clasificare a acestora în funcție de domeniul utilizării și scopul calculării lor, după cum
urmează:
 mărimi relative de structură;
 mărimi relative de coordonare;
 mărimi relative de intensitate;
 mărimi relative de dinamică.
Analiza mai detaliată a acestora permite o mai bună cunoaștere a posibilităților reale de
aplicare în activitatea practică.

3.2 MĂRIMILE RELATIVE

3.2.1 Mărimi relative de structură

O analiză mai detaliată a colectivităților supuse cercetării statistice presupune


descompunerea și studierea statistică a acestora pe grupe omogene după variația uneia sau mai
multor caracteristici de grupare. Grupele stabilite formează structura colectivității supuse
studiului.
Semnificativă pentru analiza statistică este stabilirea raportului în care se află fiecare
grupă față de total colectivitate, ceea ce presupune utilizarea indicatorilor relativi de structură.
Indicatorii relativi de structură se determină ca mărimi relative care arată în ce raport se
află fiecare parte față de întreg, astfel:
 pe baza frecvențelor absolute corespunzătoare grupelor (ni), fiind denumite frecvențe
relative (fi);
Ele se stabilesc ca un raport între numărul unităților din fiecare grupă și numărul
unităților din întreaga colectivitate și pot fi exprimate sub formă de:
 coeficient:
n
fi  k i , i = 1, k
 ni
(3.3)
i 1
 procent:
ni
fi %  k
100 , i = 1, k
n
(3.4)
i
i 1

Ca proprietate a mărimilor relative de structură: f i  1 ∑ fi = 1 dacă rezultatul este


sub formă de coeficient, respectiv ∑ fi* = 100 f i
%
 100% atunci când rezultatul este sub
formă procentuală.
 pe baza valorii caracteristicii aferente fiecărei grupe ( xi ), având denumirea de
pondere sau greutate specifică ( g i );
Greutatea specifică (ponderea) exprimă importanța fiecărei grupe sau părți în
nivelul absolut al caracteristicii pe total colectivitate. Ea se poate evidenția ca determinare
fie pe seria simplă, fie pe o serie cu frecvențe:

49
- pentru o serie simplă:
xi
gi  k
100 , i = 1, k
x
(3.5)
i
i 1
- pentru o serie de frecvențe:
xi ni
gi  k
100 , i = 1, k
xn
(3.6)
i i
i 1
Și în cazul greutăților specifice trebuie să se verifice egalitatea:
 g i = 100% (3.7)
Indicatorii relativi de structură se reprezintă grafic prin diagrame de suprafață denumite
și de structură, care pot fi: dreptunghiul, cercul, semicercul, pătratul, triunghiul etc.
Cele mai utilizate sunt:
 Dreptunghiul, care pentru reprezentare se dimensionează astfel: 1 cm = 10%, iar
lungimea dreptunghiului este formată din 10 cm, astfel încât suprafața să fie de 100%.

 Cercul pentru care scara de reprezentare se stabilește astfel:


3600 ..............100%
 => x0 
gi
 3600 (3.8)
x 0 ............... g i % 100
 Pătratul a cărui dimensionare se realizează prin împărțirea acestuia printr-o rețea de
drepte orizontale și verticale în 100 pătrățele, în care fiecare pătrățel să reprezinte 1%.

Exemplul 3.1:
Despre 4 tipuri de magazine care comercializează același tip de produse
cunoaștem următoarea distribuție a valorii încasărilor:
Tabel 3-1 Distribuția valorii încasărilor pe tipuri de magazine
Tipuri magazin Valoarea încasărilor (mil. U.M.)
A 10
B 24
C 14
D 12
Stabiliți structura valorii încasărilor pe tipuri de magazine și realizați o reprezentare
grafică.

Rezolvare:
Structura valorii încasărilor pe tipuri de magazine se poate determina astfel încât
rezultatul să fie sub formă de coeficient sau sub formă procentuală, după cum se prezintă în
tabelul următor:

50
Tabel 3-2 Algoritm de determinare a structurii valorii încasărilor pe tipuri de
magazine
Valoarea Structura valorii încasărilor
încasărilor xi xi
Tipuri (mil. U.M.) gi  4
(coeficient) gi  4
 100 (procentual)
x x
magazine
xi i i
i 1 i 1
A 10 10 : 60  0,1667 10 : 60 100  16,67%  17%
B 24 24 : 60  0,4 (24:60)100=40%
C 14 14 : 60  0,2333 (14:60)100=23%
D 12 12 : 60  0,20 (12:60)100=20%
4 4 4
Total  xi =60
i 1
 gi  1
i 1
g i 1
i  100

Reprezentarea grafică se prezintă ca diagramă de structură sub forma unui cerc:

Structura valorii încasărilor pe


A
tipuri de magazine

20% 17% B

C
23%
40%
D

Figura 3-2

Metodologia construirii graficului constă în determinarea unghiului la centru ce


revine fiecărei ponderi în parte, după cum urmează:
17 23
x A0   3600  61,20  magazinului A xC0   3600  82,80  magazinului C
100 100
40 20
xB0   3600  1440  magazinului B xD0   3600  720  magazinului D
100 100

x A0  x B0  xc0  x D0  61,2 0  144 0  82,80  72 0  360 0


Atât din rezultatele prezentate în tabelul cu algoritmul de calcul, cât și din grafic, se
observă că ponderea cea mai mare a valorii încasărilor este realizată de magazinele de tip B,
în timp ce magazinele de tip A realizează numai 17% din valoarea totală a încasărilor pe
produsele respective.

3.2.2 Mărimi relative de coordonare

În multe situații din activitatea practică apare necesitatea comparării:


 elementelor structurale componente ale aceleași colectivități
 mai multor colectivități de același tip existente în aceeași unitate de timp, dar în unități
teritoriale diferite.
Compararea, necesar a fi realizată în condițiile menționate anterior, presupune
determinarea mărimilor relative de coordonare sau corespondență (indicatorilor relativi de

51
coordonare) care se exprimă de cele mai multe ori sub formă de coeficienți, dar pot apare și sub
formă procentuală.
Exprimarea sub formă de coeficienți rezultă prin aplicarea relației:
X
kA/B = A (3.9)
XB
unde:
X A = nivelul grupei (colectivității) care se compară,
X B = nivelul grupei (colectivității) aleasă ca bază de comparație.

În analiza statistică a fenomenelor și proceselor stabilite ca urmare a derulării


activităților din economie, baza de comparație se alege în raport cu scopul cunoașterii.
Aceste mărimi se folosesc cel mai frecvent în studiul variației în profil teritorial, când
se compară același indicator din două unități teritoriale. De exemplu, se compară numărul
înnoptărilor structurilor de primire turistică dintr-un județ cu același indicator stabilit la nivelul
altui județ.
Reprezentarea grafică a mărimilor relative de coordonare se realizează prin diagrame
prin coloane sau prin benzi (coloanele sau benzile sunt plasate pe abscisă sau ordonată, iar
lungimea fiecărei coloane sau benzi este direct proporțională cu mărimea relativă de coordonare
reprezentată).

Exemplul 3.2:

Distribuția salariaților unui hotel după sexul acestora se prezintă astfel:

Tabel 3-3 Distribuția salariaților după sex


Grupe salariați Număr
după sex salariați
F 30
M 20

Să se determine mărimile relative de coordonare, luând ca bază de comparare atât


grupa persoanelor de sex feminin, cât și a celor de sex masculin.

Rezolvare:

Tabel 3-4 Algoritm de determinare a indicatorilor relativi de coordonare


Raport de coordonare față de:
Grupe salariați după sex Număr salariați
grupa F grupa M
F 30 30 : 30  1 30 : 20  1,5
M 20 20 : 30  0,67 20 : 20  1

Interpretare: numărul bărbaților angajați este de 0,67 ori mai mic decât al femeilor,
în timp ce numărul femeilor angajate în hotel este de 1,5 ori mai mare decât cel al bărbaților.

52
3.2.3 Mărimi relative de intensitate

Activitatea practică de multe ori impune stabilirea unui raport între două fenomene care
se află într-o relație de interdependență. Utilizarea acestui raport reprezintă de fapt determinarea
indicatorilor relativi de intensitate care au ca scop evidențierea gradului de răspândire a
fenomenului în raport cu mărimea celui ales ca bază de raportare.
Calculul indicatorilor relativi de intensitate depinde de nivelul la care se determină
aceștia:
 la nivelul fiecărei unități se aplică relația:
i x
K  (3.10)
x/ y y
unde:
x și y - valorile înregistrate pentru caracteristica X și Y la unitatea i;
K i - mărimea relativă de intensitate calculată pentru unitatea i.
 la nivelul unei grupe se aplică relația:

Kx / y 
x (3.11)
y
 La nivelul unei colectivități, se aplică relația:

Kx / y 
x yi i
(3.12)
y i
Exprimarea indicatorilor relativi de intensitate vizează unitățile de măsură specifice
celor doi indicatori comparați.
Specifici activităților de turism se pot prezenta câțiva indicatori relativi de intensitate,
dintre care mai utilizați sunt următorii2:
 nivelul salariului mediu ( s ), calculat ca raport între fondul de salarii ( FS ) dintr-o
anumită perioadă și numărul mediu de salariați ( T ) al aceleiași perioade:
FS
s (3.13)
T
 durata medie a sejurului ( d s ), care se calculează în mod asemănător, dar la nivelul
agențiilor de turism, prin raportarea numărului de turiști-zile (  TZ ) la numărul de turiști (  T
) participanți la acțiunile turistice:
ds 
 TZ
(3.14)
T
în care, numărul de turiști-zile se determină prin înmulțirea numărului de turiști
participanți la acțiunile turistice cu durata efectivă în zile a acțiunilor turistice ( d ):
 TZ   T  d (3.15)
 coeficientul sporului natural ( CSN ), determinat prin raportarea sporului natural ( SN
) la numărul locuitorilor ( P ), astfel:
SN
CSN  1000 (3.16)
P
 densitatea populației ( DP ) care se calculează prin raportarea populației ( P ) la
suprafața ( S ):

2
Secăreanu C., Gruiescu M. – op. citată, pg. 62-64.

53
P
DP  (3.17)
S
 productivitatea muncii ( W ), este un indicator stabilit prin raportarea producției ( Q )
la consumul forței de muncă ( C ),
Q
W (3.18)
C

Exemplul 3.3:

Se cunosc datele dintr-un județ privind numărul firmelor și cifra de afaceri


(CA) corespunzătoare acestora, distribuite după tipul lor în raport cu
mărimea acestora, astfel:

Tabel 3-5 Distribuția firmelor și CA după tipul lor


Grupe firme Număr CA
după tipul lor firme (mil. U.M.)
Mari 7 626
Mijlocii 15 1297
Mici 8 597
Total 30 2520

Stabiliți cifra medie de afaceri la fiecare tip de grupă și pe totalul firmelor la nivel
de județ.

Rezolvare:

Determinarea cifrei medii de afaceri pentru această aplicație, presupune stabilirea


mărimilor relative de intensitate, astfel:

Tabel 3-6 Algoritm de calcul a mărimilor relative de intensitate


Număr CA Cifra medie de afaceri
Grupe firme după tipul lor
firme (mil. U.M.) (mil. U.M./firmă)
Mari 7 626 626 : 7  89,43
Mijlocii 15 1297 1297 : 15  86,47
Mici 8 597 597 : 8  74,63
Total 30 2520 2520 : 30  84

Interpretare: La nivelul firmelor mari s-a stabilit cea mai mare cifră medie de
afaceri de 89,43 mil. U.M./firmă, în timp ce pentru cele mici cifra medie de afaceri a fost
înregistrată ca fiind doar de 74,63 mil. U.M./firmă.
Luând în considerare CA stabilită pentru toate cele 30 de firme de la nivelul
județului, s-a stabilit că, cifra medie de afaceri este de 84 mil. U.M./firmă.

54
3.2.4 Mărimi relative de dinamică

Procesul de comparare în timp a fenomenelor și proceselor stabilite ca urmare a derulării


activităților din economie are la bază determinarea mărimilor relative de dinamică.
Mărimile relative de dinamică (indici) reprezintă indicatorii relativi de dinamică, care
se determină prin raportarea aceluiași indicator înregistrat, dar pentru unități de timp diferite.
Relația stabilită cuprinde la numărător indicatorul cu nivelul din perioada curentă (x 1),
iar la numitor, același indicator cu nivelul din perioada considerată bază de comparație (x0).
Raportul astfel stabilit caracterizează evoluția în timp, în dinamică a fenomenului sau
procesului supus cercetării.
Dacă ne referim la indicii individuali care redau valoarea relativă doar a unui element
component al colectivității cercetate dintr-o perioadă față de altă perioadă anterioară, se poate
evidenția relația de calcul:
x1
k1/ 0   (100) (3.19)
x0
unde: x = caracteristica elementului component comparată în perioada curentă (1) față de cea
anterioară (0).
Dacă datele absolute preluate în urma cercetării privind indicatorul pe baza căruia se
analizează evoluția în timp se referă la mai multe unități de timp succesive, se pot calcula în
raport cu baza de comparare:
a) Indici cu bază fixă (indicatori relativi ai dinamicii cu bază fixă), care se determină
ca raport între nivelul termenului fiecărei perioade ( x t ) și nivelul termenului perioadei stabilită
ca bază de comparare, de obicei al primului termen ( x1 ).
x
ki / 0  i  (100) (3.20)
x0
b) Indici cu bază în lanț sau mobilă (indicatori relativi ai dinamicii cu bază în lanț sau
mobilă), care se determină ca raport între nivelul termenului fiecărei perioade ( x t ) și nivelul
termenului perioadei anterioare ( xt 1 );
x
ki / i 1  i  (100) (3.21)
xi 1
Mărimile relative ale planului se folosesc ori de câte ori un fenomen se desfășoară în
mod organizat, programat sau planificat. Agenții economici utilizează acești indicatori pentru
caracterizarea producției, aprovizionării, desfacerilor, costurilor, fondurilor de salarii, în funcție
de programele elaborate și urmărite.
Se pot determina:
- mărimile relative ale sarcinii de plan;
- mărimile relative ale îndeplinirii planului.
Mărimea relativă a sarcinii de plan se determină raportând nivelul planificat pentru
perioada curentă, la nivelul efectiv realizat într-o perioadă anterioară, luată drept bază de
comparație, după formula:
x
k pl / 0  pl  100 (3.22)
x0
Rezultatul arată cu cât la sută este mai mic sau mai mare nivelul planificat față de nivelul
realizat în perioada de bază.

55
Mărimea relativă a îndeplinirii planului se obține prin raportarea nivelului efectiv
realizat în perioada curentă, la nivelul planificat pentru perioada curentă. Formula de calcul
este:
x1
k1/ pl  100 (3.23)
x pl
Rezultatul poate fi interpretat astfel:
dacă este: - mai mare de 100%, s-a înregistrat o depășire de plan;
-egal cu 100%, planul a fost realizat integral;
- mai mic de 100%, planul nu a fost îndeplinit.
Între cei trei coeficienți există relația:
k1/ 0  k pl / 0 . k1/ pl (3.24)
Putem calcula mărimi relative ale planului la nivel de ansamblu, pentru variabile
însumabile direct:
 x pl x
K pl / 0  100 K 1/ pl   100
1
respectiv
x
(3.25)
 x0 pl

Mărimile relative de dinamică (Indicatorii relativi ai dinamicii) se exprimă atât sub


formă de coeficienți, cât și sub formă procentuală, alegerea făcându-se, în contextul dat, în
funcție de expresivitate și puterea de informare.

Exemplul 3.4:

Un agent comercial a realizat în lunile mai 2012 și iunie 2012 vânzări în valoare
de 1500 u.m., respectiv, 1850 u.m. La finalul lunii mai 2012 agentul comercial
și-a planificat un volum al vânzărilor pentru luna următoare de 2000 u.m.
Să se caracterizeze activitatea agentului comercial cu ajutorul mărimilor relative ale
dinamicii.

Rezolvare:
Centralizând datele prezentate în enunț, avem:

Tabel 3-7
Vânzări (u.m.)
Perioada
xi
Mai 2012 – realizat în perioada de bază (0) 1500
Iunie 2012 – planificat pentru perioada curentă (pl) 2000
Iunie 2012 – realizat în perioada curentă (1) 1850

În contextul datelor prezentate, putem calcula următorii coeficienți:


- Coeficientul de dinamică
 1,23 123%
x 1850 x1 1850
x
i1/0 = x1 = 1500 = 1,23(123%) k1/ 0  
0 x0 1500
În luna iunie 2012 volumul vânzărilor realizate reprezintă 123% din valoarea obținută în
luna precedentă. Sau, putem interpreta ritmul de dinamică (obținut prin scăderea cu 100
a valorii coeficientului), precizând că în luna iunie 2012 s-au realizat vânzări într-un
volum mai mare cu 23% față de cel înregistrat în luna mai 2012.
- Coeficientul sarcinii de plan

56
x pl
 1,33 133%
xpl 2000 2000
ixpl/0 = = 1500 = 1,33(133%) k pl / 0  
x0 x0 1500
Pentru luna iunie 2012 s-a planificat o creștere cu 33% a vânzărilor față de luna mai 2012
(perioada de bază sau de comparație).
- Coeficientul îndeplinirii planului
 0,92 92%
x 1850 x 1850
x
i1/pl = x 1 = 2000 = 0,92(92%) k1/ pl  1 
pl x pl 2000

Reprezentarea grafică a mărimilor relative de dinamică presupune construirea unei


cronograme sau a diagramei prin coloane.

3.3 MĂRIMI MEDII DE CALCUL (PROPRIU – ZISE)

Noțiunea, importanța și rolul mărimilor medii în cunoașterea statistică a realității

Mărimile medii caracterizează în mod sintetic, generalizat și într-o singură expresie


numerică ceea ce este esențial, normal, tipic și reprezentativ în cadrul unei colectivități statistice
sub aspectul unei caracteristici a unităților statistice.
Media sau valoarea tip poate fi considerată valoarea variabilei statistice
corespunzătoare frecvenței maxime, mărimea ei situată la mijlocul șirului de valori, ordonate
crescător ori descrescător, sau mărimea medie a variabilei statistice obținută prin calcule
specifice, luând în considerare toate variantele acesteia sau uneori doar o parte a lor situate în
centrul șirului ordonat al acestora.
Influența factorilor esențiali, care au acționat asupra unităților statistice dintr-o
colectivitate sub aspectul unei anumite caracteristici a unităților statistice se determină cu
ajutorul mărimilor medii. Influența factorilor sistematici și a celor întâmplători, care au acționat
asupra unităților statistice dintr-o colectivitate statistică, determină împrăștierea sau variația
nivelurilor individuale ale unei anumite variabile statistice în jurul nivelului ei mediu fiind
măsurată de către indicatorii variației, ai dispersării sau împrăștierii și concentrării.
În practica statistică mărimea medie se utilizează pentru caracterizarea tendinței și
ritmului de dezvoltare a fenomenelor colective, pentru studierea legăturilor dintre fenomene,
pentru descoperirea tendințelor, legilor, legităților și regularităților lor de dezvoltare.
Omogenitatea colectivităților statistice constituie o condiție indispensabilă pentru a
asigura mărimii medii un conținut real și reprezentativ, un caracter științific.

Clasificarea mărimilor medii

În teoria statistică se cunosc, și în practică se utilizează, numeroase mărimi medii, care


diferă între ele prin definiția lor, prin modul de calcul, cât și prin conținutul și rolul lor specific
pe care-l îndeplinesc în studierea colectivităților statistice, cum ar fi: media aritmetică, media
cronologică, media pătratică, mediile mobile, media armonică, media geometrică, mediana,
modul, mediala etc.
Alegerea tipului mediei trebuie să pornească de la natura datelor din care se calculează
o medie.
Pentru sistematizarea studiului lor, mărimile medii se pot clasifica după criterii diferite,
cum ar fi: modul de determinare, importanța lor în cercetarea statistică, felul seriei statistice
pentru care se calculează etc.

57
a) În funcție de modul lor de determinare, mărimile medii se pot împărți în două
categorii:
- indicatori propriu-ziși ai tendinței centrale sau medii propriu-zise: media aritmetică,
media geometrică, media armonică, media cronologică, media pătratică, media cubică, media
de ordin superior, mediile mobile etc.;
- indicatori ai localizării: mediana, modul, mediala și alte mărimi medii înrudite cu
acestea.

b) După importanța lor în practica statistică, mărimile medii se pot clasifica în două
mari categorii:
- mărimi medii de bază sau fundamentale: media aritmetică, mediana, mediala, modul
etc.;
- mărimi medii cu aplicații speciale: media armonică, media geometrică, media
cronologică, media pătratică, mediile mobile etc.

c) În funcție de felul seriei (simplă sau cu frecvență) pentru care se calculează, mărimile
medii se împart în două categorii și anume:
- mărimi medii simple sau neponderate (în cazul seriilor simple);
- mărimi medii ponderate (în cazul seriilor cu frecvență).

Mărimile medii reprezintă valori teoretice ale variabilelor statistice și se exprimă în


aceleași unități de măsură ca și acestea.

3.3.1 Media aritmetică

Media aritmetică poate fi aplicată în cazul unei variabile măsurate printr-o scală de
raport (metrică), iar datele din care se calculează sunt valori primare, direct măsurabile. Teoretic
ar trebui ca valorile empirice observate să tindă să formeze o progresie aritmetică.
Media aritmetică are avantajul că este ușor de aplicat si este ușor de înțeles. Media
aritmetică are marele dezavantaj că este sensibilă la valorile extreme.
Media aritmetică a unui șir de valori individuale ale unei variabile statistice este egală
cu raportul dintre suma și numărul lor.
1) în cazul unei serii simple se utilizează media aritmetică simplă sau neponderată;
2) în cazul unei serii cu frecvență se calculează media aritmetică ponderată.
Dacă considerăm o variabilă statistică X cu variantele ei x1, x2, ..., xi, ..., xn atunci media
aritmetică a acestei variabile statistice, notată cu x , este egală cu:
n

x i
1 n (3.26)
x i 1

n

sau x 
n i 1
xi

Deoarece fiecare nivel individual xi al variabilei statistice se întâlnește o singură dată


sau de un număr constant de ori, în cadrul seriei luate în considerație, formula (3.26), poartă
denumirea de medie aritmetică simplă. Din formula (3.26) rezultă că pentru determinarea
mediei aritmetice nu este necesar să cunoaștem toate nivelurile individuale ale unei variabile
statistice ci doar suma nivelurilor individuale și numărul acestor niveluri.

58
Exemplul 3.5:

Pe baza recensământului din 18 martie 2002 din România, pentru a se obține


dimensiunea M( x ) a unei gospodării, se împarte efectivul total al populației țării
21698181 persoane la numărul de gospodării 7392131:
n

Efectivul total al populatiei


i 1
Pi
21698181
x = = = 2,94 persoane
Numarul de gospodarii Ng 7392131
Rezultă că, în România, numărul mediu de persoane dintr-o gospodărie, la data
recensământului, a fost de 2,94 persoane, deci aproape 3.

Dacă numărul variantelor unei variabile statistice este foarte mare, calculul mediei ( x )
se poate simplifica formând, în prealabil, seria cu frecvență pe variante (tabel 3.8) sau pe
intervale (tabel 3.10).

Tabel 3-8 Forma generală de prezentare a unei serii de repartiție


Nivelurile Frecvența Frecvența Frecvența relativă
Frecvența relativă
caracteristicii absolută absolută cumulată cumulată
fi
xi ni N ( xi )  F ( xi ) 
x1 n1 f1 N ( x1 ) F x1 
x2 n2 f2 N ( x2 ) F x2 
    
xi ni fi N  xi  F  xi 
    
xk nk fk N xk  F xk 
k k
Total  ni  n
i 1
f
i 1
i 1 - -

În cazul grupării nivelurilor individuale ale variabilei statistice pe variantele ei (tabel


3.8), x se va determina pe baza definiției formulate anterior:

x n i i
x i 1
k (3.27)
 ni
i 1

Exemplul 3.6:
Ora de sport a unei clasei a-IX-a dintr-un liceu începe cu măsurarea înălțimii elevilor,
distribuția lor prezentându-se astfel:

Tabel 3-9
Înălțime (m) 1,53 1,54 1,57 1,58 1,60 1,65 1,70 1,72 1,75 1,82
Număr elevi 1 3 4 6 1 7 2 3 2 1

Stabiliți înălțimea medie pe elev determinată pentru cei 30 elevi.

59
Rezolvare:
Înălțimea medie pe elev se determină prin aplicarea relației mediei aritmetice ponderate:

 xi ni 1,53 1  1,54  3  1,57  4  1,58  6  1,60 1  1,65  7  1,70  2  1,72  3  1,75  2  1,82 1
x 
 ni 30
x  1,63 m / elev

Interpretare:
S-a stabilit la nivelul clasei, că înălțimea medie pe elev este de 1,63 m/elev.

În cazul unei serii cu frecvență și cu caracteristica unității statistice distribuită pe


intervale (tabel 3.10) este necesar să se determine mai întâi câte o valoare reprezentativă a
fiecărui interval.

Tabel 3-10 Serie de repartiție cu caracteristica sub formă de intervale


Frecvența Frecvența Frecvența relativă
Caracteristica Frecvența relativă
absolută absolută cumulată cumulată
xi 1  xi  ni  N   fi  F 
i i

x0  x1 n1 N1 f1 F1
x1  x2 n2 N2 f2 F2
    
xi 1  xi ni Ni fi Fi
    
xk 1  xk nk Nk fk Fk
k k
Total n
i 1
i - f i 1
i 1 -

Admițându-se convențional că, în cadrul fiecărui interval, caracteristica unității


statistice se distribuie în mod uniform, mijlocul intervalului, respectiv x i' este valoarea
reprezentativă a fiecărui interval.
k

x n '
i i
xi 1  xi
x i 1
k
unde xi'  (3.28)
n
2
i
i 1
Media aritmetică determinată pentru o distribuție grupată pe intervale este întotdeauna
aproximativă. Pentru seriile cu intervale, în care unul sau ambele intervale marginale sunt
deschise, nu se recomandă utilizarea mediei aritmetice.

Proprietățile mediei aritmetice

Media aritmetică posedă o serie de proprietăți a căror cunoaștere este utilă pentru mai
buna înțelegere a conținutului acestui indicator, ca și pentru efectuarea unor calcule simplificate
ale ei.
1. Media aritmetică este o valoare internă a unei serii.
x1 < x < x s (3.29)

60
2. Media aritmetică a unui șir de valori constante este egală cu valoarea lor comună.
Fie: x1 = x 2 = x3 = . . . = x s = k = x
3. Media aritmetică este asociativă. În cadrul unei serii statistice, dacă se înlocuiesc mai
multe variante ale variabilei statistice cu mărimea medie a lor, atunci mărimea medie a seriei
modificate este egală cu mărimea medie a seriei inițiale.
În particular, dacă într-o serie statistică se înlocuiesc toate nivelurile individuale ale
variabilei statistice cu x al lor, atunci volumul total al variabilei statistice rămâne nemodificat.
4. Media aritmetică crește sau descrește atunci când una sau mai multe variante ale
variabilei statistice cresc sau descresc.
În cazul general considerând că r - p, valori ale variabilei statistice se modifică cu o
constantă q, media seriei modificate va fi:
r

'
q n i

x  x  x  q unde p < r < n


p
s
(3.30)
ni 1
i

5. Media aritmetică este translativă. Dacă se mărește sau se micșorează fiecare nivel
individual al variabilei statistice dintr-o serie, cu o cantitate constantă a, x se mărește sau se
micșorează cu acea constantă. ( a  x ).
s s s

'
 (x i  a )  ni x i  ni  a   n i
x  i 1
s
 i 1
s
i 1
 xa
n
i 1
i n
i 1
i

Rezultă:
n s

 xi ni  (x i  a)  (x i  a ) ni
x x i 1
 a și x  i 1
a (3.31)
 ni s

n
n
i
i 1
Pentru a obține o simplificare maximă a calculelor, constanta a se alege egală cu un
nivel al caracteristicii unității statistice din centrul seriei ordonate, apropiat de valoarea medie
x.
6. Dacă se mărește sau se micșorează fiecare variantă a variabilei statistice de un anumit
număr de ori k, atunci și x a seriei modificate se mărește sau se micșorează de același număr
de ori k, k  0 .
În baza proprietății (6) se obțin următoarele formule de calcul simplificat:
n s
xi xi
i 1 k

i 1 k
 ni
x  k și x  s
k (3.32)
 ni
n
i 1
În formulele (3.32), pentru a se obține simplificarea maximă a calculelor, este necesar
ca valoarea constantei k să fie egală cu cel mai mare divizor comun al variantelor x i .
7. Media aritmetică rămâne neschimbată dacă frecvențele fiecărei variante a variabilei
se măresc sau se micșorează de un anumit număr de ori m.
Pentru a obține cea mai mare simplificare a calculelor valoarea constantei m se
consideră egală cu cel mai mare divizor comun al frecvențelor ni .

61
În particular, dacă constanta m este egală cu totalul frecvențelor prin raportarea lui ni
la m, se face trecerea de la o serie cu frecvențe absolute la seria corespunzătoare cu frecvențe
relative.
s

s x i  fi
x   xi  f i sau x i 1

i 1 100
Rezultă că x a unei serii nu se schimbă, dacă se calculează pe baza frecvențelor absolute
sau pe baza celor relative.
Evident, dacă se utilizează în calculul x concomitent mai multe proprietăți ale ei, se
obține o simplificare mai mare a calculelor.
Astfel, utilizând proprietățile 5 și 6, se obțin următoarele formule de calcul simplificat:
n
xi  a s
xi  a
 k
 k
 ni
x i 1
 k  a și x  i 1
s
k  a (3.33)
 ni
n
i 1
Utilizând proprietățile 5, 6 și 7 se obține cea mai mare simplificare a calculelor:
s
x i  a ni
 k

m
x i 1
s
k  a (3.34)
ni
i 1 m
8. Suma algebrică a abaterilor variantelor unei variabile statistice de la nivelul ei mediu
este egală cu zero, deoarece abaterile în plus de la x se compensează cu abaterile în minus.
n n

 ( xi  x)  0 și
i 1
 (x
i 1
i  x )  ni  0 (3.35)
9. Suma pătratelor abaterilor nivelurilor individuale ale variabilei statistice de la nivelul
ei x este mai mică decât suma pătratelor abaterilor de la oricare alt număr a, a  x .
 În cazul unei serii simple se verifică relația:
n n

 ( xi  x) 2 <
i 1
 (x
i 1
i  a) 2 (3.36)

 Pentru o serie cu frecvențe demonstrația se realizează similar, proprietatea 9 fiind


valabilă și în acest caz:
n n

 ( x i  x ) 2  ni <
i 1
 (x
i 1
i  a) 2  ni unde 0 < a  x (3.37)

Exemplul 3.7:

În vederea efectuării calculului obișnuit și simplificat al mediei aritmetice


considerăm seria din tabel 3-11 și 3-12.
Tabel 3-11 Calculul obișnuit al mediei ( x )
Nivelul Numărul
salariului salariaților x i' xi'  ni fi xi' f i
(lei) ( ni )
1600 - 2000 20 1800 36000 5 9000
2000 - 2400 30 2200 66000 7,5 16500
2400 - 2800 45 2600 117000 11,25 29250

62
2800 - 3200 50 3000 150000 12,50 37500
3200 - 3600 55 3400 187000 13,75 46750
3600 - 4000 70 3800 266000 17,50 66500
4000 - 4400 50 4200 210000 12,50 52500
4400 - 4800 35 4600 161000 8,75 40250
4800 - 5200 30 5000 150000 7,50 37500
5200 - 5600 15 5400 81000 3,75 20250
Total 400 - 1424000 100 356000

 În cazul utilizării frecvențelor absolute ( ni ):


10

x '
i  ni
1424000
x i 1
10
 = 3560 lei
n
400
i
i 1

Unde: x i' reprezintă mijlocul fiecărui interval, considerat o valoare reprezentativă în


ipoteza distribuirii liniar – uniforme a caracteristicii unității statistice.

 În cazul utilizării frecvențelor relative ( f i ):


10 10

 xi'  fi x  f '
i i
356000
x i 1
10
 i 1
  3560 lei
f
100 100
i
i 1

Unde: x reprezintă mijlocul fiecărui interval, considerat o valoare reprezentativă în ipoteza


'
i
distribuirii liniar – uniforme a caracteristicii unității statistice.
Utilizând proprietățile 5 și 6, pe baza metodologiei de calcul din tabelul 3-12, rezultă:
10
xi'  a
 k
 ni
160
x i 1
10
k  a   400  3400  3560 lei/lună
 ni
100
i 1

Unde: k  400 este cel mai mare divizor comun al variantelor


xi : 1600, 2000, 2800, ..., 5200, 5600
3600  3200
Deoarece x  3200;3600  a  x5   3400
2
O altă simplificare a calculelor rezultă din aplicarea proprietăților 6 și 7, în care m  5
este cel mai mare divizor comun al frecvențelor absolute ni : 20, 30, 45, ..., 30, 15 :
10
xi' ni

i 1 k

m 712
x  10 k   400  3560 lei/lună
ni

100
i 1 m

63
Tabel 3-12 Calculul simplificat al mediei ( x )
Nivelul
Numărul
salariului
salariaților xi'  a
xi'  a xi'  a ni xi' ni xi'  a ni
(lei) x i'  ni  
( ni ) k k m k m k m
( xi 1  xi )
1600 - 2000 20 1800 -1600 -4 - 80 4 18 -16
2000 - 2400 30 2200 -1200 -3 - 90 6 33 -18
2400 - 2800 45 2600 -800 -2 - 90 9 58,5 -18
2800 - 3200 50 3000 -400 -1 - 50 10 75 -10
3200 - 3600 55 3400 0 0 0 11 93,5 0
3600 - 4000 70 3800 400 1 70 14 133 14
4000 - 4400 50 4200 800 2 100 10 105 20
4400 - 4800 35 4600 1200 3 105 7 80,5 21
4800 - 5200 30 5000 1600 4 120 6 75 24
5200 - 5600 15 5400 2000 5 75 3 40,5 15
Total 400 - - - 160 80 712 32

Simplificarea cea mai mare a calculelor se obține prin aplicarea formulei (3.30), care
înglobează simultan proprietățile 5, 6 și 7:
10
xi'  a ni
 k

m 32
x i 1
10
k  a   400  3400  3560 lei/lună
ni

80
i 1 m

Astfel de simplificări ale calculelor se pot obține și în cazul seriilor cu frecvență


relativă.

Media aritmetică a unei caracteristici binare

Considerăm o colectivitate formată din n unități statistice din care n1 posedă varianta
x1 , iar n 2 posedă nivelul x 2 al variabilei statistice.

Tabel 3-13 Serie cu caracteristica unității statistice binară


Variantele variabilei ( x i ) Frecvența absolută ( ni ) Frecvența relativă ( f i )
x1 =1 n1 p
x 2 =0 n2 q
Total n 1
Dacă notăm cu x1 = 1 și x 2 = 0 cele două variante ale caracteristicii unităților statistice,
forma generală a unei distribuții binare se prezintă în tabelul 3.13, unde se verifică relațiile:
n n n n
n1  n2  n p  1 q  2 și p  q  1  2  1
n n n n
Media aritmetică a unei variabile statistice binare devine:
2

x n i i
1  n1  0  n2 n1 n
x i 1
   1 p (3.38)
2
n1  n2 n1  n2
n
n
i
i 1
Rezultă că media aritmetică a unei caracteristici a unităților statistice alternative este
egală cu frecvența relativă a unităților care posedă varianta x1 a variabilei statistice.

64
Exemplul 3.8:

Să considerăm, pentru exemplificare, distribuția populației României după


variabila statistică mediul social la recensământul populației și locuințelor din
2002 (tabel 3.14).

Tabel 3-14 Distribuția populației României după mediul social la recensământul


populației și locuințelor din 2002
Mediul Frecvența Frecvența
social absolută (persoane) relativă
Urban = 1 11435080 0,53
Rural = 0 10245894 0,47
Total 21680974 1
Sursa: prelucrat după Recensământul populației și al locuințelor din 18 martie 2002, vol. I,
Institutul Național de Statistică, București, 2003, p.4.

În prima variantă de calcul, utilizând frecvențele absolute, obținem:


2

x n i i
1  11435080  0  10245894 11435080
x i 1
   0,53
2
11435080  10245894
n
21680974
i
i 1
Prin folosirea frecvențelor relative se obține în final același rezultat:
2

x i fi
1  0,53  0  0,47 0,53
x i 1
   0,53
2
0,53  0,47
f
1,00
i
i 1

În concluzie, media aritmetică a unei variabile statistice alternative este o mărime


relativă de structură, care evidențiază ponderea unităților statistice care posedă caracteristica
unităților statistice luată în studiu din totalul unităților statistice care alcătuiesc colectivitatea
statistică cercetată. Astfel, în cadrul exemplului considerat, valoarea mediei aritmetice de
0,53 ne arată faptul că 0,53 (sau 53%) din totalul populației României posedă nivelul 1 al
caracteristicii unității statistice, adică aparțin mediului urban.

3.3.2 Media armonică

Media armonică ( x h ) este o formă transformată a mediei aritmetice și se determină ca


o medie aritmetică inversă, calculată din mărimile inverse ale variantelor variabilelor statistice.
k

n i
xh  k
i 1
(3.39)
1

i 1 x i
 ni

Ca și în cazul celorlalte mărimi medii, atunci când frecvențele tuturor nivelurilor


individuale ale unei variabile statistice sunt egale, acestea se pot neglija obținându-se, din relația
(3.35) formula x h a mediei armonice simple:

65
k
xh  k
1
x
(3.40)
i 1 i

Din formulele (3.39) și (3.40) rezultă că mediile armonice se pot aplica numai atunci
când toate variantele variabilei statistice sunt valori pozitive ( x i > 0) și este imposibil de calculat
pentru o variabilă statistică care are cel puțin una dintre variante egală cu zero, deoarece din
punct de vedere matematic se ajunge la o nedeterminare.
În practică, dacă o serie este formată dintr-un număr redus de termeni, calculul mediei
armonice se poate efectua pe baza unor formule echivalente și simplificatoare:
2x  x 2 3x1  x2  x3
xh  1 2  și x h 
x1  x 2 1 1 x1  x2  x1  x3  x2  x3 (3.41)

x1 x 2

Ca regulă, media armonică trebuie folosită când datele din care se calculează media nu
sunt date primare ci sunt date derivate, rezultate din calcule, respectiv sunt mărimi relative de
structură sau mărimi relative de intensitate. Aceste mărimi relative pot fi interpretate drept
medii parțiale, din care trebuie calculată o medie totală / generală.
În practica statistică si în analiza activității economice, media armonică se folosește cel
mai frecvent la calculul indicelui prețurilor de tip Paasche (vezi capitolul 8: Indici statistici).

Exemplul 3.9:
Să presupunem că un automobil parcurge dus și întors distanța de 100 km dintre
două localități (A) și (B) cu viteze diferite. La dus realizează viteza de v1 = 80
km/h, iar la întoarcere v 2 = 100 km/h. Se cere să se determine viteza medie a
automobilului pe întregul parcurs.
Viteza medie a automobilului calculată cu ajutorul mediei aritmetice ar fi:
v1  v2 80  100
v   90km / h
2 2
Dacă x  v ar însemna că întreaga distanță de 200 km a fost parcursă cu o viteză
medie de 90 km/h, lucru care nu corespunde realității deoarece nu ține seama de timpul
utilizat la ducere și la întoarcere.
De aceea, în acest caz x  v , calculul corect al vitezei medii a automobilului se poate
face cu ajutorul mediei armonice simple pe baza formulei (3.40) sau (3.41):
n 2 2 1600
vh  2     88,88 km/h
1 1 1 10  8

18

i 1 vi 80 100 800

Interpretare: Viteza medie a automobilului pe întregul parcurs a fost 88,88 km/h.

66
3.3.3 Media geometrică

Media geometrică ( x g ) se utilizează în practică pentru determinarea nivelului mărimii


medii a fenomenelor care se dezvoltă în progresie geometrică sau după o lege exponențială.

 n lg x
k

 k

 xini sau lg x g 
ni i i
xg  i 1 i 1
(3.42)
k
i 1
ni 1
i

Din formula (3.42) se observă că, dacă cel puțin o variantă a unei variabile statistice este
egală cu zero, atunci x g a seriei este zero. De asemenea, dacă cel puțin una dintre variantele
variabilei statistice este mai mică decât zero, atunci x g este un număr imaginar.
Aceasta înseamnă că logaritmul x g este egal cu media aritmetică a logaritmilor
termenilor seriei. De aceea, x g mai poartă și denumirea de medie logaritmică.
Situația în care frecvențele tuturor nivelurilor individuale ale unei variabile statistice
sunt egale, permite aplicarea următoarei formule (3.42) a mediei geometrice (logaritmice)
simple:
k
1 k
xg  k x i
sau lg x g   lg xi
k i 1
(3.43)
i 1

În cazul unei serii formate numai din două variante x1 și x 2 x g devine:

x g  x1  x2 (3.44)

Calcularea mărimii medii cu ajutorul x g are semnificație economică doar în situația


când există o relație de multiplicare între termenii unei serii statistice.
De cele mai multe ori, media geometrică se aplică când seria este formată din termeni
care reprezintă mărimi relative de dinamică.
Din modificări relative exprimate sub formă de coeficienți (rate de creștere) nu se
calculează direct media geometrică. Aceste date se transformă mai întâi în indici, adăugând 1,
urmând ca din datele obținute să se calculeze media geometrică. Creșterea medie se obține dacă
din rezultatul mediei geometrice se scade 1.

Exemplul 3.10:
Să presupunem pentru aprofundarea noțiunii următorul exemplu: în anii 2003,
2004 și 2005 o firmă a realizat o cifră de afaceri de 5.000 euro, 10.000 euro și
respectiv 60.000 euro. Utilizând aceste informații se urmărește să se determine
de câte ori a crescut în medie pe an cifra de afaceri pentru întreaga perioadă
considerată. Se observă imediat că între anii 2003 și 2004 s-a înregistrat o dublare a cifrei de
afaceri, iar între 2004 și 2005 a avut loc o creștere de 6 ori a acestui indicator.

x g  2  6  3,4641 ori pe an

67
Interpretare:
Astfel, creșterea mărimii medii anuală reală pentru perioada considerată 2003 – 2005
a fost de aproximativ 3,4641 ori pe an, deoarece dacă pornim de la valoarea de 5.000 euro în
anul 2003 și cifra de afaceri s-ar multiplica de 3,4641 ori în 2004 și de 3,4641 ori în 2005, în
acest ultim an ea ar înregistra o valoare de 59.999,9 euro, deci ar coincide aproape cu valoarea
reală de 60.000 euro, fapt care justifică utilizarea în cadrul acestui exemplu a x g .

3.3.4 Media pătratică

Media pătratică ( x p ) se calculează din pătratele termenilor seriei. Se recomandă a fi


folosită atunci când în colectivitate predomină valorile mari (serie asimptotică către valorile
mari) sau atunci când termenii au atât valori pozitive, cât și negative.
Cu alte cuvinte, media pătratică este acea valoare care, înlocuind termenii înregistrați
ai seriei de date, nu modifică suma pătratelor acestora:
n
x12  x22  ......  xn2   xi2 (3.45)
i 1
n
x p  x p  ......  x p   xi2
2 2 2
(3.46)
i 1
n
n  x p   xi2
2
(3.47)
i 1
de unde rezultă:
- pentru serii simple, media pătratică simplă:

xp 
x 2
i
(3.48)
n
- pentru serii de frecvență, media pătratică ponderată:

xp 
x n 2
i i
(3.49)
n i

Media pătratică are proprietățile următoare:


- este cuprinsă între valoarea minimă și cea maximă a seriei de date;
- este influențată într-o foarte mare măsură de variantele cu o valoare mare, deoarece,
prin ridicare la pătrat, se mărește importanța (influența) acestora în calcul.
Media pătratică se aplică cel mai frecvent la calculul abaterii medii pătratice, care este
unul din cei mai utilizați indicatori sintetici de variație.

3.3.5 Media cronologică

Se utilizează la calculul mediei termenilor unei serii cronologice de momente.


Momentele pot fi situate la intervale egale și atunci se utilizează media cronologică simplă:
x1 x
 x 2  x3  ...  x n 1  n
(3.50)
x cr  2 2
n 1
Dacă momentele se situează la intervale neegale atunci se utilizează media cronologică
ponderată:

68
f1 f  f2 f  f3 f  fn f
x1  x2 1  x3 2  ...  x n 1 n 1  xn n
x cr  2 2 2 2 2
n (3.51)
 fi
i 1
unde:
fi = mărimea intervalelor (număr zile) și fiecare termen xi se ponderează cu jumătate din
mărimea intervalelor alăturate.

3.4 MĂRIMI MEDII DE POZIȚIE

3.4.1 Modul (Mo) sau Dominanta (Do)

Modul este acea valoare a caracteristicii care are frecvența absolută (relativă) cea mai
mare. Este o mărime medie de poziție și se determină, conform definiției, prin aflarea frecvenței
maxime a distribuției și apoi a valorii caracteristicii corespunzătoare acesteia.
În cazul unei serii cu caracteristica prezentată sub formă de intervale, determinarea
modului presupune efectuarea unei interpolări în interiorul intervalului modal (intervalul
corespunzător frecvenței maxime) după formula:
1
M0 = xi-1+d (3.52)
1   2
unde:
xi-1 = limita inferioară a intervalului modal;
d = dimensiunea (mărimea) intervalului modal;
1 = diferența dintre frecvența intervalului modal și frecvența intervalului anterior celui
modal;
2 = diferența dintre frecvența intervalului modal și frecvența intervalului următor celui
modal.
Valoarea modului se poate afla și prin metoda grafică, folosind poligonul frecvențelor
(în cazul seriilor calitative pe variante) sau histogramă (în cazul seriilor calitative de intervale).
Valoarea modului este dată de abscisa corespunzătoare ordonatei maxime.
Proprietățile modului:
a) Modul este cuprins între cea mai mică și cea mai mare valoare a caracteristicii
xmin M0 xmax iar verificarea proprietății este evidentă din definiția modului
b) Dacă se împart frecvențele absolute sau relative ale unei serii printr-o constantă m
atunci valoarea modului nu se schimbă
ni ni 1

m m 1
M0 = xi-1+d  xi 1  d  M0 (3.53)
 ni ni 1   ni ni 1  1   2
      
m m  m m 
c) Dacă se mărește sau se micșorează fiecare nivel individual al caracteristicii unei serii
cu o anumită constantă a atunci valoarea modului se mărește sau se micșorează cu acea
constantă.
1 1
M0= (xi-1a) + d  xi 1  d  a  M0  a (3.54)
1   2 1   2
d) Dacă se înmulțește sau se împarte fiecare nivel individual al caracteristicii unei serii
printr-o constantă k, atunci modul se mărește, respectiv se micșorează de același număr de ori.

69
xi 1 xi  xi 1 1 1
M 0'     M0
k k 1   2 k
1
M0’= kxi-1+k(xi-xi-1)  kM 0 (3.55)
1   2
Din combinarea ultimelor 3 proprietăți obținem:
ni ni 1

xi 1  a xi  a xi 1  a m m 1 1 
M0 
'
(  )   xi 1  d  a  
k k k  ni ni 1   ni ni 1  k 1   2 
      
m m  m m 

1
k
M 0  a 
Deci M0= kM0  a (3.56)

Exemplul 3.11:
Utilizând distribuția prezentată în tabelul de mai jos (3-15) să se determine
valoarea mediei cu ajutorul modului.
Tabel 3-15
xi
ni
(se exprimă în nr. de minute)
<30 25
30-60 50
60-90 60
90-120 45
120-150 15
150 și peste 5

Determinarea modului impune aflarea intervalului modal care se găsește în dreptul


frecvenței maxime și efectuarea unei interpolări.
Frecvența maximă este 60, iar intervalul modal găsit în dreptul ei 60-90.
1 60  50
M 0  xi 1  d  60  30  72
1   2 60  50  60  45
M0 = 72 minute
Astfel, durata cea mai des regăsită în cadrul distribuției analizate este de 72 de minute.

În cazul unei serii pe variante, modul se stabilește ca fiind tipul sau valoarea
caracteristicii ( xi ) căreia îi corespunde frecvența cea mai mare.

70
Exemplul 3.12:

Dintr-o grupă de 25 studenți, 20 au luat note de trecere la examenul de statistică,


repartiția lor prezentându-se astfel:
Tabel 3-16
Note studenți Număr studenți
xi ni
5 5
6 2
7 3
8 6
9 2
10 2
Care este nota cea mai des obținută de studenți?

Rezolvare:
Distribuția studenților după note, prezentată în tabelul 3-16 formează o serie de
frecvență pe variante. Variabila „Note studenți” este cantitativă, iar modul se determină ca
valoare a caracteristicii căreia îi corespunde frecvența cea mai mare.
Cum cei mai mulți studenți ( nmax  6 studenți) au obținut nota 8, rezultă că modul
este M 0  8, fiind nota cea mai des obținută de studenți la examenul de statistică.

Modul prezintă avantajul că se poate stabili și pentru o variabilă calitativă. De exemplu,


în analizele de marketing se poate stabili culoarea cea mai frecvent solicitată la articolele de
îmbrăcăminte sau încălțăminte.
De precizat faptul că modul este o valoare foarte instabilă. Simpla deplasare cu câteva
unități (deci reluarea grupării) poate să modifice sensibil valoarea modului.
Pentru seriile cu un pronunțat caracter de asimetrie, valoarea dominantă nu are sens să
fie folosită pentru a caracteriza tendința centrală. În acest caz, se recomandă să se folosească
grupări combinate care să separe colectivitatea înregistrată pe mai multe grupe de variație,
aparținând unor structuri diferite.
Este important de remarcat că modul este un indicator al tendinței centrale care are sens
în cazul unei repartiții după o variabilă nominală sau ordinală.

Exemplul 3.13:

Se consideră următoarea distribuție după variabila nivel de instruire

Tabel 3-17
Nivel de instruire Număr persoane
xi ni
Primar 5
Gimnazial 10
Liceal 30
Postliceal 15
Universitar 20
Fără școală absolvită 2

71
Variabila studiată este de tip calitativ și este evident faptul că singurul indicator din
categoria mărimilor medii ce poate fi determinat la nivelul acestei distribuții este modul.
Valoarea modală este varianta Învățământ liceal, varianta ce corespunde grupului celui mai
numeros din rândul persoanelor incluse în studiu.

3.4.2 Mediana (Me)

Mediana reprezintă acel nivel al caracteristicii unei serii ordonate crescător sau
descrescător care împarte o distribuție în 2 părți egale: jumătate din unitățile colectivității au
valori ale caracteristicii mai mari ca mediana, iar jumătate mai mici.
În situația unor distribuții eterogene media aritmetică este influențată în mai mare
măsură de eventuale valori extreme, aberante ale variabilei – caz în care este preferată mediana
în vederea stabilirii tendinței centrale, în locul mediei, deoarece este mai stabilă în raport cu
astfel de valori.
Mediana depinde de locul valorilor în serie, nu de mărimea acestor valori. În felul acesta
ea nu este supusă influenței așa-ziselor valori aberante (anormal de mari sau anormal de mici)
care sunt lăsate în afara seriei prin deschiderea intervalelor marginale.
În cazul unei distribuții unimodale ușor asimetrice, frecvențele sunt ușor deplasate într-
o parte sau alta, între cei trei indicatori ai tendinței centrale există următoarea relație
x  Mo  3( x  Me) , care se respectă și în cadrul aplicației noastre.
Aflarea medianei se face diferențiat, în funcție de felul seriei:
 pentru o serie simplă cu un număr impar de termeni, ale căror valori sunt ordonate
crescător sau descrescător, aflarea Me constă în găsirea termenului central pe baza determinării
unității medianei;
n 1
U Me  (3.57)
2
Mediana reprezintă valoarea termenului central al seriei.
 pentru o serie simplă cu un număr par de termeni, ale căror valori sunt ordonate
crescător sau descrescător, Me se află prin calcularea mediei aritmetice simple a celor 2 termeni
centrali ai seriei, stabiliți tot ca urmare a aplicării formulei unității medianei (3.57);
 pentru o serie cu frecvență cu caracteristica prezentată pe variante, aflarea Me
presupune efectuarea următoarelor operații:
a) determinarea șirului frecvențelor cumulate ( N i );
b) calculul unității mediane (UMe);

U Me 
 ni  1 (3.58)
2
și găsirea locului ei în șirul frecvențelor cumulate respectând condiția NiUMe;
c) Mediana reprezintă tipul sau valoarea caracteristicii care satisface condiția NiUMe;

72
Exemplul 3.14:
La finele anului școlar, situația rezultatelor școlare a elevilor unei clase I se
prezintă astfel:
Tabel 3-18
Rezultate școlare Număr elevi Frecvențe cumulate ( N i )
Premiul I 1 1
Premiul II 4 5
Premiul III 3 8
Mențiuni 8 16
Fără premii 4 20
Total 20 ---
Stabiliți, calculați și interpretați indicatorii tendinței centrale corespunzători acestui tip de
distribuție.

Rezolvare:
Distribuția elevilor după rezultatele școlare prezentată în tabelul 3-18 formează o
serie de frecvențe pe variante. Variabila „rezultate școlare” este calitativă, iar scala de
măsurare este ordinală, ceea ce conduce la determinarea doar a doi indicatori ai tendinței
centrale: modul (a) și mediana (b).
(a) Se știe că modul este tipul sau valoarea caracteristicii căreia îi corespunde
frecvența cea mai mare. Cum cei mai mulți elevi ( nmax  8 elevi) au obținut mențiuni,
rezultă că modul este reprezentat de tipul caracteristicii “Mențiuni”, cele mai des întâlnite
ca rezultate școlare.
(b) Stabilirea medianei presupune parcurgerea etapelor:
b.1. determinarea șirului frecvențelor cumulate ( N i - coloana 3 din tabelul 3-18);
b.2. calculul unității mediane (UMe);
5

 n 1 i
20  1
U Me  i 1
  10,5
2 2
și găsirea locului ei în șirul frecvențelor cumulate respectând condiția NiUMe; deci
locul ei este la tipul caracteristicii “Mențiuni”, Ni 16  U M 10,5
e

b.3. Mediana reprezintă tipul sau valoarea caracteristicii care satisface condiția NiUMe; prin
urmare, deoarece Ni 16  U M 10,5 mediana este reprezentată de mențiuni, ceea ce
e

înseamnă că 50% din totalul elevilor au luat premii (I, II, III), iar cealaltă jumătate a
numărului elevilor au mențiuni sau sunt fără premii.

 pentru o serie cu frecvență a cărei caracteristică dată se prezintă sub formă de


intervale, aflarea Me presupune efectuarea următoarelor operații:
a) determinarea șirului frecvențelor cumulate (Ni)

b) calculul unității mediane UMe după formula U Me 


 ni  1
2
și găsirea locului ei în șirul frecvențelor respectând condiția: NiUMe

c) în dreptul NiUMe se află intervalul median. Determinarea Me constă în efectuarea


unei interpolări în cadrul intervalului median după formula:

73
UMe  Ni  1
Me  xi 1  d  (3.59)
nm
unde:
xi-1 = limita inferioară a intervalului median;
d = mărimea intervalului median;
UMe = unitatea mediană;
Ni-1 = frecvența cumulată anterioară intervalului median;
nm = frecvența intervalului median.
Mediana fiind o mărime medie cu o poziție centrală într-o serie statistică ordonată, se
poate determina ușor pe cale grafică folosind curba frecvențelor cumulate. Me este reprezentată
de abscisa corespunzătoare ordonatei ce poartă valoarea UMe (figura 3.3(a)).
Dacă la construcția curbelor frecvențelor cumulate se pornește de la limita inferioară,
respectiv, cea superioară ale distribuției și dacă se coboară o perpendiculara din intersecția celor
doua curbe pe abscisă se poate identifica, de asemenea, valoarea medianei (figura 3.3(b)).
.
Ni Ni

Ni

UMe

Ni-1

O xi-1 Me xi xi O Me xi
3.3(a) 3.3(b)
Figura 3-3 - Reprezentarea grafică a medianei

3.4.3 Cuantilele

Cuantilele sunt valori ale variabilei care separă repartiția ordonată în “n” părți
cuprinzând același efectiv egal cu 1/n din efectivul total. Cuantilele sunt valori ale caracteristicii
care împart seria în “n” părți egale.
În funcție de valorile lui “n” cuantilele se numesc:
n=2 - mediană; b) n=4 - quartile; c) n=10 - decile; d) n=100 - centile.

Quartilele (Q) reprezintă valori ale caracteristicii care împart volumul colectivității în
4 părți egale. Există 3 quartile ( Q1 , Q2  M e , Q3 ) care se determină diferit, în raport cu tipul
seriei, astfel:
 pentru o serie simplă cu un număr impar de termeni, ale căror valori sunt ordonate
crescător sau descrescător, aflarea quartilelor constă în găsirea termenului central pe baza
determinării unității quartilice;
U Q1 
1
n  1 ; U Q2  1 n  1  U M e ; U Q3  3 n  1 (3.60)
4 2 4
Quartilele reprezintă valori ale termenilor centrali.

74
Exemplul 3.15:
În cadrul unui muzeu s-a realizat o cercetare pe baza numărului biletelor vândute
în 15 zile, situația prezentându-se astfel: 50, 13, 25, 28, 30, 50, 44, 35, 29, 44,
28, 48, 44, 52, 38.
Să se determine quartilele seriei numărului biletelor.

Rezolvare:
Înaintea determinării quartilelor este obligatorie ordonarea crescătoare a valorilor
numărului biletelor vândute:
xi : 13, 25, 28, 28, 29, 30, 35, 38, 44, 44, 44, 48, 50, 50, 52 (bilete)

Prima quartilă ( Q1 ) : U Q  1
1
n  1  1 15  1  4 , locul primei quartile fiind în dreptul
4 4
celui de-al patrulea termen ( x4 ), deci Q1  x4  28 bilete ceea ce înseamnă că, în primele trei
zile (un sfert sau 25% din totalul celor 15 zile) ordonate crescător după numărul biletelor
vândute, s-a înregistrat o vânzare mai mică de 28 bilete, pentru ca în restul zilelor (trei sferturi
sau 75%) vânzarea a depășit valoarea stabilită.

A doua quartilă sau mediana ( Q2  M e ) :


U Q2  U M e 
1
n  1  1 15  1  8 , locul medianei fiind în dreptul celui de-al optulea
2 2
termen ( x8 )
M e  Q2  x8  38 bilete ceea ce înseamnă că, în jumătate din numărul total al zilelor de
vizită la muzeu s-au vândut mai puțin de 38 bilete, iar în cealaltă jumătate vânzarea a fost
mai mare de 38 bilete, valoare stabilită după ordonarea crescătoare a numărului biletelor
vândute.

A treia quartilă ( Q3 ):
U Q3 
3
n  1  3 15  1  12 , locul ultimei quartile fiind în dreptul celui de-al
4 4
doisprezecelea termen ( x12 )
Q3  x12  48 bilete ceea ce înseamnă că, în primele 11 zile (trei sferturi sau 75% din totalul
celor 15 zile) ordonate crescător după numărul biletelor vândute, s-au vândut mai puțin de 48
bilete, pentru ca în restul zilelor (un sfert sau 25%) vânzarea să depășească valoarea
determinată.

 pentru o serie simplă cu un număr par de termeni, ale căror valori sunt ordonate
crescător sau descrescător, quartilele se află prin calcularea mediei aritmetice simple a celor 2
termeni stabiliți tot ca urmare a aplicării formulei unității quartilelor (3.60);

75
Exemplul 3.16:
Pe fiecare rută, compania de transport public local stabilește pentru 18 autobuze
timpul mediu (minute) în care trebuie parcurs traseul: 40, 30, 35, 50, 55, 45, 60,
120, 100, 65, 110, 70, 90, 80, 85, 95, 75, 105.

Rezolvare:
Anterior determinării quartilelor este necesară ordonarea crescătoare a valorilor
timpului mediu:
xi : 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 120 (minute)

Prima quartilă ( Q1 ) :
U Q1 
1
n  1  1 18  1  4,75 , locul primei quartile este plasat între termenul patru și
4 4
x x 45  50
cinci ( x4 și x5 ), deci Q1  4 5   47,50 minute ceea ce înseamnă că 25% din
2 2
totalul celor 18 autobuze, ordonate crescător după timpul mediu, trebuie să parcurgă traseul
stabilit în mai puțin de 47,50 minute, restul de 75% dintre autobuze peste această valoare
determinată.

A doua quartilă sau mediana ( Q2  Me ) :


U Q1  U M e 
1
n  1  1 18  1  9,5 , locul medianei este plasat între termenul nouă și
2 2
x x 70  75
zece ( x9 și x10 ), deci M e  Q2  9 10   72,5 minute ceea ce înseamnă că, din
2 2
totalul celor 18 autobuze, 9 reprezentând 50% trebuie să parcurgă traseul stabilit în mai puțin
de 72,5 minute, iar celelalte autobuze, reprezentând cealaltă jumătate, vor depăși timpul
stabilit.

A treia quartilă ( Q3 ):
U Q3 
3
n  1  3 18  1  14,28 , locul ultimei quartile este plasat între termenul
4 4
x x
paisprezece și cincisprezece ( x14 și x15 ), deci Q3  14 15  97,50 minute ceea ce înseamnă
2
că 14 autobuze (reprezentând 75% din totalul celor 18 autobuze) ordonate crescător după
timpul mediu, vor trebui să parcurgă traseul stabilit în mai puțin de 97,50 minute, restul de 4
autobuze (un sfert sau 25%) având la dispoziție mai mult de 97,50 minute pentru a ajunge la
destinație.

 pentru o serie cu frecvență prezentată pe variante, aflarea quartilei presupune


efectuarea următoarelor operații:
a. determinarea șirului frecvențelor cumulate ( N i );
b. calculul unității fiecărei quartile ( U Q );
U Q1 
1
4
 ni  1 ; U Q2   ni  1  U M e ; U Q3   ni  1 (3.61)
1 3
2 4
și găsirea locului ei în șirul frecvențelor cumulate respectând condiția Ni  U ;
Q

76
c. Fiecare quartilă reprezintă tipul sau valoarea caracteristicii care satisface condiția
Ni  U Q ;

 pentru o serie cu frecvență sub formă de intervale, aflarea Q presupune efectuarea


următoarelor operații:
a. determinarea șirului frecvențelor cumulate (Ni)
b. calculul unității fiecărei quartile ( U Q ), după formulele (3.61) și găsirea locului ei în
șirul frecvențelor respectând condiția: Ni  U
Q

în dreptul Ni  U se află intervalul quartilic. Determinarea quartilei constă în


Q
c.
efectuarea unei interpolări în cadrul intervalului quartilic după relațiile:

U Q1  Ni  1 U M e  Ni  1
Q1  xi1  d  Q2  Me  xi1  d 
nQ1 nM e
(3.62)
U Q3  Ni  1
Q3  xi1  d 
nQ3
unde:
xi-1 = limita inferioară a intervalului quartilic;
d = dimensiunea (mărimea) intervalului quartilic;
U Q = unitatea quartilică;
Ni-1 = frecvența cumulată anterioară intervalului quartilic;
nQ = frecvența intervalului quartilic.

Locul lor într-o distribuție statistică normală este prezentat în figura 3.4.

ni

O Q1 Q2 Q3 xi
Figura 3-4 – Reprezentarea grafică a quartilelor, în cadrul unei distribuții normale

Decilele (D) reprezintă valori ale caracteristicii care împart unitățile colectivității în 10
părți egale. Există 9 decile:
U D1  N i 1
D1 = xi-1 + d (3.63)
n D1

D5 = Me= Q2
U D 9  N i 1
D9 = xi-1 + d (3.64)
nD9

77
1   ni 9   ni
în care U D1  , ……., U 9  unități decilice
10 n10

Centilele (C) reprezintă valori ale caracteristicii care împart volumul colectivității în
100 părți egale. Există 99 centile:
U C1  N i 1
C1 = xi-1 + d (3.65)
nC 1
C50 = D5 = Q2= Me
U C 99  N i 1
C99 = xi-1 + d (3.66)
nC 99
1   ni 99   ni
în care U C1  , ……., U C 99  unități centilice
100 100

Exemplul 3.17:

Considerând datele din tabelul de mai jos se cere să se determine mediana și


quantilele. Vom alipi coloanele 3 și 4 la acest tabel în care calculăm frecvențele
cumulate

Tabel 3-19
Xi ni Ni() Ni ()
0-30 25 25 200
30-60 50 75 175
60-90 60 135 UMe 125
90-120 45 180 65
120-150 15 195 20
150 și peste 5 200 5
Total 200 - -

Fiind o serie cu caracteristică prezentată pe intervale de variație, mediana se află


printr-o interpolare în intervalul median. Intervalul median se găsește în dreptul frecvenței
cumulate pentru care NiUMe
UMe = (  ni+1)/2=201/2=100,5
Înseamnă că intervalul median este (60-90). Prin urmare, aplicând formula de
interpolare mediana este:
U Me  N i 1 100  75
Me = xi-1 + d = 60+30  =72,45, deci Me=72,45 minute
ni 60
Quartila unu (Q1) se determină astfel:
U Q1 
1
4
 ni  1=201/4=50 deci intervalul quartilic unu este (30-60)
U Q1  N i 1 50  25
Q1= xi-1+d = 30+30 = 45, deci Q1= 45 minute
nQ1 50
Quartila doi (Q2) este egală cu mediana deoarece:
UQ2= UMe deci și Q2 = Me
Quartila trei (Q3):

78
U Q3 
3
 ni  1=(3*201)/4=151deci intervalul quartilic trei este (90-120)
4
U Q 3  N i 1 151−135
Q3= xi-1+d = 90+30 =99,99100, deci Q3 = 100 minute
nQ 3 45

3.4.4 Mediala

Mediala este un indicator de poziție egal cu acel nivel al caracteristicii (xi) care împarte
n
suma termenilor seriei (  x n ) în două părți egale.
i 1
i i

Determinarea medialei este asemănătoare medianei. Pentru aceeași distribuție statistică,


mediala este mai mare decât mediana, cu excepția cazului când Me = Ml.
Pentru o serie simplă, determinarea medialei presupune parcurgerea următoarelor etape:
a) Se ordonează crescător termenii (xi) ai seriei;
b) Se determină șirul valorilor individuale
n cumulate ale caracteristicii (Lh);
Lh =  x i ; h = 1, n
i1
c) Se determină unitatea medială după formula:
n

Ml
x
i1
i
(3.67)
U =
2
d) Se află mediala, adică se găsește acel nivel al caracteristicii xh corespunzător
primului nivel cumulat (Lh) egal sau mai mare decât UMl (Lh  UMl).
Pentru o serie de distribuție de frecvențe, în cazul unei caracteristici discrete, mediala
se determină parcurgând următoarele etape:
a) Se determină șirul produselor (xini) cumulate, adică Lh:
h
Lh =  x n ; h = 1, k
i1
i i (3.68)
b) Se determină unitatea medială pe baza formulei:
h

xn i i
(3.69)
UMl = i1
2
c) Se determină mediala, prin găsirea acelui nivel al caracteristicii care corespunde
primului produs cumulat Lh egal sau mai mare ca UMl (Lh  UMl).
Pentru o serie de distribuție de frecvențe în cazul unei caracteristici continue, mediala
se determină în mod asemănător, cu deosebirea că, în dreptul Lh  UMI, se citește intervalul
medial. Valoarea medială se calculează prin interpolare liniară, după relația:

Ml = xi-1 + d xi-1 = limita inferioară a intervalului


1 k
 ml1 medial;
  x ini    x ini d = mărimea intervalului medial; (3.70)
2  i1  i1
ml = indexul intervalului medial;
x mlnml xmlnml = produsul intervalului medial

79
De reținut!

Mărimile relative sunt indicatori derivați calculați ca raport între doua mărimi.
Rezultatul obținut este o expresie numerica care arata câte unități din indicatorul
raportat revin la o unitate a indicatorului baza de raportare.
Tehnica de calcul a mărimilor relative este simplă ceea ce explică și larga lor utilizare în
cercetarea statistică, în analiza activității economico-financiare sau în alte lucrări de analiza
și cercetare.

De reținut!

Existența mai multor tipuri de medii ridică întrebarea: când se aplică una sau
alta din mediile prezentate anterior?

• Modul este singurul indicator ai tendinței centrale care are sens în cazul variabilelor
măsurate pentru o scală nominală.
• Mediana este principalul indicator ai tendinței centrale în cazul variabilelor măsurate
pe baza unei scale ordinale. În cazul variabilelor cantitative, măsurate printr-o scală de raport,
mediana completează media aritmetică sau poate înlocui această medie dacă repartiția este
pronunțat asimetrică sau cuprinde valori care se abat semnificativ de masa valorilor.
• Media aritmetică este cea mai importantă medie în cazul seriilor alcătuite pentru o
variabilă măsurată pe baza unei scale de raport. Se poate aplică întotdeauna când are sens să
se însumeze termenii seriei.
• Media geometrică se aplică tot în cazul variabilelor scalate metric și când între date
există o relație de produs, respectiv exprimă evoluția în timp.
• Media armonică presupune ca măsurarea să se bazeze pe o scală de raport, iar datele
din care se calculează să fie mărimi relative de structură sau de intensitate.
• Media pătratică se aplică în cazul seriilor de date scalate metric, când termenii pot fi
atât valori pozitive cât și negative.

80
3.5 APLICAȚII

Aplicație rezolvată - continuare

Rezultatul grupării salariaților pe intervale egale de producție, obținut la capitolul


anterior, va reprezenta punctul de plecare în exemplificarea mărimilor relative și a
celor medii.

Tabel 3-20
Producție Nr.
- buc. - salariați
Xi ni
20-30 7
30-40 9
40-50 19
50-60 7
60-70 8
TOTAL 50
*limită inferioară inclusă în interval

Cerințe:
1. Determinați mărimile relative permise a fi calculate de date centralizate în tabelul
3.20.
2. Reprezentați grafic mărimile relative de structură și cele de coordonare determinate.
3. Determinați mărimile medii de calcul.
4. Determinați modul, mediana și mediala.

Cerința nr. 1

a. Mărimile relative de structură ce pot fi calculate, în contextul datelor disponibile


în această aplicație, iau forma frecvențelor relative, ce au fost deja determinate la capitolul
anterior, și cea a greutăților specifice.
Acestea din urmă se determină cu ajutorul relației:
 100 
xi
gi 
 xi
CONVENȚIE
În cazul în care se dispune de o distribuție pe grupe, nu este posibilă utilizarea
în calcule a intervalelor ca atare. Astfel, se face o convenție și în locul
valorilor Xi se iau în considerare centrele intervalelor de grupare.
Această convenție este indusă de următoarea ipoteză: în interiorul tuturor intervalelor
de grupare frecvențele sunt uniform distribuite.
În practică, ipoteza prezentată se verifică foarte rar, motiv pentru care între rezultatele
obținute pe baza centrelor de interval și cele obținute pe baza datelor inițiale există diferențe.

Relația prezentată mai sus indică raportarea producției aferente fiecărui interval la
totalul producției obținut în ziua precedentă. Pentru a estima aceste valori, centrele intervalelor
de grupare vor fi ponderate cu frecvențele de apariție corespunzătoare.
Astfel, pentru calculul greutăților specifice determinate în cazul datelor grupate pe
intervale se va utiliza forma ponderată de calcul:

81
x i  ni
gi   100 
 x i  ni
Ne vom ajuta de următorul tabel pentru exemplificarea algoritmului de calcul:

Tabel 3-21
Producție Nr.
- buc. - salariați xi’ xi’ni gi
Xi ni
20-30 7 25 175 8%
30-40 9 35 315 14%
40-50 19 45 855 38%
50-60 7 55 385 17%
60-70 8 65 520 23%
TOTAL 50 2250 100%
*limită inferioară inclusă în interval

Nota:
Vom nota centrele intervalelor de grupare cu Xi’. Valorile aferente vor fi
determinate cu ajutorul relației:
xmin  xmax
xi' 
2

Interpretare:
Se prezintă interpretarea doar pentru valorile descoperite pentru primul interval,
deoarece pentru următoarele valori calculate interpretarea se face în mod asemănător.
Salariații grupați pe primul interval de producție au reușit în ziua precedentă să producă
175 de bucăți, ceea ce reprezintă 8% din totalul producției zilei precedente.

b. Datele disponibile ne permit si calculul mărimilor relative de coordonare


(corespondență).
nA X
Acestea vor fi determinate cu ajutorul relațiilor K A / B   (10) sau K A / B  A  (10) ,
nB XB
care presupun determinarea raportului între valorile aferente a două intervale de grupare.
Relația ne permite fie raportarea numărului de salariați fie producției aferente intervalelor de
grupare.
Pentru calculul mărimilor relative de coordonare, trebuie să stabilim în primă fază o
bază de raportare. Putem avea în vedere multiple criterii după care am putea alege baza de
raportare, însă alegerea o vom face pentru un interval reprezentativ. Astfel, putem alege între
primul interval de grupare sau ultimul, respectiv între intervalul ce cuprinde cei mai mulți
salariați sau intervalul ce cuprinde cei mai puțini salariați.
Calculele sunt realizate în continuare utilizând ca bază de raportare valorile aferente
primului interval de grupare și un factor de multiplicare de 10. Rezultatele sunt prezentate în
următorul tabel:

82
Tabel 3-22
Producție Nr. nA XA
- buc. - salariați Xi’∙ni  (10)  (10)
Xi ni nB XB
20-30 7 175 - -
30-40 9 315 13 18
40-50 19 855 27 49
50-60 7 385 10 22
60-70 8 520 11 30
TOTAL 50 2250 - -
*limită inferioară inclusă în interval

Interpretare:
Se barează nivelurile din dreptul intervalului ales ca bază deoarece nu are sens realizarea
unei comparații a acestui interval cu el însuși.
Se prezintă interpretarea doar pentru valorile descoperite pentru cel de-al 3-lea interval,
deoarece și pentru celelalte valori calculate interpretarea se face în mod asemănător.
La 10 salariați din grupa de producție (20 -30) corespund, în cadrul colectivității,
aproximativ 27 de salariați cu o producție cuprinsă între (40-50).
La 10 produse obținute de salariații din grupa de producție (20 -30) corespund 49 de
produse obținute de salariații din grupa de producție (40-50).

c. Datele de care dispunem nu ne permit și calculul mărimilor relative de dinamică,


respectiv cele ale planificării.

d. Ultimul tip de mărimi relative pentru care putem exemplifica modul de calcul și de
interpretare este cel al mărimilor relative de intensitate.
Acestea se obțin prin raportarea a doi indicatori în mărime absolută, de natură diferită,
care se află într-o relație de interdependență.
x
Relația de calcul este Kx / y  . În contextul aplicației date, determinarea mărimilor
y
relative de intensitate se realizează fie prin raportarea producția zilei precedente la totalul
salariaților care au contribuit la obținerea sa, astfel se va determina productivitatea medie a
muncii, fie prin realizarea raportului invers, totalul salariaților raportat la producția obținută.

2250
Kx / y   45 buc / salariat
50
Interpretare: Rezultatul obținut ia interpretarea unei medii, astfel, se prezintă că în ziua
precedentă fiecare salariat a obținut în medie 45 de bucăți – producție.

50
Ky / x  100  2 salariati / 100bucati
2250

Interpretare: Pentru interpretarea rezultatului obținut în cazul raportului invers se


utilizează multiplicatorul 100. Astfel, calculul efectuat indică faptul că pentru obținerea unei
cantități zilnice de 100 de bucăți sunt necesar în medie 2 salariați.

83
Cerința nr. 2

Reprezentarea grafică a mărimilor relative de structură a fost deja exemplificată la


capitolul anterior, prezentându-se dreptunghiul de structură. Totuși, cea mai populară
modalitate de reprezentare grafică a mărimilor relative de structură este cercul de structură.
Pentru exemplificarea reprezentării grafice a cercului de structură se vor utiliza în
continuare greutățile specifice determinate.
Principiul de reprezentare este acela de a împărți un cerc în sectoare de cerc
proporționale cu valorile greutăților specifice. Astfel, vor trebui transformate valorile
procentuale în valori proporționale exprimate în grade, prezentate în tabelul 3.23.

Tabel 3-23
Producție Valori
- buc. - proporționale Distribuţia producţiei pe grupe de
Xi gi exprimate în
grade
încadrare a salariaţilor
20-30 8% 28o 20-30
30-40 8%
14% 50,4o 23% 14% 30-40
40-50 38% 136,8o 40-50
50-60 17% 61,6o 17%
38% 50-60
60-70 23% 83,2o
TOTAL 100% 360 o 60-70

Figura 3-5

Reprezentarea grafică a indicatorilor relativi de coordonare se realizează cu ajutorul


diagramelor prin suprafețe geometrice pentru reprezentarea volumului. Vom utiliza în
continuare cercul de volum.
Cercul de volum are ca principiu de reprezentare grafică asigurarea proporționalității
între suprafața cercului și indicatorul analizat.

Raportul de mărime între numărul de salariaţi grupaţi pe XA


intervale de producţie fată de numărul celor din primul R A2  X A  R A 
interval de grupare 

19 XB
RB2  X B  RB 

unde: R  raza cercului;


9
8 R  aria cercului.
2
7 7

20-30 30-40 40-50 50-60 60-70


Figura 3-6

Ordinul de mărime al subcolectivităților formate prin gruparea producției pe intervale


este reliefat în cadrul graficului atât prin aria cercurilor cât și prin plasarea diferențiată a
cercurilor pe axa Oy (ordonatelor).

84
Cerința nr. 3

Determinarea mărimilor medii de calcul.

• Media este o măsură a tendinței centrale, iar valoarea sa calculată sintetizează într-un
singur nivel reprezentativ tot ceea ce este tipic, esențial, comun și obiectiv în apariția și
manifestarea fenomenelor de masă.
• Din cadrul mărimilor medii de calcul se vor prezenta în continuare: media aritmetică,
media armonică și media pătratică.

 Pentru determinarea mediei aritmetice se utilizează formula de calcul ponderată.


k

x n i i
x i 1
k

n
i 1
i

În vederea identificării valorii de la numărătorul relației de calcul ne vom ajuta de


următorul tabel:
Tabel 3-24
Producție Nr.
- buc. - salariați x' xi’ni
Xi ni
20-30 7 25 175
30-40 9 35 315
40-50 19 45 855
50-60 7 55 385
60-70 8 65 520
TOTAL 50 - 2250

2250
Astfel media aritmetica este egală cu  45 buc/salariat.
50

Interpretare: Ca atare, în medie, în ziua precedentă, cei 50 de salariați au produs 45 de


bucăți/salariat.

 Pentru determinarea mediei armonice se utilizează următoarea formulă de calcul:


k

n i 1
i
xh  k
1
x
i 1
ni
i

85
În vederea identificării valorii de la numitorul relației de calcul ne vom ajuta de
următorul tabel:

Tabel 3-25
Producția Nr.
(buc) salariați x' n/x
Xi ni
20-30 7 25 0,280
30-40 9 35 0,257
40-50 19 45 0,422
50-60 7 55 0,127
60-70 8 65 0,123
Total 50 - 1,210

50
Interpretare: Media armonică este egală cu  41,33 . Deoarece producția este o
1,210
caracteristică statistică cu variație discretă (discontinuă), se va rotunji rezultatul obținut la
valoarea întreagă 41 buc/salariat.

 Pentru determinarea mediei pătratice se utilizează următoarea formulă de calcul:

x
i 1
2
i ni
xp  k

n i 1
i

În vederea identificării valorii de la numărătorul relației de calcul ne vom ajuta de următorul


tabel:
Tabel 3-26
Producția Nr.
(buc) salariați x' x2n
Xi ni
20-30 7 25 4375
30-40 9 35 11025
40-50 19 45 38475
50-60 7 55 21175
60-70 8 65 33800
Total 50 - 108850

108850
Media pătratică este egală cu  46,65 . Deoarece producția este o
50
caracteristică statistică cu variație discretă (discontinuă), se va rotunji rezultatul obținut la
valoarea întreagă 47 buc/salariat.

Așa cum se observă, valorile calculate pentru aceste mărimi medii de calcul nu sunt
egale, mai mult se știe că acestea respectă relația de inegalitate x h  x g  x  x p .
Interpretarea mediilor se va realiza după același tipar prezentat în cazul mediei
aritmetice.

86
Cerința nr. 4

Determinarea mărimilor medii de poziție.


Mediana și modul se exprimă în aceleași unități de măsură ca și variabilele pentru care
se determină și prezintă avantajul că valoarea lor nu se modifică dacă se închid în mod
convențional intervalele deschise.

 Valoarea modală a caracteristicii (numită și valoare dominantă, valoarea cea mai


probabilă sau modul) reprezintă acea valoare a caracteristicii care corespunde celui mai mare
număr de unități sau aceea care are cea mai mare frecvență de apariție.
Relația de calcul în cazul unei distribuții grupate pe intervale, este:
1
Mo  xi 1  d 
1   2
Într-o primă fază se identifică intervalul modal analizând coloana frecvențelor ni și
identificând valoarea cea mai mare. În cazul nostru frecvența ni cea mai mare este 19, aceasta
fiind corespunzătoare intervalului (40-50), ca atare, acesta va fi intervalul modal.
(19  9)
Astfel, valoarea dominantă este egală cu 40  10  44,54 . Deoarece
(19  9)  (19  7)
producția este o caracteristică statistică cu variație discretă (discontinuă), se va rotunji rezultatul
obținut la valoarea întreagă 45 buc.
Interpretare: Producția obținută de către cei mai mulți salariați, din rândul celor 50
analizați, a fost de 45 buc.

 Mediana împarte numărul unităților investigate în două părți egale.

În vederea determinării acestui indicator se parcurg următoarele etape:


k

n i 1
50  1
a. Calculul unității mediane, UMe  i 1
, UMe   25,5
2 2
b. Se determină frecvențele cumulate Ni

Tabel 3-27 Algoritmul de calcul al medianei


Frecvențe
Producția Nr.
cumulate crescător
(buc) salariați
Xi ni Ni
20-30 7 7
30-40 9 16
40-50 19 35 UMe
50-60 7 42
60-70 8 50
Total 50 -

c. Se identifică intervalul median prin comparare N i  UMe


Astfel, frecvența cumulată cea mai apropiată de unitatea mediană și care respectă
condiția de mai sus este 35, aferentă intervalului 40-50.

d. Utilizarea următoarei relații pentru determinarea valorii medianei

87
UMe  Ni  1
Me  xi 1  d 
nm
25,5  16
Me=40+10  45 bucăți
19
Interpretare: Valoarea producției ce împarte distribuția aferentă celor 50 de salariați în
2 părți de volum egal este 45 buc.

 Mediala împarte suma termenilor distribuției producțiilor individuale în două părți


egale.
Determinarea medialei este asemănătoare medianei.

Tabel 3-28 Algoritmul de calcul al medialei


Producție Nr.
- buc. - salariați x' xi’ni Lh
Xi ni
20-30 7 25 175 175
30-40 9 35 315 490
40-50 19 45 855 1345 UMl
50-60 7 55 385 1730
60-70 8 65 520 2250
TOTAL 50 - 2250 -

Pentru o serie de distribuție de frecvențe, mediala se determină parcurgând următoarele


etape:
a) Se determină șirul produselor (xini) cumulate, adică Lh:
h
Lh =  x n ; h = 1, k
i1
i i

b) Se determină unitatea medială pe baza formulei:


h

xn
i1
i i
2250
U Ml
= = 1125 =
2 2
c) Se determină intervalul medial în dreptul Lh  UMI.
Valoarea Lh care respectă în cazul acestei aplicații relația prezentată este 1345, acesta
este aferentă intervalului 40-50, ca atare, acesta va fi considerat interval medial.

d) Valoarea medială se calculează prin interpolare liniară, după relația:


1 k  ml1
  x ini    x ini
Ml = xi-1 + d  i1  i1
2
x mlnml
unde:
xi-1 = limita inferioară a intervalului medial;
d = mărimea intervalului medial;
ml = indexul intervalului medial;
xmlnml = produsul intervalului medial.
1125−490
Ml=40+10 ≅ 47 bucăți
855

Interpretare: Valoarea producției ce împarte suma termenilor distribuției aferente celor


50 de salariați în 2 părți egale este 47 bucăți.

88
Aplicații propuse

Aplicația 3.1
Conform Anuarului Statistic 2003, ariile protejate din România se caracterizează astfel:

Tabel 3-29
Ariile protejate Număr Suprafața (ha)
Rezervații științifice 53 101207
Parcuri naționale 11 300544
Monumente ale naturii 231 2177
Rezervații naturale 543 128265
Parcuri naturale 5 251632
Rezervații ale biosferei 3 664446
Să se determine:
a) Mărimile relative de structură;
b) Mărimile relative de coordonare;
c) Mărimile relative de intensitate.

Aplicația 3.2
O societate comercială prezintă următoarea situație a fondului de salarii și a numărului
de salariați pe grupe de vechime în muncă (date convenționale):

Tabel 3-30
Grupe de Fondul de salarii Număr de
vechime (mii. lei) salariați
(ani) (persoane)
Sub 10 30 10
10-20 80 15
20-30 175 25
peste 30 60 5
Se cere:
a) Să se determine mărimile relative de coordonare față de ultima grupă de vechime,
pentru fiecare variabilă studiată și să se facă analiza comparativă a rezultatelor;
b) Să se reprezinte grafic structura fondului de salarii și a numărului de salariați;
c) Să se determine mărimile relative de intensitate. Care este semnificația economică
a acestora?

89
Aplicația 3.3
Se cunoaște distribuția a 83 studenți ai anului II din cadrul Facultății de Științe
Economice și Administrație Publică în funcție de notele obținute la examenul de statistică:

Tabel 3-31
Grupe de note Număr de studenți
Sub 4 4
4-6 26
6-8 35
8 și peste 18
Total 83
*
limita superioară nu este cuprinsă în interval
Se cere:
a) Să se determine nota medie la examenul de statistică pentru cei 83 de studenți;
b) Să se determine nota cea mai des obținută de studenți;
c) Să se determine nota care împarte studenții anului în două părți egale;
d) Să se transforme frecvențele absolute în frecvențe relative și să se refacă estimările
pentru medie, mediană și mod. Ce se constată?

Aplicația 3.4
Repartiția sosirilor în pensiunile agroturistice din România, pe categorii de confort, se
prezintă astfel:
Tabel 3-32
Categorii de confort ale
Număr sosiri
pensiunilor agroturistice
5 flori 8829
4 flori 75090
3 flori 239616
2 flori 115341
1 floare 8237

Stabiliți, calculați și interpretați indicatorii tendinței centrale corespunzători acestui tip


de distribuție.

Aplicația 3.5
Valorile a 12 contracte publicitare încheiate de un hotel se prezintă astfel:
23, 33, 26, 31, 27, 21, 22, 34, 17, 29, 28, 25 mii UM
Se cere:
a) Să se stabilească valoarea medie a unui contract publicitar încheiat.
b) Care este valoarea contractelor peste care se situează valorile a:
1) trei sferturi din contracte?
2) 50% din contracte
3) o pătrime din contracte.

90
Unitatea de învățare nr. 4: INDICATORII VARIAȚIEI,
CONCENTRĂRII
ȘI FORMEI DISTRIBUȚIILOR

Timpul de studiu individual estimat: 7 h

Competențele specifice unității de învățare


La sfârșitul parcurgerii unității de învățare, studenții trebuie:
 să înțeleagă care este obiectul si metoda statisticii;
 să cunoască care sunt formele si modalitatea de calcul a indicatorilor gradului
de variabilitate;
 să înțeleagă semnificația economica a indicatorilor gradului de variabilitate;
 să cunoască utilitatea și modalitatea de efectuare a analizei dispersionale
 să cunoască modalitatea de calcul și semnificația indicatorului de asimetrie;
 să cunoască modalitatea de calcul și semnificația indicatorului de boltire
(aplatizare);
 să cunoască modalitatea de calcul si interpretare a indicatorului ”Coeficientul
Gini”.

Cuprinsul unității de învățare:


4.1 INDICATORII VARIAȚIEI
4.1.1 Indicatorii simpli ai variației
4.1.2 Indicatorii sintetici ai variației
4.1.3 Indicatorii variației pentru o caracteristică alternativă
4.1.4 Regula de adunare a dispersiilor
4.2 CONCENTRAREA
4.3 FORMA DISTRIBUȚIILOR
4.3.1 Asimetria distribuțiilor
4.3.2 Boltirea/aplatizarea distribuțiilor
4.4 APLICAȚII

4.1 INDICATORII VARIAȚIEI

4.1.1 Indicatorii simpli ai variației

Un indicator simplu al variației, care oferă o imagine


generală asupra dispersiei, este distanța dintre nivelul
maxim și nivelul minim al variabilei sau amplitudinea
variației. Amplitudinea variației Ax se poate exprima
atât în mărimi absolute, cât și în mărimi relative.
Amplitudinea variației exprimată în mărimi
absolute se determină pe baza formulei:

91
Ax = xmax – xmin (4.1)
Exprimată în măsuri relative, amplitudinea variației se poate calcula:
 fie ca raport între x max și x min:
𝑥𝑚𝑎𝑥
𝐴′𝑥 = (4.2)
𝑥𝑚𝑖𝑛
 fie ca raport între amplitudinea absolută și nivelul mediu al caracteristicii:
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
𝐴′′𝑥 = (4.3)
𝑥̅
Amplitudinea variației depinde numai de valorile extreme ale unei variabile și poate să
dea o imagine eronată a intervalului de variație, atunci când cel puțin una dintre valorile extreme
se abate în mare măsură de la celelalte niveluri individuale ale caracteristicii. Amplitudinea
variației nu poate caracteriza în mod corespunzător împrăștierea unor variabile obținute prin
sondaj, în cazul seriilor formate dintr-un număr redus de variante.
Un alt indicator simplu al variației îl constituie abaterile nivelurilor individuale ale unei
variabile față de nivelul lor mediu, notate cu di, și care se pot calcula după formula:
d i  xi  x (4.4)
Abaterile di se pot exprima și în mărimi relative prin raportarea lor la nivelul mediu al
variabilei, astfel:
d x x
d i %  i  100  i  100 (4.5)
x x
În practică aceste abateri se utilizează pentru calculul ulterior al indicatorilor sintetici ai
variației.

4.1.2 Indicatorii sintetici ai variației

Indicatorii sintetici ai variației se caracterizează prin faptul că, în calculul lor, se


includ abaterile tuturor nivelurilor individuale ale unei variabile față de nivelul lor mediu.
Din categoria indicatorilor sintetici ai variației fac parte: abaterea medie (denumită și
liniară), dispersia, abaterea medie pătratică și coeficientul de variație.

1. Abaterea medie liniară, notată cu d , se determină ca o medie aritmetică (simplă


sau ponderată) a abaterilor nivelurilor individuale ale unei variabile față de media lor aritmetică,
considerate în valoare absolută. Pe baza acestei definiții abaterea medie liniară se poate calcula
cu ajutorul următoarei formule:
 pentru o serie simplă:
n

x i x
(4.6)
d  i 1

n
 pentru o serie cu frecvență:
k k

 x i  x ni x i  x fi
d  i 1
k
sau d  i 1
k (4.7)
n
i 1
i f
i 1
i

Abaterile xi  x trebuie considerate în valoare absolută, deoarece dacă s-ar ține seama
de semne, suma lor ar fi egală cu zero, conform proprietăților mediei aritmetice.
Abaterea medie liniară se poate calcula și față de mediană.

92
Formulele de calcul ale acesteia față de mediană se vor obține substituind pe x cu Me în
formulele (4.6) și (4.7), astfel:
 pentru o serie simplă:
n

'
x i  Me
(4.8)
d  i 1

n
 pentru o serie cu frecvență:
k k

'
x i  M e  ni
'
x i  M e  fi
d  i 1
k
d  i 1
n (4.9)
n i 1
i f i 1
i
sau

Pe baza proprietăților medianei, reținem faptul că suma abaterilor nivelurilor


individuale ale caracteristicii față de mediană este mai mică decât în cazul oricărei alte mărimi
medii. Aceasta înseamnă că între abaterea medie calculată pe baza mediei aritmetice și cea
'
calculată pe baza medianei există relația: d  d
Oricare ar fi forma mediei, luată în calcul, abaterea medie liniară prezintă dezavantajul
că nu face nici o distincție între abaterile pozitive și cele negative ale variantelor unei
caracteristici, deși în practică acestea au semnificații cu totul deosebite.

Exemplul 4.1:
Să considerăm pentru exemplificare, seria din tabelul 4.1.

Tabel 4-1 Distribuția muncitorilor după productivitatea zilnică


Numărul de piese Numărul
pe zi muncitorilor xi xi  x x i  x ni xi  M e xi  M e ni
255-265 5 260 -41 205 -40 200
265-275 10 270 -31 310 -30 300
275-285 20 280 -21 420 -20 400
285-295 40 290 -11 440 -10 400
295-305 50 300 -1 50 0 0
305-315 30 310 -9 270 10 300
315-325 25 320 -19 475 20 500
325-335 10 330 -29 290 30 300
335-345 10 340 -39 390 40 400
Total 200 - - 2850 - 2800

Se știe că: x =301 piese/zi, iar Me =300 piese/zi.


k

x i  x  ni
2850
d i 1
k
  14,25  14 piese/zi
n
200
i
i 1
Rezultă că, în medie, un muncitor din grupul considerat se abate de la productivitatea
medie cu ± 14 piese.
k

'
x i  M e  ni
2800
d  i 1
k
  14 piese/zi
n
200
i
i 1

93
Se observă că diferența între rezultatele obținute este foarte mică deoarece distribuția
este foarte apropiată de cea normală.

2. Dispersia, notată cu  2 , este un alt indicator sintetic al variației mai mult cu o


semnificație de calcul dar cu o importanță deosebită în analiza influenței factorilor care
acționează în cadrul colectivităților. Dispersia se calculează ca o medie aritmetică a pătratelor
abaterilor nivelurilor individuale ale unei variabile de la nivelul lor mediu (media aritmetică).
Formulele de calcul ale dispersiei sunt:
 pentru o serie simplă:
n

 x  x
2
i
(4.10)
2  i 1

n
 pentru o serie cu frecvență:
k k

  x i  x  ni  x  x  fi
2 2
i
2  i 1
k
sau  2  i 1
k (4.11)
 ni
i 1
 i 1
fi

3. Abaterea medie pătratică, numită și abatere standard sau abatere tip se notează
cu  și se calculează prin extragerea rădăcinii pătrate din valoarea dispersiei. Abaterea medie
pătratică reprezintă media pătratică a abaterilor nivelurilor individuale ale caracteristicii față de
media lor.
Formulele de calcul ale abaterii standard sunt următoarele:
 pentru o serie simplă:
n

 x  x
2
i
(4.12)
 i 1

n
 pentru o serie cu frecvență:
k k

  x i  x  ni  x  x  fi
2 2
i
 i 1
k
sau   i 1
k
(4.13)
n
i 1
i f
i 1
i

Formula de calcul simplificată a abaterii medii pătratice va fi:


k

  x i  x 2 n i
c
  i 1 k (4.14)
ni

i 1 c

94
Exemplul 4.2:

Pornind de la datele cuprinse în exemplul 4.1, pentru determinarea abaterii medii


pătratice calculele se sistematizează cu ajutorul tabelului 4.2.

Tabel 4-2 Determinarea abaterii medii pătratice


xi ni xi  x x i x  x  x n
2
i
2
i
f i % x  x
i
2
fi
260 5 -41 1681 8405 2,5 4202,5
270 10 -31 961 9610 5,0 4805,0
280 20 -21 441 8820 10,0 4410,0
290 40 -11 121 4840 20,0 2420,0
300 50 -1 1 50 25,0 25,0
310 30 9 81 2430 15,0 1215,0
320 25 19 361 9025 12,0 4512,5
330 10 29 841 8410 5,0 4205,0
340 10 39 1521 15210 5,0 7605,0
Total 200 - - 66800 100,0 33400,0

În cazul utilizării frecvențelor exprimate în mărimi absolute, abaterea medie pătratică


a seriei se calculează pe baza formulei (4.28), astfel:

 x  x  ni
2
i
66800
 i 1
k
=  334 = 18,27  18 piese/zi
200
n
i 1
i

 x  x  fi
2
i
33400
 i 1
k
= = 18,27≅18 piese/zi
100
f
i 1
i

Același rezultat se obține dacă în locul frecvențelor absolute se vor utiliza frecvențele
relative (ultimele două coloane ale tabelului 4.2).
σ=18 piese/zi înseamnă că, în medie, producția zilnică a unui muncitor se abate de la
nivelul mediu al grupului cu ±18 piese / zi.

Abaterea medie liniară și abaterea medie pătratică se exprimă în aceleași unități


ca și variabila luată în calcul. De aceea, acești indicatori se pot utiliza pentru caracterizarea
gradului de împrăștiere în cadrul oricărei distribuții și pentru compararea împrăștierii unor
distribuții diferite, de aceeași natură și cu caracteristica exprimată în aceleași unități de măsură.
Ei nu pot fi folosiți pentru caracterizarea împrăștierii unor colectivități cu caracteristicile
exprimate în unități de măsură diferite, ca și pentru colectivitățile care, deși au caracteristicile
exprimate în aceleași unități de măsură, diferă prin natura lor.
În aceste situații se utilizează expresia relativă (standardizată) a abaterii medii pătratice,
numită și coeficient de variație.

4. Coeficientul de variație, notat cu v , se calculează ca raport între abaterea medie


pătratică și nivelul mediu al unei variabile, iar pentru a se interpreta mai ușor se exprimă în
procente:

95

v 
 100 (4.15)
x
Coeficientul de variație arată în ce raport se găsește împrăștierea unei variabile,
măsurată prin abaterea medie pătratică, față de nivelul ei mediu. Datorită faptului că acest
indicator sintetic al variației se exprimă în procente, făcând deci abstracție de unitățile de
măsură concrete ale caracteristicilor, el poate fi utilizat pentru compararea gradului de
împrăștiere al unor distribuții care au caracteristica exprimată în unități de măsură diferite.
Coeficientul de variație se poate calcula și prin raportarea abaterii medii liniare la media
aritmetică a distribuției, astfel:
d
v d   100 (4.16)
x
În funcție de valoarea pe care o ia în intervalul [0 – 100 %], are o arie destul de largă de
aplicabilitate, fiind stabilit pentru:
- a preciza gradul de omogenitate a colectivității;
- a testa semnificația reprezentativității mediei;
- a preciza dacă gruparea este bine realizată.
Pornind de la interpretarea rezultatelor care se apropie de limitele intervalului (cu cât
valoarea tinde spre 0, cu atât omogenitatea este mai pronunțată, iar media mai reprezentativă,
în timp ce, rezultatele care se apropie de 100% evidențiază tendința de eterogenitate a seriei și
nereprezentativitate a mediei). Coeficienții de variație se interpretează, în general, după modelul
prezentat în tabelul următor:

Tabel 4-3- Interpretarea teoretică a coeficientului de variație


Intervale de variație Interpretarea rezultatului
0, 35% seria este omogenă
media este reprezentativă
35%, 100% seria NU este omogenă
media NU este reprezentativă

4.1.3 Indicatorii variației pentru o caracteristică alternativă

În vederea ilustrării calculului indicatorilor variației pentru o caracteristică alternativă


se consideră tabelul de mai jos, în care se reprezintă o astfel de distribuție.
Tabel 4-4 - Distribuția unei caracteristici alternative
Caracteristica Numărul unităților Frecvența relativă x if i
xi nI fi
1 n1 p p
0 n2 q 0
Total N 1 p

Valoarea medie a unei caracteristici alternative este egală cu greutatea specifică a


unităților statistice care poartă caracteristica:
2 2

x n i i
n x i fi
xp  i 1
2
 1 sau xp  i 1
2
p i  1,2
n f
n
i i
i 1 i 1

96
Aplicând formula generală a dispersiei și în cazul caracteristicii alternative, se obține:
2

 x  x  fi
2

 2p  i 1
i

0  p2 q  1  p2 p  pq
2
pq
f
i 1
i

 p2  pq (4.17)
deci
sau  p  p(1  p)
2
(4.18)
Din formula (4.32) rezultă că dispersia unei caracteristici alternative este egală cu
produsul între ponderea unităților care posedă nivelul x1 al caracteristicii și ponderea celor care
posedă nivelul x2 al caracteristicii.
Abaterea medie pătratică a caracteristicii alternative va fi prin definiție:
(4.19)
În particular, dacă numărul unităților care posedă nivelul x1 al caracteristicii este egal
cu numărul unităților care posedă celălalt nivel al ei x2, adică p=q =50% atunci dispersia va fi

 p2  0,5  0,5  0,25


 p2  0,25
egală cu:

Nota: 0,25 este valoarea maximă pe care o poate lua dispersia unei caracteristici
alternative.

Indicatorii variației, calculați pentru caracteristici alternative, își găsesc o largă aplicare
în studiul statistic al calității produselor, în cercetările prin sondaj din economie, biologie,
psihologie, pedagogie și, în general, în toate domeniile în care însușirile fenomenelor pot fi
privite drept caracteristici alternative, binare. Din punct de vedere teoretic, orice caracteristică
nealternativă se poate transforma într-o caracteristică alternativă, prin determinarea abaterilor
nivelurilor individuale ale acesteia față de nivelul ei mediu sau față de o valoare reprezentativă
a seriei și prin împărțirea abaterilor, astfel calculate, în două grupe după semnul lor (abateri
pozitive și abateri negative).

4.1.4 Regula de adunare a dispersiilor

Sistematizarea datelor după două variabile (pe variante sau pe intervale de variație) are
ca rezultat obținerea unei serii bidimensionale (bivariate).
Dacă avem două variabile statistice X și Y, pentru care s-au calculat mediile x și y,
media sumei valorilor individuale (x i  y i ) este întotdeauna egală cu suma mediilor
x  y  x  y . În aceeași situație, media produselor valorilor individuale ( x i  y i ) este egală cu

produsul mediilor, numai în cazul în care cele două variabile sunt independente: x  y  x  y .
 
Dacă variabilele sunt dependente, diferența x  y  x  y  0 și poartă denumirea de covarianță
între x și y (covxy) și este un indicator care măsoară intensitatea dependenței legăturii între cele
două variabile.

97
Să presupunem că valorile variabilei X au fost sistematizate pe „r” variante (sau
intervale) și s-au urmărit în fiecare din cele „m” intervale (grupe) formate după o altă variabilă
Y.

Tabel 4-5 Forma teoretică a tabelului unei distribuții bidimensionale


Valorile caracteristicii rezultative ( Y )
Grupe după factorul
Total
(X) y1 y2 ... yj ... ym
m
x1 n11 n12 ... n1 j ... n1m n1   n1 j
j 1
m
x2 n21 n22 ... n2 j ... n2 m n2   n2 j
j 1

... ... ... ... ... ... ...


m

xi ni1 ni 2 ... nij ... n im ni   nij


j 1

... ... ... ... ... ... ...


m
xr n r1 nr 2 ... nrj ... n rm nr   nrj
j 1
r r r r r m
Total n1`   ni1 n2`   ni 2 ... n `j   nij ... nm`   nim n   nij
i 1 i 1 i 1 i 1 i 1 j 1

În tabelul nr. 4.5 apar pentru variabila efect (Y) două tipuri de repartiții:
a) o repartiție pe total (yj, nj), care nu ține seama de grupele construite după caracteristica
considerată cauza;
b) r repartiții condiționate de grupele construite după caracteristica de grupare.
Corespunzător celor două tipuri de repartiții se pot calcula pentru variabila Y
următoarele medii:
- o media generală respectiv pentru repartiția pe total (𝑦
̅̅̅0 )
∑𝑚 𝑟
𝑗=1 𝑦𝑗 𝑛𝑗 ∑𝑖=1 𝑦 ̅𝑛
𝑦
̅̅̅0 = ∑𝑚 = ∑𝑟 𝑖 𝑖 (4.20)
𝑗=1 𝑛𝑗 𝑖=1 𝑛𝑖
- medii de grupă sau medii condiționate de factorul de grupare (𝑦
̅i ), pentru repartițiile
condiționate:
∑𝑚
𝑗=1 𝑦𝑗 𝑛𝑖𝑗
𝑦̅𝑖 = 𝑚 (4.21)
∑𝑗=1 𝑛𝑖𝑗
Numărul mediilor de grupă este egal cu numărul grupelor construite după caracteristica
factorială. Media mediilor de grupă este egală cu media generală.
Pornind de la valorile individuale (𝑦𝑗 ), mediile condiționate (𝑦 ̅𝑖 ) și de la media generală
(̅̅̅
𝑦0 ) se pot determina următoarele abateri:
- variația valorilor individuale în jurul mediei generale, 𝑦𝑗 - ̅̅̅ 𝑦0 ;
- variația valorilor individuale în jurul mediilor de grupă (condiționate), 𝑦𝑗 - 𝑦 ̅𝑖 ;
- abaterea mediilor condiționate de la media generală, 𝑦 ̅𝑖 - ̅̅̅
𝑦0 .
Corespunzător celor trei tipuri de abateri la nivelul fiecărei unități observate se poate
scrie:
𝑦𝑗 - ̅̅̅
𝑦0 = (𝑦𝑗 - 𝑦̅𝑖 )+(𝑦̅𝑖 - ̅̅̅
𝑦0 ) (4.22)
Ce semnificație au aceste abateri?
 𝑦𝑗 - ̅̅̅
𝑦0 − măsoară variația valorilor individuale în jurul mediei generale. Dacă
98
valorile empirice înregistrate (𝑦𝑗 ) sunt rezultatul influenței tuturor factorilor
(esențiali și neesențiali) iar media presupune că toți factorii sunt constanți,
înseamnă că această diferență exprimă variația valorilor individuale în jurul
mediei sub acțiunea tuturor factorilor: factorul X considerat esențial si toți
ceilalți factori, considerați neesențiali.
 𝑦𝑗 - 𝑦 ̅𝑖 − măsoară variația valorilor individuale de la media de grupă, deci
exprimă variația în interiorul fiecărei grupe construite după factorul X. cum
factorul X are aceiași valoare în cazul tuturor unităților din aceiași grupă,
înseamnă că această diferență se datorează acțiunii cauzelor din interiorul grupei,
deci factorilor neesențiali.
 𝑦 ̅𝑖 - ̅̅̅
𝑦0 − evidențiază influența factorului esențial, de grupare (X), asupra
variației valorilor în jurul mediei generale.
Pe baza acestor abateri se pot calcula următoarele dispersii:
 Dispersia generală (02 sau y2) se determină pentru repartiția marginală
construită pentru Y, și ca urmare, nu ține seama de grupele construite după
factorul X.
𝑚 2
∑ 𝑗=1(𝑦 𝑗 − 𝑦
̅̅̅)
0 𝑛𝑗
𝜎02 = 𝜎𝑦2 = (4.23)
∑𝑚𝑗=1 𝑛 𝑗
2
 Dispersia de grupă sau dispersia condiționată (𝜎𝑖 ) măsoară variația la nivelul
fiecărei grupe construite după factorul X. Numărul dispersiilor de grupă este egal
cu numărul grupelor stabilite după caracteristica considerată cauză (i = 1, 2 ... r).
2
2
∑𝑚𝑗=1(𝑦𝑗 − 𝑦 ̅)
i 𝑛𝑖𝑗
𝜎𝑖 = (4.24)
∑𝑚𝑗=1 𝑛𝑖𝑗
Fiecare dispersie de grupă măsoară variația valorilor variabilei dependente sub influența
factorilor din interiorul grupei respective, care sunt priviți ca factori neesențiali în raport cu
factorul X.
Pentru a măsura acțiunea tuturor factorilor neesențiali din toate grupele se calculează
media dispersiilor de grupă.
Media dispersiilor de grupă (𝜎 ̅̅̅2̅) este o medie aritmetică a dispersiilor de grupă:
∑𝑟𝑖=1 𝜎𝑖2 𝑛𝑖
̅̅̅2 =
𝜎 (4.25)
∑𝑟𝑖=1 𝑛𝑖
2
 Dispersia dintre grupe (  2 sau 𝜎𝑦/𝑥 ) sau dispersia explicată măsoară variația
mediilor de grupă de la media generală si exprimă variația datorată acțiunii
factorilor de grupare, deci X.
2 2
∑𝑟𝑖=1(𝑦̅𝑖 − ̅̅̅)
𝑦0 2 𝑛𝑖
𝛿 = 𝜎𝑦/𝑥 = (4.26)
∑𝑟𝑖=1 𝑛𝑖
Pornind de la factorii de influență care determină variația valorilor variabilei Y, între
dispersiile menționate există relația:
02=2 + 2 (4.27)
Această relație este cunoscută sub denumirea de “regula de adunare a dispersiilor” sau
“ecuația fundamentală a analizei dispersionale”.
Pe baza celor trei dispersii se pot construi alți indicatori:
 gradul de determinație (R2)
2
R2  100 (4.28)
 02

99
 gradul de nedeterminație (K2)
2
K2  100 (4.29)
 02
Gradul de determinație (R2) exprimă măsura în care variația caracteristicii urmărite
depinde de factorul principal sistematic după care s-a structurat colectivitatea în grupe
omogene, adică arată intensitatea legăturii dintre variabila X și variabila Y. Cu cât valoarea lui
se apropie de 1, cu atât legătura este mai strânsă și cu cât valorile sale sunt mai apropiate de
zero legătura dintre X și Y este mai slabă. Dacă R2=0 înseamnă că între variația celor două
variabile nu există nici o legătură.
Gradul de nedeterminație (K2) exprimă măsura în care variația caracteristicii depinde de
variația factorilor aleatori, ce acționează în interiorul grupelor.
Între cei doi indicatori există următoarea relație:
R 2  K 2  100 (4.30)
Dacă R K , înseamnă că factorul principal de grupare acționează în mod hotărâtor
2 2

asupra variației caracteristicii xi.


Dacă R2K2, variația caracteristicii se datorează influenței exercitate de alte cauze, de
factori întâmplători.

4.2 CONCENTRAREA

Studiul concentrării permite analiza structurală a colectivităților a căror caracteristică


este o mărime pozitivă și cumulativă. Astfel se poate cerceta distribuția întreprinderilor după
mărimea veniturilor, după cifra afacerilor, după suprafața cultivată, distribuția populației pe
localități, pe zone administrative etc. Studiul concentrării urmărește să caracterizeze gradul de
apropiere (respectiv de depărtare) a unei distribuții concrete, observate, față de distribuția
egalitară corespunzătoare a caracteristicii luate în considerare.
În general, o repartiție egalitară a volumului unei caracteristici între unitățile statistice
ale unei colectivități se reprezintă în așa fel încât n% dintre unitățile statistice posedă n% din
volumul caracteristicii, oricare ar fi valoarea lui n. Fie o serie statistică:
 x , x2 , ..., xi , ..., xk 
X :  1 
 n1 , n2 , ..., ni , ..., nk 
Luând în considerare:
 Frecvențele cumulate:
N i  N i 1  ni  i  1, k
 Produsele xi ni cumulate:
Li  Li 1  xi ni i  1, k
se determină punctele de coordonate  pi , qi  pe baza relațiilor:
Ni
pi  k

n
i 1
i

Li
qi  k

xn
i 1
i i

100
Reprezentând într-un sistem de axe rectangulare (figura 4.1) cele două variabile pi și qi
pe ordonată și respectiv pe abscisă, bisectoarea axelor de coordonate OA va reprezenta
distribuția egalitară a volumului caracteristicii studiate, iar funcția f(qi ,pj) ia forma unei curbe
ODA cu atât mai îndepărtată de diagonala pătratului cu cât distribuția studiată va fi mai
concentrată, mai inegalitară. Această curbă poartă denumirea de curbă de concentrare sau
curba Lorentz - Gini.
qi(%)
100

80
Suprafața de
60 concentrare

40
Curba de
concentrare
20

0
0 20 40 60 80 100 pi(%)
Figura 4-1- Curba de concentrare și suprafața de concentrare
Relația dintre mediană, medială și concentrarea unei variabile se poate ilustra și pe cale
grafică (figura 4.2).

qi (a) qi (b) (c)


100 100 100 qi

Me 50 50 50
Me

Me
0 pi 0 pi pi
50 100 50 Ml 100 0 50 Ml 100
Ml
abc
Figura 4-2- Gradul de concentrare

Din figura 4.2(a) se observă că, în cazul în care curba de concentrare se confundă cu
diagonala pătratului, nu există nici un fel de concentrare, iar abaterea dintre mediană și medială
este nulă. Absența concentrării înseamnă, în cazul unei întreprinderi după producția zilnică
obținută, că m% dintre muncitori realizează m% din producția totală. Există deci o concordanță
perfectă între numărul de muncitori și producția obținută. Acest tip de distribuție poartă
denumirea de distribuție egalitară sau de echirepartiție, căreia îi corespunde o concentrare nulă.
În situația opusă, când curba de concentrare se confundă cu laturile pătratului,
concentrarea este maximă. Teoretic, acest caz extrem se poate interpreta astfel: 99% dintre
muncitori realizează o producție egală cu zero și un singur procent dintre muncitori realizează
întreaga producție 100%.

101
Între aceste două situații extreme se situează cazurile reale de concentrare. Figura 4.2(b)
reprezintă o repartiție cu o slabă concentrare, iar figura 4.2(c) una cu un grad mare de
concentrare.
În general, gradul de concentrare variază proporțional cu mărimea suprafeței cuprinse
între curba de concentrare și diagonala pătratului, numită suprafață de concentrare. Cu cât
această suprafață este mai mică, cu atât gradul de concentrare este mai redus și invers.

Exemplul 4.3:

Distribuția județelor României după numărul bibliotecilor instituțiilor de


învățământ superior, în 2012, este următoarea:

Tabel 4-6
Intervale de variație a Număr
județelor după nr. județe Ni pi xi xi ni Li qi
biblioteci ni
1-3 12 12 0,5714 2 24 24 0,3000
3-5 5 17 0,8095 4 20 44 0,5500
5-7 1 18 0,8571 6 6 50 0,6250
7-9 1 19 0,9047 8 8 58 0,7250
9 - 11 1 20 0,9523 10 10 68 0,8500
11 - 13 1 21 1 12 12 80 1
Total 21 - - - 80 - -
Limita inferioară inclusă în interval

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Figura 4-3 – Curba de concentrare aferentă distribuției bibliotecilor la nivelul


județelor

Interpretare:
Curba de reprezentare pe baza punctelor  pi , qi  stabilite de rezultatele obținute
0,5714; 0,3000; 0,8095; 0,5500; 0,8571; 0,6250; 0,9047; 0,7250; 0,9523; 0,8500; 1;1
fiind foarte apropiată de diagonala pătratului, se poate evidenția o concentrarea moderată a
bibliotecilor pe județe (disparitățile fiind reduse) în anul 2012.
Corespondența  pi , qi  arată că:
 30% din totalul bibliotecilor revine unui procent de 57,14% din totalul județelor;

102
 55% din totalul bibliotecilor revine unui procent de 80,95% din totalul județelor;
 62,50% din totalul bibliotecilor revine unui procent de 85,71% din totalul județelor;
 72,50% din totalul bibliotecilor revine unui procent de 90,47% din totalul județelor;
 85% din totalul bibliotecilor revine unui procent de 95,23% din totalul județelor.

Statisticianul italian Corrado Gini a formulat pentru prima dată un indicator al gradului
de concentrare în raport cu suprafața de concentrare, numit indice de concentrare. Indicele de
concentrare Ic este egal cu raportul dintre mărimea suprafeței de concentrare C și jumătate din
aria pătratului S/2:
sup rafata de concentrare
ic 
aria patratului (4.31)
2
Deoarece suprafața de concentrare variază între 0 și jumătate din aria pătratului, rezultă
că:
0  ic  1
ic = 0 corespunde lipsei de concentrare
ic = 1 corespunde concentrării maxime
Desigur, gradul de concentrare în realitate nu atinge aceste limite ci se situează în
interiorul lor.
Indicele de concentrare se poate determina în mai multe feluri:
a) Pe baza suprafeței de concentrare.
Mărimea suprafeței de concentrare se poate calcula pe cale grafică prin însumarea
suprafețelor triunghiurilor, trapezelor și pătratelor înscrise în interiorul ei cu ajutorul formulei:
S
IIGC  c
1 (4.32)
Sp
2
b) Gradul de concentrare se poate aprecia și cu ajutorul diferenței dintre mediană și
medială, notată cu  Me,Ml :
 Me,Ml  Ml  Me  0 (4.33)

Indicele de concentrare Gini

Indicatorul propus de statisticianul italian Corrado Gini pentru a măsura gradul de


concentrare a variantelor unei distribuții este mai mult un indicator de măsurare a inegalității
distribuției, adică a abaterii distribuției studiate față de o distribuție perfect egalitară.
Coeficientul lui Gini nu ia în considerare mișcările de concentrare. Astfel, dacă un
anumit număr de întreprinderi de aceeași mărime fuzionează pentru a forma un număr mai mic
de întreprinderi de aceeași mărime (evident mai mare decât în primul caz) se înțelege că are loc
un proces de concentrare, dar indicele lui Gini nu se modifică. În unele cazuri particulare
indicatorul lui Gini poate chiar denatura realitatea.
k
Relația de calcul este CG  g
i 1
2
i (4.34)

 1 
Interpretarea valorilor coeficientului Gini se realizează în raport cu intervalul  , 1 , astfel:
 n 

103
1
- dacă CG  , atunci repartiția este absolut uniformă
n
- dacă CG  1 , atunci repartiția este concentrată pe o singură unitate teritorială

Se poate utiliza și forma sa modificată de către statisticianul R. Struck


k
n   gi2  1
(4.35)
CS  i 1
n 1
Valorile coeficientului Struck se interpretează în raport cu intervalul 0, 1, astfel:
- dacă CS  0 , atunci repartiția este absolut uniformă
- dacă CS  1 , atunci repartiția este concentrată pe o singură unitate teritorială

Exemplul 4.4

Pe baza datelor exemplului 4.3 se măsoară gradul de concentrare cu ajutorul


coeficienților Ginni și Struck.

Tabel 4-7
Intervale variație a Număr județe
județelor după nr.
ni xi xi ni gi g i2
biblioteci
1-3 12 2 24 0,3 0,09
3-5 5 4 20 0,25 0,06
5-7 1 6 6 0,075 0,01
7-9 1 8 8 0,1 0,01
9 - 11 1 10 10 0,125 0,02
11 - 13 1 12 12 0,15 0,02
Total 21 - 80 1 0,21

k
CG  g
i 1
2
i  0,21  0,45

k
n   g i2  1
21  0,21  1
CS  i 1
  0,41
n 1 21  1
Interpretare:
Și prin intermediul acestor indicatori se evidențiază concentrarea moderată a
bibliotecilor pe județe în anul 2012.

104
4.3 FORMA DISTRIBUȚIILOR

În urma desfășurării activităților din economie se obțin date statistice a căror repartiție
urmează într-o măsură mai mică sau mai mare distribuția teoretică Gauss-Laplace.
Forma distribuției este evidențiată fie prin intermediul abaterilor de la cazul simetriei în
jurul valorilor centrale, fenomen denumit oblicitate, asimetrie, fie prin înălțimea curbei
repartiției, adică gradul de boltire.

4.3.1 Asimetria distribuțiilor

Abaterile distribuțiilor datelor empirice de la cele teoretice considerate simetrice


evidențiază tendințele urmate de repartiții în direcția stabilirii a două tipuri de asimetrii: de
dreapta sau de stânga.
Distribuția unei caracteristici care prezintă un câmp redus de variație determină un grad
ridicat de reprezentativitate a mediei și conturează o repartiție tot mai apropiată de cea simetrică.
În practică, se întâlnesc atât distribuții simetrice, cât și asimetrice, a căror fluctuație cuprinde
toate tipurile de la cele ușor asimetrice, până la cele cu tendință pronunțată de asimetrie.
Când variația caracteristicii este simetrică față de valoarea centrală a acesteia, atunci
compensarea abaterilor se face atât pe ansamblul seriei, cât și în interiorul acesteia, frecvențele
de apariție a abaterilor fiind egal repartizate de ambele părți ale valorii centrale.
Gradul de asimetrie se stabilește în raport cu poziția și valorile pe care le au cei trei
indicatori ai tendinței centrale: media, mediana și modul, astfel:
 dacă mediana sau modul se află plasate în partea dreaptă față de medie pe grafic,
întâlnim asimetrie de dreapta;
 dacă mediana sau modul se află plasate în partea stângă față de medie pe grafic,
întâlnim asimetrie de stânga.
Măsurarea și stabilirea gradului de asimetrie se poate realiza prin utilizarea unor
indicatori absoluți sau relativi. Cel mai semnificativ și frecvent aplicat este coeficientul de
asimetrie Pearson (Cas):
x  Mo
C as    1,1 (4.36)

În condițiile în care seria de repartiție nu are modul sau este bimodală, multimodală
(frecvența cea mai mare apare de două sau de mai multe ori) care tinde spre normalitate, se
recomandă calcularea coeficientului de asimetrie stabilit pe baza medianei(C`as).

 
C as
3 x  Me   (4.37)

Interpretările celor doi coeficienți se prezintă astfel:

Tabel 4-8 Semnificațiile valorilor coeficienților de asimetrie


Dacă Cas  0 , Cas'  0 seria este SIMETRICĂ
Coeficient de asimetrie Pearson Coeficient de asimetrie Pearson

C as 
x  Mo
  1,1  
C as

3 x  Me    3,3
 
Interval Tipul asimetriei Interval Tipul asimetriei
Cas   1 ;  0,5 C   3 ;  1,5
'
as
Asimetrie pronunțată Asimetrie pronunțată
Cas  0,5 ; 1 Cas'  1,5 ; 3

105
Cas   0,5 ; 0 Cas'   1,5 ; 0
Asimetrie redusă Asimetrie redusă
Cas  0 ; 0,5 Cas'  0 ; 1,5

Un alt coeficient de asimetrie se poate determina pe baza momentelor centrate3, astfel:


32
1  (4.38)
 23
Indicatorul asimetriei stabilit de obicei prin programele informatice de analiză statistică
este coeficientul de asimetrie Fisher. Acest coeficient se determină pe baza momentelor
centrate, astfel:
3
  1  (4.39)
1
 23
Momentul centrat de ordin doi (  2 ), cunoscut și sub denumirea de dispersie, este determinat:
n

 x  x 
2
i
(4.40)
 în cazul seriei simple:  2  i 1
2
n
n

 x  x  n
2
i i
 în cazul seriei cu frecvențe:  2  i 1
n
2 (4.41)
 ni
i 1

Momentul centrat de ordin trei ( 3 ) determinat:


n

 x  x 
3
i
(4.42)
 în cazul seriei simple: 3  i 1
n
n

 x  x  n
3
i i
 în cazul seriei cu frecvențe: 3  i 1
n (4.43)
n
i 1
i

Având în vedere că semnul coeficientului de asimetrie Fisher este dat de cel al


momentului centrat de ordin trei, interpretarea evidențiază forma repartiției astfel:
o dacă  =0, atunci repartiția este simetrică
1

o dacă  1
≠0, atunci repartiția este asimetrică
Valorile negative sunt considerate asimetrii la stânga, iar valorile pozitive indică asimetrii la
dreapta.

3
Momentele centrate de ordin „m” reprezintă medii ale abaterilor valorilor de la o valoare medie, calculat:
n

 x  x 
n

 x  x 
m m
i i ni
m  i 1
(serie simplă) sau  m  i 1
n
(serie cu frecvențe)
n
n
i 1
i

106
4.3.2 Boltirea/aplatizarea distribuțiilor

Ca forme ale distribuției, boltirea/ aplatizarea permit compararea curbei frecvențelor


repartiției empirice cu reprezentarea curbei clopotului Gauss-Laplace de aceeași medie și
dispersie, conducând la stabilirea gradului de boltire.
Programele statistice pe calculator permit stabilirea boltirii unei repartiții prin
intermediul mai multor indicatori printre care, cel mai utilizat, este coeficientul de boltire
Fisher. Acest coeficient se determină pe baza momentelor centrate, pornind de la coeficientul
de boltire Pearson astfel:
4 
 2  2  3   3  42  3 (4.44)
 4
2
Momentul centrat de ordin doi (  2 ), cunoscut și sub denumirea de dispersie, a fost prezentat în
cazul coeficientului de asimetrie Fisher prin intermediul relațiilor 4.53 și 4.54:
Momentul centrat de ordin patru (  4 ) determinat:
n

 x  x 
4
i
(4.45)
 în cazul seriei simple:  4  i 1
n
n

 x  x  n
4
i i
 în cazul seriei cu frecvențe:  4  i 1
n (4.46)
 ni
i 1
Coeficientul de boltire Pearson
4 4
2   (4.47)
 4 22
Atât aprecierea grafică a boltirii, cât și determinarea coeficienților de boltire conduc la
următoarele trei cazuri:
1. cazul repartiției mezocurtice: curba normală coincide cu cea a distribuției empirice, iar
  3 și    0
2. cazul repartiției leptocurtică: variație mare a frecvenței distribuției empirice comparativ
cu cea a curbei normale, iar   3 și    0
3. cazul repartiției platicurtică: variație redusă a frecvenței distribuției empirice comparativ
cu cea a curbei normale, iar   3 și    0

Se prezintă în continuare modalitățile de determinare a asimetriei (oblicității) și boltirii.

Exemplu 4.9

Pe baza datelor de mai jos și a rezultatelor prealabile stabilite ( x  7,9 sute


buc./salariat, M o  8 sute buc/salariat, M e  8 sute buc/salariat,   1,37 sute
buc.), să se măsoare asimetria și boltirea distribuției:

107
Tabel 4-9
Producție Nr. salariați
( x i ) - (sute buc.) ( ni )
xi  x xi  x 2 ni xi  x 3 ni xi  x 4 ni
5 2 -2,93 17,21 -50,48 148,07
7 3 -0,93 2,61 -2,44 2,28
8 5 0,07 0,02 0,00 0,00
9 4 1,07 4,55 4,85 5,18
12 1 4,07 16,54 67,25 273,50
TOTAL 15 40,93 19,19 429,03

Rezolvare
Măsurarea asimetriei distribuției privind producția realizată de 15 salariați ai unei
echipe, cu ajutorul coeficienților Pearson, se prezintă astfel:
x  Mo
7,9  8
C as    0,07   0,5;0 , deci distribuției salariaților după
 1,65
producția vândută îi corespunde o asimetrie redusă de dreapta (modul e plasat în dreapta față
de medie pe grafic).

3x  M e  37,9  8
`
Cas    0,21  1,5;0 , deci distribuției salariaților după
 1,65
producția vândută îi corespunde o asimetrie redusă de dreapta (mediana e plasată în dreapta
față de medie pe grafic).

Măsurarea asimetriei distribuției privind producția prin intermediul momentelor


centrate presupune determinarea coeficientului de asimetrie Pearson ( 1 ):
n

 x  x  ni
2
i
40,9
2   2   2,72 ;  2  7,44 ;  2  20,32
i 1 2 3
n

n
15
i
i 1
n

 x  x  ni
3
i
19,19
3  i 1
n
  1,27
n
15
i
i 1
n

 x  x  ni
4
i
429,02
4  i 1
n
  28,6
n
15
i
i 1


1,27
  0,28
1
20,32
Valoarea coeficientului este pozitiva, dar redusă, astfel, și această metodologie de
analiza a asimetriei confirmă caracterul moderat al asimetriei de dreapta prezente în cadrul
distribuției analizate.
Măsurarea boltirii distribuției privind producția prin intermediul momentelor centrate
presupune atât determinarea coeficientului de boltire Pearson (  2 ), cât și a coeficientului de
boltire Fisher (  2 ) :

108
 4  4 28,6
2     3,84  3
 4  22 7,44
 
 2   2  3  44  3  42  3  3,84  3  0,84  0
 2
Rezultatele obținute au condus la   3 și  2  0 ceea ce însemnă că distribuția
producției are o formă leptocurtică.

Aplicarea diferențiată a metodelor și procedeelor de calcul statistic trebuie să se bazeze


pe un studiu teoretic prin care să se ia în considerare tendințele obiective de dezvoltare a
fenomenelor și proceselor apărute pe parcursul derulării activităților din economie.

4.4 APLICAȚII

Aplicație rezolvată - continuare

Rezultatul grupării salariaților pe intervale egale de producție va reprezenta punctul


de plecare și în exemplificarea indicatorilor variației.

Tabel 4-10
Producție Nr.
- buc. - salariați
Xi ni
20-30 7
30-40 9
40-50 19
50-60 7
60-70 8
TOTAL 50
*limită inferioară inclusă în interval

Cerințe:
1. Caracterizați variabilitatea față de tendința centrală cu ajutorul indicatorilor simpli
și sintetici ai variației.
2. Caracterizați concentrarea regăsită în cadrul distribuției.
3. Utilizând gruparea combinată a salariaților după cele două variabile urmărite
realizată la capitolul II, să se deducă proporția în care variația producției este determinată de
variația vârstei salariaților.
4. Determinați media și dispersia pentru salariații cu o producție egală sau mai mare
decât 50 de bucăți.
5. Să se caracterizeze asimetria si boltirea distribuției de valori.

109
Rezolvare:

Cerința nr. 1

 Un indicator simplu al variației, care oferă o imagine generală asupra dispersiei,


este distanța dintre nivelul maxim și nivelul minim al variabilei sau amplitudinea variației.
Ax = xmax – xmin

Ax =70-20=50 buc

Interpretare: Distanța dintre nivelul maxim și nivelul minim al producției realizate este
de 50 de bucăți-producție.

 abaterile nivelurilor individuale ale unei variabile față de nivelul lor mediu,
notate cu di, și care se pot calcula după formula:
d i  xi  x ,
Media aritmetică a distribuției a fost determinată și are valoarea x =45 buc/salariat

Determinarea abaterilor individuale față de media aritmetică a distribuție se prezintă în


următorul tabel:
Tabel 4-11
Producție Nr.
salariați
a r
- buc. - x' di di
Xi ni
20-30 7 25 -20 -44%
30-40 9 35 -10 -22%
40-50 19 45 0 0%
50-60 7 55 10 22%
60-70 8 65 20 44%
TOTAL 50 - - -

 Abaterile di se pot exprima și în mărimi relative prin raportarea lor la nivelul mediu
al variabilei, astfel:
di x x
di %   100  i  100
x x

În practică, aceste abateri se utilizează pentru calculul ulterior al indicatorilor sintetici


ai variației

Interpretare:
Se observă că prima grupă de salariați a reușit să producă cu 20 de bucăți mai puțin
decât media colectivității sau putem prezenta în formă relativă că au produs cu 44% mai puțin
decât media colectivității. În mod asemănător se interpretează și valorile determinate pentru
intervalele de grupare următoare, cu precizarea că valorile pozitive exprimă depășiri ale
nivelului mediu al colectivității.

Indicatorii sintetici ai variației se caracterizează prin faptul că, în calculul lor, includ
abaterile tuturor nivelurilor individuale ale unei variabile față de nivelul lor mediu.

110
 Abaterea medie liniară, notată cu d , se determină ca o medie aritmetică (simplă
sau ponderată) a abaterilor nivelurilor individuale ale unei variabile față de media lor aritmetică,
considerate în valoare absolută.
k

x i  x ni
d  i 1
k

n i 1
i

Abaterea medie liniară se poate calcula și față de mediană.


Determinarea valorii de la numărătorul relației o vom realiza cu ajutorul următorului
tabel:

Tabel 4-12
Producția Nr.
(buc) salariați x' di xi  x ni
Xi ni
20-30 7 25 -20 140
30-40 9 35 -10 90
40-50 19 45 0 0
50-60 7 55 10 70
60-70 8 65 20 160
Total 50 - - 460

460
d   9,2
50
Deoarece producția este o caracteristică statistică cu variație discretă (discontinuă), se
va rotunji rezultatul obținut la valoarea întreagă 9 buc.

Interpretare:
Putem concluziona că fiecare salariat, din rândul celor 50 analizați, s-a abătut de la
producția medie a eșantionului selectat, în medie, cu 9 buc/salariat.

 Dispersia, notată cu  , se calculează ca o medie aritmetică a pătratelor abaterilor


2

nivelurilor individuale ale unei variabile de la nivelul lor mediu (media aritmetică).
k

 x  x  ni
2
i
2  i 1
k

n
i 1
i

Tabel 4-13
Producția Nr.
(buc)
Xi
salariați
ni x' di xi  x 2 ni
20-30 7 25 -20 2800
30-40 9 35 -10 900
40-50 19 45 0 0
50-60 7 55 10 700
60-70 8 65 20 3200
Total 50 - - 7600
7600
2   152
50

111
Interpretare:
Dispersia este un indicator cu un caracter economic abstract. Astfel, valoarea acestui
indicator nu poate fi interpretată din punct de vedere economic și nici nu se va prezenta vreo
unitate de măsură.

 Abaterea medie pătratică, numită și abatere standard sau abatere tip se notează
cu  și se calculează prin extragerea rădăcinii pătrate din dispersie. Abaterea medie pătratică
reprezintă media pătratică a abaterilor nivelurilor individuale ale caracteristicii față de media
lor.
k

 x  x  ni
2
7600
i
 12,32
 i 1
k 50
n
i 1
i

Deoarece producția este o caracteristică statistică cu variație discretă (discontinuă), se


va rotunji rezultatul obținut la valoarea întreagă 12 buc/salariat.

Interpretare:
Interpretarea abaterii pătratice se realizează după modelul prezentat în cazul abaterii
liniare, fiecare salariat, din rândul celor 50 analizați, s-a abătut de la producția medie a
eșantionului selectat, în medie cu 12 buc/salariat.

 Coeficientul de variație, notat cu v, se calculează ca raport între abaterea medie și


nivelul mediu al unei variabile, iar pentru a se interpreta mai ușor se exprimă în procente:
 d
v   100 vd   100
x x
• Cu cât valorile sale sunt mai apropiate de zero, cu atât seria este mai omogenă (media
este mai reprezentativă)
• Cu cât valorile sale sunt mai apropiate de 100 cu atât ansamblul valorilor individuale
observate este mai eterogen (împrăștierea este mai mare, iar media calculată este mai puțin
reprezentativă).
• Practica utilizării coeficientului de variație a stabilit pragul de trecere de la starea de
omogenitate la cea de eterogenitate: dacă v <=35% colectivitatea este omogenă; dacă v>35%
colectivitatea este eterogenă.

12 9
v   100  27% vd  100  20%
45 45

Interpretare:
Valorile determinate ale coeficientului de variație se situează sub valoare de 35%, astfel
concluzionăm că eșantionul celor 50 de salariați analizați este unul omogen din perspectiva
variabilei producție și, totodată, rezultă că și media producției este reprezentativă din punct de
vedere statistic.

112
Cerința nr. 2
Concentrarea distribuției

Concentrarea distribuției va fi caracterizată cu ajutorul coeficientului Corado Gini


k
CG= g
i 1
2
i
,

alături de forma sa modificată de către statisticianul R. Struck


k
n   g i2  1
i 1
CS= .
n 1
Aceștia utilizează greutățile specifice gi ce au fost determinate la capitolul mărimi
relative. Ca atare, ne vom ajuta de valorile deja determinate si reluate în tabelul următor. Dacă
valoarea coeficientului, denumit în final Gini-Struck tinde către 1, indică un grad ridicat de
concentrare a producției, și dacă valoarea coeficientului tinde către 0, indică un grad slab de
concentrare a structurii producției analizate în cadrul eșantionului de salariați.

Tabel 4-14
Producție Nr.
- buc. - salariați gi gi2
Xi ni
20-30 7 0,08 0,006
30-40 9 0,14 0,020
40-50 19 0,38 0,144
50-60 7 0,17 0,029
60-70 8 0,23 0,053
TOTAL 50 1 0,253

CG= 0,253  0,50, iar


50  0,253  1
CS= =0,49
50  1
Valorile obținute sunt foarte apropiate și putem deduce că se regăsește o concentrare
moderată a producției în cadrul eșantionului de salariați.

Cerința nr. 3

Pentru a estima proporția influenței variației vechimii în muncă asupra variației


producției obținute se va porni de la gruparea combinată realizată utilizând cele două variabile.

Tabel 4-15
Producție - buc. -
Vechime Yj
-ani-
20-30 30-40 40-50 50-60 60-70
Xi Total
25 35 45 55 65
≤ 15 ani 7 9 17 - - 33
> 15 ani - - 2 7 8 17
Total 7 9 19 7 8 50

113
În vederea stabilirii coeficientului de determinație se vor parcurge următoarele etape de
calcul:

1. Se calculează mediile de grupă, mediile producțiilor pentru cele două grupe de


vechime evidențiate:
∑𝑚
𝑗=1 𝑦𝑗 𝑛𝑖𝑗
𝑦̅𝑖 = 𝑚
∑𝑗=1 𝑛𝑖𝑗
25  7  35  9  45  17 38,03≈38 buc./salariat
y1  
33
45  2  55  7  65  8 58,53≈59 buc./salariat
y2  
17
2. Se calculează media generală:

y i  ni.
y0  i 1
r

n
i 1
i.

38  33  59 17
y0   45 buc./salariat
50
y 0 reprezintă producția medie realizată la nivelul celor 50 de salariați.
3. Se calculează dispersia generală:
2
2
∑𝑚
𝑗=1(𝑦𝑗 − ̅̅̅)
𝑦0 𝑛𝑗
𝜎0 =
∑𝑚
𝑗=1 𝑛𝑗
2 2
2
(25 − 45) ∙ 7 + (35 − 45) ∙ 9 + (45 − 45)2 ∙ 19 + (55 − 45)2 ∙ 7 + (65 − 45)2 ∙ 8
𝜎0 =
50
=
152
2
4. Se calculează dispersiile de grupă sau dispersia condiționată (𝜎𝑖 ):
2
2
∑𝑚
𝑗=1(𝑦𝑗 − 𝑦̅)
i 𝑛𝑖𝑗
𝜎𝑖 =
∑𝑚𝑗=1 𝑛𝑖𝑗
(25 − 38) ∙ 7 + (35 − 38) ∙ 9 + (45 − 38)2 ∙ 17 2097
2 2
𝜎12 = = = 63
33 33

(45 − 59)2 ∙ 2 + (55 − 59)2 ∙ 7 + (65 − 59)2 ∙ 8 792


𝜎22 = = = 46
17 17
5. Se calculează media dispersiilor de grupă (𝜎 ̅̅̅2̅):
∑𝑟𝑖=1 𝜎𝑖2 𝑛𝑖
̅̅̅
2
𝜎 =
∑𝑟𝑖=1 𝑛𝑖
̅̅̅ 63 ∙ 33 + 46 ∙ 17
𝜎2 = = 57
50
2
6. Se calculează dispersia dintre grupe (𝛿 2 ) sau dispersia explicată (𝜎𝑦/𝑥 )
2
∑𝑟𝑖=1(𝑦̅𝑖 − ̅̅̅)
𝑦0 2 𝑛𝑖
𝛿 =
∑𝑟𝑖=1 𝑛𝑖

114
(38 − 45)  33 + (59 − 45)  17
2 2
2
𝛿 = = 98
55

Pentru determinarea proporției în care variația vechimii salariaților influențează


2

producția se va utiliza relația coeficientului de determinație R 2


 100 care presupune
 02
y/x

raportarea dispersiei sistematice (explicate) la dispersia totală.


2 98
Astfel coeficientului de determinație 𝑅𝑦/𝑥 = 152 ∙ 100 = 64% ceea ce înseamnă că
aproximativ 64% din variația producției celor 50 de salariați se datorează deosebirilor privind
vechimea în câmpul muncii.
Gradul de nedeterminație K 2   2 100 =152 ∙ 100 =36%
2 57

0
Cota parte de 36% din producției se poate explica prin acțiunea tuturor celorlalți factori
considerați neesențiali, reziduali.

Cerința nr. 4

Pentru determinarea mediei și a dispersiei pentru salariații cu o producție egală sau mai
mare decât 50 de bucăți se va restructura distribuția salariaților de pe 5 intervale de grupare pe
doar 2.

Tabel 4-16
Producție Nr. Producție Nr.
- buc. - salariați - buc. - salariați
Xi ni Xi ni
20-30 7
 50 buc. 35
30-40 9
40-50 19
50-60 7  50 buc. 15
60-70 8 TOTAL 50
TOTAL 50

Variabila producție se prezintă, după restructurare, după modelul uneia de tip alternativ.
Astfel, pentru determinarea mediei și a dispersiei pentru salariații cu o producție egală sau mai
mare decât 50 de bucăți se vor utiliza relațiile specifice unei caracteristici alternative.
M 15
Nivelul mediu se va determina după relația xp  = =0,3 (30%)
N 50
Nivelul mediu în cazul variabilelor alternative se interpretează ca o pondere, astfel se
poate preciza că 30% dintre salariați au obținut o producție egală sau mai mare de 50 de bucăți.
Dispersia se determină după relația
  p (1  p )
2
p

 p2  0,3(1  0,3)  0,21


Ca și în cazul variabilelor nealternative, valoarea dispersiei nu se va interpreta din punct
de vedere economic nici în cazul caracteristicelor de tip alternativ.

115
Cerința nr. 5

În vederea caracterizării deplasării față de distribuția normală, vom determina


coeficienții asimetriei și boltirii.
Coeficientul de x  Mo  32
asimetrie Cas   
 23
1
 sau
Coeficientul de 
boltire  2  42
 2

Calculele necesare determinării momentului centrat de ordin 3, respectiv 4 vor fi


realizate în cadrul următorului tabel:

Tabel 4-17
Producție Nr.
- buc. - salariați ( xi  x) 3 ni ( xi  x) 4 ni
Xi ni
20-30 7 -56000 1120000
30-40 9 -9000 90000
40-50 19 0 0
50-60 7 7000 70000
60-70 8 64000 1280000
TOTAL 50 6000 2560000
k

(x i  x) 3 ni
6000
3  i 1
k
  120
n
50
i
i 1
k

(x i  x) 4 ni
2560000
4  i 1
k
  51200
n
50
i
i 1

Nota: Valorile aferente mediei, modului și deviației standard au fost preluate


din calculele anterior realizate.

Coeficientul de asimetrie Cas  45  44,5  0,04


12,32
120 2
1   0,004
152 3
Rezultatele aferente coeficientului de asimetrie calculat în cele 2 forme indică o foarte
slabă asimetrie de dreapta.
 4 51200
Coeficientul de boltire  2    2,21
 22 152 2
Coeficientul de boltire determinat, având o valoare mai mică de 3, indică o distribuție
platicurtică. Ca formă, distribuția analizată prezintă o ușoară aplatizare față de cea normală.

116
De reținut!

Pentru caracterizarea unei colectivități statistice din punct de vedere al


împrăștierii nivelurilor individuale se folosesc indicatori specifici cunoscuți sub
denumirea de indicatorii variației.

Indicatorii variației calculați pentru întreaga colectivitate sintetizează doua categorii


de influențe:
- influența factorilor cu acțiune întâmplătoare localizați la nivelul grupelor care
determină variația interna a grupelor;
- influența factorilor obiectivi reprezentați prin conținutul și tipologia caracteristicilor
de grupare care au puterea de a determina departajarea colectivității în grupe care evidențiază
tipuri calitative distincte și care determină variația dintre grupe.

Analiza dispersională este o operațiune de testare statistica ce se bazeaza pe felurile


dispersiilor și care oferă posibilitatea cunoașterii unor aspecte definitorii.

Aplicații propuse

Aplicația 4.1
O societate comercială are 15 sucursale în orașe diferite, grupate după profitul obținut
astfel (date convenționale):
Tabel 4-18
Grupe după profit Număr filiale
(mii. euro)
Sub 10 2
10-20 3
20-30 7
30-40 2
peste 40 1
Total 15

Se cere să se determine și comenteze indicatorii simpli și sintetici ai variației în jurul profitului


mediu.

117
Aplicația 4.2
Repartiția muncitorilor din cadrul unei secții de producție, după timpul lucrat într-o lună
calendaristică se prezintă astfel:
Tabel 4-19
Intervale de Număr de
timp lucrat muncitori (persoane)
(ore)
Sub 150 3
150-156 12
156-162 13
162-168 14
168 - 174 5
174 și peste 3

Total 50
Se cere:
a) Să se reprezinte grafic repartiția muncitorilor după timpul lucrat și să se observe
forma repartiției;
b) Să se calculeze indicatorii tendinței centrale și să se observe relația dintre aceștia;
c) Să se caracterizeze gradul de omogenitate al repartiției;
d) Să se măsoare gradul de asimetrie.

Aplicația 4.3
Despre un eșantion format din 60 de salariați, care își desfășoară activitatea în sectorul
comercial, s-au înregistrat la nivelul unei perioade de 15 zile din anul 2012, următoarele
informații:

Tabel 4-20
Grupe de persoane Număr de persoane
după valoarea - frecvențe absolute
încasărilor (mil.lei) (ni)
80-82 4
82-84 8
84-86 9
86-88 19
88-90 8
90-92 4
92-94 3
94-96 5
Total 60
Să se calculeze principalii indicatori care caracterizează seria de distribuție privind
încasările din vânzările de mărfuri astfel:
a) indicatorii tendinței centrale;
b) mărimile medii de calcul;
c) indicatorii medii de poziție;
d) indicatorii de variație;
e) indicatorii de asimetrie;
f) indicatorii de măsurare a gradului de concentrare.

118
Aplicația 4.4
La nivelul a 35 agenții de turism dintr-o regiune se derulează o cercetare care, într-o
primă fază, vizează cel mai mare număr de bilete vândute lunar în raport cu categoriile de
confort a unităților turistice cu care au încheiat contracte, situația prezentându-se astfel:

Tabel 4-21
Categorii de Număr agenții Număr mediu bilete Coeficient de variație
confort de turism vândute lunar/agenție al numărului de bilete vândute
1 stea 7 890 8,9
2 stele 5 730 12,8
3 stele 15 1220 30,5
4 stele 5 700 10
5 stele 3 666 7,7

Se cere:
a) Precizați dacă grupele agențiilor în raport cu categoriile de confort a unităților
turistice cu care au încheiat contracte sunt omogene din perspectiva numărului de
bilete vândute lunar;
b) În ce măsură variația vânzărilor de bilete este influențată semnificativ de categoria
de confort a unităților turistice cu care au încheiat contracte

Aplicația 4.5
Situația privind tarifele medii practicate pentru 20 de vile, în perioada de sezon din anul
2012 situate în mediul rural și urban, dintr-o regiune turistică mai puțin dezvoltată din punct de
vedere turistic, se prezintă astfel:

Tabel 4-22 Tarifele practicate de vile în raport cu mediul de amplasare


Medii de Valoarea tarifelor medii practicate
Număr vile
amplasare (sute lei )
Rural 1,45; 1,35; 1,55; 1,40; 1,80; 1,70; 1,40; 1,55; 1,55; 1,70 10
Urban 1,2; 1,1; 1,0; 1,0;1,3 5

Se cere:
c) Precizați dacă valoarea medie a tarifelor medii practicate pe fiecare grupă în raport
cu mediul de amplasare este reprezentativă;
d) Stabiliți dacă valoarea medie a tarifelor medii practicate la nivelul tuturor
pensiunilor este o valoare reprezentativă;
e) Precizați dacă mediul de amplasare a pensiunilor influențează variația valorii
tarifelor practicate.

119
Unitatea de învățare nr. 5: CERCETAREA SELECTIVĂ
Timpul de studiu individual estimat: 7 h

Competențele specifice unității de învățare


La sfârșitul parcurgerii unității de învățare, studenții trebuie:
 să cunoască conceptul de sondaj statistic;
 să înțeleagă limitele acestui tip de cercetare;
 să cunoască procedeele statistice prin care se constituie eșantioane;
 să cunoască modul de calcul al mărimii estimate a erorii de reprezentativitate în funcție
de tipul eșantionului;
 să calculeze intervalul de încredere pentru un indicator statistic aferent colectivității
statistice din care s-a extras eșantionul.

Cuprinsul unității de învățare:

5.1 NOŢIUNI SPECIFICE CERCETĂRII SELECTIVE, AVANTAJELE SELECŢIEI,


DOMENII DE APLICARE
5.2 REPREZENTATIVITATEA EȘANTIONULUI, ERORILE CERCETĂRII
SELECTIVE
5.3 INDICATORII PRINCIPALELOR TIPURI DE SELECŢIE UTILIZATE ÎN
CERCETAREA ACTIVITĂȚII SOCIO-ECONOMICE
5.3.1 Selecția întâmplătoare simplă
5.3.2 Selecția tipică (stratificată)
5.3.3 Selecția de serii
5.4 EXTINDEREA REZULTATELOR SELECŢIEI ASUPRA COLECTIVITĂŢII
GENERALE
5.5 APLICAȚII

Considerații preliminare
Fenomenele din economie și societate au adesea manifestări
prea numeroase și prea complexe pentru a permite o observare
și analiză pe întreaga masă de unități statistice. Se ajunge astfel
la ideea examinării numai a unei părți a acestei populații, care
este numită selecție (eșantion, sondaj).
Populațiile statistice pot fi finite sau infinite. Unele
populații, deși finite, sunt atât de mari încât pot fi considerate,
practic, infinite. Măsurarea unor caracteristici și însușiri într-o
populație poate fi, în unele situații, destul de ușoară. Alteori,
acest lucru este, practic, imposibil. Cu cât este mai mare
volumul colectivității statistice, cu atât devine mai dificilă
obținerea informațiilor despre toate elementele colectivității. Soluția este să extragem un
eșantion, să calculăm indicatorii ce caracterizează colectivitatea de sondaj, și apoi să extindem
rezultatele obținute la întreaga colectivitate.
Procedeul de a obține date privind întreaga populație, pornind de la un eșantion,
poartă numele de inferență statistică. Atunci când cercetăm un eșantion, presupunem că ceea
ce observăm este caracteristic pentru întreaga populație. Dacă presupunerea este corectă,
concluziile obținute din analiza sondajului sunt valabile și pentru întreaga populație

120
(colectivitate). Validitatea și acuratețea acestui proces depind de reprezentativitatea
eșantionului, iar inferența statistică se bazează pe principiile teoriei probabilităților.

5.1 NOȚIUNI SPECIFICE CERCETĂRII SELECTIVE, AVANTAJELE


SELECȚIEI, DOMENII DE APLICARE

Indicatorii calculați pe baza datelor dintr-o colectivitate totală se numesc parametri, iar
cei calculați pe baza unui eșantion, estimatori. Selecția statistică are ca scop estimarea
parametrilor colectivității totale, pe baza informațiilor culese și prelucrate statistic, folosind
principiile teoriei probabilităților. Pentru aceasta se vor parcurge două etape distincte:
- prima, denumită etapa descriptivă, constă în culegerea și prelucrarea informațiilor
referitoare la eșantion, respectiv calculul indicatorilor care-l definesc (media, dispersia etc.);
- a doua, denumită și inferența statistică sau extinderea indicatorilor eșantionului
asupra colectivității generale, în scopul caracterizării complete și cât mai exacte a colectivității
totale.
În cercetarea selectivă se folosesc noțiuni pereche și respectiv indicatori statistici
pereche, de exemplu: colectivitate generală - colectivitate de selecție; media colectivității
generale - media colectivității de selecție; dispersia colectivității generale - dispersia
colectivității de selecție etc.
Termenii populație (colectivitate generală) și eșantion sunt utilizați frecvent în
cercetarea statistică.
Colectivitatea generală, denumită colectivitate de bază sau populație, reprezintă
totalitatea unităților simple sau complexe care formează obiectul supus cercetării. Delimitarea
strictă în timp și spațiu a colectivității generale este obligatorie și nu constituie o decizie
statistică. Ea este o decizie pragmatică a cercetătorului, privind grupul de elemente care se
studiază și asupra cărora trebuie trase concluzii statistice.
Volumul colectivității generale se notează cu „N”, în cazul în care colectivitatea este
formată din unități simple, și cu „R” în cazul în care este formată din unități complexe.
În cazul caracteristicilor alternative, numărul unităților la care s-a răspuns afirmativ se
notează cu „M”.
Colectivitatea de selecție, denumită eșantion, reprezintă o parte a colectivității
generale de la care urmează să se culeagă și să se prelucreze informațiile în scopul inferenței
statistice.
Volumul colectivității de selecție se notează cu „n”, când este format din unități simple,
și cu „r” când este format din unități complexe. Pentru caracteristicile alternative, numărul
unităților la care s-a răspuns afirmativ se notează cu „m”. Volumul eșantionului poate varia de
la un element (unitate statistică) până la n-1 (r-1) unități statistice. Dintr-o colectivitate generală
se pot extrage mai multe eșantioane care diferă între ele ca volum și structură. Pentru acest
motiv indicatorii statistici ce caracterizează colectivitatea de selecție sunt variabile aleatoare
pentru care se pot stabili distribuții de frecvențe corespunzătoare față de media și dispersia
colectivității generale. Formulele de calcul al mediilor, dispersiilor și abaterilor medii pătratice
sunt prezentate în tabelul 5.1.

121
Tabel 5-1 Formule de calcul ale mediilor, dispersiilor și abaterilor medii pătratice
Caracteristică
Denumirea
nealternativă alternativă
indicatorilo
Colectivitatea Colectivitatea de Colectivitatea Colectivitatea de
r
generală selecție generală selecție
N n

Media  xi x i
p
M
w 
m
xo  i 1
xi  i 1
N n
N n
N

 (x
N

 (x i  x 0 )2 i  xi ) 2
 p2  pq  p(1  p)  w2  w(1  w)
Dispersia 02  i 1
 
2 i 1
N i
n
Abatere
medie 0  02 i  i2 p  2p  w   w2
pătratică

Reușita selecției statistice necesită o pregătire prealabilă pe baza unui plan care trebuie
să cuprindă decizii tehnice și organizatorice referitoare la: scopul cercetării statistice;
delimitarea populației care va fi cuprinsă în studiu; verificarea omogenității colectivității
generale; alegerea tipului și procedeului de selecție care va fi folosit; delimitarea unităților de
eșantionare; stabilirea cadrelor de eșantionare (a bazei de selecție) astfel încât selecția să fie
aleatoare; stabilirea metodelor adecvate de culegere și prelucrate a datelor; stabilirea
modalităților de verificare a semnificației indicatorilor și de interferență statistică.
Comparativ cu înregistrarea totală similară, cercetarea selectivă prezintă unele
avantaje:
- este mai operativă și mai economică, necesitând cheltuieli materiale și umane mai
reduse;
- informațiile sunt mai complete, erorile de înregistrare mai puține și ușor de înlăturat,
deoarece n<N;
- programul de cercetare poate fi mai amplu, mai consistent, se pot aplica mai multe
teste de verificare și se poate acorda mai multă atenție redactării și analizei;
- se poate folosi cu rezultate mai bune în studiul fenomenelor social-economice
complexe pentru care observarea totală ar fi dificil de realizat și ar necesita cheltuieli bănești
ridicate. De exemplu, studiul veniturilor și cheltuielilor bănești ale populației se realizează prin
anchetele integrate în gospodării, bazate pe un eșantion reprezentativ de familii de muncitori,
țărani, pensionari etc.;
- poate fi folosită în cazuri în care cercetarea totală ar fi imposibil de realizat (de
exemplu în studiul statistic al calității mărfurilor fără să ducă la distrugere întregului lot);
- se mai poate utiliza în testarea unei ipoteze statistice legate de cerea de mărfuri pentru
produse noi lansate pe piață.
Avantajele prezentate sunt completate cu altele sesizate mai „discret” care pe ansamblu,
în timp, au determinat extinderea ariei de investigare în toate sectoarele de activitate. Evoluția
rapidă a numărului cercetărilor ultimelor două decenii au condus la fundamentarea unor decizii
la nivelul tuturor domeniilor de activitate.
Evidențierea avantajelor reflectă larga paletă de aplicabilitate care se manifestă atât la
nivelul sectoarelor private, cât și a celor publice. Vizând aspectele vieții politice, sociale,
economice, culturale, studiile sunt întreprinse pornind de la nivelul unei gospodării, până la
organisme guvernamentale, nonguvernamentale și instituții. Totodată, acestea conturează un

122
sistem motivațional care justifică la nivel mondial gradul ridicat de aplicabilitate și atenția
deosebită îndreptată spre utilizarea intensă a acesteia.
Aria largă de utilizare conduce la o poziție permisivă a cercetării selective îndreptată
spre investigarea teoretico-analitică și practică, având la bază operațiuni de: studiere,
cunoaștere, verificare, control, estimare etc. Rezultatele privind opiniile persoanelor
intervievate sau a elementelor implicate în studii conduc la informații interesante privind latura
umană, economică, politică.
Debutul îl au aspectele privind populația, care sunt evidențiate pe diverse categorii (sex,
vârstă etc), pe medii de proveniență, pe regiuni de dezvoltare, cuprinzând elemente care pot
viza:
- mișcarea naturală și migrația populației privind evaluarea fluctuațiilor forței de muncă;
- evoluția nivelului, structurii forței de muncă și a condițiilor de muncă pentru stabilirea
legăturilor operative între producători și consumatori;
- veniturile pe gospodării și salariat, cheltuielile și consumul populației în vederea
comensurării activităților vânzărilor de mărfuri și servicii;
- sănătatea, securitatea și asistența socială pentru evidențierea cauzelor primordiale de
influență cu impact semnificativ asupra stabilirii nivelului de trai;
- educația, cultura și sportul reflectând acceptarea sau respingerea unor factori
motivaționali;
- nivelul prețurilor în circuitul mediului social și al pieței;
- condițiile de locuit și de trai sub impactul vieții publice și al măsurilor administrative, a
ridicării gradului de înzestrare a familiilor cu bunuri.
Aspectele rezultatelor cercetării selective din activitățile altor domenii pot include:
- industria și construcțiile sub impactul măsurării consumului de materii prime, a calității
produselor;
- agricultura și silvicultura în interfață cu evaluarea suprafețelor, materiilor prime, a
rezultatelor activităților agricole;
- investițiile și imobilizările corporale în raport cu sursele de finanțare, formele de
proprietate, activitățile economiei naționale în contextul comensurării fluctuațiilor
pieței;
- transporturile, poșta și telecomunicațiile care permit stabilirea unor interdependențe
operative între partenerii implicați în aplicarea unor noi metode de tranzacționare și
comercializare în vederea satisfacerii cererii și ridicării gradului de solicitudine a
populației;
- tranzacțiile și schimburile comerciale sub spectrul satisfacerii cererii populației la
standarde ridicate ca urmare a aplicării unor metode moderne de vânzare și a unor noi
modalități de apreciere a preferințelor consumatorilor;
- serviciile și turismul a căror piață poate fi caracterizată complex pornind de la aprecierea
mediului și nivelului de trai, precum și a motivațiilor comportamentale sociale;
- politica și justiția care vin să completeze indicatorii de comensurare a atitudinii
oamenilor cu privire la diferite aspecte politice (exemplu: alegerea președintelui țării) și
sociale.
Datorită avantajelor sale, care o fac mult mai operativă și eficientă decât observarea
totală, se mai poate folosi și în cazul organizării unei observări totale de mare amploare ca
mijloc de control al acesteia.
În condițiile în care avantajele reprezintă punctele tari ale cercetării selective, teoria și
practica permit stabilirea punctelor slabe sub forma adversității acesteia.
Procesul derulării cercetării selective se confruntă cu dificultăți în privința constituirii
eșantionului și apariția erorilor de eșantionare. Constituirea eșantionului se bazează pe
necesitatea îndeplinirii condițiilor de reprezentativitate, problematica vizând populația de

123
referință. Dimensionarea acestei populații prin enumerare și definirea ei prin însușirile unităților
elementare de a avea una sau mai multe caracteristici reprezintă elemente „sensibile” în
constituirea eșantioanelor.
Respectarea proprietăților procedeelor de selecție și a caracteristicilor esențiale
corespunzătoare erorilor de eșantionare reprezintă atuuri în planul depășirii limitelor cercetării
selective și transformarea lor în avantaje cu impact semnificativ asupra deciziilor vizate la
nivelul fiecărui domeniu de activitate la care este aplicată.

5.2 REPREZENTATIVITATEA EȘANTIONULUI, ERORILE CERCETĂRII


SELECTIVE

Rezultatele obținute dintr-o cercetare selectivă pot fi extinse la întreaga colectivitate,


dacă eșantionul este reprezentativ. Un eșantion este considerat reprezentativ atunci când
structura colectivității de selecție este identică cu structura colectivității generale sau
diferă foarte puțin de aceasta. Dacă cele două structuri sunt identice se spune că eșantionul
reprezintă perfect colectivitatea generală. Dar, în practică, reprezentativitatea perfectă nu se
poate realiza decât cu totul întâmplător. De aceea se consideră că reprezentativitatea este bună
dacă greutatea specifică a fiecărei grupe din colectivitatea de selecție diferă cu cel mult 5% față
de greutatea specifică pe care o are grupa corespunzătoare din colectivitatea generală. Dacă,
din cercetări anterioare, se cunosc indicatorii (media și dispersia) din colectivitatea generală, se
calculează media și dispersia pentru caracteristicile studiate în eșantion și se compară cu
indicatorii respectivi. Dacă diferențele sunt mici sau se află în limitele unui interval anterior
stabilit înseamnă că eșantionul este reprezentativ, în caz contrar selecția trebuind refăcută.
Teoria și practica statistică demonstrează că asigurarea reprezentativității eșantionului
presupune respectarea cu strictețe a următoarelor condiții:
- selecția unităților să se facă în mod obiectiv, fără preferințe, după principiul
hazardului, cu o probabilitate calculată anticipat și diferită de zero;
- eșantionul trebuie să fie suficient de mare pentru a reda trăsăturile esențiale ale
colectivității generale;
- includerea unităților în eșantion să se facă independent de alte unități.
Reprezentativitatea eșantionului depinde de procedeul și tipul de selecție folosit.4
Eroarea reprezintă diferența dintre valoarea indicatorilor obținuți în urma
prelucrării datelor din eșantion și valoarea acelorași indicatori obținuți în urma
observării totale.
Erorile pot fi: de observare (înregistrare); de prelucrare; de reprezentativitate. Erorile de
reprezentativitate sunt specifice selecției.
Erorile de înregistrare sunt mai puține ca număr și ușor de înlăturat datorită numărului
redus de unități care se înregistrează și folosirii pentru culegerea datelor a personalului de
specialitate. Deci, aceste erori pot să nu afecteze calitatea informațiilor culese, dacă sunt
accidentale (compensatoare) și nu sunt sistematice.
Erorile de reprezentativitate sunt de două feluri: erori sistematice și erori
întâmplătoare.
Erorile sistematice de reprezentativitate se datorează nerespectării principiilor teoriei
selecției ca fiecare unitate a colectivității generale să aibă șanse egale și diferite de zero, de a
pătrunde în eșantion. Atunci când există erori sistematice de reprezentativitate, extinderea
rezultatelor prin inferență statistică nu va fi validă și corectă. Erorile sistematice sunt
determinate de:
4
Se folosesc eşantioane: de volum normal n>120 unităţi, de volum mijlociu n= (40-120) unităţi şi eşantioane de
volum redus n<40 unităţi.

124
- alegerea preferențială, din comoditate sau interes a unităților din eșantion;
- alegerea la nimereală (nu la întâmplare) a unităților.
Erorile întâmplătoare de reprezentativitate sunt legate strict de specificul sondajului și
apar chiar dacă se respectă principiile teoriei selecției pentru a forma eșantionul. Ele sunt legate
de însăși esența sondajului, adică prin numărul mic de unități din eșantion nu se poate reproduce
identic - decât întâmplător - structura colectivității generale. Înregistrarea totală cuprinde toate
unitățile colectivității, care au stat sub influența cauzelor esențiale și neesențiale, obiective și
întâmplătoare. Deci, erorile întâmplătoare de reprezentativitate sunt inevitabile, deoarece
sondajul, prin natura sa, nu ține seama de rolul jucat de toate cauzele neesențiale în evoluția
caracteristicii cercetate. Erorile întâmplătoare de reprezentativitate nu se pot înlătura, ci se pot
calcula anticipat și chiar limita. Inferența statistică este făcută sub presupunerea că erorile
întâmplătoare există și cele sistematice sunt absente.
În practică, erorile întâmplătoare sunt cunoscute ca erori efective și erori probabile.
Erorile efective de reprezentativitate s-ar putea calcula - numai pentru acele
caracteristici la care s-au înregistrat date printr-o observare totală - ca diferența între media
eșantionului și media colectivității totale. Eroarea efectivă de reprezentativitate stă la baza
verificării reprezentativității eșantionului în raport cu structura colectivității totale. Verificarea
se face prin compararea structurii pe grupe a colectivității de selecție cu cea a colectivității
generale, denumită și structură programată. Reprezentativitatea se poate verifica prin
coeficientul de reprezentativitate (dx%) calculat ca raport între eroarea efectivă de
reprezentativitate (dx) și media colectivității generale ( x0 ). Dacă media generală nu este
cunoscută, se efectuează mai multe selecții succesive și se calculează media mediilor de selecție
( x ). În acest caz, eroarea efectivă de reprezentativitate se va calcula după formula:
d x  x  x d x %  (( x  x) / x)100 (5.1)
Dacă nu se pot calcula erorile întâmplătoare efective, calcularea anticipată a erorilor de
reprezentativitate, precum și întreaga teorie a selecției, se bazează pe principiile teoriei
probabilităților și ale statisticii matematice, ceea ce conduce la stabilirea erorilor probabile.
În practică, la formarea eșantionului se folosesc mai multe modalități dintre care mai
des întâlnite sunt cele cunoscute sub numele de selecții aleatoare, selecții subiectiv organizate
sau dirijate și selecții mixte.
Selecțiile aleatoare (întâmplătoare) constituie modelul de bază utilizat pentru
asigurarea reprezentativității. Ele se bazează pe principiul tragerii la sorți și exclud orice
element subiectiv în formarea eșantionului. În selecțiile dirijate, alegerea unităților se face de
către persoanele care culeg datele, dar se folosesc mai rar în practică. Selecția mixtă combină
principiile selecției întâmplătoare cu cele ale selecției dirijate. În acest caz, se împarte
colectivitatea în grupe tipice după o anumită caracteristică, și apoi se extrag la întâmplare unități
din fiecare grupă.
Concret, stabilirea eșantionului în selecțiile aleatoare se realizează prin: procedeul
tragerii la sorți, procedeul cu numere întâmplătoare, procedeul selecției mecanice.
Procedeul tragerii la sorți presupune extragerea dintr-o urnă a unor bile, discuri, bilete
care reprezintă câte o unitate a colectivității generale. Schema de extragere din urnă se face
prin: procedeul selecției repetate sau a bilei revenite și procedeul selecției nerepetate sau a bilei
nerevenite.
În cazul procedeului bilei revenite, probabilitatea fiecărei unități de a fi selectată rămâne
constantă (p=1/N) tot timpul cât durează selecția. La închiderea operației, în urnă vor rămâne
N-1 unități.
Prin procedeul bilei nerevenite, probabilitățile sunt variabile și cresc pe măsura formării
eșantionului, mărind astfel șansa unităților de a fi selectate.
(p1=1/N; p2=1/(N-1), p3=1/(N-2)…pn=1/(N-(n-1)), (5.2)

125
Rezultă, în acest caz, că în urnă rămân la sfârșit N-n unități. Acest procedeu exclude
posibilitatea extragerii de mai multe ori a aceleiași unități, ceea ce duce la creșterea gradului de
precizie.
Procedeul cu numere întâmplătoare se bazează pe tabelele cu numere întâmplătoare.
Modul de folosire a tabelului cu numere întâmplătoare este simplu. Dacă avem de ales 100 de
unități dintr-o bază alcătuită din 1000 de unități statistice, le vom numerota de la 000 la 999.
Dintr-un tabel cu numere întâmplătoare vom citi primele 100 de numere alcătuite din trei cifre
(sau vom citi primele trei cifre din 100 de numere, eliminând repetările). Tabela se va citi de
sus în jos, pe coloane sau pe linii, ordinea considerată neavând importanță, deoarece numerele
ce figurează în tabel sunt scrise pe baza ipotezei hazardului și a independenței unui număr de
altul. Singura regulă este de a fixa procedeul de citire înainte de a începe efectiv citirea
numerelor.
Procedeul selecției mecanice se folosește după ce unitățile se ordonează după o
caracteristică oarecare neesențială (denumirea străzii, ordinea alfabetică etc.) și sunt înscrise
într-o listă. Formarea eșantionului este precedată de stabilirea pasului de numărare (k) calculat
după formula k = N/n, care împarte colectivitatea totală în grupe de volum egal. Prin tragerea
la sorți se selectează la întâmplare o unitate din prima grupă la care se adaugă succesiv pasul
de numărare până la obținerea celor "n" unități.
Selecțiile dirijate și cele mixte se folosesc în general în sondajele de opinie, în cercetări
cu caracter sociologic și în studiul cererii de consum a populației.
Pornind de la legea numerelor mari, formulată de J. Bernoulli cu privire la relația
dintre probabilitatea "p" și frecvența relativă "ni" , precum și de la inegalitatea Bienayme-
Cebâșev, se poate demonstra că, media de selecție estimează corect media colectivității
generale. Adică, se poate demonstra că, dacă volumul de sondaj este suficient de mare, mediile
de selecție au o distribuție normală de medie x0 (media colectivității generale). Dacă se
formează toate eșantioanele posibile, folosind tragerea la sorți prin procedeul bilei revenite,
numărul lor este egal cu Nn, iar prin procedeul bilei nerevenite va rezulta:
N!
C Nn  (5.3)
n!( N  n)!
Fiecare eșantion va fi definit de o medie și de o dispersie, calculabile pentru fiecare
caracteristică înregistrată. Acestea se vor abate în plus sau în minus de la media și dispersia
colectivității generale. Eroarea de selecție este deci o variabilă aleatoare, calculată ca diferența
dintre media de selecție (pentru fiecare eșantion) și media generală.
În practica, se lucrează doar cu un singur eșantion, dar nu se poate ști ce eroare de
selecție va apărea. Pentru acest motiv se folosește eroarea medie de reprezentativitate. Eroarea
medie se calculează ca abatere medie pătratică a tuturor mediilor de selecție posibile față de
media colectivității generale, notată cu  x după formula:
k

 (x  xi o ) 2 ni
(5.4)
x  i 1

n i

unde:
x i = medii de selecție posibile;
ni = frecvența mediilor de selecție posibile;
k = numărul eșantioanelor posibile după procedeul bilei revenite.

Frecvența de apariție a fiecărei medii de selecție luată ca frecvență relativă are tendința
de a coincide cu probabilitatea de producere a erorii față de media colectivității generale. Pentru

126
o anumită valoare a raportului n/N, fiecărei medii de selecție îi corespunde o probabilitate bine

determinată, în funcție de abaterea respectivă x i  x 0 . 
Rezultă că mărimea și probabilitatea de apariție a fiecărei medii de selecție sunt în
funcție de mărimea eșantionului (n); cu cât acesta din urmă va fi mai mare, cu atât media de
selecție va fi un estimator mai corect al mediei generale. Aceasta corespunde legii numerelor
mari formulate de J. Bernoulli, conform căreia probabilitatea ca diferența în valoare absolută

dintre frecvența relativă ni și probabilitatea (p) de producere a unui eveniment să fie mai mică
decât un număr pozitiv și arbitrar tinde către 1 când volumul eșantionului tinde către infinit,
adică:

lim.P| ni - p|< ε = 1 oricare ar fi ε > 0 (5.5)
Dacă volumul eșantionului este suficient de mare (de volum normal sau mediu n > 40
unități), media de selecție se distribuie după curba normala a lui Gauss-Laplace de medie x o și
2
dispersie .
n
Distribuția normală este o distribuție teoretică simetrică în care cea mai mare
probabilitate de apariție o are acea medie de selecție care coincide cu media colectivității
generale și pentru care eroarea de selecție este egală cu zero. De o parte și de alta a probabilității
maxime, mediile de selecție, erorile de selecție posibile și probabilitățile lor de apariție descresc
proporțional și simetric. Probabilitățile de apariție scad pe măsură ce cresc erorile de selecție în
aceleași unități de măsură ca și caracteristica cercetată. Pentru a permite comparabilitatea pentru
orice variabilă numerică, erorile se vor exprima în abateri normale, adică:
xi  x0
zi  (5.6)
x
Pentru distribuția normală a mediilor și erorilor de selecție, trebuie stabilit intervalul de
încredere, nivelurile de siguranță și pragurile de semnificație (vezi tabelul 5.2).
Grafic, distribuția normală a erorilor de reprezentativitate pentru o selecție aleatoare de
"n" unități se face pe baza curbei normale, Gauss-Laplace.

Tabel 5-2
Nivelul de siguranță Pragul de semnificație
Interval de încredere
% %
  x  x0   x 68,26 31,74

 1,96 x  x0  1,96 x 95,00 5,00

 2,00 x  x0  2,00 x 95,44 5,56

 2,58 x  x0  2,58 x 99,00 1,00

 3,00 x  x0  3,00 x 99,73 0,27

 3,29 x  x0  3,29 x 99,90 0,10

Dacă se efectuează toate eșantioanele posibile, intervalul de variație al tuturor mediilor


de selecție obținute este acoperit de suma probabilităților lor de apariție  pi  1 .

127
5.3 INDICATORII PRINCIPALELOR TIPURI DE SELECȚIE UTILIZATE ÎN
CERCETAREA ACTIVITĂȚII SOCIO-ECONOMICE

Tipurile de selecție utilizate în practică diferă, în special, prin îmbunătățirile care se


aduc în scopul de a se reduce erorile de reprezentativitate sau de a realiza o precizie cerută cu
minimum de cheltuieli.
După modul în care se combină sistemul de organizare, felul unităților de selecție și
procedeul de selecție folosit, se disting următoarele tipuri de selecție:
- selecție întâmplătoare simplă;
- selecție tipică (stratificată);
- selecție de serii etc.
Pornind de la modelul de bază, cel al selecției întâmplătoare simple, se calculează pentru
fiecare tip de selecție indicatori specifici: eroarea medie de reprezentativitate x, eroarea
limită (  x ) și volumul eșantionului (n).

5.3.1 Selecția întâmplătoare simplă

Eșantionarea simplă aleatoare este modelul de bază utilizat pentru asigurarea


reprezentativității. Este tipul utilizat în special pentru colectivități statistice negrupate, formate
dintr-un număr de unități simple și care se caracterizează printr-un anumit grad de omogenitate.
Nu se folosește pentru colectivități eterogene, deoarece se vor obține erori mari. Pentru
eșantionarea simplă aleatoare caracteristic este faptul că fiecare unitate are șansa egală de
selecție în eșantion; în general, pentru eșantionarea aleatoare probabilitatea este calculabilă și
diferită de zero. Pentru selecția simplă aleatoare, formarea eșantionului constă în extragerea
unităților în mod repetat sau nerepetat, dintr-o urnă sau de pe o listă stabilită dinainte. Pentru
calculul indicatorilor de selecție se folosește dispersia totală (  02 ) sau dispersia de selecție (
 i2 ) care măsoară variația totală a caracteristicilor studiate.
Erorile de reprezentativitate sunt mari în raport cu alte tipuri de selecție, deoarece
dispersia folosită măsoară variația totală a caracteristicii, datorată cauzelor care o influențează.
Calculul anticipat al erorii medii de selecție când se lucrează cu un singur eșantion și
nu se cunoaște media colectivității generale, se face folosind relația dintre dispersia
 
colectivității generale  0 , dispersia mediilor de selecție posibile față de media colectivității
2

 
generale  x și volumul eșantionului (n), verificabilă în cazul selecției întâmplătoare repetate,
2

adică:
 02  n x2 (5.7)
 02
x  (5.8)
n
Se observă că eroarea medie de selecție este direct proporțională cu dispersia și invers
proporțională cu volumul eșantionului (n). Pentru calculul erorii medii de selecție, dispersia
totală se poate lua dintr-o cercetare statistică anterioară similară, dacă condițiile evoluției
fenomenului cercetat nu s-au schimbat de la o perioadă la alta. Dacă nu se cunoaște dispersia
 
totală, ea se înlocuiește cu dispersia eșantionului  i când volumul acestuia este suficient de
2

mare. Adică, se poate scrie:


 02   i2 , iar (5.9)

128
 i2
x  (5.10)
n
În cazul selecției nerepetate (în care unitățile deja extrase nu mai participă la formarea
eșantionului) numărul de eșantioane posibile este mai mic, câmpul de variație a erorilor de
reprezentativitate se micșorează. Se poate scrie:
 02  n x2 (5.11)
Din practica sondajului s-a văzut că există un raport de proporționalitate între dispersia
mediilor de selecție posibile față de media colectivității generale și volumul colectivității totale
după ultima extragere:
 x2 nerepetat N  n
 (5.12)
 x2 repetat N 1
Se constată că  x nerepetat   x repetat
2 2

 N n
Raportul   poartă denumirea de coeficient de corecție al erorilor în cazul folosirii
 N 1 
procedeului bilei nerevenite.
Dacă volumul colectivității generale este foarte mare iar selecția are la bază unități
simple, se poate renunța la 1 din numitorul coeficientului de corecție și formula de calcul al
erorii medii de selecție devine:
 02 
n  i2  n
x  1    1   (5.13)
n  N n  N
Într-un sondaj fără revenire, eroarea medie de reprezentativitate este, așa cum s-a arătat,
mai mică față de sondajul cu revenire. Totuși, această reducere este neglijabilă dacă n este foarte
mic în raport cu N. Din contra, dacă se extrag toate unitățile din colectivitate, coeficientul de
corecție devine 0 și eroarea medie de reprezentativitate devine și ea, 0.
Formulele prezentate anterior se folosesc și în cazul selecției întâmplătoare repetate și
nerepetate pentru o caracteristică nealternativă.
Pentru caracteristica alternativă, eroarea medie de selecție,  w , se va calcula astfel:
p 1  p  w 1  w
w   pentru selecția repetată (5.14)
n n
p 1  p   n w 1  w  n
w  1    1   pentru selecția
n  N n  N (5.15)
nerepetată
Eroarea medie limită  x  se calculează ca o abatere între media de selecție și media
colectivității generale garantată cu suma probabilităților corespunzătoare intervalului de
variație, după formula:
 x  z  x pentru caracteristica nealternativă (5.16)
  z  pentru caracteristica alternativă
w w
(5.17)

Eroarea medie limită se poate mări sau micșora fie prin modificarea volumului
eșantionului (n), fie prin modificarea probabilității cu care se garantează rezultatele, deoarece
dispersia colectivității totale rămâne aceeași.

129
Coeficientul de probabilitate "z" este direct proporțional cu eroarea medie limită și
invers proporțional cu eroarea medie de reprezentativitate. Din relația  x  z  x (pentru
caracteristica nealternativă) rezultă că:

z x (5.18)
x
Funcția de probabilitate este direct proporțională cu mărimea coeficientului "z".
În mod normal, creșterea probabilității se manifestă prin mărimea intervalului de
încredere, ceea ce duce la o precizie mai scăzută a rezultatelor. Se observă că, pe măsură ce
crește probabilitatea, scade precizia și invers. Rezolvarea acestei probleme are o soluție, și
anume, în condiții de probabilitate, creșterea preciziei rezultatelor se obține prin mărirea
volumului de selecție.

Volumul eșantionului trebuie corelat cu fondurile bănești alocate cercetării selective și


cu operativitatea obținerii rezultatelor respective. Deoarece, în practică, se lucrează cu o eroare
de selecție limitată, calculul volumului eșantionului se face folosind formula erorii medii limită.
 02 2 0
2
Dacă x  z x  z  x  z
2 (5.19)
n n
rezultă că volumul eșantionului pentru selecția întâmplătoare simplă repetată este:
z 2 02 z 2 i2
n 2  2 (5.20)
x x
Pentru selecția întâmplătoare nerepetată volumul eșantionului este dat de formula:
𝑧 2 𝜎𝑖2
𝑛=
𝑧2𝜎 2 (5.21)
∆2𝑥 + 𝑁 𝑖

Exemplul 5.1

Pentru a urmări tehnica de calcul a indicatorilor de selecție amintiți, prezentăm


datele convenționale din tabelul următor obținute în urma înregistrării și
prelucrării datelor referitoare la volumul vânzărilor trimestriale la 70 societăți
comerciale (15% din populația totală).

Tabel 5-3
Volumul vânzărilor (mii lei) Nr. societăți
Xi ni
80-100 9
100-120 15
120-140 21
140-160 18
160-180 7
Total 70
Nota: limita inferioară inclusă în interval
Rezolvare:
• Deoarece nu cunoaștem dispersia dintr-o cercetare totală anterioară, vom folosi
dispersia de selecție pentru calculul erorii medii și erorii limită.
• Efectuând calculele aferente mediei eșantionului și dispersiei acestuia se obțin:

130
xi 130 mii lei/societate com. și  i2  554
• Pentru exemplificarea calculelor și în cazul unei caracteristici alternative, împărțim
colectivitatea în două grupe în funcție de poziționarea unităților față de media
calculată.
25
w=70 = 0,35  w2 =0,35*(1-0,35)= 0,2275
• Ne propunem să calculăm indicatorii de selecție (  x și  x , respectiv,  w și  w ) în
condițiile în care rezultatele vor fi garantate cu o probabilitate P=0,95 la care
corespunde z = 1,96.
 Pentru o selecție repetată:

 i2 554
x    2,81 mii lei / soc. com.
n 70
 x  z  x  2,81*1,96  5,51 mii lei / soc. com.

 Pentru o selecție nerepetată:

 i2  N  n  554  467  70 
x       2,59 mii lei / soc. com.
n  N 1  70  467  1 
 x  z  x  2,59 *1,96  5,07 mii lei / soc. com.
• Se poate aprecia, pe baza probabilității cu care se garantează rezultatele, că în 95 de
cazuri din 100 posibile, media de selecție se va abate de la volumul vânzărilor din
colectivitatea generală cu cel mult ±5,51 mii lei în cazul în care eșantionul s-a
construit după procedeul selecției repetate și ±5,07 mii lei când eșantionul s-a format
după procedeul selecției nerepetate.
• Eroarea medie și eroarea limită a greutății specifice a societăților comerciale cu un
volum al vânzărilor mai mare decât media (în cazul caracteristicii alternative) vor fi:
 selecția repetată

w 1  w 0,2275
w    0,057
n 70
 w  z  w  0,057 *1,96  0,1117
 selecția nerepetată

w 1  w  N  n  0,2275  467  70 
w       0,053
n  N 1  70  467  1 
 w  z  w  0,053 *1,96  0,1039
• Deci, greutatea specifică a societăților comerciale care obțin un volum al vânzărilor
mai mare decât media, se va abate într-un sens sau altul cu ±11,17% în cazul selecției
repetate și cu ±10,39% în cazul selecției nerepetate, rezultatele fiind garantate cu
aceeași probabilitate de 0,95.
• Rezultatele obținute evidențiază faptul că în cazul selecției nerepetate erorile sunt mai
mici. Ca urmare a acestui fapt intervalul de încredere pentru estimarea parametrilor

131
colectivității generale va fi mai mic, deci rezultatele vor avea un grad de precizie mai
ridicat atât pentru caracteristica nealternativă cât și pentru cea alternativă.
• Astfel, vom obține următoarele intervale de încredere pentru
 selecția repetată

xi   x  xo  xi   x
130  5,51  xo  130  5,51
124,49  xo  135,51mii lei / soc. com.
 selecția nerepetată

xi   x  xo  xi   x
130  5,07  xo  130  5,07
124,93  xo  135,07 mii lei / soc. com.

• Rezultă că volumul vânzărilor realizate, în medie, de o societate comercială din cadrul


colectivității generale, este cuprins între 124,49 mii lei și 135,51 mii lei în cazul
selecției repetate și între 124,93 și 135,07 mii lei în cazul selecției nerepetate.
• Volumul total al desfacerilor realizate de către cele 467 societăți va fi pentru:
 selecția repetată
467
N ( xi   )   x i  N ( xi   )
x x
i 1
467
467 *124,49   x i  467 *135,51
i 1
467
58136,83 mii lei   x i  63283,17 mii lei
i 1

 selecția nerepetată
467
467 *124,93   x i  467 *135,07
i 1
467
58342,31 mii lei   x i  63077,69 mii lei
i 1
• Proporția societăților care au realizat un volum al desfacerilor mai mare decât media,
în colectivitatea generală, se va situa între următoarele valori pentru:
 selecția repetată

w  w  p  w  w
0,35  0,1117  p  0,35  0,1117
0,2383  p  0,4617

 selecția nerepetată
0,35  0,1039  p  0,35  0,1039

132
0,2461  p  0,4539
• În continuare să se considere necesar reluarea cercetării și, astfel, să se determine
volumul necesar pentru proiectarea noului sondaj dacă rezultatele se garantează cu
aceeași probabilitate iar eroarea limită se micșorează de 1,5 ori.
• Aplicând formulele de calcul vom obține pentru:
 selecția repetată
𝑧 2 𝜎𝑖2 1,962 ∗ 554
𝑛′ = 2 = = 158 societăți comerciale
∆ 5,51 2
( 𝑥) ( )
1,5 1,5
 selecția nerepetată
𝑧 2 𝜎𝑖2 1962 ∗ 554
𝑛′ = 2 = = 133 societăți comerciale
∆ 𝑧2𝜎 2 5,07 2 1962 ∗ 554
( 𝑥 ) + 𝑁𝑖 ( ) +
1,5 1,5 467

5.3.2 Selecția tipică (stratificată)

Una dintre căile de mărire a preciziei eșantionului simplu aleator este creșterea
dimensiunilor sale. O altă metodă de mărire a preciziei este stratificarea.
Selecția tipică se aplică cel mai frecvent în studiul fenomenelor social-economice care,
în prealabil, au fost împărțite în grupe omogene (straturi sau tipuri de unități) - după o
caracteristică esențială - notate cu N1,N2,...,Nr și reprezentate în sondaje prin volumul
subeșantioanelor n1 , n 2 ,..., n r .
Stratificarea presupune divizarea populației (colectivității generale) în "straturi" cât mai
omogene, cu caracteristici cât mai asemănătoare, astfel încât unitățile statistice din interiorul
fiecărui strat să prezinte, cel puțin din punct de vedere teoretic, caracteristici comune. Prin
creșterea omogenității, împrăștierea din interiorul diverselor straturi este sensibil inferioară față
de împrăștierea totală a populației. Apoi este ales la întâmplare un eșantion din interiorul
fiecărui strat.
Selecția tipică asigură astfel reprezentarea exactă a diferitelor straturi ale populației în
eșantion. Dacă grupele în care a fost împărțită colectivitatea sunt omogene, mediile de grupă (
xi )au valori apropiate de valorile individuale din care s-au calculat, abaterile într-un sens sau
altul sunt mici, iar gradul de variație este mic.
În acest caz, variația mediilor de selecție posibile va fi în funcție de variația fiecărei
grupe, măsurată prin dispersiile de grupă (  i ), și sintetizată prin media dispersiilor parțiale (
2

 2 ). Deci, pentru calculul erorilor medii de sondaj se va folosi media dispersiilor de grupă din
colectivitatea totală (  )sau cea din colectivitatea de selecție (  i ). Media dispersiilor de
2 2

grupă sau parțiale (  02 ); (  i )se calculează ca o medie aritmetică ponderată a dispersiilor de


2

grupă astfel:

0 
2   i20 N i
(5.22)
Ni

133

 n 2

respectiv:  , i  1, r
2 i i
(5.23)
n
i
i
unde ”r” este numărul grupelor din colectivitatea generală sau cea de selecție. Media de selecție
( x ) se va calcula ca o medie aritmetică ponderată a mediilor subeșantioanelor,

respectiv: x 
x ni i
, i  1, r (5.24)
n i
În scopul creșterii preciziei datorate stratificării, trebuie să existe o legătură cât mai
puternică între criteriul care servește stratificării și variabila studiată.
Prin intermediul stratificării, cercetătorul are siguranța că diferitele straturi vor fi
reprezentate în eșantion, reducând astfel jocul șansei asupra compoziției sondajului. În acest
mod, variația între straturi nu va influența eroarea de reprezentativitate, deoarece această
variație este precis reflectată în eșantion. În calculul erorii medii de reprezentativitate va intra
numai împrăștierea din interiorul straturilor.
Din regula de adunare a dispersiilor, media dispersiilor parțiale este o componentă a
dispersiei totale, adică:
 02   02   2 , i  1, r (5.25)
ceea ce înseamnă că  0   0 . Rezultă că, în cazul selecției tipice, eroarea medie de selecție
2 2

este mai mică decât în cazul selecției întâmplătoare simple.


Selecția tipică poate fi: simplă, proporțională și optimă.
Selecția tipică simplă se caracterizează prin faptul că extragerea unităților din fiecare
grupă se face la întâmplare, fără a ține seama de ponderea unităților din fiecare grupă a
colectivității generale. Volumul subeșantioanelor este același în toate grupele. Dacă se notează
cu "r" numărul grupelor, atunci:
n
ni  (5.26)
r
Selecția tipică proporțională este acea selecție la care volumul subeșantioanelor diferă
în raport cu ponderea pe care o are fiecare grupă în colectivitatea generală și se respectă
proporția de selecție nN. Volumul fiecărui subeșantion va fi:
Ni
ni  n , i  1, r
 Ni ,
(5.27)

iar structura pe grupe este aceeași atât în colectivitatea generală cât și în colectivitatea
de selecție.
Selecția tipică optimă este acea selecție în care, la formarea eșantionului se ia în
considerație ponderea grupelor în colectivitatea generală și mărimea variației din interiorul
grupelor măsurată prin abaterea medie pătratică. Volumul subeșantioanelor pe grupe (ni) se va
calcula după relația:
N i i 0
ni  n , i  1, r
 N i i 0 ,
(5.28)

unde:
Ni = numărul unităților pe grupe din colectivitatea totală;
 i 0 = abaterea medie pătratică pe grupe ale colectivității totale.

Ținând seama de particularitățile unui sondaj tipic, indicatorii de selecție se vor calcula
folosind media dispersiilor parțiale, respectiv:

134
a) pentru caracteristica nealternativă:
- selecția repetată:
2 2
0 i
x   (5.29)
n n
- selecția nerepetată:
2 2
0  n i  n
x  1    1   (5.30)
n  N n  N

b) pentru caracteristica alternativă:


- selecția repetată :
p(1  p) w(1  w)
w   (5.31)
n n
- selecția nerepetată:
p(1  p)  n w(1  w)  n
w  1    1   (5.32)
n  N n  N

Exemplul 5.2

Pentru estimarea volumului mediu zilnic al vânzărilor și volumul total zilnic


realizat de o colectivitate de agenți economici s-a efectuat un sondaj stratificat
proporțional de 15%, datele înregistrate s-au prelucrat și rezultatele sunt
prezentate în tabelul următor:

Tabel 5-4
Volumul vânzărilor (Yi)
80-100 100-120 120-140 140-160 160-180 Total
Nr. salariați (Xi)
<9 8 12 12 8 40
>9 1 3 9 10 7 30
Total 9 15 21 18 7 70

Se solicită calculul indicatorilor de selecție și estimarea parametrilor colectivității


generale.

Rezolvare:
 Se calculează mediile de grupă, mediile producțiilor pentru cele două grupe de
vechime evidențiate:
r

y
j 1
i  nij
yi  r

n
j 1
ij

90  8  110  12  130  12  150  8


y1   120 mii lei/soc. com.
40

135
90  1  110  3  130  9  150  10  170  7
y2   142,67 mii lei/soc. com.
30
 Media mediilor de grupă:

y  n 
y n 120  40  142,67  30
i i
 129,71  130 mii lei/soc. com.
 70 i

 Dispersiile de grupă
2
∑6𝑗=1(𝑦𝑗 − ̅̅̅)
𝑦1 𝑛1𝑗
𝜎12
= =
∑ 𝑛1𝑗
(90 − 120)2 ∗ 8 + (110 − 120)2 ∗ 12 + (130 − 120)2 ∗ 12 + (150 − 120)2 ∗ 8
= 420
40
2
∑6𝑗=1(𝑦𝑗 −𝑦
̅̅̅2̅) 𝑛2𝑗
𝜎22 = ∑ 𝑛2𝑗
=
(90−142,67)2 ∗1+(110−142,67)2 ∗3+(130−142,67)2 ∗9+(150−142,67)2 ∗10+(170−142,67)2 ∗7
=
30
439,56

 Media dispersiilor de grupă

 2

 n i
2
i

420  40  439,56  30
 428,38
n
i
i 70
 Eroarea medie de reprezentativitate (𝜎𝑦̅ )

̅̅̅̅
𝜎2 𝑛 428.38 70
𝜎𝑦̅ = √ 𝑛𝑖 (1 − 𝑁) = √ (1 − 467) = 2,281 mii lei/soc. com.
70

 Eroarea limită (∆𝑦 )

∆𝑦 = 𝑧 ∗ 𝜎𝑦̅ = 1,96 ∙ 2,281 = 4,4708 mii lei/soc. com.

 Estimarea volumului mediu zilnic pe total colectivitate:

y  
y
 y y  0
 
y

- de unde:

130  4,47  y  130  4.47


0

125,53  xo  134,47 mii lei / soc. com.


 Estimarea volumului total al vânzărilor la nivelul colectivității generale:
467
N( y 
 ) y
 yi  N ( y 
)
y
i 1
467
467 *125,53   xi  467 *134,47
i 1

136
467
58622,51 mii lei   xi  62797,49 mii lei
i 1
 Să se considere necesar reluarea cercetării și, astfel, să se determine volumul necesar
pentru proiectarea noului sondaj dacă rezultatele se garantează cu aceeași
probabilitate iar eroarea limită se micșorează de 1,5 ori.

𝑧 2 ̅̅̅̅
𝜎𝑖2 1,962 ∗428.38
𝑛′ = 2 ̅̅̅̅
2
= 4,47 2 1,962 ∗428.38
≈133 societăți comerciale
∆𝑥 𝑧2 𝜎 ( 1,5 ) +
( 1,5 ) + 𝑁 𝑖 467

5.3.3 Selecția de serii

Se folosește când colectivitatea generală este formată din unități complexe numite și
serii (echipe, societăți comerciale etc.). Unitățile complexe sunt formate la rândul lor din unități
simple ce posedă caracteristici (însușiri) ce le deosebesc una de alta, au caracter eterogen, în
raport cu unitățile componente ale grupelor tipice care se caracterizează prin omogenitate.
Constituirea eșantionului se face prin procedeele cunoscute, selectând unități complexe sau serii
întregi de unități simple.
Caracteristic pentru acest tip de selecție este faptul că, în locul variantelor concrete ale
caracteristicilor de la sondajele bazate pe unități simple, se vor folosi indicatori de selecție
calculați la nivelul seriei. Cerința reprezentativității se va asigura prin apropierea mediilor din
 
seriile de unități selectate de mediile colectivității generale. Mediile de serii x s se calculează
prin formula mediei aritmetice simple sau ponderate și servesc la estimarea mediei de sondaj.
Eșantionarea făcându-se pe bază de serii, numărul acestora se va nota cu "r" în
colectivitatea de selecție și cu "R" în colectivitatea totală.
Abaterile dintre mediile seriilor selectate și media de sondaj se măsoară sintetic prin
dispersia dintre serii  . Deci, în acest tip de sondaj dispersia dintre serii înlocuiește dispersia
2

 
generală  0 din sondajul simplu și, ca atare, erorile de reprezentativitate vor fi mai mici sau
2

cel mult egale cu erorile de la sondajul simplu, deoarece:

   02 (5.33)

Rr
Coeficientul de corecție finită va fi   , nu se mai renunță la "1" de la numitor,
 R 1 
deoarece el reprezintă o serie ca unitate complexă.

 
Dispersia dintre serii o vom nota cu  x (pentru caracteristica nealternativă) și cu  w
2 2

(pentru caracteristica alternativă). Ea reflectă variația dintre mediile seriilor selectate și media
pe întregul eșantion și se calculează după una din formulele:
 x 
2
i  xs
 2
x  (5.34)
r

137
 x  x  n
2
i s
 2

i
(5.35)
n
x
i

unde:
r = numărul seriilor selectate;
ni = numărul unităților simple din fiecare serie.

Exemplul nr. 5.3

Pentru verificarea greutății medii a unui produs s-a organizat un sondaj de 10%
dintr-un lot de 1000 de produse ambalate în cutii de câte 10 bucăți. În urma
măsurării greutății produselor din fiecare cutie (serie) s-a calculat greutatea
medie exprimată în grame

Tabel 5-5
Nr. crt. Greutate medie
𝒙𝒔 𝟐
(𝒙̅𝒊 − ̅̅̅)
al seriei (𝒙̅𝒊 )
1. 1524 26896
2. 1741 2809
3. 1615 5329
4. 1722 1156
5. 1810 14884
6. 1755 4489
7. 1685 9
8. 1589 9801
9. 1665 529
10. 1774 7396
Total 16880 73298

Rezolvare:
• Cutiile (seriile) având aceeași dimensiune, pentru calculul mediei pe total se va
folosi relația mediei aritmetice simple

xs 
x i 16880
  1688 g. / produs
r 10
• Pentru calcularea erorii medii este necesară calcularea dispersiei dintre serii

∑𝑟𝑖=1(𝑥̅𝑖 − 𝑥̅𝑠 )2 73298


𝛿𝑠2 = = = 7329,8
𝑟 10
• Fiind un sondaj de serii unde R = 100, r = 10 eroarea limită se calculează astfel:

𝛿𝑠2 𝑅 − 𝑟 7329,8 100 − 10


∆𝑥 = 𝑧 √ ∙ = 1,96√ ∙ = 50,59 𝑔./𝑝𝑟𝑜𝑑𝑢𝑠
𝑟 𝑅−1 10 100 − 1

• Limitele între care se va încadra media pe total:

xs   x  xo  xs   x
de unde:
1688  50,59  xo  1688  50,59
1637,41  xo  1738,59 g. / produs

138
5.4 EXTINDEREA REZULTATELOR SELECȚIEI ASUPRA COLECTIVITĂȚII
GENERALE

Indicatorii statistici care se calculează pe baza informațiilor culese de la unitățile


selectate servesc în final la estimarea parametrilor colectivității generale cu o precizie a cărei
probabilitate este apriori stabilită. Pentru extinderea rezultatelor asupra întregii colectivități se
folosesc două procedee:
Procedeul coeficientului de corecție se folosește de obicei la verificarea autenticității
datelor culese dintr-o observare totală.
Procedeul extinderii directe se utilizează la caracterizarea fenomenelor pentru care nu
dispunem de informații prin observarea totală. În esență, acest procedeu constă în estimarea
parametrilor colectivității generale pe baza rezultatelor selecției statistice. Pentru estimarea
parametrilor colectivității generale și a erorilor de eșantion este important faptul că, la
eșantioane suficient de mari, distribuția de eșantionare a mediei, proporției etc., sunt
aproximativ distribuții normale, chiar dacă populația în ansamblu este asimetrică. Aceasta
înseamnă că distribuția mediilor obținute pe un număr mare de eșantioane va avea o formă
apropiată de cea a distribuției normale. În acest caz, media estimațiilor unui parametru al
populației, derivată dintr-un număr infinit de eșantioane, numită valoarea scontată a estimației,
va fi egală cu parametrul populației, iar procedura de selecție va fi nedistorsionată. Indicatorii
obținuți pe baza selecției se abat de la cei reali datorită erorilor de reprezentativitate, dar cu o
anumită probabilitate, potrivit inegalității lui P. Cebâșev, se situează într-un interval de
încredere dat de media de sondaj la care se adaugă sau se scade eroarea limită, respectiv:
- pentru caracteristica nealternativă
x   x  x0  x   x (5.36)
P x   x  x0  x   x   1   (5.37)
- pentru caracteristica alternativă.
w  w  p  w  w (5.38)
P w   w  p  w  w   1   (5.39)
Formulele de mai înainte ne ajută să estimăm nivelul mediu al colectivității totale. Se
poate estima și nivelul total al caracteristicii pentru întreaga colectivitate pentru caracteristica
nealternativă  xi și respectiv alternativă  
M i , după formulele:

    x  x   N
N
N x  x i x (5.40)
i 1
N
N w   w    M i  w   w N (5.41)
i 1

De menționat că media de selecție, eroarea limită și volumul colectivității generale se


vor lua în calcul în conformitate cu tipul de sondaj care s-a folosit.
Stabilirea intervalelor de încredere pornind de la distribuțiile de selecție reprezintă
suportul extinderii rezultatelor de selecție asupra colectivității generale, având un impact
semnificativ în procesele decizionale la nivelul tuturor domeniilor de activitate.

139
5.5 APLICAȚII

Aplicație rezolvată - continuare

1. Determinați eroarea maximă admisibilă (limită) între media producției


descoperită la nivelul eșantionului și media producției realizată la nivelul întregii
colectivități de salariați formată, așa cum se precizează în enunț, din 250 persoane.
2. Determinați nivelul eșantionului necesar a fi extras dacă se dorește reluarea
cercetării și obținerea unei reduceri a erorii maxime admisibile descoperite anterior cu 30%.

Calculele se vor realiza cu o probabilitate de lucru de 95,45% pentru care coeficientul


z=2.
Prezentați calculele atât pentru procedeul extragerii repetate cât și pentru procedeul
extragerii nerepetate.

Rezolvare

Cerința nr. 1

 Procedeul extragerii repetate


Eroarea maximă admisibilă se determină cu ajutorul relației x  z  x
În cadrul acestei relații  x semnifică eroarea standard (eroarea medie de
reprezentativitate), ce poate fi determinată cu ajutorul relației de mai jos:

Nota: Valoarea dispersiei a fost preluată din calculele realizate la capitolul


anterior.

2 152
x    1,74 buc/salariat
n 50
 x  1,74∙2 = 3,48. Deoarece producția este o caracteristică statistică cu variație
discretă (discontinuă), se va rotunji rezultatul obținut la valoarea întreagă 4.

Interpretare: Se garantează cu o probabilitate de 95,45% o eroare maximă între media


producției descoperită la nivelul eșantionului și media producției realizată la nivelul întregii
colectivități de salariați, în cazul unei extrageri repetate, de 4 buc/ salariat.

 Procedeul extragerii nerepetate

Eroarea maximă admisibilă se determină cu ajutorul relației x  z  x


În cadrul acestei relații  x semnifică eroarea standard (eroarea medie de
reprezentativitate), ce poate fi determinată cu ajutorul relației de mai jos:
2  n 152  50 
x  1    1    1,55 buc/salariat
n  N 50  250 
 x  1,55  2  3,1 . Deoarece producția este o caracteristică statistică cu variație discretă
(discontinuă), se va rotunji rezultatul obținut la valoarea întreagă 3.

140
Interpretare: Se garantează cu o probabilitate de 95,45% o eroare maximă între media
producției descoperită la nivelul eșantionului și media producției realizată la nivelul întregii
colectivități de salariați, în cazul unei extrageri nerepetate, de 3 buc/ salariat.

Cerința nr. 2

 Procedeul extragerii repetate

Nivelul eșantionului, pentru extragerea repetată, se determină cu ajutorul relației:


z 2 2
n 2
x
Eroarea maximă admisibilă obținută anterior se reduce cu 30%, astfel ∆′𝑥 =2,43
buc/salariat
2 2 152
n  102 ,96 .
2,43 2
Fiind vorba despre un număr de salariați va trebui sa rotunjim rezultatul la 103 persoane,
eșantion necesar a fi extras pentru a se garanta cu o probabilitate de 95,45% o eroare maximă
admisibilă de 2,43 buc/salariat.

 Procedeul extragerii nerepetate

Nivelul eșantionului, pentru extragerea nerepetată, se determină cu ajutorul relației:


z 2 2
n
z 2 2
2x 
N
Eroarea maximă admisibilă obținută anterior se reduce cu 30%, astfel ∆′𝑥 =2,17
buc/salariat

2 2 152
n  85,14 .
2 2 152
2,17 
2

250
Fiind vorba despre un număr de salariați, va trebui sa rotunjim rezultatul la 85 persoane,
eșantion necesar a fi extras pentru a se garanta cu o probabilitate de 95,45% o eroare maximă
admisibilă de 2,17 buc/salariat.

De reținut!

Procedeul de a obține date privind întreaga populație, pornind de la un eșantion,


poartă numele de inferență statistică.

Rezultatele obținute dintr-o cercetare selectivă pot fi extinse la întreaga colectivitate, dacă
eșantionul este reprezentativ. Un eșantion este considerat reprezentativ atunci când structura
colectivității de selecție este identică cu structura colectivității generale sau diferă foarte puțin
de aceasta.

Eroarea reprezintă diferența dintre valoarea indicatorilor obținuți în urma prelucrării datelor
din eșantion și valoarea acelorași indicatori obținuți în urma observării totale.

141
Aplicații propuse

Aplicația 5.1
Distribuția unui eșantion de unități comerciale (selectat întâmplător și nerepetat, de
volum 10% din colectivitatea generală), după valoarea desfacerilor lunare, se prezintă astfel:

Tabel 5-6
Intervale de variație a Nr. unități comerciale
desfacerilor (mii. lei)
<10 5
10-20 10
20-30 18
30-40 32
40-50 20
50 și peste 15
Total 100
Se cere:
Să se estimeze limitele între care se va încadra valoarea totală a desfacerilor de mărfuri
în întreaga rețea de unități comerciale, dacă rezultatele sunt garantate cu o probabilitate P =
0,9545, pentru care z = 2.

Aplicația 5.2
Ancheta cu privire la vârsta cititorilor rubricii de știri din economie a unui cotidian local
a condus la următoarele rezultate:
Tabel 5-7
Vârsta Nr persoane
(ani)
Sub 20 10
20 - 30 15
30-40 40
40-50 50
50 – 60 25
Peste 60 10
Total 150
Se cere:
a) Să se caracterizeze omogenitatea seriei de repartiție;
b) Considerând că cele 150 de persoane reprezintă un eșantion obținut prin extragere
simplă, aleatoare, nerepetată (N = 1000 persoane), să se estimeze cu o probabilitate P = 0,9545
(z = 2) limitele intervalului în care se încadrează vârsta medie a întregii populații statistice de
cititori;
c) Care este volumul eșantionului necesar a fi extras pentru o nouă cercetare pentru
care eroarea maximă admisibilă să se reducă cu un procent de 20% față de nivelul determinat
la cerința anterioară.

142
Aplicația 5.3
Distribuția a 40 de studenți după notele obținute la examenul de statistică în sesiunea de
examene din iunie 2012, se prezintă în felul următor:
Tabel 5-8
Grupe studenți după notele Număr studenți
obținute
Pana la 4 6
4,01-6 17
6,01 - 8 10
8,01 - 10 7
Total 40
Se cere:
a) Să se determine indicatorii tendinței centrale și să se interpreteze rezultatele;
b) Dacă presupunem că cei 40 de studenți constituie un eșantion reprezentativ format
simplu, aleator și nerepetat dintr-o colectivitate de 500 studenți, să se estimeze nota medie
corespunzătoare colectivității generale de 500 studenți, cu probabilitatea P = 0,9545 (z=2).

Aplicația 5.4
Într-o localitate, la nivelul unor gospodării, s-a efectuat un sondaj simplu repetat în
vederea stabilirii calității unui nou produs de întreținere (pastă de dinți). Dintre cele 400
persoane intervievate 280 sunt mulțumite de calitatea acestui produs.
Să se estimeze proporția persoanelor mulțumite de produs la nivelul tuturor
gospodăriilor localității în care a fost extras eșantionul (rezultatele se garantează cu o
probabilitate P = 0,95 pentru care z = 1,96).

Aplicația 5.5
Derularea unui studiu realizat pe un eșantion de 120 studenți, anul I, ai unei facultăți cu
profil economic, s-a bazat pe următoarea distribuție:

Tabel 5-9
Grupe studenți după Intervale de variație a vârstei studenților (ani)
mediul de proveniență 18-20 20-22 22-24 24-26 26-28 Peste 28
Rural 17 28 23 8 1 1
Urban 15 10 8 7 2 -

Se cere:
a) Să se estimeze intervalul de încredere al vârstei medii a studenților, având în vedere
că eșantionul reprezintă 20% din totalul studenților admiși în anul I și este format prin selecție
nerepetată, iar rezultatele se garantează cu o probabilitate P = 0,9973 (z = 3);
b) Estimați valoarea medie a vârstei studenților pentru persoanele care provin din
mediul rural;
c) Precizați care va fi volumul eșantionului în condițiile asigurării aceleiași precizii a
rezultatelor, dacă pentru cercetare ar fi necesară derularea unui sondaj aleator simplu nerepetat;
d) Să se precizeze procentul minim al studenților care au vârsta sub 24 ani.

143
TEMA DE CONTROL NR. 2

OBIECTIV: Prin intermediul TC2 studenții vor putea sa-si verifice cunoștințele
acumulate in cadrul întâlnirilor tutoriale, în vederea pregătirii examenului la disciplina
Statistica

CERINTE:
TC2 presupune realizarea unei analize statistice la nivelul unei colectivităţi statistice
formate din 300 de salariaţi din perspectiva veniturilor realizate în luna calendaristică
precedentă. Se presupune ca această colectivitate nu a putut fi analizată în totalitate, din cauza
resurselor fiinanciare şi umane limitate şi, astfel, s-a recurs la extragerea unui eşantion format
din 50 de persoane.

Datele statistice pe baza cărora se va face analiza vor fi generate individual de către
fiecare student cu ajutorul funcţie RANDOM NUMBER GENERATION din cadrul MS Excel.

Procedura de generare a valorilor se va face urmând etapele:

1. Funcţia RANDOM NUMBER GENERATION este integrtă în pachetul DATA


ANALYSIS. Acesta se instalează astfel:
-
 Pentru versiunea Excel 2007

Accesarea butonului Office (situat în partea stângă-sus a ferestrei Excel) > Excel options >
Add-Ins

Fig.: 1

Alegem din lista MANAGE Excel Add-Ins şi se apasă butonul Go...

144
Din lista afişată în fereastra nou apărută bifăm ANALYSIS TOOLPACK, apăsăm butonul OK
şi....aşteptăm să se instaleze. 

Fig.: 2

Ulterior în secţiunea de meniuri DATA vom regăsi opţiunea DATA ANALYSIS

Fig.: 3

 Pentru versiunea Excel 2003

În cazul utilizării acestei versiuni de excel, pentru instalarea pachetului de analiză


statistică e necesar să accesăm meniul TOOLS>ADD-INS şi se ajunge la fereastra de lucru
reprezentată în Fig: 2. Se parcuge procedura descrisă mai sus, ulterior în secţiunea de meniuri
DATA vom regăsi opţiunea DATA ANALYSIS

2. După ce ne asigurăm că acest pachet suplimentar de instrumente a fost instalat


corect, vom putea utiliza funcţia RANDOM NUMBER GENERATION din cadrul listei de
funcţii afişată în urma accesării meniului DATA > DATA ANALYSIS. Se ajunge la următoarea
fereastră de lucru:
-

145
-
Fig.: 4

În cadrul acestei ferestre trebuie să precizăm următorii parametrii de lucru:


a) Din lista DISTRIBUTION alegem NORMAL

b) În câmpul de text MEAN introducem o valoare la alegere curprinsă în intervalul [60 –


100]

c) În câmpul de text STANDARD DEVIATION introducem o valoare la alegere curprinsă


în intervalul [10 – 20]

d) În câmpul de text NUMBER VARIABLES introducem valoarea 1

e) În câmpul de text NUMBER OF RANDOM NUMBERS introducem valoarea 50

După introducerea acestor valori putem apăsa butonul OK.

3. Deoarece valorile generate nu vor fi în general valori numere întregi, pentru a obţine
acest lucru vom utiliza funcţia ROUND. Aceasta este disponibilă în pachetul de
formule MATH&TRIG

Fig.: 5

146
Pentru această funcţie, ca argumente, este necesar să precizăm valoarea ce dorim să fie
transformată şi numărul de zecimale la care dorim să fie transformată valoare (se va trece 0).
Sintaxa utilizată este ROUND (referinta_celula;numar_zecimale)
După realizarea transformării pentru prima valoare din listă, pentru aplicarea acestei
transformări şi restului de valori este necesar doar să aplicăm procedeul dragării.
O a doua modalitate de transformare a valorilor generate în valori întregi presupune
următoarele etape:
 Selectarea serie de valori
 Click dreapta şi alegerea opţiunii FORMAT CELLS...
 Se alege opţiunea NUMBER şi în câmpul DECIMAL PLACES se va trece
valoarea 0.

4. Astfel generam valorile pe care le vom utiliza în continuare în cadrul proiectului


individual.

Sarcini de realizat:

1. Realizaţi gruparea valorilor pe 5 intervale egale de variaţie. Gruparea se va face alegând


una din variantele limită superioară respectiv inferioară inclusă în interval.
2. Reprezentaţi grafic distribuţia valorilor grupate cu ajutorul histogramei.
3. Determinaţi şi reprezentaţi grafic mărimile relative de structură.
4. Analizaţi rapoartele de coordonare (corespondenţă) ce pot determinate faţă de primul
interval de grupare a veniturilor.
5. Determinaţi nivelul mediu al veniturilor cu ajutor mediilor: aritmetică, armonică,
pătratică şi geometrică şi verificaţi relaţia de ordine dintre valorile obţinute.
6. Determinaţi valoarea veniturilor ce a fost obţinută de cei mai mulţi salariaţi.
7. Descoperiţi valoarea mediană a veniturilor obţinute.
8. Caracterizaţi reprezentativitatea statistică a nivelului mediu obţinut al veniturilor cu
ajutorul indicatorilor de variaţie ( se vor utiliza atât indicatorii simpli cât şi cei sintetici).
9. Atât pentru situaţia unei extrageri repetate cât şi pentru o extragere nerepetată a
eşantionului:
a. Identificaţi intervalul de încredere ce va conţine cu o probabilitate de 95%
(z=1,96) valoarea media a veniturilor tuturor celor 300 de salariaţi.
b. Determinaţi mărimea eşantionului necesar a fi extras în situaţia în care se doreşte
o reducere a erorii maxime admisibile cu 25% faţă de nivelul obţinut la punctul
9a şi o creştere a probailităţii de lucru la nivelul 95,44% (z=2).

147
PRECIZARI:
• Referatul va fi redactat de mână.
• Referatul va fi predat î prin intermediul platformei e-learning si ulterior, la data
examenului, in format fizic. Pe platforma e-learning se va încărca o copie scanata a
referatului.

148
BIBLIOGRAFIE

1. Andrei T., Stancu S., Pele D.T. - Statistică. Teorie și aplicații, Ed. Economică, București,
2002.
2. Baron T., Biji E. - Statistică teoretică și economică, Ed. Didactică și Pedagogică, București,
1996.
3. Bădiță M., Baron T., Cristache S.E. - Statistică pentru afaceri în comerț – turism, vol. 1, 2,
Ed. Luceafărul, București, 2002.
4. Bădiță M., Baron T., Korka M. - Statistică pentru afaceri, Ed. Eficient, București, 1998.
5. Biji E.(coordonator) - Statistică teoretică și economică, Ed. Didactică și Pedagogică,
București, 1991.
6. Cristache, S.E. - Metode de calcul și analiză statistică a eficienței economice în Comerț, Ed.
ASE, București, 2003.
7. Cristache S.E., Șerban D. - Lucrări aplicative de statistică și econometrie pentru
administrarea afacerilor, Ed. ASE, București, 2007.
8. Gogonea RM., Zaharia M – Econometrie cu aplicații în activitatea de comerț-turism-
servicii,Editura Universitară, București, 2008.
9. Hapenciuc C.V. - Elemente de analiză și prognoză în turism, Ed. Junimea, Iași, 2004.
10. Hapenciuc C.V. - Cercetarea statistică în turism, Ed. Didactică și Pedagogică, București,
2003.
11. Isaic-Maniu A., Mitruț C., Voineagu V. - Statistică, Ed. Universitară, București, 2003.
12. Isaic-Maniu A., Mitruț C., Voineagu V., Statistica pentru managementul afacerilor,
ediția a II-A, Ed. Economică, București, 2000.
13. Isaic-Maniu A., Grădinaru A., Voineagu V., Mitruț C. - Statistică teoretică și economică,
Ed. Tehnică, Chișinău, 1994.
14. Jaba E. – Statistică, Ed. Economică, București, 1998.
15. Korka M., Begu L., Tușa E., Manole C. – Bazele statisticii pentru economiști, Ed. Tribuna
Economică, București, 2005.
16. Mitruț C., Șerban D. - Statistics for Bussiness Administration, Ed. ASE, București, 2003.
17. Novak, A. - Statistică – teorie, aplicații, exerciții, Ed. Sylvi, București, 2001.
18. Rotariu T., Iluț P. - Ancheta sociologică și sondajul de opinie, Ed. Polirom, Iași, 2001.
19. Secăreanu C., Gruiescu M. - Statistică. Concepte, metode și tehnici de bază, Ed.
Enciclopedică, București, 2007.
20. Șerban D. - Statistică pentru studii de marketing și administrarea afacerilor, Ed. ASE,
București, 2004.
21. Tővissi L., Isaic- Maniu A. - Statistică, Ed. ASE, București, 1994.
22. Trebici, V. - Mică enciclopedie statistică, Ed. Științifică și Enciclopedică, București,
1985.
23. Țarcă M., Țarcă V.– Elemente de statistică, Ed. Junimea, Iași, 2005.
24. Țarcă M. - Tratat de statistică aplicată, Ed. Didactică și Pedagogică, București, 1998.
25. Voineagu V, Țițan E., Șerban R., Ghiță S., Tudose D., Boboc C., Pele D. - Teorie și
practică econometrică, Ed. Meteor Press, 2007.
26. Wagner P. - Bazele statisticii, Ed. Universității Titu Maiorescu, București, 2005.
27. *** - Anuarul Statistic al României, 2010.
28. *** - https://statistici.insse.ro --- TEMPO-Online

149
Anexa 1
Distribuția normală.
x2

Funcția integrală a lui Laplace z   
z 1 2
e dx
0 2

z Ф(z) z Ф(z) z Ф(z) z Ф(z) z Ф(z)


0,00 0,00000 0,30 0,11790 0,60 0,22575 0,90 0,31595 1,20 0,38495
0,01 0,00400 0,31 0,12170 0,61 0,22905 0,91 0,31860 1,21 0,38685
0,02 0,00800 0,32 0,12550 0,62 0,23235 0,92 0,32120 1,22 0,38875
0,03 0,01195 0,33 0,12930 0,63 0,23565 0,93 0,32380 1,23 0,39065
0,04 0,01595 0,34 0,13305 0,64 0,23890 0,94 0,32640 1,24 0,39250
0,05 0,01995 0,35 0,13685 0,65 0,24215 0,95 0,32895 1,25 0,39435
0,06 0,02390 0,36 0,14060 0,66 0,24535 0,96 0,33145 1,26 0,39615
0,07 0,02790 0,37 0,14430 0,67 0,24855 0,97 0,33400 1,27 0,39795
0,08 0,03190 0,38 0,14805 0,68 0,25175 0,98 0,33645 1,28 0,39975
0,09 0,03585 0,39 0,15175 0,69 0,25490 0,99 0,33890 1,29 0,40150
0,10 0,03985 0,40 0,15540 0,70 0,25805 1,00 0,34135 1,30 0,40320
0,11 0,04380 0,41 0,15910 0,71 0,26115 1,01 0,34375 1,31 0,40490
0,12 0,04775 0,42 0,16275 0,72 0,26425 1,02 0,34615 1,32 0,40660
0,13 0,05170 0,43 0,16640 0,73 0,26730 1,03 0,34850 1,33 0,40825
0,14 0,05565 0,44 0,17005 0,74 0,27035 1,04 0,35085 1,34 0,40990
0,15 0,05960 0,45 0,17365 0,75 0,27335 1,05 0,35315 1,35 0,41150
0,16 0,06355 0,46 0,17725 0,76 0,27635 1,06 0,35545 1,36 0,41310
0,17 0,06750 0,47 0,18130 0,77 0,27935 1,07 0,35770 1,37 0,41465
0,18 0,07140 0,48 0,18440 0,78 0,28230 1,08 0,35995 1,38 0,41620
0,19 0,07535 0,49 0,18795 0,79 0,28525 1,09 0,36215 1,39 0,41775
0,20 0,07925 0,50 0,19145 0,80 0,28815 1,10 0,36435 1,40 0,41925
0,21 0,08315 0,51 0,19495 0,81 0,29105 1,11 0,36650 1,41 0,42075
0,22 0,08705 0,52 0,19845 0,82 0,29390 1,12 0,36875 1,42 0,42220
0,23 0,09095 0,53 0,20195 0,83 0,29675 1,13 0,37075 1,43 0,42365
0,24 0,09485 0,54 0,20540 0,84 0,29955 1,14 0,37285 1,44 0,42505
0,25 0,09870 0,55 0,20885 0,85 0,30235 1,15 0,37495 1,45 0,42645
0,26 0,10255 0,56 0,21225 0,86 0,30510 1,16 0,37700 1,46 0,42785
0,27 0,10640 0,57 0,21565 0,87 0,30785 1,17 0,37800 1,47 0,42920
0,28 0,11025 0,58 0,21655 0,88 0,31055 1,18 0,38100 1,48 0,43055
0,29 0,11410 0,59 0,22240 0,89 0,31325 1,19 0,38300 1,49 0,43190

150
Distribuția normală

x2

Funcția integrală a lui Laplace z   
z 1 2
e dx
0 2
(continuare)

z Ф(z) z Ф(z) z Ф(z) z Ф(z) z Ф(z)


1,50 0,43320 1,72 0,45730 1,94 0,47380 2,32 0,48985 2,76 0,49710
1,51 0,43450 1,73 0,45820 1,95 0,47440 2,34 0,49035 2,78 0,49730
1,52 0,43575 1,74 0,45905 1,96 0,47500 2,36 0,49085 2,80 0,49745
1,53 0,43700 1,75 0,45995 1,97 0,47560 2,38 0,49135 2,82 0,49760
1,54 0,43820 1,76 0,46080 1,98 0,47615 2,40 0,49180 2,84 0,49775
1,55 0,43945 1,77 0,46165 1,99 0,47670 2,42 0,49225 2,86 0,49790
1,56 0,44060 1,78 0,46245 2,00 0,47725 2,44 0,49265 2,88 0,49800
1,57 0,44180 1,79 0,46325 2,02 0,47830 2,46 0,49305 2,90 0,49810
1,58 0,44295 1,80 0,46405 2,04 0,47935 2,48 0,49345 2,92 0,49825
1,59 0,44410 1,81 0,46485 2,06 0,48030 2,50 0,49380 2,94 0,49835
1,60 0,44520 1,82 0,46560 2,08 0,48125 2,52 0,49415 2,96 0,49845
1,61 0,44630 1,83 0,46640 2,10 0,48215 2,54 0,49445 2,98 0,49855
1,62 0,44740 1,84 0,46710 2,12 0,48300 2,56 0,49475 3,00 0,49865
1,63 0,44845 1,85 0,46785 2,14 0,48380 2,58 0,49505 3,20 0,49930
1,64 0,44950 1,86 0,46855 2,16 0,48460 2,60 0,49535 3,40 0,49965
1,65 0,45055 1,87 0,46925 2,18 0,48535 2,62 0,49560 3,60 0,49984
1,66 0,45155 1,88 0,46995 2,20 0,48610 2,64 0,49585 3,80 0,49993
1,67 0,45255 1,89 0,47060 2,22 0,48670 2,66 0,49610 4,00 0,49996
1,68 0,45350 1,90 0,47130 2,24 0,48745 2,68 0,49630 4,50 0,49999
1,69 0,45450 1,91 0,47195 2,26 0,48810 2,70 0,49655 5,00 0,50000
1,70 0,45545 1,92 0,47270 2,28 0,48870 2,72 0,49675
1,71 0,45635 1,93 0,47320 2,30 0,48930 2,74 0,49695

151

S-ar putea să vă placă și