Documente Academic
Documente Profesional
Documente Cultură
Forma de învăţământ: ID
Program de studiu : Contabilitate și informatică de gestiune
Anul I, sem I
STATISTICĂ
2017
INTRODUCERE
Obiectivele principale ale acestui curs sunt concretizate în competentele pe care le veți
dobândi după parcurgerea și asimilarea sa:
- însușirea conceptelor de bază ale statisticii, a metodelor și procedeelor de observare,
prelucrare și analiză statistică.
- însușirea de cunoștințe și formarea de deprinderi la studenți, care să le permită
realizarea cercetărilor statistice în domeniul economic.
- formarea deprinderilor necesare utilizării metodelor și procedeelor statistice la
elaborarea unor lucrări de cercetare fundamentale și aplicative.
Prin conținutul său aplicativ și profund științific, cursul de statistică oferă o logică clară
care privește culegerea, prelucrarea și interpretarea rezultatelor obținute în contextul
desfășurării unei cercetări statistice.
Cursul Statistică este structurat în cinci unități de învățare (capitole), fiecare dintre
acestea indicând următoarele elemente: timp estimativ de studiu pentru asimilarea informației;
competente specifice unității de învățare; cuprins al unității de învățare.
2
Cuprins
3
Unitatea de învățare nr. 1: NOȚIUNI INTRODUCTIVE
PRIVIND STATISTICA
4
În același timp cu Școala germană a statisticii descriptive a luat ființă și s-a dezvoltat
în Anglia (secolele XVII-XVIII) o altă remarcabilă școală de statistică numită Aritmetica politică
după titlul lucrării fundamentale a acestei școli Political Arithmetick or a Discourse concerning
the Extend and Value of Lands, People, Buildings, elaborată de William Petty. În concepția
reprezentanților de frunte ai școlii Aritmeticii Politice – John Graunt, Edmund Halley, Gregory
King – fenomenele sociale în general, cele economice în special sunt fenomene măsurabile și
pot fi supuse unor prelucrări matematice pe baza cărora se pot desprinde prin analiză
regularitățile care le guvernează.
În Țările Române, sub influența Școlii descriptive germane, prima și cea mai
reprezentativă lucrare a genului este monografia cărturarului și domnitorului Moldovei,
Dimitrie Cantemir, intitulată Descriptio antiqui et hodierni status Moldaviae.
O contribuție românească remarcabilă la dezvoltarea statisticii descriptive o reprezintă
activitatea în domeniul acestei științe a primului economist și a primului statistician român, om
politic în același timp, Nicolae Șutu, membru al Royal Statistical Society din Londra. Nicolae
Șutu și-a asumat sarcina deosebit de complexă și dificilă de a culege, sistematiza și interpreta
științific informațiile statistice veridice provenind din surse diferite în scopul obținerii unei
descrieri statistice adecvate a situației economice din Moldova și România. În aceste lucrări se
află și importante considerații teoretice ale lui Șutu cu privire la caracterul științific al statisticii
și la rolul deosebit al acesteia în activitatea de conducere a statelor, ca unul dintre cele mai
puternice instrumente de cunoaștere a realității social-economice.
În concepția sa, formată sub influența școlilor de specialitate franceză și engleză,
statistica este o știință socială descriptivă, care studiază starea fizică, morală, intelectuală și
politică a societății, îmbrățișând toate domeniile vieții sociale, știința care încearcă să descrie
„faptele variabile” care sunt determinate de cauze variabile.
Alături de Nicolae Șutu, în Moldova secolului al XIX-lea s-a afirmat și agronomul,
economistul și statisticianul Ion Ionescu de la Brad, personalitate complexă, care și-a înscris
definitiv numele în galeria oamenilor de știință români, ca unul dintre întemeietorii statisticii
moderne românești. El și-a expus pentru prima dată concepțiile sale în domeniul statisticii în
lucrarea Povățuiri pentru facerea catagrafiei Moldovei precedate de oarecari elemente de
statistică, publicată în anul 1859. Prima parte a acestei lucrări, Elemente de statistică, constituie
primul manual de statistică elaborat de un autor român, în care savantul expune obiectul și
sarcinile statisticii, metodele, activitatea practică de statistică, organizarea statisticii oficiale,
mijloacele de culegere a informațiilor statistice și utilitatea statisticii în cunoașterea realităților
social-economice ale unui stat.
Deși influențat în mare măsură de concepția monografică a lui Nicolae Șutu, Ion Ionescu
de la Brad a adus importante contribuții creatoare și în domeniul cercetărilor monografice
pentru studierea vieții social-economice. El elaborează monografiile județelor Dorohoi, Putna
și Mehedinți, care au ca scop completarea informațiilor obținute dintr-o cercetare totală.
Contemporan cu Nicolae Șutu și cu Ion Ionescu de la Brad, la mijlocul secolului XIX,
în Muntenia s-a afirmat în domeniul statisticii și economiei, proeminenta personalitate a lui
Dionisie Pop Marțian, care a organizat și condus primul Oficiu Central de Statistică al acestei
provincii în anul 1859 și ulterior, pe cel al Principatelor Unite, fiind și inițiatorul și
conducătorul primei reviste de specialitate din România, apărută în anul 1860 și intitulată
Analele statistice.
Obiectivul fundamental al statisticii ca știință este generalizarea experienței
acumulate de practică, elaborarea și examinarea critică a indicatorilor folosiți și a
metodelor de calcul și analiză a acestora, precum și perfecționarea lor continuă în vederea
îmbunătățirii practicii în acest domeniu.
Principalul rezultat al activității științifice în domeniul statisticii îl constituie indicatorii
statistici, fundamentați din punct de vedere științific, care reflectă veridic realitatea și care
5
trebuie folosiți întotdeauna în cercetarea și determinarea realității concrete, când atât conținutul,
cât și forma de manifestare cantitativă a fenomenelor și proceselor cercetate au un caracter
specific și apar în anumite condiții bine determinate. Prin urmare, indicatorii statistici sunt
noțiuni teoretice elaborate ca rezultat al măsurării și abstractizării, care trebuie să
reflecte cât mai precis anumite trăsături ale realității obiective.
Ceea ce caracterizează în mod specific obiectul statisticii este faptul că ea studiază
fenomenele și procesele de masă sub formă de mulțimi sau colectivități, care s-au constituit ca
rezultat al acțiunii unui mare număr de cauze cu caracter esențial, asociate cu cele
întâmplătoare, ale căror influențe depind de condițiile concrete de spațiu și timp în care se
produc. Datorită faptului că fenomenele și procesele colective depind de un mare număr de
factori, forma lor individuală de manifestare poate varia în mare măsură de la o unitate la alta,
în funcție de modul de asociere a influenței factorilor esențiali cu cei întâmplători, de
intensitatea, stabilitatea, durata și sensul acestor influențe.
Legitățile care se manifestă în cadrul fenomenelor și proceselor de masă, în mișcarea
lor continuă, nu pot fi scoase în relief, nu pot fi cunoscute și caracterizate de statistică, decât
dacă se iau în studiu toate cazurile individuale sau o parte suficient de mare a lor, care să
prezinte la scară redusă trăsăturile principale ale ansamblului, întrucât manifestările individuale
sunt extrem de variate.
Știința realizează o unitate indestructibilă a celor două componente esențiale ale ei:
teoria și metoda științifică. Dacă teoria unei științe constă din fondul de cunoștințe acumulate,
transpuse într-o formă raționalizată de concepte și idei, metoda reprezintă modul de cercetare,
de cunoaștere a realității obiective sau modalitatea de a opera cu fondul de cunoștințe existent
pentru o dezvoltare continuă a cunoașterii.
În activitatea de cercetare, fiecare disciplină științifică folosește un ansamblu de metode
și tehnici. Unele îi sunt specifice, iar altele sunt preluate de la disciplinele înrudite. Ansamblul
metodelor folosite într-o anumită știință reprezintă metodologia particulară a științei
respective. Aceasta se situează la un nivel subordonat metodologiei generale a oricărei științe.
Însușirea și perfecționarea metodologiei științifice este de o importanță deosebită pentru fiecare
știință particulară.
Ceea ce caracterizează sub aspect metodologic statistica este exprimarea fenomenelor
și proceselor colective sub formă cantitativă, numerică.
Conceptul de număr a apărut în antichitate în urma procesului de abstractizare a
rezultatelor unor observații empirice a ființelor și lucrurilor, a faptelor și evenimentelor care se
iveau în câmpul receptivității omului. Introducerea simbolurilor literale, deci a unităților
imaginare, în locul numerelor a reprezentat o nouă treaptă ascendentă în procesul de
abstractizare care a contribuit în mod hotărâtor la constituirea statisticii ca știință.
Conceptul de număr l-a generat pe cel de numărare, iar acesta a determinat apariția
șirurilor de numere în matematică și mai târziu a conceptelor de grupuri, colectivități, variabile,
serii și distribuții în statistică.
Abstractizarea este o cale a gândirii conceptuale care se bazează pe analiza trăsăturilor
calitative, pe ierarhizarea și trierea acestora în scopul separării și luării în considerare numai a
unei proprietăți determinate a lor, neglijând pe toate celelalte. Abstractizarea contribuie la
descoperirea trăsăturilor comune ale ființelor și lucrurilor, faptelor și evenimentelor, care se
constituie în acte de cunoaștere, având o semnificație deosebită. Conceptualizarea se
întemeiază pe procesul abstractizării și permite relevarea a ceea ce este echivalent între
fenomene, deoarece egalitatea lor deplină, absolută, nu apare în realitate niciodată.
6
Raportul dintre un fenomen și structura sa de bază este deosebit de complex și nu poate
fi urmărit cu precizie în fiecare caz individual, particular. Se poate aprecia că până în prezent
doar științele naturii au reușit într-o măsură mai mare clarificarea relației dintre conceptele cu
care se descriu fenomenele naturii și acelea simplificatoare, care apar în formularea legilor
naturii.
Caracteristicile cantitative sunt transformate în studiu statistic sub formă cantitativă prin
cuantificare. Acest fapt creează posibilitatea prelucrării și analizei cantitative a fenomenelor
colective, simplificării și caracterizării în mod sintetic și generalizat a particularităților lor
calitative.
Măsurarea și, pe această bază, obținerea indicatorilor cantitativi și calitativi ai
fenomenelor sociale și economice, descoperirea și stabilirea legăturilor dintre ei, permite
trecerea la o etapă superioară a cunoașterii și anume, la modelarea statistică a realității.
Practica a arătat că măsurările, indiferent de natura lor și oricât de corect s-ar efectua,
sunt afectate în mod obligatoriu de erori, datorită variației în timp și spațiu a obiectului sau
fenomenului măsurat, imperfecțiunii organelor noastre de simț, aparaturii și metodelor de
măsurare, precum și influenței condițiilor exterioare. Evident, prin perfecționarea aparaturii și
a metodelor de măsurare se pot obține aproximații din ce în ce mai bune ale entităților observate,
însă mărimea preciziei măsurării este limitată.
Diferența dintre rezultatul obținut prin măsurarea unui anumit obiect sau fenomen și
valoarea lui reală poartă denumirea de eroare de măsurare.
Erorile de măsurare intervin în orice proces de măsurare, indiferent dacă aceasta se face
în natură sau societate. În general, se consideră că erorile de măsurare sunt mai mari în cazul
fenomenelor sociale decât cele corespunzătoare fenomenelor naturii, datorită unei variabilități
și a unei diversități mai mari ale acestora, cât și datorită inexistenței unor mijloace de măsurare
adecvate.
Statistica și-a elaborat metode specifice de estimare a erorilor de măsurare.
În orice cercetare științifică concretă și completă se pot identifica mai multe etape
(Figura 1-1):
Observarea
Pregătirea statistică date Prelucrarea Analiza
cercetării (culegerea statistică statistică
datelor)
În contextul detalierii elementelor din Figura 1-1 se vor contura mult mai bine aspectele
care prezintă cunoașterea proceselor care se derulează în cadrul activităților economico-sociale
și politice.
Derularea unei analize statistice vizează pregătirea cercetării, ca o primă etapă care
trebuie parcursă și care presupune o definire a:
obiectivului cercetării;
scopului cercetării;
indicatorilor prin intermediul cărora se poate îndeplini obiectivul stabilit pentru
cercetare;
variabilelor ca date individuale necesare derulării cercetării;
unitățile utilizate pe parcursul desfășurării cercetării;
7
modalităților de obținere a datelor individuale (unele răspund obiectivului de
cunoaștere; apare necesitatea unei înregistrări; alteori, se impune culegerea unor date pentru
toate unitățile colectivității, iar în alte condiții numai pentru un eșantion).
Observarea statistică, a doua etapă parcursă în derularea unei analize statistice, vizează
o înregistrare după reguli unitare ale caracteristicilor unităților colectivității și se concretizează
în materialul faptic.
A treia etapă, prelucrarea statistică urmărește derularea procesului de sistematizare a
datelor individuale, de prezentare a datelor sub formă de serii, tabele și grafice statistice, precum
și de calculare a indicatorilor derivați care permit o caracterizare a tendinței centrale, a variației
valorilor, a intensității corelației și a tendinței de evoluție.
Ultima etapă a cercetării statistice constă în analiza statistică ce presupune compararea
și confruntarea datelor, apoi o formulare și prezentare a concluziilor ca urmare a stabilirii
indicatorilor derivați în procesul de formulare și verificare a ipotezelor.
Statistica privită ca știință care cercetează diverse fenomene de masă este tratată în
general din două puncte de vedere:
- ca statistică descriptivă – acea parte a statisticii care urmărește prezentarea cât mai
sugestivă a datelor empirice care sunt rezultatul etapei observării, constituind volumul,
structura, evoluția în timp a fenomenului analizat.
Observație:
Informațiile furnizate de statistica descriptivă se referă numai la masa
unităților la care s-au observat valorile variabilelor.
8
Una dintre cele mai cunoscute și utilizate legi în statistică este legea numerelor mari
care presupune că într-un număr suficient de mare de cazuri individuale, a căror variație este
întâmplătoare, influența factorilor într-un sens este egal probabilă cu influența factorilor de sens
contrar și de aceea se compensează reciproc, în așa fel încât se obține o anumită valoare tipică,
caracteristică întregii colectivități.
Un alt exemplu de lege statistică este cea conform căreia la naștere, proporția copiilor
pe sexe nu este întâmplătoare, ci urmează o distribuție care la nivel național și pe o perioadă
îndelungată de timp, face ca la fiecare 100 de fete să se nască 105-106 băieți. Legea a fost
descoperită de englezul John Graunt în anul 1662, publicată în lucrarea Natural and Political
Observations upon the Bills of Mortality și observată ulterior la aproape toate popoarele lumii.
Termenul statistică derivă din latinescul status cu sensul pe care l-a avut în latina
medievală de stare politică.
Accepțiunea actuală a cuvintelor statistică, statistician, statistic datează de peste 100 de
ani. Totuși, aceste cuvinte au o vechime mult mai mare și sensul lor a suferit modificări în timp.
Semnificațiile actuale ale cuvântului statistică sunt următoarele:
a) Date numerice cu privire la unul sau mai multe fenomene din natură sau societate,
culese, sistematizate, centralizate și uneori publicate în anuare statistice, culegeri de date
statistice etc.;
b) Activitate de culegere, prelucrare și valorificare a informațiilor statistice, organizată
de stat sau individual de către cercetători;
În sensul prezentat mai sus, statistica a apărut ca răspuns la nevoia de cunoaștere în
expresie numerică a realității. Statistica ca activitate practică are drept obiectiv obținerea datelor
statistice exprimate numeric, referitoare la colectivități statistice. Înțeleasă în acest fel, statistica
are cel mai adesea forma unor tabele, construirea cărora presupunând ca regulă culegerea
datelor, sistematizarea și prelucrarea lor.
Exemplul 1.1
În ceea ce privește analiza statisticii populației, unitățile care fac obiectul
cercetării sunt reprezentate de persoanele înregistrate la recensământ care sunt
sistematizate pe sexe, vârstă, nivel de pregătire, domenii de activitate etc.
9
Luând în considerare că cele mai multe fenomene și procese nu sunt de tip determinist,
sau certe, ele se produc și se modifică în timp și spațiu ca rezultat al combinării complexe a mai
multor factori de influență. Rezultatul influenței acestor factori care se modifică în timp și în
spațiu se evidențiază sub forma unei mulțimi de manifestări individuale aparent întâmplătoare.
Realitatea reflectă faptul că, în mulțimea factorilor de influență există unii care imprimă tuturor
manifestărilor o esență comună, insesizabilă la nivelul fiecărui element, astfel încât fiecare
manifestare individuală (yi) a fenomenului (Y) este rezultat al combinării influențelor esențiale
(sistematice) cu cele neesențiale (întâmplătoare) sub a căror acțiune ia naștere și determină o
variație a fenomenului analizat.
În acest context, ceea ce este normal, esențial, regulă, se evidențiază prin cercetarea unei
mulțimi a acestor manifestări individuale (masă, colectivitate), eliminându-se ceea ce este
întâmplător, neesențial, prin simplificări și abstractizări succesive.
Concluziile cercetării furnizează informații utile privind astfel de fenomene care se
numesc fenomene de masă sau de tip colectiv, cunoașterea lor necesitând cercetarea
ansamblului de manifestări individuale.
d) Știință de sine stătătoare
Statistica tratată ca știință, are un obiectiv de studiu, o metodă particulară și un scop
bine precizat. Din această perspectivă, se susține frecvent că statistica este știința metodelor
pentru cercetarea în expresie numerică a fenomenelor de masă, metode de cercetare folosite și
de alte discipline științifice.
În literatura de specialitate se întâlnesc numeroase definiții ale statisticii, dar una unanim
acceptată lipsește. Cu toate acestea, se poate identifica o explicitare a noțiunii de statistică ca
o știință metodologică a cărui obiectiv este studierea fenomenelor și proceselor colective din
natură și din societate pe baza observării lor științifice, a culegerii și prelucrării detaliate a
informațiilor statistice cu scopul de a formula și explica legile, legitățile și regularitățile ce le
guvernează.
În condițiile actuale are loc o lărgire considerabilă a cadrului de aplicare a metodelor
statistice moderne în toate domeniile de cercetare științifică, ca și în rezolvarea unor probleme
practice ale etapei de tranziție spre economia de piață și nu numai. De aici rezultă că sfera celor
interesați în cunoașterea noțiunilor fundamentale ale statisticii și a metodelor, care își găsesc
aplicații eficiente în activitatea practică de producție, se lărgește din ce în ce mai mult
cuprinzând, pe lângă statisticieni și economiști, pe demografi, sociologi, ingineri, tehnicieni
etc., care lucrează în cele mai variate domenii ale vieții sociale și economice.
La nivel de întreprindere, Statistica reprezintă un instrument util pentru îmbunătățirea
administrării activității acesteia, permițând exercitarea unui control permanent asupra
procesului productiv de bunuri sau servicii, ca și în fundamentarea unor măsuri corespunzătoare
în cazul unor perturbații importante care pot să apară în timp, cum ar fi: variații importante ale
cererii sau ofertei, insuficiența temporară a unor resurse materiale, de energie etc. Statistica este
aceea care permite administratorului să-și structureze și sintetizeze informațiile potențial
disponibile și să le utilizeze în fundamentarea deciziilor celor mai adecvate.
Volumul informațiilor disponibile în întreprinderi este important și se referă la
specializarea diferitelor lor compartimente ca și relațiile acestora cu alte unități economice care
necesită numeroase schimburi reciproce de informații utilizate în scopuri de coordonare: note
de comandă, note de livrare, facturi, note contabile, fișe ale utilajelor, fișe de salarii etc., ținute
pe suporturi fizice sau informatice. Toate aceste forme de evidență sunt întocmite cu scopul
precis de a determina drepturile și obligațiile legale ale întreprinderii față de furnizori, de clienți
și de proprii salariați.
În funcție de sursa lor, informațiile necesare administratorului se pot împărți în două
categorii și anume în informații interne arhivate temporar, care, după ce au fost utilizate se
distrug sau sunt centralizate pentru a servi o durată mai mare de timp și informații externe
10
întreprinderii, ținute de instituții specializate precum cea amintită deja și anume Institutul
Național de Statistică și Studii Economice (www.insse.ro).
Se poate afirma că în epoca contemporană metoda caracteristică a cercetării științifice
moderne, aproape în toate domeniile, este metoda statistică. Aceasta asigură baza sistemului
informațional modern, iar deciziile de ordin politic, social și economic pe plan național, regional
și local, ca și în întreprinderi se bazează pe informația statistică.
Exemplul 1.2:
la nivel macroeconomic, cercetarea statistică a unei colectivități
statistice ar putea cuprinde: populația României la data de ...; rezervele de grâu
ale statului român la data de....; producția viticolă pe regiuni de dezvoltare
economică, în perioada...
la nivel microeconomic, procesul investigației statistice poate include: stocul
calculatoarelor aflate în depozitul unui supermarket la data de....; studenții înscriși la o
facultate în perioada 1990-2012, turiștii sosiți într-o pensiune în lunile anului 2012 etc.
11
Colectivitatea statică prezintă o stare la un moment dat (oră, zi etc) a entităților
componente a fenomenului ce urmează a fi cercetat. Ansamblul creat este cunoscut în
investigația statistică și sub denumirea de colectivitate de stoc.
Exemplul 1.4: exporturile României în anul ..., încasările unei firme în luna ...,
colectivitatea copiilor născuți vii în Suceava în anul ....
Unitatea statistică reprezintă cel de-al doilea concept de bază utilizat în statistică, fiind
considerat elementul constitutiv al sistemului care alcătuiește colectivitatea statistică.
Fiind purtătoarea trăsăturilor prin intermediul cărora se caracterizează colectivitatea
statistică, unitatea statistică trebuie clar stabilită deoarece, în funcție de conținutul acesteia se
pot lua deciziile corespunzătoare privind procesul prelucrării statistice.
Clasificarea unităților statistice se prezintă astfel:
a. În funcție de structura acestora:
unități simple – acestea sunt alcătuite dintr-un singur element;
unități complexe – structurate pe baza a două sau mai multor unități simple,
în raport cu modul lor de organizare.
b. În raport cu modul de înregistrare:
unități active – reprezentate de acele entități care transmite informațiile
necesare cercetării atât despre ele cât și despre cele pe care le reprezintă;
unități pasive – exprimate prin elementele despre care se comunică datele.
Exemplul 1.5:
unitate simplă: angajatul, persoana, firma, produsul etc.
unitate complexă: secția de producție, gospodăria, ramura de activitate.
12
unitate activă: profesorii care dau detalii atât despre ei, cât și despre elevi; la un
recensământ, reprezentantul familiei transmite date atât despre el, cât și despre
membrii familiei;
unitate pasivă: calculatoare; producție mașini.
Observație:
Se impune a se face distincție între caracteristici de înregistrare și
caracteristici de identificare. Corespunzător primelor se culeg date pentru
toate unitățile colectivității, iar ultimele servesc la identificarea, delimitarea
unităților care formează colectivitatea.
Cantitative Calitative
Alternative Nealternative
(numerice) (nenumerice)))
Variabile
Variabile
Variabile
Variabile cantitative
13
Cel mai semnificativ criteriu are în vedere clasificarea variabilelor statistice după modul
de exprimare, astfel:
variabile cantitative - reprezentând rezultatele înregistrate ca urmare a procesului
de numărare, măsurare sau determinare prin calcul;
variabile calitative – exprimate prin cuvinte corespunzătoare clasificărilor din
nomenclatoare sau prin coduri și simboluri ale diferitelor categorii analizate.
Exemplul 1.6:
variabile cantitative: venitul, cifra de afaceri, vârsta, valoare export etc.
variabile calitative: mediul de proveniență, domeniul de activitate, zona de
amplasare, sexul
Importantă este și clasificarea variabilelor statistice după natura variației, după cum
urmează (acest criteriu se aplică exclusiv variabilelor de tip cantitativ):
variabile discrete – acele variabile care au o variație discontinuă, reprezentate de
valori, de regulă, numere întregi, pozitive de forma: x1, x2 ,..., xn ( x1 x2 ... xn );
variabile continue – sunt variabile cu variație continuă redate prin valori numărabile
divizibile la infinit, care se pot transpune matematic prin intermediul intervalelor egale/neegale,
închise/ deschise de forma: x0 , x1 , x1 , x2 ,..., ( xi1 , xi ) , unde Ii xi1, xi este un interval
geometric, reprezentat printr-un segment de dreaptă.
Exemplul 1.7:
variabile discrete: număr angajați, producție de ouă (bucăți), număr hoteluri
variabile continue: câștig salarial, greutate corporală, valoare import
Exemplul 1.8:
variabile de timp: data de fabricație a unui produs; vechimea în muncă; dată
înregistrare contract;
variabile de spațiu: zona de amplasare a unei agenții de turism; domiciliul;
regiune de dezvoltare;
variabile atributive: PIB, număr bilete vândute de Agenția de transport feroviar, număr
mașini.
14
Exemplul 1.9:
variabile alternative (binare): sexul (masculin, feminin), răspuns binar (da,
nu), rezultat examen (admis, respins), mediul de proveniență (rural, urban);
variabile nealternative: categorii de confort, vârstă, stare civilă
Exemplul 1.10:
variabile primare: cantități produse, număr de angajați;
variabile derivate: PIB/locuitor, rata inflației, rata profitului
P X xi f xi (1.2)
În studiile statistice s-a stabilit că fiecare unitate statistică poate avea o valoare empirică
diferită sau aceeași ca și a altei unități. În acest context, se poate vorbi despre frecvența de
apariție a valorilor, care poate fi mai mare sau egală cu 1, fiind denumită frecvență relativă sau
absolută.
Frecvența absolută (ni) arată de câte ori a fost înregistrată o variantă distinctă, iar cea
relativă (fi) exprimă ponderea, greutatea specifică sau cota parte în totalul elementelor unei
colectivități ( fi = ni / ni).
15
În raport cu mulțimea unor perechi de tipul xi , ni , respectiv xi , fi , distribuția de
frecvențe a variabilei X poate fi prezentată astfel:
pentru o caracteristică ce include valori empirice absolute ( ni ), perechea xi , ni
conduce la o distribuție de forma:
xi
X : (1.3)
ni
ni
pentru caracteristică ale căror valori empirice relative ( f i ) aparțin combinației
n
xi , fi , distribuția va apărea de forma:
xi
X : (1.4)
fi
Pe parcursul cercetării, caracteristicii statistice îi corespunde o distribuție statistică ce
reprezintă baza fundamentală pentru procesul prelucrării și interpretării rezultatelor obținute.
Diferite aspecte ale fenomenelor și proceselor de masă se pot cuantifica prin aplicarea
indicatorilor statistici.
Indicatorul statistic reprezintă acea noțiune în care se întrepătrund două elemente
componente: o componentă rațională care definește conținutul indicatorilor și una sub forma
unei expresii numerice concretizată în timp și în spațiu, astfel fiind considerat expresia numerică
ce corespunde unor măsurări statistice sau unor calcule realizate asupra datelor obținute ca
urmare a înregistrărilor statistice.
Acest context impune ca procesul determinării și aplicării indicatorilor să cuprindă
următoarele etape:
elaborarea conceptuală și metodologică privind tipul indicatorilor statistici aplicabili
fenomenului analizat;
calcularea indicatorilor statistici stabiliți a se aplica, pe baza datelor observate.
Exemplul 1.11:
PIB-ul României a fost în anul 2011 de 1.152.000 miliarde lei; rata inflației a
fost în România în decembrie 2011 față de decembrie 2010 de 17,8%.
Procesul măsurării în statistică este reflectat prin intermediul acțiunii de acordare a unor
valori pentru trăsăturile unităților statistice, în raport cu aplicarea unor reguli precise. Astfel,
între valorile incluse în procesul prelucrării apar diferențe care pot fi măsurate cu ajutorul unor
scale.
Variabilele calitative se pot transforma în variabile cantitative ca urmare a înlocuirii
cuvintelor prin numere, proces denumit scalare.
În practica statistică se folosesc diverse tipuri de scale, cele mai semnificative fiind:
scala nominală, scala ordinală, scala interval și scala raport, la care se adaugă și scările de
intensitate, respectiv de opinie, utilizate în special pentru cercetările de marketing.
Scala nominală este utilizată pentru variabile calitative, ale căror valori empirice sunt
cuvinte ce nu pot fi ordonate. Aplicabilitatea acesteia constă în măsurarea prin înlocuire a
16
cuvintelor cu numere ca urmare a codării sau a determinării frecvențelor de apariție, fără a
diferenția unitățile statistice ale colectivității investigate.
Exemplul 1.12:
În cazul variabilei de promovare cu variantele de răspuns: admis și respins
codate cu (0) și (1), nu se admit nici un fel de operații aritmetice.
Indicatorii aplicabili în cazul acestui tip de scală sunt: modul, coeficientul de contingență,
testul .
2
Scala ordinală sau cu ranguri este aplicată tot variabilelor calitative, numai că
valorilor empirice sub forma cuvintelor le sunt acordate numere sau ranguri prin intermediul
cărora se stabilește o anumită ordine (crescătoare sau descrescătoare), dar fără a cuantifica
distanța (diferența) dintre două numere.
Exemplul 1.13:
În cazul scalei gradelor didactice acordate (1, 2, ..., 10), scalei categoriilor de
confort ale structurilor de primire turistică din mediul rural (1 floare, 2 flori,...,5
flori), numerele atribuite sub forma rangurilor nu admit operații aritmetice și nu
pot cuantifica distanța (diferența) dintre două numere.
Exemplul 1.14:
Măsurarea temperaturii după cele două tipuri de scale se prezintă astfel:
Tabel 1-1
0
Scala Celsius -18 10 30 100
punct de origine
0
Scala Farenheit 32 50 86 212
punct de origine
Principalii indicatori aplicați în cazul scalei interval sunt: indicatorii tendinței centrale,
indicatori ai variației, indicatori ai corelației și regresiei etc.
17
Scala raport (metrică): este aplicabilă valorilor empirice care în afara trăsăturilor
corespunzătoare celor de la scala interval, mai posedă încă una prin intermediul căreia se
impune stabilirea unei origini reale, fixe (ca punct de referință).
Exemplul 1.15:
Măsurarea valorilor următoarelor variabile: dimensiunile fizice (înălțime,
greutate), preț, viteză
Nota:
Unele softuri statistice precizează o singura scala numerica (ex: SPSS), fără
a mai face deosebirea între scala de interval și cea de raport.
Exemplul 1.16:
Tabel 1-2
Nr.
Variabila Variante înregistrate Scale aplicabile
variabilă
1. Sexul: masculin, feminin Scala nominală
căsătorit, necăsătorit, divorțat,
2. Starea civilă: Scala nominală
văduv
Performanțe
3. foarte bune, bune, satisfăcătoare Scala ordinală
profesionale:
4. Înălțime corporală: x cm Scala raport
5. Numărul copiilor: 0,1,2,3,.... Scala raport
În cazul primelor două variabile calitative (sex, stare civilă) variantele înregistrate
sunt cuvinte care nu se obțin prin numărare sau măsurare, ci fiecare unitate are sau nu are o
anumită însușire. Situația prezentată evidențiază imposibilitatea ordonării sau stabilirii
distanțelor / rapoartelor variantelor prezentate, ceea ce conduce spre utilizarea scalei
nominale.
Pentru a treia variabilă (performanțe profesionale) se poate menționa posibilitatea
aranjării variantelor înregistrate după o ordine prestabilită sau un rang acordat, deci se aplică
scala ordinală.
Celorlalte două variabile (înălțime corporală, numărul copiilor) le corespund variante
numerice obținute prin măsurare sau numărare, ceea ce permite stabilirea unor distanțe și
rapoarte, iar pentru că se impune stabilirea unei origini reale, fixe (ca punct de referință),
atunci se aplică scala raport.
Investigarea opiniilor și comportamentelor persoanelor intervievate conduce la o
măsurare a datelor înregistrate prin intermediul a două scale: scala de intensitate și scala de
opinie.
18
Exemplul 1.17:
Scala de opinie al lui Ilse Krasemann1:
-10 0 + 10
Exemplul 1.18:
Scală privind măsurarea gradului de mulțumire față de locul de muncă:
1 2 3 4 5
1.5 APLICAȚII
Aplicație rezolvată
Tabel 1-3
Nr. Producție Vechime Nr. Producție Vechime Nr. Producție Vechime
salariat - buc. - - ani - salariat - buc. - - ani - salariat - buc. - - ani -
1. 43 14 18. 42 13 35. 67 28
2. 32 7 19. 47 16 36. 45 15
3. 49 17 20. 46 13 37. 40 12
4. 60 24 21. 49 13 38. 53 20
5. 59 23 22. 42 13 39. 42 13
6. 61 27 23. 61 25 40. 54 20
7. 21 1 24. 45 15 41. 30 6
1
E. Jaba – Statistica, Ed. Economică, București, 2002, p. 26
19
8. 43 14 25. 49 14 42. 31 10
9. 58 23 26. 40 12 43. 29 5
10. 34 8 27. 68 29 44. 42 13
11. 38 11 28. 56 22 45. 46 15
12. 27 4 29. 70 30 46. 46 15
13. 26 3 30. 39 11 47. 49 13
14. 35 9 31. 68 26 48. 70 30
15. 37 10 32. 28 5 49. 25 4
16. 25 2 33. 52 19 50. 38 11
17. 40 12 34. 56 22
Să se precizeze noțiunile de bază cu care se operează.
Rezolvare:
Colectivitatea statistică analizată este formată din 250 de salariați ai unei întreprinderi,
din rândul acestora s-a extras un eșantion format din 50.
Unitatea statistică este reprezentată de către un salariat și reprezintă o unitate statistică
simplă.
Pentru colectivitatea menționată s-au analizat două caracteristici statistice:
- Producție (exprimată în bucăți): variabilă atributivă, numerică, discontinuă,
nealternativă, primară, măsurată pe scala de raport;
- Vechime (exprimată în ani): variabilă atributivă, numerică, discontinuă, nealternativă,
primară, măsurată pe scala de raport.
Notă: Pentru a exista o continuitate a prezentării noțiunilor, această aplicație va
fi actualizată cu noi cerințe pe parcursul următoarelor capitole.
De reținut!
Statistica are ca obiect cercetarea fenomenelor social-economice cu existență
concretă, trecând de la date individuale numeroase si variate ca forma de
manifestare, la dimensionarea prin indicatori specifici, sintetici și analitici, a
trăsăturilor esențiale ale fenomenelor.
Cu ajutorul generalizărilor și abstractizărilor cu care operează,
statistica ilustrează viața economică și socială în mărimi cifrice denumite generic, indicatori
20
Aplicații propuse
Aplicația 1.1
Pentru caracterizarea unei grupe de studenți din anul I al Facultății de Științe Economice
și Administrație Publică, în funcție de media la admitere, unitatea de observare este:
a) grupa;
b) studentul;
c) media la admitere.
Aplicația 1.2
Pentru următoarele exemple, arătați unitatea statistică, variabila statistică, tipul
variabilei și scala ei de măsurare:
a) numărul de piese din 10 depozite;
b) temperatura înregistrată pe perioada unei luni calendaristice la o stație meteo;
c) localitatea unde își au înregistrate sediile sociale 100 de organizații economice;
d) profitul obținut în anul 2012 de către 350 de societăți comerciale;
e) culoarea preferată de către copiii din cadrul a 20 de familii.
Aplicația 1.3
Un cercetător este interesat să compare durata medie de căutare a unui loc de muncă
pentru bărbații și femeile care absolvă cursurile unei facultății. Sunt cercetați 100 de bărbați și
100 de femei.
a) descrieți populația;
b) descrieți eșantionul;
c) descrieți inferența care interesează.
Aplicația 1.4
În cadrul unui chestionar, printre întrebările formulate se află și următoarea: „Ce vârstă
aveți?”, la care respondentul va preciza valoarea într-o rubrică deschisă sau persoanele
intervievate sunt rugate să bifeze în căsuța corespunzătoare vârstei care se grupează astfel:
18 - 28 ani
28 – 38 ani
38 – 48 ani
48 – 58 ani
peste 58 ani
Se cere:
a) Care este unitatea statistică cercetată?
b) Precizați tipul variabilei în raport cu criteriile stabilite în clasificare;
c) În funcție de fiecare formulare a întrebării, să se stabilească scala de măsurare.
Aplicația 1.5
La nivelul unei facultăți cu profil economic, în decursul unui an trebuie să se desfășoare
două cercetări. Precizați două teme de cercetare, pentru fiecare specificându-se și
caracterizându-se: colectivitatea și unitatea statistică, două variabile cantitative, două variabile
calitative și scalele de măsurare aplicabile acestora.
21
Unitatea de învățare nr. 2: METODOLOGIA
INVESTIGAȚIEI STATISTICE
Timpul de studiu individual estimat: 5 h
22
În teoria statistică se cunosc și în practică se utilizează numeroase tipuri și forme de
înregistrări care se pot sistematiza prin clasificarea după criterii diferite:
a) Din punct de vedere al gradului de cuprindere a colectivităților studiate în procesul
de înregistrare deosebim:
Înregistrarea totală (exhaustivă) care înseamnă consemnarea într-o formă unitară a
tuturor unităților componente ale unei colectivități statistice cu caracteristicile lor, care
interesează o anumită cercetare.
Înregistrarea parțială care se efectuează asupra unei părți din unitățile care compun
colectivitatea cercetată, cu caracteristicile cuprinse în studiu, în așa fel încât partea înregistrată
să fie reprezentativă pentru ansamblul colectivității respective.
Indiferent de forma de înregistrare (totală sau parțială), informația obținută trebuie să
servească pentru caracterizarea colectivității generale.
b) Din punct de vedere al timpului de înregistrare se disting:
Înregistrarea curentă se efectuează cu caracter continuu, sistematic și operativ
asupra faptelor și fenomenelor în timpul, la locul și pe măsura apariției lor. Înregistrarea curentă
oferă posibilitatea urmăririi operative a îndeplinirii programelor de dezvoltare, a descoperirii
rezervelor nefolosite și ajută la conducerea operativă a unităților economice. Ea îmbracă, în
general, forma documentației primare, care stă la baza evidenței tehnico-operative, a evidenței
contabile și a celei statistice (exemplu: înregistrarea fenomenelor demografice).
Înregistrările periodice (înregistrări la un moment dat) a colectivităților de stări ce
se fac la anumite intervale de timp, dinainte stabilite, egale (de obicei) sau neegale. În statistică,
înregistrările periodice îmbracă forma recensămintelor populației, locuințelor, animalelor,
inventarierilor statistice efectuate cu scopul evaluării și reevaluării mijloacelor fixe din
economie, inventarierii mijloacelor circulante etc.
Înregistrările ocazionale (unice) se utilizează în cazul unor colectivități de fapte și
evenimente discontinue, ocazionale, neobișnuite, cum ar fi de exemplu, înregistrarea clădirilor
efectuată în luna martie 1977 pentru localitățile din România care au fost afectate de distrugerile
cauzate de cutremurul din 4 martie 1977.
Aceste trei feluri de înregistrări se utilizează în mod combinat în statistică, iar în cadrul
lor rolul principal îl are înregistrarea curentă, care servește ca bază documentară pentru
întocmirea evidenței statistice.
c) Din punct de vedere al procedeului folosit înregistrările pot fi:
Înregistrare directă, ce presupune consemnarea nemijlocită a fenomenelor în
documente se efectuează prin contactul direct al cercetătorului cu fiecare unitate a colectivității,
determinându-i nivelurile de dezvoltare ale caracteristicilor și înregistrându-le în formulare
(recensămintele populației, recensămintele animalelor, inventarierile statistice, toată
documentația primară, cercetările prin sondaj ale calității producției etc.).
Înregistrare pe bază de documente se face pe baza unor înscrisuri oficiale în care au
fost consemnate fenomenele în timpul producerii lor, de exemplu, întocmirea evidenței
statistice pe baza evidenței primare, a evidenței tehnice operative și a evidenței contabile.
Înregistrarea pe bază de documente înseamnă consemnarea datelor din documentele anterioare
și transcrierea lor în formulare speciale. În condițiile unei evidențe primare bine organizate,
înregistrarea pe bază de documente este tot atât de exactă ca și înregistrarea directă, dar este
mai puțin costisitoare.
Înregistrare prin interogare se efectuează pe baza chestionării de către cercetător a
persoanelor supuse cercetării sau a celor care au fost de față la producerea fenomenului cercetat.
Înregistrarea prin interogare se mai utilizează și în următoarele momente:
- când cercetătorul nu poate lua contact direct cu unitățile colectivității cercetate;
- când fenomenele s-au produs anterior, fără a fi fost consemnate în documente;
23
- când, deși cercetătorul are posibilitatea unui contact direct cu unitățile cercetate, nu
este în măsură să stabilească singur nivelul de dezvoltare al anumitor caracteristici.
Precizia informațiilor obținute dintr-o înregistrare prin interogare depinde de o serie de
factori subiectivi, cum ar fi: exactitatea cu care faptele petrecute anterior s-au reflectat în
conștiința celui interogat, corectitudinea punerii întrebărilor și buna credință a recenzorului și a
celui recenzat.
Înregistrarea prin interogare se poate efectua și prin corespondență.
Autoînregistrarea poate fi socotită o formă specială de înregistrare prin interogare,
în care înregistrarea propriu-zisă se efectuează de către persoana cercetată, pe formulare
speciale primite de la cercetător, de exemplu, anchetele statistice. În acest caz, cercetătorul
înmânează sau trimite prin poștă formularele cu instrucțiunile de completare a lor celui interogat
și apoi le ridică după ce verifică în prealabil exactitatea datelor consemnate. Această formă de
înregistrare a informațiilor statistice este mai puțin costisitoare, dar și rezultatele ei sunt supuse
unei probabilități sporite de producere a erorilor de înregistrare.
24
cu acțiunile lor în sens contrar și se compensează reciproc la nivelul colectivității. De exemplu,
la efectuarea controlului statistic al calității producției când se măsoară o anumită caracteristică
se comit erori de măsurare în plus sau în minus față de valorile reale ale caracteristicii diferitelor
unități, dar pe ansamblu – dacă numărul variantelor este suficient de mare – abaterile într-un
sens se compensează cu abaterile în sens contrar, iar valoarea medie va tinde spre valoarea reală
a caracteristicii măsurate.
Erori sistematice care acționează într-o anumită direcție bine determinată și
denaturează întotdeauna realitatea. Cele mai frecvente erori de înregistrare sistematice se
produc cu ocazia înregistrărilor totale.
Erorile de înregistrare apar atât în cazul înregistrărilor totale, cât și în cazul
înregistrărilor parțiale. De regulă, ele vor fi mai mari în cazul înregistrărilor totale și mai mici
în cazul celor parțiale datorită, printre altele, și volumului mai redus de muncă care determină
un risc mai mic de comitere a erorilor. Aceasta nu însemnă că informațiile provenite dintr-o
înregistrare parțială sunt mai exacte decât cele care provin dintr-o înregistrare totală, datorită
faptului că primele, sunt afectate și de un tip special de erori – erori de reprezentativitate.
Erorile de reprezentativitate se exprimă ca diferențe între mărimea unui indicator
sintetic (nivelul mediu al unei variabile, gradul de împrăștiere al variantelor individuale în jurul
nivelului ei mediu, diferiți indicatori de structură etc.) obținut pe baza eșantionului și mărimea
aceluiași indicator determinată pe baza unei înregistrări totale, cu condiția ca eroarea de
înregistrare să fie la fel de mare în ambele cazuri. Aceste erori sunt determinate de
imposibilitatea reproducerii exacte în cadrul eșantionului a structurii colectivității generale.
Pentru a se asigura autenticitatea datelor statistice este necesar să se verifice în mod
sistematic, în toate etapele procesului de înregistrare, modul cum au fost înțelese programul și
formularele de înregistrare, instrucțiunile de completare a lor cu scopul de preveni producerea
erorilor.
Prevenirea producerii erorilor de înregistrare se poate face pe căi diferite, precum:
testarea formularelor de înregistrare prin anchete test, recensăminte de probă etc.;
alegerea judicioasă a personalului de înregistrare, mai ales pentru înregistrările totale;
instruirea personalului care face înregistrarea și, pentru unele cercetări speciale, chiar
testarea aptitudinilor acestora;
popularizarea lucrărilor statistice și formarea convingerilor în rândul populației cu
privire la însemnătatea științifică și aplicativă a recensământului populației, animalelor,
pomilor, precum și a diferitelor anchete statistice;
efectuarea unui control riguros asupra activității personalului de înregistrare;
verificarea modului cum sunt ținute evidențele ce stau la baza informațiilor statistice.
Erorile nepremeditate pot fi mai greu prevenite și de aceea datele statistice, înainte de fi
utilizate ca atare, trebuie analizate, controlate și corectate.
Controlul datelor statistice este o acțiune ulterioară înregistrării și se efectuează cu
scopul de a asigura volumul complet și calitatea datelor înregistrate. Acest control se poate
efectua fie la locul înregistrării, în mod operativ, fie la diferite organe teritoriale sau centrale
(Direcțiile Județene de Statistică, Institutul Național de Statistică și Studii Economice).
Independent de locul unde se efectuează, în primul rând se procedează la un control
cantitativ al datelor obținute prin înregistrare, pentru a se constata dacă au fost cuprinse toate
unitățile colectivității cercetate și dacă la fiecare unitate au fost înscrise toate caracteristicile
cuprinse în formulare. Astfel, în cazul diferitelor documente statistice se verifică dacă este
complet volumul informațiilor statistice.
Pe lângă controlul cantitativ se efectuează în practica statistică și un control calitativ cu
ajutorul căruia se verifică înregistrarea corectă a indicatorilor stabiliți. Controlul calitativ se
efectuează sub formă de control logic și sub formă de control aritmetic.
25
Controlul logic constă în a se verifica dacă legătura dintre diferite caracteristici
înregistrate corespunde unei legături reale. Compararea acestor legături se poate face în timp,
în spațiu sau din punct de vedere calitativ.
Controlul aritmetic constă în verificarea calculelor din care au rezultat totalurile
înregistrate.
Etapa de bază a cercetării, observarea statistică constă în alegerea unor date (figura 2.1),
după o metodologie unitară, privind caracteristicile componentelor colectivității supuse
cercetării sub aspectul mărimii valorii și a formelor de manifestare.
Elementele care stau la baza derulării procesului de observare statistică se referă la:
a) planul observării;
b) felul observării;
c) erorile de observare.
Datele culese
Probleme
METODOLOGICE
PLANUL
OBSERVĂRII Probleme
ORGANIZATORICE
26
timpul observării se referă la două aspecte: stabilirea timpului la care se referă toate
datele care urmează a fi înregistrate și timpul (perioada) în care trebuie realizată înregistrarea.
În cazul unei colectivități de stoc, toate datele înregistrate se referă la un moment dat (moment
critic), iar în cazul unei colectivități de flux timpul la care se referă datele este o perioadă (lună,
trimestru etc.);
locul observării statistice coincide, de regulă, cu locul producerii fenomenului
înregistrat;
măsuri organizatorice, respectiv măsurile prin care se asigură logistica desfășurării
observării statistice: elaborarea formularelor de înregistrare și a instrucțiunilor de completare,
recrutarea și instruirea personalului de înregistrare etc.
În funcție de natura fenomenelor studiate, scopul urmărit, modul de organizare a
activității economico-sociale și mijloacele tehnice de prelucrare, observarea statistică se
realizează în diverse forme.
27
Gruparea statistică presupune organizarea datelor primare după una sau mai multe
caracteristici, cu scopul relevării tipurilor calitative ale populației cercetate.
Grupări SIMPLE
(după a singură caracteristică)
Numărul
caracteristicilor Grupări COMBINATE
(după două sau mai multe caracteristici)
Grupări teritoriale
(după caracteristici de spațiu)
Conținutul
Grupări de timp sau cronologice
caracteristicilor
(după caracteristici de timp)
Grupările statistice după caracteristici numerice le putem întâlni atât sub forma
grupărilor simple cât și combinate.
Gruparea simplă poate fi: pe variante numerice și pe intervale de variație
Gruparea pe variante numerice presupune determinarea numărului de unități din
colectivitate la nivelul cărora sunt variantele înregistrate, precum și valoarea realizată a
caracteristicii, situație valabilă numai în cazul în care caracteristica de grupare presupune
prezența unui număr foarte mic de variante.
28
n = numărul de unități în colectivitatea de selecție.
Varianta A.
Considerând că fenomenul studiat are o distribuție de tipul Gauss-Laplace, asimptotic
normală, gruparea se realizează în raportul mediu al caracteristicii încât numărul cel mai mare
de unități să se plaseze în grupa mijlocie, după cum urmează:
- Grupa a I-a cuprinde numărul de unităților cărora corespund valori mai mici decât
nivelul mediu al caracteristicii de grupare;
- Grupa a II-a cuprinde numărul unităților cu valori cât mai apropiate de nivelul mediu;
- Grupa a III-a cuprinde numărul unităților cu valori mult mai mari comparativ cu
nivelul mediu al respectivei caracteristici de grupare.
Varianta B.
Intervalele neegale se stabilesc în funcție de poziția termenilor tot față de nivelul mediu,
dar cu o distanță egală cu plus sau minus valoarea abaterii medii liniare. Astfel:
29
- grupa mică;
- grupa mijlocie;
- grupa mare.
Exemplul 2.1:
Vânzarea de bilete realizată de 20 agenții de turism din Suceava, înregistrată
pentru fiecare dintre acestea pe parcursul unei luni calendaristice din perioada
de extrasezon, se prezintă astfel: 20, 24, 26, 25, 23, 24, 25, 28, 28, 30, 26, 28,
28, 25, 24, 27, 25, 25, 20, 26.
Se cere să se grupeze agențiile de turism după numărul biletelor vândute, realizându-
se:
a) o grupare simplă pe variante;
b) o grupare simplă pe intervale de grupare egale.
Rezolvare:
Realizarea grupărilor simple atât pe variante, cât și pe intervale de grupare egale
presupune adoptarea unei metodologii după cum urmează:
a) Pentru stabilirea unei grupări simple pe variante se ia fiecare variabilă statistică
x (număr bilete) și frecvența de apariție corespunzătoare acesteia (numărul agențiilor care
realizează respectivul număr de vânzare al biletelor), după cum se prezintă în următorul tabel:
30
- se formează intervalele de grupare pornind de la valoarea minimă (x min) la care se
adaugă mărimea intervalului de grupare (kx), după cum se prezintă în următorul tabel (2-3):
Tabel 2-3 Distribuția agențiilor de turism pe grupe după numărul biletelor vândute
Grupe de agenții de turism Număr agenții de turism
după vânzare (ni)
(nr. bilete – x -)
20 – 22 2
22 – 24 1
24 – 26 8
26 – 28 4
28 – 30 4
30 – 32 1
Total 20
Limita inferioară este inclusă în interval
Aceeași metodologie este aplicată și în cazul în care entitățile supuse cercetării nu sunt
numerotate (după cum au fost agențiile de turism), ci sunt prezentate sub forma cuvintelor
cărora le corespund valorile corespunzătoare (Exemplul 2.2.- tabel 2.4.).
Exemplul 2.2:
Se cunosc datele privind repartiția utilizatorilor unei aplicații online pe țări, care
se prezintă astfel:
Tabel 2-4 Distribuția numărului utilizatorilor de internet pe țări
Nr. Nr. Nr. Nr. Nr. Nr.
Țara Țara Țara
țară utilizatori țară utilizatori țară utilizatori
Africa de
1. 90 16. Finlanda 839 31. Polonia 588
Sud
2. Argentina 304 17. Franța 32. Portugalia 486
3. Australia 720 18. Germania 795 33. Regatul Unit 832
4. Austria 735 19. Grecia 441 34. România 366
Federația
5. Belgia 752 20. India 53 35. 421
Rusă
6. Brazilia 392 21. Indonezia 87 36. Singapore 733
7. Bulgaria 448 22. Irlanda 684 37. Slovacia 750
8. Canada 777 23. Italia 485 38. Slovenia 636
Republica
9. 637 24. Japonia 777 39. Spania 612
Cehă
10. R.P. Chineză 288 25. Letonia 667 40. S.U.A 781
Republica S.U.
11. 809 26. Lituania 588 41. 265
Coreea Mexicane
12. Danemarca 859 27. Malaezia 576 42. Suedia 903
13. Egipt 200 28. Norvegia 918 43. Turcia 353
Noua
14. Elveția 709 29. 834 44. Ucraina 333
Zeelandă
15. Estonia 723 30. Olanda 900 45. Ungaria 616
Rezolvare:
Realizarea unei grupării simple pe intervale egale de grupare se parcurg următoarele etape:
- se determină amplitudinea absolută a variației (Ax):
31
Ax xmax xmin 903 53 850 utilizatori
unde:
xmax – numărul maxim de utilizatori;
xmin – numărul minim de utilizatori.
32
2. Serii de repartiție, de frecvențe– se prezintă sub forma unor date paralele cu referire la
o caracteristică statistică de grupare numerică sau cantitativă și numărul unităților
colectivității statistice care revin pe variante ale caracteristicii sau pe intervale de
grupare. De exemplu, seria numărului salariaților care își desfășoară activitatea în cadrul
unei firme comerciale, grupați după mărimea salariului mediu lunar.
3. Seriile cronologice(de timp sau dinamice) prezintă evoluția în timp a unui fenomen sau
descrie un anumit proces. De exemplu, dinamica cifrei de afaceri obținută anual de un
agent economic într-o perioadă de cinci ani.
4. Seriile teritoriale (de spațiu) sunt acele serii statistice care rezultă din centralizarea
datelor condiționată de unitatea teritorială din care fac parte. Aceste serii se obțin cel
mai frecvent după criterii administrativ-teritoriale, ceea ce înseamnă că ele consideră
variabil spațiul (teritoriul) și constante timpul și structura organizatorică. De exemplu,
repartizarea numărului locuitorilor pe județe la o anumită dată calendaristică. Valorile
absolute ale caracteristicilor/indicatorilor dintr-o serie teritorială sunt însumabile.
Elaborarea seriilor și a tabelelor statistice reprezintă nu numai un mijloc eficient de
prezentare a datelor statistice dar și o operație premergătoare pentru reprezentare grafică.
33
tabele pe grupe – se folosesc pentru prezentarea rezultatelor unei grupări simple și a
valorilor centralizate pe grupe corespunzătoare frecvențelor și caracteristicii;
tabele cu dublă intrare – servesc la prezentarea rezultatelor grupării după două
caracteristici interdependente.
34
2.4 APLICAȚII
Cerințe:
1. Să se grupeze salariații din eșantionul analizat după caracteristica
producție pe 5 intervale egale de variație;
2. Să se transforme caracteristica vechime într-o caracteristică de tip alternativ;
3. Să se grupeze eșantionul celor 50 de salariați într-o distribuție bidimensională,
utilizând rezultatele obținute la primele 2 cerințe;
4. Să se reprezinte grafic rezultatele primelor 3 cerințe;
5. Să se determine și să se interpreteze frecvențele relative și cele cumulate ce pot fi
determinate pentru distribuția salariaților grupată după caracteristica producție.
Rezolvare
Cerința nr. 1
Convenție:
În general, caracteristica analizată în cadrul unei distribuții unidimensionale
(utilizând o singură caracteristică de grupare), așa cum este prezentată situația
cerinței nr.1, se notează cu Xi.
Producția maximă obținută a fost de 70 de buc., iar cea minimă de 22 buc.; astfel,
amplitudinea variației este: 70-22=48 buc
35
r=1+3,322lg N, unde N = numărul unităților colectivității cercetate.
48
În acest moment putem determina valoarea lui 𝑘 = = 9,6 ≈ 10 .
5
Convenție:
• Dacă raportul dintre amplitudinea variației și numărul de grupe nu este un
cât exact atunci se rotunjește în plus, la numărul întreg cel mai apropiat. E
important de precizat că sunt situații în care rotunjirea la întregul superior
este prea mare, și atunci se poate face o aproximare (rotunjire) prin adaos la un număr întreg
sau zecimal ales convenabil;
• Dacă rezultatul este un număr întreg, se deschide intervalul extrem corespunzător,
pentru a include și valoarea care coincide cu o limită a intervalului (cu limita superioară a
ultimului interval dacă intervalele sunt închise la stânga, respectiv cu limita inferioară a
primului interval dacă intervalele sunt închise la dreapta).
Nota:
Acest artificiu este propus doar din rațiuni de estetică în ceea ce privește
prezentarea intervalelor de grupare.
36
c. În cea de-a treia etapă se identifică frecvențele ce caracterizează fiecare interval,
adică trebuie să se precizeze câți salariați au o producție cuprinsă între 20-30, câți între 30-40
s.a.m.d.
Înainte de a putea face aceste precizări se observă că sunt 3 salariați ce au produs 40 de
buc., astfel, va trebui sa alegem unde încadrăm acești salariați având ca alternative intervalele
30-40, respectiv 40-50.
Pentru a avea un demers unitar, va trebui sa alegem una din următoarele 2 reguli: limita
inferioară inclusă în interval (ceea ce va face să includem cei 3 salariați în intervalul 40-50) sau
limita superioară inclusă în interval (ceea ce va face să includem cei 3 salariați în intervalul 30-
40).
Utilizând cele 2 reguli obținem:
Convenție:
Vom nota frecvențele absolute de apariție cu ni.
Ca regulă, dintre cele două alternative de grupare, se alege cea care oferă o distribuție
cât mai apropiată de cea normală.
Noțiunile prezentate până în acest moment nu permit aplicarea unui test de verificare a
normalității distribuțiilor. Astfel, arbitrar, pentru continuarea prezentărilor reținem varianta
obținută prin regula limită inferioară inclusă în interval.
Cerința nr. 2
37
salariați cu o vechime până în nivelul mediu al vechimii aferent eșantionului, respectiv salariați
cu o vechime ce depășește nivelul mediu al vechimii aferent eșantionului.
Nivelul mediu al vechimii îl putem determina cu ajutorul relației mediei aritmetice,
prezentată mai jos:
n
x i
737
x i 1
15 ani/salariat
n 50
Ca atare, putem prezenta variabila vechime după modelul uneia de tip alternativ astfel:
Cerința nr. 3
Cerința nr. 4
38
Construcția
Distribuţia salariaţilor pe intervale de histogramei presupune
grupare ale producţiei realizarea unei diagrame prin
20 coloane. Pentru fiecare
interval de grupare se
15 construiește o coloană a cărei
lungime este dată de frecvența
10 de apariție ni corespunzătoare.
Nr. Salariaţi
Pe axa absciselor se
5 prezintă intervalele de grupare
7 9 19 7 8 ale caracteristicii Xi iar pe axa
0 ordonatelor se vor prezenta
20-30 30-40 40-50 50-60 60-70 valorile frecvențelor de
apariție ni
Figura 2-6
Poligonul frecvențelor
Distribuţia salariaţilor pe intervale de poate fi considerat ca o
grupare ale producţiei variantă a histogramei. Se
19
construiește unind cu o linie
20 frântă punctele ce marchează
mijlocul bazelor de sus a
15
coloanelor din histogramă.
9 Nr. Salariaţi Poligonul frecvențelor
10 8
7 7
Nr. Salariaţi tinde către Curba frecvențelor
5 atunci când numărul
variantelor sau al intervalelor
0 de grupare ale variabilei de
20-30 30-40 40-50 50-60 60-70 grupare este foarte mare.
Figura 2-7
Curba frecvențelor
Distribuţia salariaţilor pe intervale de este asemănătoare poligonului
grupare ale producţiei frecvențelor. Punctele din
19
20 plan însă nu se mai unesc prin
segmente de dreaptă, ci printr-
15 o curbă continuă, obținută
9 8 Nr. Salariaţi prin ajustarea punctelor.
10 7 7 Astfel reprezentată, curba
Nr. Salariaţi
5 frecvențelor aproximează
mult mai bine forma de
0 distribuție a colectivității
20-30 30-40 40-50 50-60 60-70 după caracteristica cercetată.
Figura 2-8
Distribuția salariaților în funcție de grupa de vechime, așa cum este ea prezentată, poate
fi asimilată unei serii calitative cu atribut calitativ, iar pentru reprezentarea sa grafică putem
utiliza o diagramă de structură.
39
Dreptunghiul de structură
Distribuţia salariaţilor în funcţie de presupune construirea unui
grupa de vechime dreptunghi și în interiorul acestuia se
60 construiesc dreptunghiuri mai mici,
50 suprapuse, cu suprafețe
40 17 proporționale cu ponderea părților în
30 > 15 ani colectivitate.
20 ≤ 15 ani
33
10
0
Nr. Salariaţi
Figura 2-9
Pentru surprinderea celor 2
Distribuţia producţiilor realizate în funcţie
variabile din cadrul grupării
de grupa de vechime a salariaţilor
combinate realizate anterior, într-un
40
sistem de axe se vor prezenta 2
30 60-70 dreptunghiuri de structură, pentru
20
17 50-59 care, pe axa absciselor se prezintă
8 40-49 cele 2 grupe de vechime iar pe axa
9
10 ordonatelor se prezintă gruparea
7 7 30-39
0 2 salariaților după producția realizată.
1-15 16-30 20-29
Grupe de vechime
Figura 2-10
Cerința nr. 5
40
Frecvența cumulată a unei valori empirice xi a caracteristicii este egală cu suma
frecvențelor tuturor valorilor mai mici sau mai mari decât xi în funcție de sensul cumulării
(descrescător sau crescător).
Frecvențele cumulate pot fi determinate:
în formă absolută, cu ajutorul relației Ni=ni+Ni-1 sau
50 50
43 42
35
34
16 15
7 8
Figura 2-11
Dacă la construcția celor două curbe se pornește de la limita inferioară, respectiv, cea
superioară ale distribuției și dacă se coboară o perpendiculara din intersecția celor doua curbe
pe abscisă se poate identifica valoarea medianei, indicator mediu al tendinței centrale care
împarte seria în doua parți egale.
De reținut!
41
Seria statistica este un sir de valori ale unei caracteristici ordonate în funcție de șirul valorilor
unei alte caracteristici sau după un anumit principiu, cum ar fi ordinea alfabetica, ordinea de
mărime sau rangul unității statistice etc.
Seriile statistice pot fi de mai multe feluri în funcție de tipul caracteristicii de grupare sau de
forma practica de prezentare a datelor
Aplicații propuse
Aplicația 2.1
Conform seriilor de date statistice (TEMPO-Online), personalul didactic din
învățământul liceal în 2012 are următoarea repartiție pe medii de rezidență, pe regiuni de
dezvoltare și județe:
Tabel 2-11
Regiuni de Număr Regiuni de Număr
Medii de Medii de
dezvoltare, personal dezvoltare, personal
rezidență rezidență
Județe didactic Județe didactic
Regiunea NORD-
Urban 7377 Urban 1441
VEST Galați
Rural 612 Rural 72
Bihor Urban 1960 Urban 507
Tulcea
Rural 244 Rural 18
Bistrița-Năsăud Urban 693 Urban 805
Vrancea
Rural 179 Rural 33
Cluj Urban 1890 REGIUNEA SUD- Urban 6951
Rural 30 MUNTENIA Rural 790
Maramureș Urban 1291 Urban 1604
Argeș
Rural 30 Rural 158
Satu-Mare Urban 1036 Urban 629
Călărași
Rural 17 Rural 39
Sălaj Urban 507 Urban 1094
Dâmbovița
Rural 112 Rural 127
Urban 6432 Urban 363
Regiunea CENTRU Giurgiu
Rural 360 Rural 88
Urban 1010 Urban 589
Alba Ialomița
Rural 44 Rural 42
Urban 1479 Urban 1796
Brașov Prahova
Rural 63 Rural 257
Covasna Urban 635 Urban 876
Teleorman
Urban 941 Rural 79
Harghita
Rural 128 REGIUNEA Urban 5104
BUCUREȘTI-
Urban 1387 Rural 222
Mureș ILFOV
Rural 100 Urban 173
Ilfov
Urban 980 Rural 222
Sibiu
Rural 25 Municipiul București Urban 4931
Regiunea NORD- Urban 8894 REGIUNEA SUD- Urban 6009
EST Rural 946 VEST OLTENIA Rural 643
Urban 1551 Urban 1839
Bacău Dolj
Rural 98 Rural 221
Botoșani Urban 1038 Gorj Urban 1215
Rural 163 Rural 149
42
Regiuni de Număr Regiuni de Număr
Medii de Medii de
dezvoltare, personal dezvoltare, personal
rezidență rezidență
Județe didactic Județe didactic
Se cere:
a) Să se realizeze o grupare a regiunilor de dezvoltare după numărul personalului
didactic;
b) Grupați mediile de rezidență după personalul didactic;
c) Realizați o grupare a județelor după personalul didactic;
d) Grupați combinat personalul didactic după mediile de rezidență și regiunile de
dezvoltare.
Aplicația 2.2
Se consideră o distribuție cu valori cuprinse între 72 și 194. Dacă se dorește construirea
unei distribuții de frecvențe pe 10 intervale egale:
a) Determinați mărimea intervalului de grupare;
b) Propuneți valoarea minimă de la care se pornește construirea intervalelor;
c) Stabiliți limitele și centrul primului interval.
Aplicația 2.3
Luând în considerare că 40 de studenți ai Facultății de Științe Economice și
Administrație Publică au obținut următoarele rezultate la un test de statistică: 63; 88; 79; 92;
86; 87; 83; 78; 40; 67; 68; 76; 46; 81; 92; 77; 84; 76; 70; 76; 77; 75; 98; 81; 82; 81; 87; 78; 70;
60; 64; 79; 52; 82; 77; 81; 77; 70; 74; 61, se cere:
a) Construiți o serie de distribuție de frecvențe pe 6 intervale de variație de mărime
egală;
b) Construiți histograma și poligonul frecvențelor;
c) Calculați frecvențele cumulate și reprezentați-le grafic.
Aplicația 2.4
Referitor la cei 145 de angajați ai unei societăți comerciale se cunosc următoarele date:
Tabel 2-12
Intervale de variație a
Sub 5 5-10 10-15 15-20 20-25 Peste 25
vechimii în activitate (ani)
Ponderea angajaților (%) 6 11 33 75 90 100
43
a) Să se precizeze tipul frecvențelor redate în tabel;
b) Să se determine frecvențele absolute și să se reprezinte grafic;
c) Să se calculeze frecvențele absolute cumulate calculate crescător și descrescător
și să se reprezinte grafic;
d) Să se precizeze care este ponderea salariaților care au o vechime de peste 20 de
ani și câți salariați îndeplinesc această condiție;
e) Să se calculeze centrele de interval.
Aplicația 2.5
Un depozit farmaceutic aprovizionează 85 farmacii. Încasările medii lunare ale
farmaciilor au următoarea repartiție:
Tabel 2-13
Intervale de variație a Încasărilor medii lunare (unități Sub 60- 64- 68- Peste
monetare) 60 64 68 70 70
Număr farmacii cu încasarea medie lunară mai mică decât
10 22 46 68 85
limita superioară
Se cere:
a) Reprezentați grafic distribuția farmaciilor după încasările medii lunare;
b) Luând în considerare frecvențele absolute cumulate crescător ale încasărilor medii
lunare din tabel, să se cumuleze descrescător frecvențele absolute ale respectivelor încasări și
să se reprezinte grafic prin intermediul ogivei;
c) Stabiliți numărul farmaciilor cu valoarea încasărilor mai mică de 64 u.m.
PRECIZARI:
• Referatul va fi redactat de mână.
• Referatul va fi predat prin intermediul platformei e-learning si ulterior, la data
examenului, in format fizic. Pe platforma e-learnig se va încărca o copie scanata a referatului.
44
Unitatea de învățare nr. 3: INDICATORII STATISTICI
Timpul de studiu individual estimat: 6 h
45
Caracteristic procesului cunoașterii îi este utilizarea indicatorilor statistici, necesitatea
utilizării acestora având ca fond de bază funcțiile acestora, cele mai importante fiind: de
măsurare, de comparare, de sinteză, de estimare și de verificare a ipotezelor și testare a
semnificației parametrilor statistici utilizați.
În raport cu etapa cercetării statistice în care apar, indicatorii statistici pot fi:
absoluți;
derivați.
Indicatori absoluți
INDICATORI
STATISTICI Indicatori derivați
Dacă indicatorii absoluți sunt reprezentați de mărimile absolute care apar în etapa de
culegere, centralizare și grupare a datelor statistice, indicatorii derivați sunt mărimile derivate
obținute prin prelucrarea mărimilor absolute, ca urmare a aplicării diferitelor metode și
procedee de calcul statistic.
Indicatorii derivați analizează aspectele calitative ale fenomenelor și proceselor
cercetate oferind informații privind:
relațiile cantitative dintre diferitele părți ale unei colectivități și dintre diferitele
caracteristici;
valorile tipice;
gradul și forma variației caracteristicilor studiate;
interdependența dintre variabile;
Principalii indicatori derivați care vor fi abordați pe parcursul capitolelor ce vor fi
prezentate sunt:
indicatorii relativi;
indicatori medii;
indicatori ai variației;
indicatori de asimetrie;
indicatori de corelație și asociere etc.
Forma numerică de prezentare a datelor statistice obținute pe parcursul derulării etapelor
cercetării statistice are o mare relevanță în ceea ce privește interpretarea economică a acestora.
În acest mod se justifică importanța deosebită care trebuie acordată clasificării indicatorilor
statistici după etapele în care apar.
46
Indicatorul absolut reprezintă acea mărime absolută prin care se exprimă direct
nivelul caracteristicii cercetate, în unități concrete de măsură, reflectând volumul unui
ansamblu sau valoarea unei caracteristici.
În raport cu metodologia lor de obținere, acești indicatori rezultă:
a) prin agregarea nivelelor individuale (indicatori de nivel).
Procesul de agregare presupune însumarea directă a valorilor individuale înregistrate cu
scopul determinării unui indicator absolut. Aplicarea metodologiei însumării presupune ca
elementele individuale să fie însumabile direct, adică să fie de aceeași natură și să fie exprimate
în aceeași unitate de măsură.
În funcție de nivelul la care se realizează agregarea, indicatorii pot fi:
- indicatori individuali – obținuți ca urmare a înregistrării statistice, exprimând valoarea
caracteristicii observate la nivelul fiecărei unități statistice ( xi , yi etc ); exemplu: numărul
sosirilor turiștilor la nivelul fiecărui tip de structură de primire turistică (pe hoteluri, moteluri
etc.).
- indicatori sintetici – rezultați prin centralizarea și gruparea unităților statistice la
b) prin compararea sub formă de diferență a două nivele ale aceluiași indicator,
înregistrate pentru unități diferite de timp sau de spațiu, sau a două nivele a doi indicatori
diferiți.
Acești indicatori apar în statistică sub forma modificărilor absolute (sporului absolut),
determinate și ele sub forma:
- modificărilor individuale – determinate ca variație prin diferență la nivelul categoriilor
sau elementelor constitutive, prin relația:
X1 /i 0 xi1 xi 0 (3.1)
- modificărilor sintetice – rezultate ca diferență stabilită la nivelul colectivității
generale:
X1 /i 0 x i1 x i 0 (3.2)
47
de aceeași natură, înregistrați la unități diferite de timp/spațiu sau la grupe diferite ale
aceleiași colectivități,
de natură diferită.
Problematica privind utilizarea indicatorilor relativi are în vedere:
a) Alegerea bazei de raportare, care vizează gradul de interdependență dintre
caracteristicile comparate sau scopul cercetării și presupune ca:
- în dinamică să se ia ca bază de comparare o perioadă considerată semnificativă sau
perioada precedentă;
- în plan teritorial, analiza se stabilește pe fiecare perioadă: baza de comparare se alege
în raport cu modificările teritoriale ale caracteristicilor social-economice care au ritmuri diferite
de dezvoltare.
b) Asigurarea comparabilității datelor care formează raportul presupune ca
indicatorii comparați să fie mărimi comparabile între ele prin sfera de cuprindere sau în sensul
că trebuie să existe o legătură de cauzalitate, logică, de condiționare permițând compararea în
timp și spațiu;
c) Stabilirea formei de exprimare a mărimilor relative are în vedere diferențele dintre
indicatorii comparabili, astfel încât rezultatul să fie ușor de înțeles și de interpretat. Cele mai
sugestive și utilizate forme de exprimare sunt: coeficienții și procentele.
Se recomandă exprimarea sub formă de coeficient în situația în care valorile
indicatorilor comparați sunt relativ apropiate. El arată câte unități din numărător revin la o
unitate a numitorului raportului.
Exprimarea sub formă procentuală (%) rezultă din înmulțirea coeficienților cu 100,
reflectând câte unități din numărător revin la 100 de unități ale numitorului.
Frecvent se face confuzie între „procent” și „punct procentual”. Spre exemplu, în cazul
creșterii cotei de T.V.A. de la 19% la 24%, frecvent s-a folosit expresia: „cota de T.V.A. a
crescut cu 5%, de la 19% la 24%”, ceea ce este greșit.
Exprimarea corectă este: „cota de T.V.A. a crescut cu 5 puncte procentuale, de la 19%
la 24%”.
O creștere cu 5 „unități de procent”, față de 19 procente, reprezintă o creștere cu
fracțiunea de 5⁄19 = 0,2632, sau, prin exprimarea acestui raport ca procent, înseamnă 26,32%.
Ori, între creșterea de 5%, calculată greșit, și creșterea de 26,32%, calculată corect, este o
diferență foarte mare.
Punctele procentuale rezultă din „diferența aritmetică dintre numerele mărimilor
exprimate în procente” și nu din „diferența aritmetică dintre mărimile exprimate în procente”.
În cazul creșterii cotei de T.V.A. de la 19% la 24%, „creșterea în punctele procentuale”
rezultă din:
„diferența aritmetică dintre numerele mărimilor exprimate în procente”, respectiv dintre
24 – 19 = 5 puncte procentuale;
nu din „diferența aritmetică dintre mărimile exprimate în procente”, nu din 24% – 19%
= 5% care nu exprimă nimic în acest caz.
Procentele(%) indică raporturi, nu diferențe sau, altfel spus, procentele (%) rezultă din
raporturi, nu din diferențe.
Important este a se reține faptul că în calculul punctelor procentuale nu se operează cu
mărimi exprimate procentual, ci numai cu numerele mărimilor exprimate procentual.
Există uneori situații în care trebuie să se sugereze cu claritate proporția reală dintre
datele supuse comparației (spre exemplu, dacă indicatorul din numărătorul raportului este cu
mult mai mic decât cel din numitor), ceea ce impune ca rezultatele să se exprime în promile,
prodecile, prodecimile. Rezultatul obținut va reflecta câte unități din indicatorul comparat revin
la 1000, 10000, respectiv 100000 de unități din baza de raportare.
48
În activitatea practică, indicatorii relativi au o largă aplicabilitate, ceea ce necesită o
clasificare a acestora în funcție de domeniul utilizării și scopul calculării lor, după cum
urmează:
mărimi relative de structură;
mărimi relative de coordonare;
mărimi relative de intensitate;
mărimi relative de dinamică.
Analiza mai detaliată a acestora permite o mai bună cunoaștere a posibilităților reale de
aplicare în activitatea practică.
49
- pentru o serie simplă:
xi
gi k
100 , i = 1, k
x
(3.5)
i
i 1
- pentru o serie de frecvențe:
xi ni
gi k
100 , i = 1, k
xn
(3.6)
i i
i 1
Și în cazul greutăților specifice trebuie să se verifice egalitatea:
g i = 100% (3.7)
Indicatorii relativi de structură se reprezintă grafic prin diagrame de suprafață denumite
și de structură, care pot fi: dreptunghiul, cercul, semicercul, pătratul, triunghiul etc.
Cele mai utilizate sunt:
Dreptunghiul, care pentru reprezentare se dimensionează astfel: 1 cm = 10%, iar
lungimea dreptunghiului este formată din 10 cm, astfel încât suprafața să fie de 100%.
Exemplul 3.1:
Despre 4 tipuri de magazine care comercializează același tip de produse
cunoaștem următoarea distribuție a valorii încasărilor:
Tabel 3-1 Distribuția valorii încasărilor pe tipuri de magazine
Tipuri magazin Valoarea încasărilor (mil. U.M.)
A 10
B 24
C 14
D 12
Stabiliți structura valorii încasărilor pe tipuri de magazine și realizați o reprezentare
grafică.
Rezolvare:
Structura valorii încasărilor pe tipuri de magazine se poate determina astfel încât
rezultatul să fie sub formă de coeficient sau sub formă procentuală, după cum se prezintă în
tabelul următor:
50
Tabel 3-2 Algoritm de determinare a structurii valorii încasărilor pe tipuri de
magazine
Valoarea Structura valorii încasărilor
încasărilor xi xi
Tipuri (mil. U.M.) gi 4
(coeficient) gi 4
100 (procentual)
x x
magazine
xi i i
i 1 i 1
A 10 10 : 60 0,1667 10 : 60 100 16,67% 17%
B 24 24 : 60 0,4 (24:60)100=40%
C 14 14 : 60 0,2333 (14:60)100=23%
D 12 12 : 60 0,20 (12:60)100=20%
4 4 4
Total xi =60
i 1
gi 1
i 1
g i 1
i 100
20% 17% B
C
23%
40%
D
Figura 3-2
51
coordonare) care se exprimă de cele mai multe ori sub formă de coeficienți, dar pot apare și sub
formă procentuală.
Exprimarea sub formă de coeficienți rezultă prin aplicarea relației:
X
kA/B = A (3.9)
XB
unde:
X A = nivelul grupei (colectivității) care se compară,
X B = nivelul grupei (colectivității) aleasă ca bază de comparație.
Exemplul 3.2:
Rezolvare:
Interpretare: numărul bărbaților angajați este de 0,67 ori mai mic decât al femeilor,
în timp ce numărul femeilor angajate în hotel este de 1,5 ori mai mare decât cel al bărbaților.
52
3.2.3 Mărimi relative de intensitate
Activitatea practică de multe ori impune stabilirea unui raport între două fenomene care
se află într-o relație de interdependență. Utilizarea acestui raport reprezintă de fapt determinarea
indicatorilor relativi de intensitate care au ca scop evidențierea gradului de răspândire a
fenomenului în raport cu mărimea celui ales ca bază de raportare.
Calculul indicatorilor relativi de intensitate depinde de nivelul la care se determină
aceștia:
la nivelul fiecărei unități se aplică relația:
i x
K (3.10)
x/ y y
unde:
x și y - valorile înregistrate pentru caracteristica X și Y la unitatea i;
K i - mărimea relativă de intensitate calculată pentru unitatea i.
la nivelul unei grupe se aplică relația:
Kx / y
x (3.11)
y
La nivelul unei colectivități, se aplică relația:
Kx / y
x yi i
(3.12)
y i
Exprimarea indicatorilor relativi de intensitate vizează unitățile de măsură specifice
celor doi indicatori comparați.
Specifici activităților de turism se pot prezenta câțiva indicatori relativi de intensitate,
dintre care mai utilizați sunt următorii2:
nivelul salariului mediu ( s ), calculat ca raport între fondul de salarii ( FS ) dintr-o
anumită perioadă și numărul mediu de salariați ( T ) al aceleiași perioade:
FS
s (3.13)
T
durata medie a sejurului ( d s ), care se calculează în mod asemănător, dar la nivelul
agențiilor de turism, prin raportarea numărului de turiști-zile ( TZ ) la numărul de turiști ( T
) participanți la acțiunile turistice:
ds
TZ
(3.14)
T
în care, numărul de turiști-zile se determină prin înmulțirea numărului de turiști
participanți la acțiunile turistice cu durata efectivă în zile a acțiunilor turistice ( d ):
TZ T d (3.15)
coeficientul sporului natural ( CSN ), determinat prin raportarea sporului natural ( SN
) la numărul locuitorilor ( P ), astfel:
SN
CSN 1000 (3.16)
P
densitatea populației ( DP ) care se calculează prin raportarea populației ( P ) la
suprafața ( S ):
2
Secăreanu C., Gruiescu M. – op. citată, pg. 62-64.
53
P
DP (3.17)
S
productivitatea muncii ( W ), este un indicator stabilit prin raportarea producției ( Q )
la consumul forței de muncă ( C ),
Q
W (3.18)
C
Exemplul 3.3:
Stabiliți cifra medie de afaceri la fiecare tip de grupă și pe totalul firmelor la nivel
de județ.
Rezolvare:
Interpretare: La nivelul firmelor mari s-a stabilit cea mai mare cifră medie de
afaceri de 89,43 mil. U.M./firmă, în timp ce pentru cele mici cifra medie de afaceri a fost
înregistrată ca fiind doar de 74,63 mil. U.M./firmă.
Luând în considerare CA stabilită pentru toate cele 30 de firme de la nivelul
județului, s-a stabilit că, cifra medie de afaceri este de 84 mil. U.M./firmă.
54
3.2.4 Mărimi relative de dinamică
55
Mărimea relativă a îndeplinirii planului se obține prin raportarea nivelului efectiv
realizat în perioada curentă, la nivelul planificat pentru perioada curentă. Formula de calcul
este:
x1
k1/ pl 100 (3.23)
x pl
Rezultatul poate fi interpretat astfel:
dacă este: - mai mare de 100%, s-a înregistrat o depășire de plan;
-egal cu 100%, planul a fost realizat integral;
- mai mic de 100%, planul nu a fost îndeplinit.
Între cei trei coeficienți există relația:
k1/ 0 k pl / 0 . k1/ pl (3.24)
Putem calcula mărimi relative ale planului la nivel de ansamblu, pentru variabile
însumabile direct:
x pl x
K pl / 0 100 K 1/ pl 100
1
respectiv
x
(3.25)
x0 pl
Exemplul 3.4:
Un agent comercial a realizat în lunile mai 2012 și iunie 2012 vânzări în valoare
de 1500 u.m., respectiv, 1850 u.m. La finalul lunii mai 2012 agentul comercial
și-a planificat un volum al vânzărilor pentru luna următoare de 2000 u.m.
Să se caracterizeze activitatea agentului comercial cu ajutorul mărimilor relative ale
dinamicii.
Rezolvare:
Centralizând datele prezentate în enunț, avem:
Tabel 3-7
Vânzări (u.m.)
Perioada
xi
Mai 2012 – realizat în perioada de bază (0) 1500
Iunie 2012 – planificat pentru perioada curentă (pl) 2000
Iunie 2012 – realizat în perioada curentă (1) 1850
56
x pl
1,33 133%
xpl 2000 2000
ixpl/0 = = 1500 = 1,33(133%) k pl / 0
x0 x0 1500
Pentru luna iunie 2012 s-a planificat o creștere cu 33% a vânzărilor față de luna mai 2012
(perioada de bază sau de comparație).
- Coeficientul îndeplinirii planului
0,92 92%
x 1850 x 1850
x
i1/pl = x 1 = 2000 = 0,92(92%) k1/ pl 1
pl x pl 2000
57
a) În funcție de modul lor de determinare, mărimile medii se pot împărți în două
categorii:
- indicatori propriu-ziși ai tendinței centrale sau medii propriu-zise: media aritmetică,
media geometrică, media armonică, media cronologică, media pătratică, media cubică, media
de ordin superior, mediile mobile etc.;
- indicatori ai localizării: mediana, modul, mediala și alte mărimi medii înrudite cu
acestea.
b) După importanța lor în practica statistică, mărimile medii se pot clasifica în două
mari categorii:
- mărimi medii de bază sau fundamentale: media aritmetică, mediana, mediala, modul
etc.;
- mărimi medii cu aplicații speciale: media armonică, media geometrică, media
cronologică, media pătratică, mediile mobile etc.
c) În funcție de felul seriei (simplă sau cu frecvență) pentru care se calculează, mărimile
medii se împart în două categorii și anume:
- mărimi medii simple sau neponderate (în cazul seriilor simple);
- mărimi medii ponderate (în cazul seriilor cu frecvență).
Media aritmetică poate fi aplicată în cazul unei variabile măsurate printr-o scală de
raport (metrică), iar datele din care se calculează sunt valori primare, direct măsurabile. Teoretic
ar trebui ca valorile empirice observate să tindă să formeze o progresie aritmetică.
Media aritmetică are avantajul că este ușor de aplicat si este ușor de înțeles. Media
aritmetică are marele dezavantaj că este sensibilă la valorile extreme.
Media aritmetică a unui șir de valori individuale ale unei variabile statistice este egală
cu raportul dintre suma și numărul lor.
1) în cazul unei serii simple se utilizează media aritmetică simplă sau neponderată;
2) în cazul unei serii cu frecvență se calculează media aritmetică ponderată.
Dacă considerăm o variabilă statistică X cu variantele ei x1, x2, ..., xi, ..., xn atunci media
aritmetică a acestei variabile statistice, notată cu x , este egală cu:
n
x i
1 n (3.26)
x i 1
n
sau x
n i 1
xi
58
Exemplul 3.5:
Dacă numărul variantelor unei variabile statistice este foarte mare, calculul mediei ( x )
se poate simplifica formând, în prealabil, seria cu frecvență pe variante (tabel 3.8) sau pe
intervale (tabel 3.10).
x n i i
x i 1
k (3.27)
ni
i 1
Exemplul 3.6:
Ora de sport a unei clasei a-IX-a dintr-un liceu începe cu măsurarea înălțimii elevilor,
distribuția lor prezentându-se astfel:
Tabel 3-9
Înălțime (m) 1,53 1,54 1,57 1,58 1,60 1,65 1,70 1,72 1,75 1,82
Număr elevi 1 3 4 6 1 7 2 3 2 1
59
Rezolvare:
Înălțimea medie pe elev se determină prin aplicarea relației mediei aritmetice ponderate:
xi ni 1,53 1 1,54 3 1,57 4 1,58 6 1,60 1 1,65 7 1,70 2 1,72 3 1,75 2 1,82 1
x
ni 30
x 1,63 m / elev
Interpretare:
S-a stabilit la nivelul clasei, că înălțimea medie pe elev este de 1,63 m/elev.
x0 x1 n1 N1 f1 F1
x1 x2 n2 N2 f2 F2
xi 1 xi ni Ni fi Fi
xk 1 xk nk Nk fk Fk
k k
Total n
i 1
i - f i 1
i 1 -
x n '
i i
xi 1 xi
x i 1
k
unde xi' (3.28)
n
2
i
i 1
Media aritmetică determinată pentru o distribuție grupată pe intervale este întotdeauna
aproximativă. Pentru seriile cu intervale, în care unul sau ambele intervale marginale sunt
deschise, nu se recomandă utilizarea mediei aritmetice.
Media aritmetică posedă o serie de proprietăți a căror cunoaștere este utilă pentru mai
buna înțelegere a conținutului acestui indicator, ca și pentru efectuarea unor calcule simplificate
ale ei.
1. Media aritmetică este o valoare internă a unei serii.
x1 < x < x s (3.29)
60
2. Media aritmetică a unui șir de valori constante este egală cu valoarea lor comună.
Fie: x1 = x 2 = x3 = . . . = x s = k = x
3. Media aritmetică este asociativă. În cadrul unei serii statistice, dacă se înlocuiesc mai
multe variante ale variabilei statistice cu mărimea medie a lor, atunci mărimea medie a seriei
modificate este egală cu mărimea medie a seriei inițiale.
În particular, dacă într-o serie statistică se înlocuiesc toate nivelurile individuale ale
variabilei statistice cu x al lor, atunci volumul total al variabilei statistice rămâne nemodificat.
4. Media aritmetică crește sau descrește atunci când una sau mai multe variante ale
variabilei statistice cresc sau descresc.
În cazul general considerând că r - p, valori ale variabilei statistice se modifică cu o
constantă q, media seriei modificate va fi:
r
'
q n i
5. Media aritmetică este translativă. Dacă se mărește sau se micșorează fiecare nivel
individual al variabilei statistice dintr-o serie, cu o cantitate constantă a, x se mărește sau se
micșorează cu acea constantă. ( a x ).
s s s
'
(x i a ) ni x i ni a n i
x i 1
s
i 1
s
i 1
xa
n
i 1
i n
i 1
i
Rezultă:
n s
xi ni (x i a) (x i a ) ni
x x i 1
a și x i 1
a (3.31)
ni s
n
n
i
i 1
Pentru a obține o simplificare maximă a calculelor, constanta a se alege egală cu un
nivel al caracteristicii unității statistice din centrul seriei ordonate, apropiat de valoarea medie
x.
6. Dacă se mărește sau se micșorează fiecare variantă a variabilei statistice de un anumit
număr de ori k, atunci și x a seriei modificate se mărește sau se micșorează de același număr
de ori k, k 0 .
În baza proprietății (6) se obțin următoarele formule de calcul simplificat:
n s
xi xi
i 1 k
i 1 k
ni
x k și x s
k (3.32)
ni
n
i 1
În formulele (3.32), pentru a se obține simplificarea maximă a calculelor, este necesar
ca valoarea constantei k să fie egală cu cel mai mare divizor comun al variantelor x i .
7. Media aritmetică rămâne neschimbată dacă frecvențele fiecărei variante a variabilei
se măresc sau se micșorează de un anumit număr de ori m.
Pentru a obține cea mai mare simplificare a calculelor valoarea constantei m se
consideră egală cu cel mai mare divizor comun al frecvențelor ni .
61
În particular, dacă constanta m este egală cu totalul frecvențelor prin raportarea lui ni
la m, se face trecerea de la o serie cu frecvențe absolute la seria corespunzătoare cu frecvențe
relative.
s
s x i fi
x xi f i sau x i 1
i 1 100
Rezultă că x a unei serii nu se schimbă, dacă se calculează pe baza frecvențelor absolute
sau pe baza celor relative.
Evident, dacă se utilizează în calculul x concomitent mai multe proprietăți ale ei, se
obține o simplificare mai mare a calculelor.
Astfel, utilizând proprietățile 5 și 6, se obțin următoarele formule de calcul simplificat:
n
xi a s
xi a
k
k
ni
x i 1
k a și x i 1
s
k a (3.33)
ni
n
i 1
Utilizând proprietățile 5, 6 și 7 se obține cea mai mare simplificare a calculelor:
s
x i a ni
k
m
x i 1
s
k a (3.34)
ni
i 1 m
8. Suma algebrică a abaterilor variantelor unei variabile statistice de la nivelul ei mediu
este egală cu zero, deoarece abaterile în plus de la x se compensează cu abaterile în minus.
n n
( xi x) 0 și
i 1
(x
i 1
i x ) ni 0 (3.35)
9. Suma pătratelor abaterilor nivelurilor individuale ale variabilei statistice de la nivelul
ei x este mai mică decât suma pătratelor abaterilor de la oricare alt număr a, a x .
În cazul unei serii simple se verifică relația:
n n
( xi x) 2 <
i 1
(x
i 1
i a) 2 (3.36)
( x i x ) 2 ni <
i 1
(x
i 1
i a) 2 ni unde 0 < a x (3.37)
Exemplul 3.7:
62
2800 - 3200 50 3000 150000 12,50 37500
3200 - 3600 55 3400 187000 13,75 46750
3600 - 4000 70 3800 266000 17,50 66500
4000 - 4400 50 4200 210000 12,50 52500
4400 - 4800 35 4600 161000 8,75 40250
4800 - 5200 30 5000 150000 7,50 37500
5200 - 5600 15 5400 81000 3,75 20250
Total 400 - 1424000 100 356000
x '
i ni
1424000
x i 1
10
= 3560 lei
n
400
i
i 1
xi' fi x f '
i i
356000
x i 1
10
i 1
3560 lei
f
100 100
i
i 1
63
Tabel 3-12 Calculul simplificat al mediei ( x )
Nivelul
Numărul
salariului
salariaților xi' a
xi' a xi' a ni xi' ni xi' a ni
(lei) x i' ni
( ni ) k k m k m k m
( xi 1 xi )
1600 - 2000 20 1800 -1600 -4 - 80 4 18 -16
2000 - 2400 30 2200 -1200 -3 - 90 6 33 -18
2400 - 2800 45 2600 -800 -2 - 90 9 58,5 -18
2800 - 3200 50 3000 -400 -1 - 50 10 75 -10
3200 - 3600 55 3400 0 0 0 11 93,5 0
3600 - 4000 70 3800 400 1 70 14 133 14
4000 - 4400 50 4200 800 2 100 10 105 20
4400 - 4800 35 4600 1200 3 105 7 80,5 21
4800 - 5200 30 5000 1600 4 120 6 75 24
5200 - 5600 15 5400 2000 5 75 3 40,5 15
Total 400 - - - 160 80 712 32
Simplificarea cea mai mare a calculelor se obține prin aplicarea formulei (3.30), care
înglobează simultan proprietățile 5, 6 și 7:
10
xi' a ni
k
m 32
x i 1
10
k a 400 3400 3560 lei/lună
ni
80
i 1 m
Considerăm o colectivitate formată din n unități statistice din care n1 posedă varianta
x1 , iar n 2 posedă nivelul x 2 al variabilei statistice.
x n i i
1 n1 0 n2 n1 n
x i 1
1 p (3.38)
2
n1 n2 n1 n2
n
n
i
i 1
Rezultă că media aritmetică a unei caracteristici a unităților statistice alternative este
egală cu frecvența relativă a unităților care posedă varianta x1 a variabilei statistice.
64
Exemplul 3.8:
x n i i
1 11435080 0 10245894 11435080
x i 1
0,53
2
11435080 10245894
n
21680974
i
i 1
Prin folosirea frecvențelor relative se obține în final același rezultat:
2
x i fi
1 0,53 0 0,47 0,53
x i 1
0,53
2
0,53 0,47
f
1,00
i
i 1
n i
xh k
i 1
(3.39)
1
i 1 x i
ni
65
k
xh k
1
x
(3.40)
i 1 i
Din formulele (3.39) și (3.40) rezultă că mediile armonice se pot aplica numai atunci
când toate variantele variabilei statistice sunt valori pozitive ( x i > 0) și este imposibil de calculat
pentru o variabilă statistică care are cel puțin una dintre variante egală cu zero, deoarece din
punct de vedere matematic se ajunge la o nedeterminare.
În practică, dacă o serie este formată dintr-un număr redus de termeni, calculul mediei
armonice se poate efectua pe baza unor formule echivalente și simplificatoare:
2x x 2 3x1 x2 x3
xh 1 2 și x h
x1 x 2 1 1 x1 x2 x1 x3 x2 x3 (3.41)
x1 x 2
Ca regulă, media armonică trebuie folosită când datele din care se calculează media nu
sunt date primare ci sunt date derivate, rezultate din calcule, respectiv sunt mărimi relative de
structură sau mărimi relative de intensitate. Aceste mărimi relative pot fi interpretate drept
medii parțiale, din care trebuie calculată o medie totală / generală.
În practica statistică si în analiza activității economice, media armonică se folosește cel
mai frecvent la calculul indicelui prețurilor de tip Paasche (vezi capitolul 8: Indici statistici).
Exemplul 3.9:
Să presupunem că un automobil parcurge dus și întors distanța de 100 km dintre
două localități (A) și (B) cu viteze diferite. La dus realizează viteza de v1 = 80
km/h, iar la întoarcere v 2 = 100 km/h. Se cere să se determine viteza medie a
automobilului pe întregul parcurs.
Viteza medie a automobilului calculată cu ajutorul mediei aritmetice ar fi:
v1 v2 80 100
v 90km / h
2 2
Dacă x v ar însemna că întreaga distanță de 200 km a fost parcursă cu o viteză
medie de 90 km/h, lucru care nu corespunde realității deoarece nu ține seama de timpul
utilizat la ducere și la întoarcere.
De aceea, în acest caz x v , calculul corect al vitezei medii a automobilului se poate
face cu ajutorul mediei armonice simple pe baza formulei (3.40) sau (3.41):
n 2 2 1600
vh 2 88,88 km/h
1 1 1 10 8
18
i 1 vi 80 100 800
66
3.3.3 Media geometrică
n lg x
k
k
xini sau lg x g
ni i i
xg i 1 i 1
(3.42)
k
i 1
ni 1
i
Din formula (3.42) se observă că, dacă cel puțin o variantă a unei variabile statistice este
egală cu zero, atunci x g a seriei este zero. De asemenea, dacă cel puțin una dintre variantele
variabilei statistice este mai mică decât zero, atunci x g este un număr imaginar.
Aceasta înseamnă că logaritmul x g este egal cu media aritmetică a logaritmilor
termenilor seriei. De aceea, x g mai poartă și denumirea de medie logaritmică.
Situația în care frecvențele tuturor nivelurilor individuale ale unei variabile statistice
sunt egale, permite aplicarea următoarei formule (3.42) a mediei geometrice (logaritmice)
simple:
k
1 k
xg k x i
sau lg x g lg xi
k i 1
(3.43)
i 1
x g x1 x2 (3.44)
Exemplul 3.10:
Să presupunem pentru aprofundarea noțiunii următorul exemplu: în anii 2003,
2004 și 2005 o firmă a realizat o cifră de afaceri de 5.000 euro, 10.000 euro și
respectiv 60.000 euro. Utilizând aceste informații se urmărește să se determine
de câte ori a crescut în medie pe an cifra de afaceri pentru întreaga perioadă
considerată. Se observă imediat că între anii 2003 și 2004 s-a înregistrat o dublare a cifrei de
afaceri, iar între 2004 și 2005 a avut loc o creștere de 6 ori a acestui indicator.
x g 2 6 3,4641 ori pe an
67
Interpretare:
Astfel, creșterea mărimii medii anuală reală pentru perioada considerată 2003 – 2005
a fost de aproximativ 3,4641 ori pe an, deoarece dacă pornim de la valoarea de 5.000 euro în
anul 2003 și cifra de afaceri s-ar multiplica de 3,4641 ori în 2004 și de 3,4641 ori în 2005, în
acest ultim an ea ar înregistra o valoare de 59.999,9 euro, deci ar coincide aproape cu valoarea
reală de 60.000 euro, fapt care justifică utilizarea în cadrul acestui exemplu a x g .
xp
x 2
i
(3.48)
n
- pentru serii de frecvență, media pătratică ponderată:
xp
x n 2
i i
(3.49)
n i
68
f1 f f2 f f3 f fn f
x1 x2 1 x3 2 ... x n 1 n 1 xn n
x cr 2 2 2 2 2
n (3.51)
fi
i 1
unde:
fi = mărimea intervalelor (număr zile) și fiecare termen xi se ponderează cu jumătate din
mărimea intervalelor alăturate.
Modul este acea valoare a caracteristicii care are frecvența absolută (relativă) cea mai
mare. Este o mărime medie de poziție și se determină, conform definiției, prin aflarea frecvenței
maxime a distribuției și apoi a valorii caracteristicii corespunzătoare acesteia.
În cazul unei serii cu caracteristica prezentată sub formă de intervale, determinarea
modului presupune efectuarea unei interpolări în interiorul intervalului modal (intervalul
corespunzător frecvenței maxime) după formula:
1
M0 = xi-1+d (3.52)
1 2
unde:
xi-1 = limita inferioară a intervalului modal;
d = dimensiunea (mărimea) intervalului modal;
1 = diferența dintre frecvența intervalului modal și frecvența intervalului anterior celui
modal;
2 = diferența dintre frecvența intervalului modal și frecvența intervalului următor celui
modal.
Valoarea modului se poate afla și prin metoda grafică, folosind poligonul frecvențelor
(în cazul seriilor calitative pe variante) sau histogramă (în cazul seriilor calitative de intervale).
Valoarea modului este dată de abscisa corespunzătoare ordonatei maxime.
Proprietățile modului:
a) Modul este cuprins între cea mai mică și cea mai mare valoare a caracteristicii
xmin M0 xmax iar verificarea proprietății este evidentă din definiția modului
b) Dacă se împart frecvențele absolute sau relative ale unei serii printr-o constantă m
atunci valoarea modului nu se schimbă
ni ni 1
m m 1
M0 = xi-1+d xi 1 d M0 (3.53)
ni ni 1 ni ni 1 1 2
m m m m
c) Dacă se mărește sau se micșorează fiecare nivel individual al caracteristicii unei serii
cu o anumită constantă a atunci valoarea modului se mărește sau se micșorează cu acea
constantă.
1 1
M0= (xi-1a) + d xi 1 d a M0 a (3.54)
1 2 1 2
d) Dacă se înmulțește sau se împarte fiecare nivel individual al caracteristicii unei serii
printr-o constantă k, atunci modul se mărește, respectiv se micșorează de același număr de ori.
69
xi 1 xi xi 1 1 1
M 0' M0
k k 1 2 k
1
M0’= kxi-1+k(xi-xi-1) kM 0 (3.55)
1 2
Din combinarea ultimelor 3 proprietăți obținem:
ni ni 1
xi 1 a xi a xi 1 a m m 1 1
M0
'
( ) xi 1 d a
k k k ni ni 1 ni ni 1 k 1 2
m m m m
1
k
M 0 a
Deci M0= kM0 a (3.56)
Exemplul 3.11:
Utilizând distribuția prezentată în tabelul de mai jos (3-15) să se determine
valoarea mediei cu ajutorul modului.
Tabel 3-15
xi
ni
(se exprimă în nr. de minute)
<30 25
30-60 50
60-90 60
90-120 45
120-150 15
150 și peste 5
În cazul unei serii pe variante, modul se stabilește ca fiind tipul sau valoarea
caracteristicii ( xi ) căreia îi corespunde frecvența cea mai mare.
70
Exemplul 3.12:
Rezolvare:
Distribuția studenților după note, prezentată în tabelul 3-16 formează o serie de
frecvență pe variante. Variabila „Note studenți” este cantitativă, iar modul se determină ca
valoare a caracteristicii căreia îi corespunde frecvența cea mai mare.
Cum cei mai mulți studenți ( nmax 6 studenți) au obținut nota 8, rezultă că modul
este M 0 8, fiind nota cea mai des obținută de studenți la examenul de statistică.
Exemplul 3.13:
Tabel 3-17
Nivel de instruire Număr persoane
xi ni
Primar 5
Gimnazial 10
Liceal 30
Postliceal 15
Universitar 20
Fără școală absolvită 2
71
Variabila studiată este de tip calitativ și este evident faptul că singurul indicator din
categoria mărimilor medii ce poate fi determinat la nivelul acestei distribuții este modul.
Valoarea modală este varianta Învățământ liceal, varianta ce corespunde grupului celui mai
numeros din rândul persoanelor incluse în studiu.
Mediana reprezintă acel nivel al caracteristicii unei serii ordonate crescător sau
descrescător care împarte o distribuție în 2 părți egale: jumătate din unitățile colectivității au
valori ale caracteristicii mai mari ca mediana, iar jumătate mai mici.
În situația unor distribuții eterogene media aritmetică este influențată în mai mare
măsură de eventuale valori extreme, aberante ale variabilei – caz în care este preferată mediana
în vederea stabilirii tendinței centrale, în locul mediei, deoarece este mai stabilă în raport cu
astfel de valori.
Mediana depinde de locul valorilor în serie, nu de mărimea acestor valori. În felul acesta
ea nu este supusă influenței așa-ziselor valori aberante (anormal de mari sau anormal de mici)
care sunt lăsate în afara seriei prin deschiderea intervalelor marginale.
În cazul unei distribuții unimodale ușor asimetrice, frecvențele sunt ușor deplasate într-
o parte sau alta, între cei trei indicatori ai tendinței centrale există următoarea relație
x Mo 3( x Me) , care se respectă și în cadrul aplicației noastre.
Aflarea medianei se face diferențiat, în funcție de felul seriei:
pentru o serie simplă cu un număr impar de termeni, ale căror valori sunt ordonate
crescător sau descrescător, aflarea Me constă în găsirea termenului central pe baza determinării
unității medianei;
n 1
U Me (3.57)
2
Mediana reprezintă valoarea termenului central al seriei.
pentru o serie simplă cu un număr par de termeni, ale căror valori sunt ordonate
crescător sau descrescător, Me se află prin calcularea mediei aritmetice simple a celor 2 termeni
centrali ai seriei, stabiliți tot ca urmare a aplicării formulei unității medianei (3.57);
pentru o serie cu frecvență cu caracteristica prezentată pe variante, aflarea Me
presupune efectuarea următoarelor operații:
a) determinarea șirului frecvențelor cumulate ( N i );
b) calculul unității mediane (UMe);
U Me
ni 1 (3.58)
2
și găsirea locului ei în șirul frecvențelor cumulate respectând condiția NiUMe;
c) Mediana reprezintă tipul sau valoarea caracteristicii care satisface condiția NiUMe;
72
Exemplul 3.14:
La finele anului școlar, situația rezultatelor școlare a elevilor unei clase I se
prezintă astfel:
Tabel 3-18
Rezultate școlare Număr elevi Frecvențe cumulate ( N i )
Premiul I 1 1
Premiul II 4 5
Premiul III 3 8
Mențiuni 8 16
Fără premii 4 20
Total 20 ---
Stabiliți, calculați și interpretați indicatorii tendinței centrale corespunzători acestui tip de
distribuție.
Rezolvare:
Distribuția elevilor după rezultatele școlare prezentată în tabelul 3-18 formează o
serie de frecvențe pe variante. Variabila „rezultate școlare” este calitativă, iar scala de
măsurare este ordinală, ceea ce conduce la determinarea doar a doi indicatori ai tendinței
centrale: modul (a) și mediana (b).
(a) Se știe că modul este tipul sau valoarea caracteristicii căreia îi corespunde
frecvența cea mai mare. Cum cei mai mulți elevi ( nmax 8 elevi) au obținut mențiuni,
rezultă că modul este reprezentat de tipul caracteristicii “Mențiuni”, cele mai des întâlnite
ca rezultate școlare.
(b) Stabilirea medianei presupune parcurgerea etapelor:
b.1. determinarea șirului frecvențelor cumulate ( N i - coloana 3 din tabelul 3-18);
b.2. calculul unității mediane (UMe);
5
n 1 i
20 1
U Me i 1
10,5
2 2
și găsirea locului ei în șirul frecvențelor cumulate respectând condiția NiUMe; deci
locul ei este la tipul caracteristicii “Mențiuni”, Ni 16 U M 10,5
e
b.3. Mediana reprezintă tipul sau valoarea caracteristicii care satisface condiția NiUMe; prin
urmare, deoarece Ni 16 U M 10,5 mediana este reprezentată de mențiuni, ceea ce
e
înseamnă că 50% din totalul elevilor au luat premii (I, II, III), iar cealaltă jumătate a
numărului elevilor au mențiuni sau sunt fără premii.
73
UMe Ni 1
Me xi 1 d (3.59)
nm
unde:
xi-1 = limita inferioară a intervalului median;
d = mărimea intervalului median;
UMe = unitatea mediană;
Ni-1 = frecvența cumulată anterioară intervalului median;
nm = frecvența intervalului median.
Mediana fiind o mărime medie cu o poziție centrală într-o serie statistică ordonată, se
poate determina ușor pe cale grafică folosind curba frecvențelor cumulate. Me este reprezentată
de abscisa corespunzătoare ordonatei ce poartă valoarea UMe (figura 3.3(a)).
Dacă la construcția curbelor frecvențelor cumulate se pornește de la limita inferioară,
respectiv, cea superioară ale distribuției și dacă se coboară o perpendiculara din intersecția celor
doua curbe pe abscisă se poate identifica, de asemenea, valoarea medianei (figura 3.3(b)).
.
Ni Ni
Ni
UMe
Ni-1
O xi-1 Me xi xi O Me xi
3.3(a) 3.3(b)
Figura 3-3 - Reprezentarea grafică a medianei
3.4.3 Cuantilele
Cuantilele sunt valori ale variabilei care separă repartiția ordonată în “n” părți
cuprinzând același efectiv egal cu 1/n din efectivul total. Cuantilele sunt valori ale caracteristicii
care împart seria în “n” părți egale.
În funcție de valorile lui “n” cuantilele se numesc:
n=2 - mediană; b) n=4 - quartile; c) n=10 - decile; d) n=100 - centile.
Quartilele (Q) reprezintă valori ale caracteristicii care împart volumul colectivității în
4 părți egale. Există 3 quartile ( Q1 , Q2 M e , Q3 ) care se determină diferit, în raport cu tipul
seriei, astfel:
pentru o serie simplă cu un număr impar de termeni, ale căror valori sunt ordonate
crescător sau descrescător, aflarea quartilelor constă în găsirea termenului central pe baza
determinării unității quartilice;
U Q1
1
n 1 ; U Q2 1 n 1 U M e ; U Q3 3 n 1 (3.60)
4 2 4
Quartilele reprezintă valori ale termenilor centrali.
74
Exemplul 3.15:
În cadrul unui muzeu s-a realizat o cercetare pe baza numărului biletelor vândute
în 15 zile, situația prezentându-se astfel: 50, 13, 25, 28, 30, 50, 44, 35, 29, 44,
28, 48, 44, 52, 38.
Să se determine quartilele seriei numărului biletelor.
Rezolvare:
Înaintea determinării quartilelor este obligatorie ordonarea crescătoare a valorilor
numărului biletelor vândute:
xi : 13, 25, 28, 28, 29, 30, 35, 38, 44, 44, 44, 48, 50, 50, 52 (bilete)
Prima quartilă ( Q1 ) : U Q 1
1
n 1 1 15 1 4 , locul primei quartile fiind în dreptul
4 4
celui de-al patrulea termen ( x4 ), deci Q1 x4 28 bilete ceea ce înseamnă că, în primele trei
zile (un sfert sau 25% din totalul celor 15 zile) ordonate crescător după numărul biletelor
vândute, s-a înregistrat o vânzare mai mică de 28 bilete, pentru ca în restul zilelor (trei sferturi
sau 75%) vânzarea a depășit valoarea stabilită.
A treia quartilă ( Q3 ):
U Q3
3
n 1 3 15 1 12 , locul ultimei quartile fiind în dreptul celui de-al
4 4
doisprezecelea termen ( x12 )
Q3 x12 48 bilete ceea ce înseamnă că, în primele 11 zile (trei sferturi sau 75% din totalul
celor 15 zile) ordonate crescător după numărul biletelor vândute, s-au vândut mai puțin de 48
bilete, pentru ca în restul zilelor (un sfert sau 25%) vânzarea să depășească valoarea
determinată.
pentru o serie simplă cu un număr par de termeni, ale căror valori sunt ordonate
crescător sau descrescător, quartilele se află prin calcularea mediei aritmetice simple a celor 2
termeni stabiliți tot ca urmare a aplicării formulei unității quartilelor (3.60);
75
Exemplul 3.16:
Pe fiecare rută, compania de transport public local stabilește pentru 18 autobuze
timpul mediu (minute) în care trebuie parcurs traseul: 40, 30, 35, 50, 55, 45, 60,
120, 100, 65, 110, 70, 90, 80, 85, 95, 75, 105.
Rezolvare:
Anterior determinării quartilelor este necesară ordonarea crescătoare a valorilor
timpului mediu:
xi : 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 120 (minute)
Prima quartilă ( Q1 ) :
U Q1
1
n 1 1 18 1 4,75 , locul primei quartile este plasat între termenul patru și
4 4
x x 45 50
cinci ( x4 și x5 ), deci Q1 4 5 47,50 minute ceea ce înseamnă că 25% din
2 2
totalul celor 18 autobuze, ordonate crescător după timpul mediu, trebuie să parcurgă traseul
stabilit în mai puțin de 47,50 minute, restul de 75% dintre autobuze peste această valoare
determinată.
A treia quartilă ( Q3 ):
U Q3
3
n 1 3 18 1 14,28 , locul ultimei quartile este plasat între termenul
4 4
x x
paisprezece și cincisprezece ( x14 și x15 ), deci Q3 14 15 97,50 minute ceea ce înseamnă
2
că 14 autobuze (reprezentând 75% din totalul celor 18 autobuze) ordonate crescător după
timpul mediu, vor trebui să parcurgă traseul stabilit în mai puțin de 97,50 minute, restul de 4
autobuze (un sfert sau 25%) având la dispoziție mai mult de 97,50 minute pentru a ajunge la
destinație.
76
c. Fiecare quartilă reprezintă tipul sau valoarea caracteristicii care satisface condiția
Ni U Q ;
U Q1 Ni 1 U M e Ni 1
Q1 xi1 d Q2 Me xi1 d
nQ1 nM e
(3.62)
U Q3 Ni 1
Q3 xi1 d
nQ3
unde:
xi-1 = limita inferioară a intervalului quartilic;
d = dimensiunea (mărimea) intervalului quartilic;
U Q = unitatea quartilică;
Ni-1 = frecvența cumulată anterioară intervalului quartilic;
nQ = frecvența intervalului quartilic.
Locul lor într-o distribuție statistică normală este prezentat în figura 3.4.
ni
O Q1 Q2 Q3 xi
Figura 3-4 – Reprezentarea grafică a quartilelor, în cadrul unei distribuții normale
Decilele (D) reprezintă valori ale caracteristicii care împart unitățile colectivității în 10
părți egale. Există 9 decile:
U D1 N i 1
D1 = xi-1 + d (3.63)
n D1
D5 = Me= Q2
U D 9 N i 1
D9 = xi-1 + d (3.64)
nD9
77
1 ni 9 ni
în care U D1 , ……., U 9 unități decilice
10 n10
Centilele (C) reprezintă valori ale caracteristicii care împart volumul colectivității în
100 părți egale. Există 99 centile:
U C1 N i 1
C1 = xi-1 + d (3.65)
nC 1
C50 = D5 = Q2= Me
U C 99 N i 1
C99 = xi-1 + d (3.66)
nC 99
1 ni 99 ni
în care U C1 , ……., U C 99 unități centilice
100 100
Exemplul 3.17:
Tabel 3-19
Xi ni Ni() Ni ()
0-30 25 25 200
30-60 50 75 175
60-90 60 135 UMe 125
90-120 45 180 65
120-150 15 195 20
150 și peste 5 200 5
Total 200 - -
78
U Q3
3
ni 1=(3*201)/4=151deci intervalul quartilic trei este (90-120)
4
U Q 3 N i 1 151−135
Q3= xi-1+d = 90+30 =99,99100, deci Q3 = 100 minute
nQ 3 45
3.4.4 Mediala
Mediala este un indicator de poziție egal cu acel nivel al caracteristicii (xi) care împarte
n
suma termenilor seriei ( x n ) în două părți egale.
i 1
i i
Ml
x
i1
i
(3.67)
U =
2
d) Se află mediala, adică se găsește acel nivel al caracteristicii xh corespunzător
primului nivel cumulat (Lh) egal sau mai mare decât UMl (Lh UMl).
Pentru o serie de distribuție de frecvențe, în cazul unei caracteristici discrete, mediala
se determină parcurgând următoarele etape:
a) Se determină șirul produselor (xini) cumulate, adică Lh:
h
Lh = x n ; h = 1, k
i1
i i (3.68)
b) Se determină unitatea medială pe baza formulei:
h
xn i i
(3.69)
UMl = i1
2
c) Se determină mediala, prin găsirea acelui nivel al caracteristicii care corespunde
primului produs cumulat Lh egal sau mai mare ca UMl (Lh UMl).
Pentru o serie de distribuție de frecvențe în cazul unei caracteristici continue, mediala
se determină în mod asemănător, cu deosebirea că, în dreptul Lh UMI, se citește intervalul
medial. Valoarea medială se calculează prin interpolare liniară, după relația:
79
De reținut!
Mărimile relative sunt indicatori derivați calculați ca raport între doua mărimi.
Rezultatul obținut este o expresie numerica care arata câte unități din indicatorul
raportat revin la o unitate a indicatorului baza de raportare.
Tehnica de calcul a mărimilor relative este simplă ceea ce explică și larga lor utilizare în
cercetarea statistică, în analiza activității economico-financiare sau în alte lucrări de analiza
și cercetare.
De reținut!
Existența mai multor tipuri de medii ridică întrebarea: când se aplică una sau
alta din mediile prezentate anterior?
• Modul este singurul indicator ai tendinței centrale care are sens în cazul variabilelor
măsurate pentru o scală nominală.
• Mediana este principalul indicator ai tendinței centrale în cazul variabilelor măsurate
pe baza unei scale ordinale. În cazul variabilelor cantitative, măsurate printr-o scală de raport,
mediana completează media aritmetică sau poate înlocui această medie dacă repartiția este
pronunțat asimetrică sau cuprinde valori care se abat semnificativ de masa valorilor.
• Media aritmetică este cea mai importantă medie în cazul seriilor alcătuite pentru o
variabilă măsurată pe baza unei scale de raport. Se poate aplică întotdeauna când are sens să
se însumeze termenii seriei.
• Media geometrică se aplică tot în cazul variabilelor scalate metric și când între date
există o relație de produs, respectiv exprimă evoluția în timp.
• Media armonică presupune ca măsurarea să se bazeze pe o scală de raport, iar datele
din care se calculează să fie mărimi relative de structură sau de intensitate.
• Media pătratică se aplică în cazul seriilor de date scalate metric, când termenii pot fi
atât valori pozitive cât și negative.
80
3.5 APLICAȚII
Tabel 3-20
Producție Nr.
- buc. - salariați
Xi ni
20-30 7
30-40 9
40-50 19
50-60 7
60-70 8
TOTAL 50
*limită inferioară inclusă în interval
Cerințe:
1. Determinați mărimile relative permise a fi calculate de date centralizate în tabelul
3.20.
2. Reprezentați grafic mărimile relative de structură și cele de coordonare determinate.
3. Determinați mărimile medii de calcul.
4. Determinați modul, mediana și mediala.
Cerința nr. 1
Relația prezentată mai sus indică raportarea producției aferente fiecărui interval la
totalul producției obținut în ziua precedentă. Pentru a estima aceste valori, centrele intervalelor
de grupare vor fi ponderate cu frecvențele de apariție corespunzătoare.
Astfel, pentru calculul greutăților specifice determinate în cazul datelor grupate pe
intervale se va utiliza forma ponderată de calcul:
81
x i ni
gi 100
x i ni
Ne vom ajuta de următorul tabel pentru exemplificarea algoritmului de calcul:
Tabel 3-21
Producție Nr.
- buc. - salariați xi’ xi’ni gi
Xi ni
20-30 7 25 175 8%
30-40 9 35 315 14%
40-50 19 45 855 38%
50-60 7 55 385 17%
60-70 8 65 520 23%
TOTAL 50 2250 100%
*limită inferioară inclusă în interval
Nota:
Vom nota centrele intervalelor de grupare cu Xi’. Valorile aferente vor fi
determinate cu ajutorul relației:
xmin xmax
xi'
2
Interpretare:
Se prezintă interpretarea doar pentru valorile descoperite pentru primul interval,
deoarece pentru următoarele valori calculate interpretarea se face în mod asemănător.
Salariații grupați pe primul interval de producție au reușit în ziua precedentă să producă
175 de bucăți, ceea ce reprezintă 8% din totalul producției zilei precedente.
82
Tabel 3-22
Producție Nr. nA XA
- buc. - salariați Xi’∙ni (10) (10)
Xi ni nB XB
20-30 7 175 - -
30-40 9 315 13 18
40-50 19 855 27 49
50-60 7 385 10 22
60-70 8 520 11 30
TOTAL 50 2250 - -
*limită inferioară inclusă în interval
Interpretare:
Se barează nivelurile din dreptul intervalului ales ca bază deoarece nu are sens realizarea
unei comparații a acestui interval cu el însuși.
Se prezintă interpretarea doar pentru valorile descoperite pentru cel de-al 3-lea interval,
deoarece și pentru celelalte valori calculate interpretarea se face în mod asemănător.
La 10 salariați din grupa de producție (20 -30) corespund, în cadrul colectivității,
aproximativ 27 de salariați cu o producție cuprinsă între (40-50).
La 10 produse obținute de salariații din grupa de producție (20 -30) corespund 49 de
produse obținute de salariații din grupa de producție (40-50).
d. Ultimul tip de mărimi relative pentru care putem exemplifica modul de calcul și de
interpretare este cel al mărimilor relative de intensitate.
Acestea se obțin prin raportarea a doi indicatori în mărime absolută, de natură diferită,
care se află într-o relație de interdependență.
x
Relația de calcul este Kx / y . În contextul aplicației date, determinarea mărimilor
y
relative de intensitate se realizează fie prin raportarea producția zilei precedente la totalul
salariaților care au contribuit la obținerea sa, astfel se va determina productivitatea medie a
muncii, fie prin realizarea raportului invers, totalul salariaților raportat la producția obținută.
2250
Kx / y 45 buc / salariat
50
Interpretare: Rezultatul obținut ia interpretarea unei medii, astfel, se prezintă că în ziua
precedentă fiecare salariat a obținut în medie 45 de bucăți – producție.
50
Ky / x 100 2 salariati / 100bucati
2250
83
Cerința nr. 2
Tabel 3-23
Producție Valori
- buc. - proporționale Distribuţia producţiei pe grupe de
Xi gi exprimate în
grade
încadrare a salariaţilor
20-30 8% 28o 20-30
30-40 8%
14% 50,4o 23% 14% 30-40
40-50 38% 136,8o 40-50
50-60 17% 61,6o 17%
38% 50-60
60-70 23% 83,2o
TOTAL 100% 360 o 60-70
Figura 3-5
19 XB
RB2 X B RB
84
Cerința nr. 3
• Media este o măsură a tendinței centrale, iar valoarea sa calculată sintetizează într-un
singur nivel reprezentativ tot ceea ce este tipic, esențial, comun și obiectiv în apariția și
manifestarea fenomenelor de masă.
• Din cadrul mărimilor medii de calcul se vor prezenta în continuare: media aritmetică,
media armonică și media pătratică.
x n i i
x i 1
k
n
i 1
i
2250
Astfel media aritmetica este egală cu 45 buc/salariat.
50
n i 1
i
xh k
1
x
i 1
ni
i
85
În vederea identificării valorii de la numitorul relației de calcul ne vom ajuta de
următorul tabel:
Tabel 3-25
Producția Nr.
(buc) salariați x' n/x
Xi ni
20-30 7 25 0,280
30-40 9 35 0,257
40-50 19 45 0,422
50-60 7 55 0,127
60-70 8 65 0,123
Total 50 - 1,210
50
Interpretare: Media armonică este egală cu 41,33 . Deoarece producția este o
1,210
caracteristică statistică cu variație discretă (discontinuă), se va rotunji rezultatul obținut la
valoarea întreagă 41 buc/salariat.
x
i 1
2
i ni
xp k
n i 1
i
108850
Media pătratică este egală cu 46,65 . Deoarece producția este o
50
caracteristică statistică cu variație discretă (discontinuă), se va rotunji rezultatul obținut la
valoarea întreagă 47 buc/salariat.
Așa cum se observă, valorile calculate pentru aceste mărimi medii de calcul nu sunt
egale, mai mult se știe că acestea respectă relația de inegalitate x h x g x x p .
Interpretarea mediilor se va realiza după același tipar prezentat în cazul mediei
aritmetice.
86
Cerința nr. 4
n i 1
50 1
a. Calculul unității mediane, UMe i 1
, UMe 25,5
2 2
b. Se determină frecvențele cumulate Ni
87
UMe Ni 1
Me xi 1 d
nm
25,5 16
Me=40+10 45 bucăți
19
Interpretare: Valoarea producției ce împarte distribuția aferentă celor 50 de salariați în
2 părți de volum egal este 45 buc.
xn
i1
i i
2250
U Ml
= = 1125 =
2 2
c) Se determină intervalul medial în dreptul Lh UMI.
Valoarea Lh care respectă în cazul acestei aplicații relația prezentată este 1345, acesta
este aferentă intervalului 40-50, ca atare, acesta va fi considerat interval medial.
88
Aplicații propuse
Aplicația 3.1
Conform Anuarului Statistic 2003, ariile protejate din România se caracterizează astfel:
Tabel 3-29
Ariile protejate Număr Suprafața (ha)
Rezervații științifice 53 101207
Parcuri naționale 11 300544
Monumente ale naturii 231 2177
Rezervații naturale 543 128265
Parcuri naturale 5 251632
Rezervații ale biosferei 3 664446
Să se determine:
a) Mărimile relative de structură;
b) Mărimile relative de coordonare;
c) Mărimile relative de intensitate.
Aplicația 3.2
O societate comercială prezintă următoarea situație a fondului de salarii și a numărului
de salariați pe grupe de vechime în muncă (date convenționale):
Tabel 3-30
Grupe de Fondul de salarii Număr de
vechime (mii. lei) salariați
(ani) (persoane)
Sub 10 30 10
10-20 80 15
20-30 175 25
peste 30 60 5
Se cere:
a) Să se determine mărimile relative de coordonare față de ultima grupă de vechime,
pentru fiecare variabilă studiată și să se facă analiza comparativă a rezultatelor;
b) Să se reprezinte grafic structura fondului de salarii și a numărului de salariați;
c) Să se determine mărimile relative de intensitate. Care este semnificația economică
a acestora?
89
Aplicația 3.3
Se cunoaște distribuția a 83 studenți ai anului II din cadrul Facultății de Științe
Economice și Administrație Publică în funcție de notele obținute la examenul de statistică:
Tabel 3-31
Grupe de note Număr de studenți
Sub 4 4
4-6 26
6-8 35
8 și peste 18
Total 83
*
limita superioară nu este cuprinsă în interval
Se cere:
a) Să se determine nota medie la examenul de statistică pentru cei 83 de studenți;
b) Să se determine nota cea mai des obținută de studenți;
c) Să se determine nota care împarte studenții anului în două părți egale;
d) Să se transforme frecvențele absolute în frecvențe relative și să se refacă estimările
pentru medie, mediană și mod. Ce se constată?
Aplicația 3.4
Repartiția sosirilor în pensiunile agroturistice din România, pe categorii de confort, se
prezintă astfel:
Tabel 3-32
Categorii de confort ale
Număr sosiri
pensiunilor agroturistice
5 flori 8829
4 flori 75090
3 flori 239616
2 flori 115341
1 floare 8237
Aplicația 3.5
Valorile a 12 contracte publicitare încheiate de un hotel se prezintă astfel:
23, 33, 26, 31, 27, 21, 22, 34, 17, 29, 28, 25 mii UM
Se cere:
a) Să se stabilească valoarea medie a unui contract publicitar încheiat.
b) Care este valoarea contractelor peste care se situează valorile a:
1) trei sferturi din contracte?
2) 50% din contracte
3) o pătrime din contracte.
90
Unitatea de învățare nr. 4: INDICATORII VARIAȚIEI,
CONCENTRĂRII
ȘI FORMEI DISTRIBUȚIILOR
91
Ax = xmax – xmin (4.1)
Exprimată în măsuri relative, amplitudinea variației se poate calcula:
fie ca raport între x max și x min:
𝑥𝑚𝑎𝑥
𝐴′𝑥 = (4.2)
𝑥𝑚𝑖𝑛
fie ca raport între amplitudinea absolută și nivelul mediu al caracteristicii:
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
𝐴′′𝑥 = (4.3)
𝑥̅
Amplitudinea variației depinde numai de valorile extreme ale unei variabile și poate să
dea o imagine eronată a intervalului de variație, atunci când cel puțin una dintre valorile extreme
se abate în mare măsură de la celelalte niveluri individuale ale caracteristicii. Amplitudinea
variației nu poate caracteriza în mod corespunzător împrăștierea unor variabile obținute prin
sondaj, în cazul seriilor formate dintr-un număr redus de variante.
Un alt indicator simplu al variației îl constituie abaterile nivelurilor individuale ale unei
variabile față de nivelul lor mediu, notate cu di, și care se pot calcula după formula:
d i xi x (4.4)
Abaterile di se pot exprima și în mărimi relative prin raportarea lor la nivelul mediu al
variabilei, astfel:
d x x
d i % i 100 i 100 (4.5)
x x
În practică aceste abateri se utilizează pentru calculul ulterior al indicatorilor sintetici ai
variației.
x i x
(4.6)
d i 1
n
pentru o serie cu frecvență:
k k
x i x ni x i x fi
d i 1
k
sau d i 1
k (4.7)
n
i 1
i f
i 1
i
Abaterile xi x trebuie considerate în valoare absolută, deoarece dacă s-ar ține seama
de semne, suma lor ar fi egală cu zero, conform proprietăților mediei aritmetice.
Abaterea medie liniară se poate calcula și față de mediană.
92
Formulele de calcul ale acesteia față de mediană se vor obține substituind pe x cu Me în
formulele (4.6) și (4.7), astfel:
pentru o serie simplă:
n
'
x i Me
(4.8)
d i 1
n
pentru o serie cu frecvență:
k k
'
x i M e ni
'
x i M e fi
d i 1
k
d i 1
n (4.9)
n i 1
i f i 1
i
sau
Exemplul 4.1:
Să considerăm pentru exemplificare, seria din tabelul 4.1.
x i x ni
2850
d i 1
k
14,25 14 piese/zi
n
200
i
i 1
Rezultă că, în medie, un muncitor din grupul considerat se abate de la productivitatea
medie cu ± 14 piese.
k
'
x i M e ni
2800
d i 1
k
14 piese/zi
n
200
i
i 1
93
Se observă că diferența între rezultatele obținute este foarte mică deoarece distribuția
este foarte apropiată de cea normală.
x x
2
i
(4.10)
2 i 1
n
pentru o serie cu frecvență:
k k
x i x ni x x fi
2 2
i
2 i 1
k
sau 2 i 1
k (4.11)
ni
i 1
i 1
fi
3. Abaterea medie pătratică, numită și abatere standard sau abatere tip se notează
cu și se calculează prin extragerea rădăcinii pătrate din valoarea dispersiei. Abaterea medie
pătratică reprezintă media pătratică a abaterilor nivelurilor individuale ale caracteristicii față de
media lor.
Formulele de calcul ale abaterii standard sunt următoarele:
pentru o serie simplă:
n
x x
2
i
(4.12)
i 1
n
pentru o serie cu frecvență:
k k
x i x ni x x fi
2 2
i
i 1
k
sau i 1
k
(4.13)
n
i 1
i f
i 1
i
x i x 2 n i
c
i 1 k (4.14)
ni
i 1 c
94
Exemplul 4.2:
x x ni
2
i
66800
i 1
k
= 334 = 18,27 18 piese/zi
200
n
i 1
i
x x fi
2
i
33400
i 1
k
= = 18,27≅18 piese/zi
100
f
i 1
i
Același rezultat se obține dacă în locul frecvențelor absolute se vor utiliza frecvențele
relative (ultimele două coloane ale tabelului 4.2).
σ=18 piese/zi înseamnă că, în medie, producția zilnică a unui muncitor se abate de la
nivelul mediu al grupului cu ±18 piese / zi.
95
v
100 (4.15)
x
Coeficientul de variație arată în ce raport se găsește împrăștierea unei variabile,
măsurată prin abaterea medie pătratică, față de nivelul ei mediu. Datorită faptului că acest
indicator sintetic al variației se exprimă în procente, făcând deci abstracție de unitățile de
măsură concrete ale caracteristicilor, el poate fi utilizat pentru compararea gradului de
împrăștiere al unor distribuții care au caracteristica exprimată în unități de măsură diferite.
Coeficientul de variație se poate calcula și prin raportarea abaterii medii liniare la media
aritmetică a distribuției, astfel:
d
v d 100 (4.16)
x
În funcție de valoarea pe care o ia în intervalul [0 – 100 %], are o arie destul de largă de
aplicabilitate, fiind stabilit pentru:
- a preciza gradul de omogenitate a colectivității;
- a testa semnificația reprezentativității mediei;
- a preciza dacă gruparea este bine realizată.
Pornind de la interpretarea rezultatelor care se apropie de limitele intervalului (cu cât
valoarea tinde spre 0, cu atât omogenitatea este mai pronunțată, iar media mai reprezentativă,
în timp ce, rezultatele care se apropie de 100% evidențiază tendința de eterogenitate a seriei și
nereprezentativitate a mediei). Coeficienții de variație se interpretează, în general, după modelul
prezentat în tabelul următor:
x n i i
n x i fi
xp i 1
2
1 sau xp i 1
2
p i 1,2
n f
n
i i
i 1 i 1
96
Aplicând formula generală a dispersiei și în cazul caracteristicii alternative, se obține:
2
x x fi
2
2p i 1
i
0 p2 q 1 p2 p pq
2
pq
f
i 1
i
p2 pq (4.17)
deci
sau p p(1 p)
2
(4.18)
Din formula (4.32) rezultă că dispersia unei caracteristici alternative este egală cu
produsul între ponderea unităților care posedă nivelul x1 al caracteristicii și ponderea celor care
posedă nivelul x2 al caracteristicii.
Abaterea medie pătratică a caracteristicii alternative va fi prin definiție:
(4.19)
În particular, dacă numărul unităților care posedă nivelul x1 al caracteristicii este egal
cu numărul unităților care posedă celălalt nivel al ei x2, adică p=q =50% atunci dispersia va fi
Nota: 0,25 este valoarea maximă pe care o poate lua dispersia unei caracteristici
alternative.
Indicatorii variației, calculați pentru caracteristici alternative, își găsesc o largă aplicare
în studiul statistic al calității produselor, în cercetările prin sondaj din economie, biologie,
psihologie, pedagogie și, în general, în toate domeniile în care însușirile fenomenelor pot fi
privite drept caracteristici alternative, binare. Din punct de vedere teoretic, orice caracteristică
nealternativă se poate transforma într-o caracteristică alternativă, prin determinarea abaterilor
nivelurilor individuale ale acesteia față de nivelul ei mediu sau față de o valoare reprezentativă
a seriei și prin împărțirea abaterilor, astfel calculate, în două grupe după semnul lor (abateri
pozitive și abateri negative).
Sistematizarea datelor după două variabile (pe variante sau pe intervale de variație) are
ca rezultat obținerea unei serii bidimensionale (bivariate).
Dacă avem două variabile statistice X și Y, pentru care s-au calculat mediile x și y,
media sumei valorilor individuale (x i y i ) este întotdeauna egală cu suma mediilor
x y x y . În aceeași situație, media produselor valorilor individuale ( x i y i ) este egală cu
produsul mediilor, numai în cazul în care cele două variabile sunt independente: x y x y .
Dacă variabilele sunt dependente, diferența x y x y 0 și poartă denumirea de covarianță
între x și y (covxy) și este un indicator care măsoară intensitatea dependenței legăturii între cele
două variabile.
97
Să presupunem că valorile variabilei X au fost sistematizate pe „r” variante (sau
intervale) și s-au urmărit în fiecare din cele „m” intervale (grupe) formate după o altă variabilă
Y.
În tabelul nr. 4.5 apar pentru variabila efect (Y) două tipuri de repartiții:
a) o repartiție pe total (yj, nj), care nu ține seama de grupele construite după caracteristica
considerată cauza;
b) r repartiții condiționate de grupele construite după caracteristica de grupare.
Corespunzător celor două tipuri de repartiții se pot calcula pentru variabila Y
următoarele medii:
- o media generală respectiv pentru repartiția pe total (𝑦
̅̅̅0 )
∑𝑚 𝑟
𝑗=1 𝑦𝑗 𝑛𝑗 ∑𝑖=1 𝑦 ̅𝑛
𝑦
̅̅̅0 = ∑𝑚 = ∑𝑟 𝑖 𝑖 (4.20)
𝑗=1 𝑛𝑗 𝑖=1 𝑛𝑖
- medii de grupă sau medii condiționate de factorul de grupare (𝑦
̅i ), pentru repartițiile
condiționate:
∑𝑚
𝑗=1 𝑦𝑗 𝑛𝑖𝑗
𝑦̅𝑖 = 𝑚 (4.21)
∑𝑗=1 𝑛𝑖𝑗
Numărul mediilor de grupă este egal cu numărul grupelor construite după caracteristica
factorială. Media mediilor de grupă este egală cu media generală.
Pornind de la valorile individuale (𝑦𝑗 ), mediile condiționate (𝑦 ̅𝑖 ) și de la media generală
(̅̅̅
𝑦0 ) se pot determina următoarele abateri:
- variația valorilor individuale în jurul mediei generale, 𝑦𝑗 - ̅̅̅ 𝑦0 ;
- variația valorilor individuale în jurul mediilor de grupă (condiționate), 𝑦𝑗 - 𝑦 ̅𝑖 ;
- abaterea mediilor condiționate de la media generală, 𝑦 ̅𝑖 - ̅̅̅
𝑦0 .
Corespunzător celor trei tipuri de abateri la nivelul fiecărei unități observate se poate
scrie:
𝑦𝑗 - ̅̅̅
𝑦0 = (𝑦𝑗 - 𝑦̅𝑖 )+(𝑦̅𝑖 - ̅̅̅
𝑦0 ) (4.22)
Ce semnificație au aceste abateri?
𝑦𝑗 - ̅̅̅
𝑦0 − măsoară variația valorilor individuale în jurul mediei generale. Dacă
98
valorile empirice înregistrate (𝑦𝑗 ) sunt rezultatul influenței tuturor factorilor
(esențiali și neesențiali) iar media presupune că toți factorii sunt constanți,
înseamnă că această diferență exprimă variația valorilor individuale în jurul
mediei sub acțiunea tuturor factorilor: factorul X considerat esențial si toți
ceilalți factori, considerați neesențiali.
𝑦𝑗 - 𝑦 ̅𝑖 − măsoară variația valorilor individuale de la media de grupă, deci
exprimă variația în interiorul fiecărei grupe construite după factorul X. cum
factorul X are aceiași valoare în cazul tuturor unităților din aceiași grupă,
înseamnă că această diferență se datorează acțiunii cauzelor din interiorul grupei,
deci factorilor neesențiali.
𝑦 ̅𝑖 - ̅̅̅
𝑦0 − evidențiază influența factorului esențial, de grupare (X), asupra
variației valorilor în jurul mediei generale.
Pe baza acestor abateri se pot calcula următoarele dispersii:
Dispersia generală (02 sau y2) se determină pentru repartiția marginală
construită pentru Y, și ca urmare, nu ține seama de grupele construite după
factorul X.
𝑚 2
∑ 𝑗=1(𝑦 𝑗 − 𝑦
̅̅̅)
0 𝑛𝑗
𝜎02 = 𝜎𝑦2 = (4.23)
∑𝑚𝑗=1 𝑛 𝑗
2
Dispersia de grupă sau dispersia condiționată (𝜎𝑖 ) măsoară variația la nivelul
fiecărei grupe construite după factorul X. Numărul dispersiilor de grupă este egal
cu numărul grupelor stabilite după caracteristica considerată cauză (i = 1, 2 ... r).
2
2
∑𝑚𝑗=1(𝑦𝑗 − 𝑦 ̅)
i 𝑛𝑖𝑗
𝜎𝑖 = (4.24)
∑𝑚𝑗=1 𝑛𝑖𝑗
Fiecare dispersie de grupă măsoară variația valorilor variabilei dependente sub influența
factorilor din interiorul grupei respective, care sunt priviți ca factori neesențiali în raport cu
factorul X.
Pentru a măsura acțiunea tuturor factorilor neesențiali din toate grupele se calculează
media dispersiilor de grupă.
Media dispersiilor de grupă (𝜎 ̅̅̅2̅) este o medie aritmetică a dispersiilor de grupă:
∑𝑟𝑖=1 𝜎𝑖2 𝑛𝑖
̅̅̅2 =
𝜎 (4.25)
∑𝑟𝑖=1 𝑛𝑖
2
Dispersia dintre grupe ( 2 sau 𝜎𝑦/𝑥 ) sau dispersia explicată măsoară variația
mediilor de grupă de la media generală si exprimă variația datorată acțiunii
factorilor de grupare, deci X.
2 2
∑𝑟𝑖=1(𝑦̅𝑖 − ̅̅̅)
𝑦0 2 𝑛𝑖
𝛿 = 𝜎𝑦/𝑥 = (4.26)
∑𝑟𝑖=1 𝑛𝑖
Pornind de la factorii de influență care determină variația valorilor variabilei Y, între
dispersiile menționate există relația:
02=2 + 2 (4.27)
Această relație este cunoscută sub denumirea de “regula de adunare a dispersiilor” sau
“ecuația fundamentală a analizei dispersionale”.
Pe baza celor trei dispersii se pot construi alți indicatori:
gradul de determinație (R2)
2
R2 100 (4.28)
02
99
gradul de nedeterminație (K2)
2
K2 100 (4.29)
02
Gradul de determinație (R2) exprimă măsura în care variația caracteristicii urmărite
depinde de factorul principal sistematic după care s-a structurat colectivitatea în grupe
omogene, adică arată intensitatea legăturii dintre variabila X și variabila Y. Cu cât valoarea lui
se apropie de 1, cu atât legătura este mai strânsă și cu cât valorile sale sunt mai apropiate de
zero legătura dintre X și Y este mai slabă. Dacă R2=0 înseamnă că între variația celor două
variabile nu există nici o legătură.
Gradul de nedeterminație (K2) exprimă măsura în care variația caracteristicii depinde de
variația factorilor aleatori, ce acționează în interiorul grupelor.
Între cei doi indicatori există următoarea relație:
R 2 K 2 100 (4.30)
Dacă R K , înseamnă că factorul principal de grupare acționează în mod hotărâtor
2 2
4.2 CONCENTRAREA
n
i 1
i
Li
qi k
xn
i 1
i i
100
Reprezentând într-un sistem de axe rectangulare (figura 4.1) cele două variabile pi și qi
pe ordonată și respectiv pe abscisă, bisectoarea axelor de coordonate OA va reprezenta
distribuția egalitară a volumului caracteristicii studiate, iar funcția f(qi ,pj) ia forma unei curbe
ODA cu atât mai îndepărtată de diagonala pătratului cu cât distribuția studiată va fi mai
concentrată, mai inegalitară. Această curbă poartă denumirea de curbă de concentrare sau
curba Lorentz - Gini.
qi(%)
100
80
Suprafața de
60 concentrare
40
Curba de
concentrare
20
0
0 20 40 60 80 100 pi(%)
Figura 4-1- Curba de concentrare și suprafața de concentrare
Relația dintre mediană, medială și concentrarea unei variabile se poate ilustra și pe cale
grafică (figura 4.2).
Me 50 50 50
Me
Me
0 pi 0 pi pi
50 100 50 Ml 100 0 50 Ml 100
Ml
abc
Figura 4-2- Gradul de concentrare
Din figura 4.2(a) se observă că, în cazul în care curba de concentrare se confundă cu
diagonala pătratului, nu există nici un fel de concentrare, iar abaterea dintre mediană și medială
este nulă. Absența concentrării înseamnă, în cazul unei întreprinderi după producția zilnică
obținută, că m% dintre muncitori realizează m% din producția totală. Există deci o concordanță
perfectă între numărul de muncitori și producția obținută. Acest tip de distribuție poartă
denumirea de distribuție egalitară sau de echirepartiție, căreia îi corespunde o concentrare nulă.
În situația opusă, când curba de concentrare se confundă cu laturile pătratului,
concentrarea este maximă. Teoretic, acest caz extrem se poate interpreta astfel: 99% dintre
muncitori realizează o producție egală cu zero și un singur procent dintre muncitori realizează
întreaga producție 100%.
101
Între aceste două situații extreme se situează cazurile reale de concentrare. Figura 4.2(b)
reprezintă o repartiție cu o slabă concentrare, iar figura 4.2(c) una cu un grad mare de
concentrare.
În general, gradul de concentrare variază proporțional cu mărimea suprafeței cuprinse
între curba de concentrare și diagonala pătratului, numită suprafață de concentrare. Cu cât
această suprafață este mai mică, cu atât gradul de concentrare este mai redus și invers.
Exemplul 4.3:
Tabel 4-6
Intervale de variație a Număr
județelor după nr. județe Ni pi xi xi ni Li qi
biblioteci ni
1-3 12 12 0,5714 2 24 24 0,3000
3-5 5 17 0,8095 4 20 44 0,5500
5-7 1 18 0,8571 6 6 50 0,6250
7-9 1 19 0,9047 8 8 58 0,7250
9 - 11 1 20 0,9523 10 10 68 0,8500
11 - 13 1 21 1 12 12 80 1
Total 21 - - - 80 - -
Limita inferioară inclusă în interval
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Interpretare:
Curba de reprezentare pe baza punctelor pi , qi stabilite de rezultatele obținute
0,5714; 0,3000; 0,8095; 0,5500; 0,8571; 0,6250; 0,9047; 0,7250; 0,9523; 0,8500; 1;1
fiind foarte apropiată de diagonala pătratului, se poate evidenția o concentrarea moderată a
bibliotecilor pe județe (disparitățile fiind reduse) în anul 2012.
Corespondența pi , qi arată că:
30% din totalul bibliotecilor revine unui procent de 57,14% din totalul județelor;
102
55% din totalul bibliotecilor revine unui procent de 80,95% din totalul județelor;
62,50% din totalul bibliotecilor revine unui procent de 85,71% din totalul județelor;
72,50% din totalul bibliotecilor revine unui procent de 90,47% din totalul județelor;
85% din totalul bibliotecilor revine unui procent de 95,23% din totalul județelor.
Statisticianul italian Corrado Gini a formulat pentru prima dată un indicator al gradului
de concentrare în raport cu suprafața de concentrare, numit indice de concentrare. Indicele de
concentrare Ic este egal cu raportul dintre mărimea suprafeței de concentrare C și jumătate din
aria pătratului S/2:
sup rafata de concentrare
ic
aria patratului (4.31)
2
Deoarece suprafața de concentrare variază între 0 și jumătate din aria pătratului, rezultă
că:
0 ic 1
ic = 0 corespunde lipsei de concentrare
ic = 1 corespunde concentrării maxime
Desigur, gradul de concentrare în realitate nu atinge aceste limite ci se situează în
interiorul lor.
Indicele de concentrare se poate determina în mai multe feluri:
a) Pe baza suprafeței de concentrare.
Mărimea suprafeței de concentrare se poate calcula pe cale grafică prin însumarea
suprafețelor triunghiurilor, trapezelor și pătratelor înscrise în interiorul ei cu ajutorul formulei:
S
IIGC c
1 (4.32)
Sp
2
b) Gradul de concentrare se poate aprecia și cu ajutorul diferenței dintre mediană și
medială, notată cu Me,Ml :
Me,Ml Ml Me 0 (4.33)
1
Interpretarea valorilor coeficientului Gini se realizează în raport cu intervalul , 1 , astfel:
n
103
1
- dacă CG , atunci repartiția este absolut uniformă
n
- dacă CG 1 , atunci repartiția este concentrată pe o singură unitate teritorială
Exemplul 4.4
Tabel 4-7
Intervale variație a Număr județe
județelor după nr.
ni xi xi ni gi g i2
biblioteci
1-3 12 2 24 0,3 0,09
3-5 5 4 20 0,25 0,06
5-7 1 6 6 0,075 0,01
7-9 1 8 8 0,1 0,01
9 - 11 1 10 10 0,125 0,02
11 - 13 1 12 12 0,15 0,02
Total 21 - 80 1 0,21
k
CG g
i 1
2
i 0,21 0,45
k
n g i2 1
21 0,21 1
CS i 1
0,41
n 1 21 1
Interpretare:
Și prin intermediul acestor indicatori se evidențiază concentrarea moderată a
bibliotecilor pe județe în anul 2012.
104
4.3 FORMA DISTRIBUȚIILOR
În urma desfășurării activităților din economie se obțin date statistice a căror repartiție
urmează într-o măsură mai mică sau mai mare distribuția teoretică Gauss-Laplace.
Forma distribuției este evidențiată fie prin intermediul abaterilor de la cazul simetriei în
jurul valorilor centrale, fenomen denumit oblicitate, asimetrie, fie prin înălțimea curbei
repartiției, adică gradul de boltire.
C as
3 x Me (4.37)
C as
x Mo
1,1
C as
3 x Me 3,3
Interval Tipul asimetriei Interval Tipul asimetriei
Cas 1 ; 0,5 C 3 ; 1,5
'
as
Asimetrie pronunțată Asimetrie pronunțată
Cas 0,5 ; 1 Cas' 1,5 ; 3
105
Cas 0,5 ; 0 Cas' 1,5 ; 0
Asimetrie redusă Asimetrie redusă
Cas 0 ; 0,5 Cas' 0 ; 1,5
x x
2
i
(4.40)
în cazul seriei simple: 2 i 1
2
n
n
x x n
2
i i
în cazul seriei cu frecvențe: 2 i 1
n
2 (4.41)
ni
i 1
x x
3
i
(4.42)
în cazul seriei simple: 3 i 1
n
n
x x n
3
i i
în cazul seriei cu frecvențe: 3 i 1
n (4.43)
n
i 1
i
o dacă 1
≠0, atunci repartiția este asimetrică
Valorile negative sunt considerate asimetrii la stânga, iar valorile pozitive indică asimetrii la
dreapta.
3
Momentele centrate de ordin „m” reprezintă medii ale abaterilor valorilor de la o valoare medie, calculat:
n
x x
n
x x
m m
i i ni
m i 1
(serie simplă) sau m i 1
n
(serie cu frecvențe)
n
n
i 1
i
106
4.3.2 Boltirea/aplatizarea distribuțiilor
x x
4
i
(4.45)
în cazul seriei simple: 4 i 1
n
n
x x n
4
i i
în cazul seriei cu frecvențe: 4 i 1
n (4.46)
ni
i 1
Coeficientul de boltire Pearson
4 4
2 (4.47)
4 22
Atât aprecierea grafică a boltirii, cât și determinarea coeficienților de boltire conduc la
următoarele trei cazuri:
1. cazul repartiției mezocurtice: curba normală coincide cu cea a distribuției empirice, iar
3 și 0
2. cazul repartiției leptocurtică: variație mare a frecvenței distribuției empirice comparativ
cu cea a curbei normale, iar 3 și 0
3. cazul repartiției platicurtică: variație redusă a frecvenței distribuției empirice comparativ
cu cea a curbei normale, iar 3 și 0
Exemplu 4.9
107
Tabel 4-9
Producție Nr. salariați
( x i ) - (sute buc.) ( ni )
xi x xi x 2 ni xi x 3 ni xi x 4 ni
5 2 -2,93 17,21 -50,48 148,07
7 3 -0,93 2,61 -2,44 2,28
8 5 0,07 0,02 0,00 0,00
9 4 1,07 4,55 4,85 5,18
12 1 4,07 16,54 67,25 273,50
TOTAL 15 40,93 19,19 429,03
Rezolvare
Măsurarea asimetriei distribuției privind producția realizată de 15 salariați ai unei
echipe, cu ajutorul coeficienților Pearson, se prezintă astfel:
x Mo
7,9 8
C as 0,07 0,5;0 , deci distribuției salariaților după
1,65
producția vândută îi corespunde o asimetrie redusă de dreapta (modul e plasat în dreapta față
de medie pe grafic).
3x M e 37,9 8
`
Cas 0,21 1,5;0 , deci distribuției salariaților după
1,65
producția vândută îi corespunde o asimetrie redusă de dreapta (mediana e plasată în dreapta
față de medie pe grafic).
x x ni
2
i
40,9
2 2 2,72 ; 2 7,44 ; 2 20,32
i 1 2 3
n
n
15
i
i 1
n
x x ni
3
i
19,19
3 i 1
n
1,27
n
15
i
i 1
n
x x ni
4
i
429,02
4 i 1
n
28,6
n
15
i
i 1
1,27
0,28
1
20,32
Valoarea coeficientului este pozitiva, dar redusă, astfel, și această metodologie de
analiza a asimetriei confirmă caracterul moderat al asimetriei de dreapta prezente în cadrul
distribuției analizate.
Măsurarea boltirii distribuției privind producția prin intermediul momentelor centrate
presupune atât determinarea coeficientului de boltire Pearson ( 2 ), cât și a coeficientului de
boltire Fisher ( 2 ) :
108
4 4 28,6
2 3,84 3
4 22 7,44
2 2 3 44 3 42 3 3,84 3 0,84 0
2
Rezultatele obținute au condus la 3 și 2 0 ceea ce însemnă că distribuția
producției are o formă leptocurtică.
4.4 APLICAȚII
Tabel 4-10
Producție Nr.
- buc. - salariați
Xi ni
20-30 7
30-40 9
40-50 19
50-60 7
60-70 8
TOTAL 50
*limită inferioară inclusă în interval
Cerințe:
1. Caracterizați variabilitatea față de tendința centrală cu ajutorul indicatorilor simpli
și sintetici ai variației.
2. Caracterizați concentrarea regăsită în cadrul distribuției.
3. Utilizând gruparea combinată a salariaților după cele două variabile urmărite
realizată la capitolul II, să se deducă proporția în care variația producției este determinată de
variația vârstei salariaților.
4. Determinați media și dispersia pentru salariații cu o producție egală sau mai mare
decât 50 de bucăți.
5. Să se caracterizeze asimetria si boltirea distribuției de valori.
109
Rezolvare:
Cerința nr. 1
Ax =70-20=50 buc
Interpretare: Distanța dintre nivelul maxim și nivelul minim al producției realizate este
de 50 de bucăți-producție.
abaterile nivelurilor individuale ale unei variabile față de nivelul lor mediu,
notate cu di, și care se pot calcula după formula:
d i xi x ,
Media aritmetică a distribuției a fost determinată și are valoarea x =45 buc/salariat
Abaterile di se pot exprima și în mărimi relative prin raportarea lor la nivelul mediu
al variabilei, astfel:
di x x
di % 100 i 100
x x
Interpretare:
Se observă că prima grupă de salariați a reușit să producă cu 20 de bucăți mai puțin
decât media colectivității sau putem prezenta în formă relativă că au produs cu 44% mai puțin
decât media colectivității. În mod asemănător se interpretează și valorile determinate pentru
intervalele de grupare următoare, cu precizarea că valorile pozitive exprimă depășiri ale
nivelului mediu al colectivității.
Indicatorii sintetici ai variației se caracterizează prin faptul că, în calculul lor, includ
abaterile tuturor nivelurilor individuale ale unei variabile față de nivelul lor mediu.
110
Abaterea medie liniară, notată cu d , se determină ca o medie aritmetică (simplă
sau ponderată) a abaterilor nivelurilor individuale ale unei variabile față de media lor aritmetică,
considerate în valoare absolută.
k
x i x ni
d i 1
k
n i 1
i
Tabel 4-12
Producția Nr.
(buc) salariați x' di xi x ni
Xi ni
20-30 7 25 -20 140
30-40 9 35 -10 90
40-50 19 45 0 0
50-60 7 55 10 70
60-70 8 65 20 160
Total 50 - - 460
460
d 9,2
50
Deoarece producția este o caracteristică statistică cu variație discretă (discontinuă), se
va rotunji rezultatul obținut la valoarea întreagă 9 buc.
Interpretare:
Putem concluziona că fiecare salariat, din rândul celor 50 analizați, s-a abătut de la
producția medie a eșantionului selectat, în medie, cu 9 buc/salariat.
nivelurilor individuale ale unei variabile de la nivelul lor mediu (media aritmetică).
k
x x ni
2
i
2 i 1
k
n
i 1
i
Tabel 4-13
Producția Nr.
(buc)
Xi
salariați
ni x' di xi x 2 ni
20-30 7 25 -20 2800
30-40 9 35 -10 900
40-50 19 45 0 0
50-60 7 55 10 700
60-70 8 65 20 3200
Total 50 - - 7600
7600
2 152
50
111
Interpretare:
Dispersia este un indicator cu un caracter economic abstract. Astfel, valoarea acestui
indicator nu poate fi interpretată din punct de vedere economic și nici nu se va prezenta vreo
unitate de măsură.
Abaterea medie pătratică, numită și abatere standard sau abatere tip se notează
cu și se calculează prin extragerea rădăcinii pătrate din dispersie. Abaterea medie pătratică
reprezintă media pătratică a abaterilor nivelurilor individuale ale caracteristicii față de media
lor.
k
x x ni
2
7600
i
12,32
i 1
k 50
n
i 1
i
Interpretare:
Interpretarea abaterii pătratice se realizează după modelul prezentat în cazul abaterii
liniare, fiecare salariat, din rândul celor 50 analizați, s-a abătut de la producția medie a
eșantionului selectat, în medie cu 12 buc/salariat.
12 9
v 100 27% vd 100 20%
45 45
Interpretare:
Valorile determinate ale coeficientului de variație se situează sub valoare de 35%, astfel
concluzionăm că eșantionul celor 50 de salariați analizați este unul omogen din perspectiva
variabilei producție și, totodată, rezultă că și media producției este reprezentativă din punct de
vedere statistic.
112
Cerința nr. 2
Concentrarea distribuției
Tabel 4-14
Producție Nr.
- buc. - salariați gi gi2
Xi ni
20-30 7 0,08 0,006
30-40 9 0,14 0,020
40-50 19 0,38 0,144
50-60 7 0,17 0,029
60-70 8 0,23 0,053
TOTAL 50 1 0,253
Cerința nr. 3
Tabel 4-15
Producție - buc. -
Vechime Yj
-ani-
20-30 30-40 40-50 50-60 60-70
Xi Total
25 35 45 55 65
≤ 15 ani 7 9 17 - - 33
> 15 ani - - 2 7 8 17
Total 7 9 19 7 8 50
113
În vederea stabilirii coeficientului de determinație se vor parcurge următoarele etape de
calcul:
y i ni.
y0 i 1
r
n
i 1
i.
38 33 59 17
y0 45 buc./salariat
50
y 0 reprezintă producția medie realizată la nivelul celor 50 de salariați.
3. Se calculează dispersia generală:
2
2
∑𝑚
𝑗=1(𝑦𝑗 − ̅̅̅)
𝑦0 𝑛𝑗
𝜎0 =
∑𝑚
𝑗=1 𝑛𝑗
2 2
2
(25 − 45) ∙ 7 + (35 − 45) ∙ 9 + (45 − 45)2 ∙ 19 + (55 − 45)2 ∙ 7 + (65 − 45)2 ∙ 8
𝜎0 =
50
=
152
2
4. Se calculează dispersiile de grupă sau dispersia condiționată (𝜎𝑖 ):
2
2
∑𝑚
𝑗=1(𝑦𝑗 − 𝑦̅)
i 𝑛𝑖𝑗
𝜎𝑖 =
∑𝑚𝑗=1 𝑛𝑖𝑗
(25 − 38) ∙ 7 + (35 − 38) ∙ 9 + (45 − 38)2 ∙ 17 2097
2 2
𝜎12 = = = 63
33 33
114
(38 − 45) 33 + (59 − 45) 17
2 2
2
𝛿 = = 98
55
2
0
Cota parte de 36% din producției se poate explica prin acțiunea tuturor celorlalți factori
considerați neesențiali, reziduali.
Cerința nr. 4
Pentru determinarea mediei și a dispersiei pentru salariații cu o producție egală sau mai
mare decât 50 de bucăți se va restructura distribuția salariaților de pe 5 intervale de grupare pe
doar 2.
Tabel 4-16
Producție Nr. Producție Nr.
- buc. - salariați - buc. - salariați
Xi ni Xi ni
20-30 7
50 buc. 35
30-40 9
40-50 19
50-60 7 50 buc. 15
60-70 8 TOTAL 50
TOTAL 50
Variabila producție se prezintă, după restructurare, după modelul uneia de tip alternativ.
Astfel, pentru determinarea mediei și a dispersiei pentru salariații cu o producție egală sau mai
mare decât 50 de bucăți se vor utiliza relațiile specifice unei caracteristici alternative.
M 15
Nivelul mediu se va determina după relația xp = =0,3 (30%)
N 50
Nivelul mediu în cazul variabilelor alternative se interpretează ca o pondere, astfel se
poate preciza că 30% dintre salariați au obținut o producție egală sau mai mare de 50 de bucăți.
Dispersia se determină după relația
p (1 p )
2
p
115
Cerința nr. 5
Tabel 4-17
Producție Nr.
- buc. - salariați ( xi x) 3 ni ( xi x) 4 ni
Xi ni
20-30 7 -56000 1120000
30-40 9 -9000 90000
40-50 19 0 0
50-60 7 7000 70000
60-70 8 64000 1280000
TOTAL 50 6000 2560000
k
(x i x) 3 ni
6000
3 i 1
k
120
n
50
i
i 1
k
(x i x) 4 ni
2560000
4 i 1
k
51200
n
50
i
i 1
116
De reținut!
Aplicații propuse
Aplicația 4.1
O societate comercială are 15 sucursale în orașe diferite, grupate după profitul obținut
astfel (date convenționale):
Tabel 4-18
Grupe după profit Număr filiale
(mii. euro)
Sub 10 2
10-20 3
20-30 7
30-40 2
peste 40 1
Total 15
117
Aplicația 4.2
Repartiția muncitorilor din cadrul unei secții de producție, după timpul lucrat într-o lună
calendaristică se prezintă astfel:
Tabel 4-19
Intervale de Număr de
timp lucrat muncitori (persoane)
(ore)
Sub 150 3
150-156 12
156-162 13
162-168 14
168 - 174 5
174 și peste 3
Total 50
Se cere:
a) Să se reprezinte grafic repartiția muncitorilor după timpul lucrat și să se observe
forma repartiției;
b) Să se calculeze indicatorii tendinței centrale și să se observe relația dintre aceștia;
c) Să se caracterizeze gradul de omogenitate al repartiției;
d) Să se măsoare gradul de asimetrie.
Aplicația 4.3
Despre un eșantion format din 60 de salariați, care își desfășoară activitatea în sectorul
comercial, s-au înregistrat la nivelul unei perioade de 15 zile din anul 2012, următoarele
informații:
Tabel 4-20
Grupe de persoane Număr de persoane
după valoarea - frecvențe absolute
încasărilor (mil.lei) (ni)
80-82 4
82-84 8
84-86 9
86-88 19
88-90 8
90-92 4
92-94 3
94-96 5
Total 60
Să se calculeze principalii indicatori care caracterizează seria de distribuție privind
încasările din vânzările de mărfuri astfel:
a) indicatorii tendinței centrale;
b) mărimile medii de calcul;
c) indicatorii medii de poziție;
d) indicatorii de variație;
e) indicatorii de asimetrie;
f) indicatorii de măsurare a gradului de concentrare.
118
Aplicația 4.4
La nivelul a 35 agenții de turism dintr-o regiune se derulează o cercetare care, într-o
primă fază, vizează cel mai mare număr de bilete vândute lunar în raport cu categoriile de
confort a unităților turistice cu care au încheiat contracte, situația prezentându-se astfel:
Tabel 4-21
Categorii de Număr agenții Număr mediu bilete Coeficient de variație
confort de turism vândute lunar/agenție al numărului de bilete vândute
1 stea 7 890 8,9
2 stele 5 730 12,8
3 stele 15 1220 30,5
4 stele 5 700 10
5 stele 3 666 7,7
Se cere:
a) Precizați dacă grupele agențiilor în raport cu categoriile de confort a unităților
turistice cu care au încheiat contracte sunt omogene din perspectiva numărului de
bilete vândute lunar;
b) În ce măsură variația vânzărilor de bilete este influențată semnificativ de categoria
de confort a unităților turistice cu care au încheiat contracte
Aplicația 4.5
Situația privind tarifele medii practicate pentru 20 de vile, în perioada de sezon din anul
2012 situate în mediul rural și urban, dintr-o regiune turistică mai puțin dezvoltată din punct de
vedere turistic, se prezintă astfel:
Se cere:
c) Precizați dacă valoarea medie a tarifelor medii practicate pe fiecare grupă în raport
cu mediul de amplasare este reprezentativă;
d) Stabiliți dacă valoarea medie a tarifelor medii practicate la nivelul tuturor
pensiunilor este o valoare reprezentativă;
e) Precizați dacă mediul de amplasare a pensiunilor influențează variația valorii
tarifelor practicate.
119
Unitatea de învățare nr. 5: CERCETAREA SELECTIVĂ
Timpul de studiu individual estimat: 7 h
Considerații preliminare
Fenomenele din economie și societate au adesea manifestări
prea numeroase și prea complexe pentru a permite o observare
și analiză pe întreaga masă de unități statistice. Se ajunge astfel
la ideea examinării numai a unei părți a acestei populații, care
este numită selecție (eșantion, sondaj).
Populațiile statistice pot fi finite sau infinite. Unele
populații, deși finite, sunt atât de mari încât pot fi considerate,
practic, infinite. Măsurarea unor caracteristici și însușiri într-o
populație poate fi, în unele situații, destul de ușoară. Alteori,
acest lucru este, practic, imposibil. Cu cât este mai mare
volumul colectivității statistice, cu atât devine mai dificilă
obținerea informațiilor despre toate elementele colectivității. Soluția este să extragem un
eșantion, să calculăm indicatorii ce caracterizează colectivitatea de sondaj, și apoi să extindem
rezultatele obținute la întreaga colectivitate.
Procedeul de a obține date privind întreaga populație, pornind de la un eșantion,
poartă numele de inferență statistică. Atunci când cercetăm un eșantion, presupunem că ceea
ce observăm este caracteristic pentru întreaga populație. Dacă presupunerea este corectă,
concluziile obținute din analiza sondajului sunt valabile și pentru întreaga populație
120
(colectivitate). Validitatea și acuratețea acestui proces depind de reprezentativitatea
eșantionului, iar inferența statistică se bazează pe principiile teoriei probabilităților.
Indicatorii calculați pe baza datelor dintr-o colectivitate totală se numesc parametri, iar
cei calculați pe baza unui eșantion, estimatori. Selecția statistică are ca scop estimarea
parametrilor colectivității totale, pe baza informațiilor culese și prelucrate statistic, folosind
principiile teoriei probabilităților. Pentru aceasta se vor parcurge două etape distincte:
- prima, denumită etapa descriptivă, constă în culegerea și prelucrarea informațiilor
referitoare la eșantion, respectiv calculul indicatorilor care-l definesc (media, dispersia etc.);
- a doua, denumită și inferența statistică sau extinderea indicatorilor eșantionului
asupra colectivității generale, în scopul caracterizării complete și cât mai exacte a colectivității
totale.
În cercetarea selectivă se folosesc noțiuni pereche și respectiv indicatori statistici
pereche, de exemplu: colectivitate generală - colectivitate de selecție; media colectivității
generale - media colectivității de selecție; dispersia colectivității generale - dispersia
colectivității de selecție etc.
Termenii populație (colectivitate generală) și eșantion sunt utilizați frecvent în
cercetarea statistică.
Colectivitatea generală, denumită colectivitate de bază sau populație, reprezintă
totalitatea unităților simple sau complexe care formează obiectul supus cercetării. Delimitarea
strictă în timp și spațiu a colectivității generale este obligatorie și nu constituie o decizie
statistică. Ea este o decizie pragmatică a cercetătorului, privind grupul de elemente care se
studiază și asupra cărora trebuie trase concluzii statistice.
Volumul colectivității generale se notează cu „N”, în cazul în care colectivitatea este
formată din unități simple, și cu „R” în cazul în care este formată din unități complexe.
În cazul caracteristicilor alternative, numărul unităților la care s-a răspuns afirmativ se
notează cu „M”.
Colectivitatea de selecție, denumită eșantion, reprezintă o parte a colectivității
generale de la care urmează să se culeagă și să se prelucreze informațiile în scopul inferenței
statistice.
Volumul colectivității de selecție se notează cu „n”, când este format din unități simple,
și cu „r” când este format din unități complexe. Pentru caracteristicile alternative, numărul
unităților la care s-a răspuns afirmativ se notează cu „m”. Volumul eșantionului poate varia de
la un element (unitate statistică) până la n-1 (r-1) unități statistice. Dintr-o colectivitate generală
se pot extrage mai multe eșantioane care diferă între ele ca volum și structură. Pentru acest
motiv indicatorii statistici ce caracterizează colectivitatea de selecție sunt variabile aleatoare
pentru care se pot stabili distribuții de frecvențe corespunzătoare față de media și dispersia
colectivității generale. Formulele de calcul al mediilor, dispersiilor și abaterilor medii pătratice
sunt prezentate în tabelul 5.1.
121
Tabel 5-1 Formule de calcul ale mediilor, dispersiilor și abaterilor medii pătratice
Caracteristică
Denumirea
nealternativă alternativă
indicatorilo
Colectivitatea Colectivitatea de Colectivitatea Colectivitatea de
r
generală selecție generală selecție
N n
Media xi x i
p
M
w
m
xo i 1
xi i 1
N n
N n
N
(x
N
(x i x 0 )2 i xi ) 2
p2 pq p(1 p) w2 w(1 w)
Dispersia 02 i 1
2 i 1
N i
n
Abatere
medie 0 02 i i2 p 2p w w2
pătratică
Reușita selecției statistice necesită o pregătire prealabilă pe baza unui plan care trebuie
să cuprindă decizii tehnice și organizatorice referitoare la: scopul cercetării statistice;
delimitarea populației care va fi cuprinsă în studiu; verificarea omogenității colectivității
generale; alegerea tipului și procedeului de selecție care va fi folosit; delimitarea unităților de
eșantionare; stabilirea cadrelor de eșantionare (a bazei de selecție) astfel încât selecția să fie
aleatoare; stabilirea metodelor adecvate de culegere și prelucrate a datelor; stabilirea
modalităților de verificare a semnificației indicatorilor și de interferență statistică.
Comparativ cu înregistrarea totală similară, cercetarea selectivă prezintă unele
avantaje:
- este mai operativă și mai economică, necesitând cheltuieli materiale și umane mai
reduse;
- informațiile sunt mai complete, erorile de înregistrare mai puține și ușor de înlăturat,
deoarece n<N;
- programul de cercetare poate fi mai amplu, mai consistent, se pot aplica mai multe
teste de verificare și se poate acorda mai multă atenție redactării și analizei;
- se poate folosi cu rezultate mai bune în studiul fenomenelor social-economice
complexe pentru care observarea totală ar fi dificil de realizat și ar necesita cheltuieli bănești
ridicate. De exemplu, studiul veniturilor și cheltuielilor bănești ale populației se realizează prin
anchetele integrate în gospodării, bazate pe un eșantion reprezentativ de familii de muncitori,
țărani, pensionari etc.;
- poate fi folosită în cazuri în care cercetarea totală ar fi imposibil de realizat (de
exemplu în studiul statistic al calității mărfurilor fără să ducă la distrugere întregului lot);
- se mai poate utiliza în testarea unei ipoteze statistice legate de cerea de mărfuri pentru
produse noi lansate pe piață.
Avantajele prezentate sunt completate cu altele sesizate mai „discret” care pe ansamblu,
în timp, au determinat extinderea ariei de investigare în toate sectoarele de activitate. Evoluția
rapidă a numărului cercetărilor ultimelor două decenii au condus la fundamentarea unor decizii
la nivelul tuturor domeniilor de activitate.
Evidențierea avantajelor reflectă larga paletă de aplicabilitate care se manifestă atât la
nivelul sectoarelor private, cât și a celor publice. Vizând aspectele vieții politice, sociale,
economice, culturale, studiile sunt întreprinse pornind de la nivelul unei gospodării, până la
organisme guvernamentale, nonguvernamentale și instituții. Totodată, acestea conturează un
122
sistem motivațional care justifică la nivel mondial gradul ridicat de aplicabilitate și atenția
deosebită îndreptată spre utilizarea intensă a acesteia.
Aria largă de utilizare conduce la o poziție permisivă a cercetării selective îndreptată
spre investigarea teoretico-analitică și practică, având la bază operațiuni de: studiere,
cunoaștere, verificare, control, estimare etc. Rezultatele privind opiniile persoanelor
intervievate sau a elementelor implicate în studii conduc la informații interesante privind latura
umană, economică, politică.
Debutul îl au aspectele privind populația, care sunt evidențiate pe diverse categorii (sex,
vârstă etc), pe medii de proveniență, pe regiuni de dezvoltare, cuprinzând elemente care pot
viza:
- mișcarea naturală și migrația populației privind evaluarea fluctuațiilor forței de muncă;
- evoluția nivelului, structurii forței de muncă și a condițiilor de muncă pentru stabilirea
legăturilor operative între producători și consumatori;
- veniturile pe gospodării și salariat, cheltuielile și consumul populației în vederea
comensurării activităților vânzărilor de mărfuri și servicii;
- sănătatea, securitatea și asistența socială pentru evidențierea cauzelor primordiale de
influență cu impact semnificativ asupra stabilirii nivelului de trai;
- educația, cultura și sportul reflectând acceptarea sau respingerea unor factori
motivaționali;
- nivelul prețurilor în circuitul mediului social și al pieței;
- condițiile de locuit și de trai sub impactul vieții publice și al măsurilor administrative, a
ridicării gradului de înzestrare a familiilor cu bunuri.
Aspectele rezultatelor cercetării selective din activitățile altor domenii pot include:
- industria și construcțiile sub impactul măsurării consumului de materii prime, a calității
produselor;
- agricultura și silvicultura în interfață cu evaluarea suprafețelor, materiilor prime, a
rezultatelor activităților agricole;
- investițiile și imobilizările corporale în raport cu sursele de finanțare, formele de
proprietate, activitățile economiei naționale în contextul comensurării fluctuațiilor
pieței;
- transporturile, poșta și telecomunicațiile care permit stabilirea unor interdependențe
operative între partenerii implicați în aplicarea unor noi metode de tranzacționare și
comercializare în vederea satisfacerii cererii și ridicării gradului de solicitudine a
populației;
- tranzacțiile și schimburile comerciale sub spectrul satisfacerii cererii populației la
standarde ridicate ca urmare a aplicării unor metode moderne de vânzare și a unor noi
modalități de apreciere a preferințelor consumatorilor;
- serviciile și turismul a căror piață poate fi caracterizată complex pornind de la aprecierea
mediului și nivelului de trai, precum și a motivațiilor comportamentale sociale;
- politica și justiția care vin să completeze indicatorii de comensurare a atitudinii
oamenilor cu privire la diferite aspecte politice (exemplu: alegerea președintelui țării) și
sociale.
Datorită avantajelor sale, care o fac mult mai operativă și eficientă decât observarea
totală, se mai poate folosi și în cazul organizării unei observări totale de mare amploare ca
mijloc de control al acesteia.
În condițiile în care avantajele reprezintă punctele tari ale cercetării selective, teoria și
practica permit stabilirea punctelor slabe sub forma adversității acesteia.
Procesul derulării cercetării selective se confruntă cu dificultăți în privința constituirii
eșantionului și apariția erorilor de eșantionare. Constituirea eșantionului se bazează pe
necesitatea îndeplinirii condițiilor de reprezentativitate, problematica vizând populația de
123
referință. Dimensionarea acestei populații prin enumerare și definirea ei prin însușirile unităților
elementare de a avea una sau mai multe caracteristici reprezintă elemente „sensibile” în
constituirea eșantioanelor.
Respectarea proprietăților procedeelor de selecție și a caracteristicilor esențiale
corespunzătoare erorilor de eșantionare reprezintă atuuri în planul depășirii limitelor cercetării
selective și transformarea lor în avantaje cu impact semnificativ asupra deciziilor vizate la
nivelul fiecărui domeniu de activitate la care este aplicată.
124
- alegerea preferențială, din comoditate sau interes a unităților din eșantion;
- alegerea la nimereală (nu la întâmplare) a unităților.
Erorile întâmplătoare de reprezentativitate sunt legate strict de specificul sondajului și
apar chiar dacă se respectă principiile teoriei selecției pentru a forma eșantionul. Ele sunt legate
de însăși esența sondajului, adică prin numărul mic de unități din eșantion nu se poate reproduce
identic - decât întâmplător - structura colectivității generale. Înregistrarea totală cuprinde toate
unitățile colectivității, care au stat sub influența cauzelor esențiale și neesențiale, obiective și
întâmplătoare. Deci, erorile întâmplătoare de reprezentativitate sunt inevitabile, deoarece
sondajul, prin natura sa, nu ține seama de rolul jucat de toate cauzele neesențiale în evoluția
caracteristicii cercetate. Erorile întâmplătoare de reprezentativitate nu se pot înlătura, ci se pot
calcula anticipat și chiar limita. Inferența statistică este făcută sub presupunerea că erorile
întâmplătoare există și cele sistematice sunt absente.
În practică, erorile întâmplătoare sunt cunoscute ca erori efective și erori probabile.
Erorile efective de reprezentativitate s-ar putea calcula - numai pentru acele
caracteristici la care s-au înregistrat date printr-o observare totală - ca diferența între media
eșantionului și media colectivității totale. Eroarea efectivă de reprezentativitate stă la baza
verificării reprezentativității eșantionului în raport cu structura colectivității totale. Verificarea
se face prin compararea structurii pe grupe a colectivității de selecție cu cea a colectivității
generale, denumită și structură programată. Reprezentativitatea se poate verifica prin
coeficientul de reprezentativitate (dx%) calculat ca raport între eroarea efectivă de
reprezentativitate (dx) și media colectivității generale ( x0 ). Dacă media generală nu este
cunoscută, se efectuează mai multe selecții succesive și se calculează media mediilor de selecție
( x ). În acest caz, eroarea efectivă de reprezentativitate se va calcula după formula:
d x x x d x % (( x x) / x)100 (5.1)
Dacă nu se pot calcula erorile întâmplătoare efective, calcularea anticipată a erorilor de
reprezentativitate, precum și întreaga teorie a selecției, se bazează pe principiile teoriei
probabilităților și ale statisticii matematice, ceea ce conduce la stabilirea erorilor probabile.
În practică, la formarea eșantionului se folosesc mai multe modalități dintre care mai
des întâlnite sunt cele cunoscute sub numele de selecții aleatoare, selecții subiectiv organizate
sau dirijate și selecții mixte.
Selecțiile aleatoare (întâmplătoare) constituie modelul de bază utilizat pentru
asigurarea reprezentativității. Ele se bazează pe principiul tragerii la sorți și exclud orice
element subiectiv în formarea eșantionului. În selecțiile dirijate, alegerea unităților se face de
către persoanele care culeg datele, dar se folosesc mai rar în practică. Selecția mixtă combină
principiile selecției întâmplătoare cu cele ale selecției dirijate. În acest caz, se împarte
colectivitatea în grupe tipice după o anumită caracteristică, și apoi se extrag la întâmplare unități
din fiecare grupă.
Concret, stabilirea eșantionului în selecțiile aleatoare se realizează prin: procedeul
tragerii la sorți, procedeul cu numere întâmplătoare, procedeul selecției mecanice.
Procedeul tragerii la sorți presupune extragerea dintr-o urnă a unor bile, discuri, bilete
care reprezintă câte o unitate a colectivității generale. Schema de extragere din urnă se face
prin: procedeul selecției repetate sau a bilei revenite și procedeul selecției nerepetate sau a bilei
nerevenite.
În cazul procedeului bilei revenite, probabilitatea fiecărei unități de a fi selectată rămâne
constantă (p=1/N) tot timpul cât durează selecția. La închiderea operației, în urnă vor rămâne
N-1 unități.
Prin procedeul bilei nerevenite, probabilitățile sunt variabile și cresc pe măsura formării
eșantionului, mărind astfel șansa unităților de a fi selectate.
(p1=1/N; p2=1/(N-1), p3=1/(N-2)…pn=1/(N-(n-1)), (5.2)
125
Rezultă, în acest caz, că în urnă rămân la sfârșit N-n unități. Acest procedeu exclude
posibilitatea extragerii de mai multe ori a aceleiași unități, ceea ce duce la creșterea gradului de
precizie.
Procedeul cu numere întâmplătoare se bazează pe tabelele cu numere întâmplătoare.
Modul de folosire a tabelului cu numere întâmplătoare este simplu. Dacă avem de ales 100 de
unități dintr-o bază alcătuită din 1000 de unități statistice, le vom numerota de la 000 la 999.
Dintr-un tabel cu numere întâmplătoare vom citi primele 100 de numere alcătuite din trei cifre
(sau vom citi primele trei cifre din 100 de numere, eliminând repetările). Tabela se va citi de
sus în jos, pe coloane sau pe linii, ordinea considerată neavând importanță, deoarece numerele
ce figurează în tabel sunt scrise pe baza ipotezei hazardului și a independenței unui număr de
altul. Singura regulă este de a fixa procedeul de citire înainte de a începe efectiv citirea
numerelor.
Procedeul selecției mecanice se folosește după ce unitățile se ordonează după o
caracteristică oarecare neesențială (denumirea străzii, ordinea alfabetică etc.) și sunt înscrise
într-o listă. Formarea eșantionului este precedată de stabilirea pasului de numărare (k) calculat
după formula k = N/n, care împarte colectivitatea totală în grupe de volum egal. Prin tragerea
la sorți se selectează la întâmplare o unitate din prima grupă la care se adaugă succesiv pasul
de numărare până la obținerea celor "n" unități.
Selecțiile dirijate și cele mixte se folosesc în general în sondajele de opinie, în cercetări
cu caracter sociologic și în studiul cererii de consum a populației.
Pornind de la legea numerelor mari, formulată de J. Bernoulli cu privire la relația
dintre probabilitatea "p" și frecvența relativă "ni" , precum și de la inegalitatea Bienayme-
Cebâșev, se poate demonstra că, media de selecție estimează corect media colectivității
generale. Adică, se poate demonstra că, dacă volumul de sondaj este suficient de mare, mediile
de selecție au o distribuție normală de medie x0 (media colectivității generale). Dacă se
formează toate eșantioanele posibile, folosind tragerea la sorți prin procedeul bilei revenite,
numărul lor este egal cu Nn, iar prin procedeul bilei nerevenite va rezulta:
N!
C Nn (5.3)
n!( N n)!
Fiecare eșantion va fi definit de o medie și de o dispersie, calculabile pentru fiecare
caracteristică înregistrată. Acestea se vor abate în plus sau în minus de la media și dispersia
colectivității generale. Eroarea de selecție este deci o variabilă aleatoare, calculată ca diferența
dintre media de selecție (pentru fiecare eșantion) și media generală.
În practica, se lucrează doar cu un singur eșantion, dar nu se poate ști ce eroare de
selecție va apărea. Pentru acest motiv se folosește eroarea medie de reprezentativitate. Eroarea
medie se calculează ca abatere medie pătratică a tuturor mediilor de selecție posibile față de
media colectivității generale, notată cu x după formula:
k
(x xi o ) 2 ni
(5.4)
x i 1
n i
unde:
x i = medii de selecție posibile;
ni = frecvența mediilor de selecție posibile;
k = numărul eșantioanelor posibile după procedeul bilei revenite.
Frecvența de apariție a fiecărei medii de selecție luată ca frecvență relativă are tendința
de a coincide cu probabilitatea de producere a erorii față de media colectivității generale. Pentru
126
o anumită valoare a raportului n/N, fiecărei medii de selecție îi corespunde o probabilitate bine
determinată, în funcție de abaterea respectivă x i x 0 .
Rezultă că mărimea și probabilitatea de apariție a fiecărei medii de selecție sunt în
funcție de mărimea eșantionului (n); cu cât acesta din urmă va fi mai mare, cu atât media de
selecție va fi un estimator mai corect al mediei generale. Aceasta corespunde legii numerelor
mari formulate de J. Bernoulli, conform căreia probabilitatea ca diferența în valoare absolută
dintre frecvența relativă ni și probabilitatea (p) de producere a unui eveniment să fie mai mică
decât un număr pozitiv și arbitrar tinde către 1 când volumul eșantionului tinde către infinit,
adică:
lim.P| ni - p|< ε = 1 oricare ar fi ε > 0 (5.5)
Dacă volumul eșantionului este suficient de mare (de volum normal sau mediu n > 40
unități), media de selecție se distribuie după curba normala a lui Gauss-Laplace de medie x o și
2
dispersie .
n
Distribuția normală este o distribuție teoretică simetrică în care cea mai mare
probabilitate de apariție o are acea medie de selecție care coincide cu media colectivității
generale și pentru care eroarea de selecție este egală cu zero. De o parte și de alta a probabilității
maxime, mediile de selecție, erorile de selecție posibile și probabilitățile lor de apariție descresc
proporțional și simetric. Probabilitățile de apariție scad pe măsură ce cresc erorile de selecție în
aceleași unități de măsură ca și caracteristica cercetată. Pentru a permite comparabilitatea pentru
orice variabilă numerică, erorile se vor exprima în abateri normale, adică:
xi x0
zi (5.6)
x
Pentru distribuția normală a mediilor și erorilor de selecție, trebuie stabilit intervalul de
încredere, nivelurile de siguranță și pragurile de semnificație (vezi tabelul 5.2).
Grafic, distribuția normală a erorilor de reprezentativitate pentru o selecție aleatoare de
"n" unități se face pe baza curbei normale, Gauss-Laplace.
Tabel 5-2
Nivelul de siguranță Pragul de semnificație
Interval de încredere
% %
x x0 x 68,26 31,74
127
5.3 INDICATORII PRINCIPALELOR TIPURI DE SELECȚIE UTILIZATE ÎN
CERCETAREA ACTIVITĂȚII SOCIO-ECONOMICE
generale x și volumul eșantionului (n), verificabilă în cazul selecției întâmplătoare repetate,
2
adică:
02 n x2 (5.7)
02
x (5.8)
n
Se observă că eroarea medie de selecție este direct proporțională cu dispersia și invers
proporțională cu volumul eșantionului (n). Pentru calculul erorii medii de selecție, dispersia
totală se poate lua dintr-o cercetare statistică anterioară similară, dacă condițiile evoluției
fenomenului cercetat nu s-au schimbat de la o perioadă la alta. Dacă nu se cunoaște dispersia
totală, ea se înlocuiește cu dispersia eșantionului i când volumul acestuia este suficient de
2
128
i2
x (5.10)
n
În cazul selecției nerepetate (în care unitățile deja extrase nu mai participă la formarea
eșantionului) numărul de eșantioane posibile este mai mic, câmpul de variație a erorilor de
reprezentativitate se micșorează. Se poate scrie:
02 n x2 (5.11)
Din practica sondajului s-a văzut că există un raport de proporționalitate între dispersia
mediilor de selecție posibile față de media colectivității generale și volumul colectivității totale
după ultima extragere:
x2 nerepetat N n
(5.12)
x2 repetat N 1
Se constată că x nerepetat x repetat
2 2
N n
Raportul poartă denumirea de coeficient de corecție al erorilor în cazul folosirii
N 1
procedeului bilei nerevenite.
Dacă volumul colectivității generale este foarte mare iar selecția are la bază unități
simple, se poate renunța la 1 din numitorul coeficientului de corecție și formula de calcul al
erorii medii de selecție devine:
02
n i2 n
x 1 1 (5.13)
n N n N
Într-un sondaj fără revenire, eroarea medie de reprezentativitate este, așa cum s-a arătat,
mai mică față de sondajul cu revenire. Totuși, această reducere este neglijabilă dacă n este foarte
mic în raport cu N. Din contra, dacă se extrag toate unitățile din colectivitate, coeficientul de
corecție devine 0 și eroarea medie de reprezentativitate devine și ea, 0.
Formulele prezentate anterior se folosesc și în cazul selecției întâmplătoare repetate și
nerepetate pentru o caracteristică nealternativă.
Pentru caracteristica alternativă, eroarea medie de selecție, w , se va calcula astfel:
p 1 p w 1 w
w pentru selecția repetată (5.14)
n n
p 1 p n w 1 w n
w 1 1 pentru selecția
n N n N (5.15)
nerepetată
Eroarea medie limită x se calculează ca o abatere între media de selecție și media
colectivității generale garantată cu suma probabilităților corespunzătoare intervalului de
variație, după formula:
x z x pentru caracteristica nealternativă (5.16)
z pentru caracteristica alternativă
w w
(5.17)
Eroarea medie limită se poate mări sau micșora fie prin modificarea volumului
eșantionului (n), fie prin modificarea probabilității cu care se garantează rezultatele, deoarece
dispersia colectivității totale rămâne aceeași.
129
Coeficientul de probabilitate "z" este direct proporțional cu eroarea medie limită și
invers proporțional cu eroarea medie de reprezentativitate. Din relația x z x (pentru
caracteristica nealternativă) rezultă că:
z x (5.18)
x
Funcția de probabilitate este direct proporțională cu mărimea coeficientului "z".
În mod normal, creșterea probabilității se manifestă prin mărimea intervalului de
încredere, ceea ce duce la o precizie mai scăzută a rezultatelor. Se observă că, pe măsură ce
crește probabilitatea, scade precizia și invers. Rezolvarea acestei probleme are o soluție, și
anume, în condiții de probabilitate, creșterea preciziei rezultatelor se obține prin mărirea
volumului de selecție.
Exemplul 5.1
Tabel 5-3
Volumul vânzărilor (mii lei) Nr. societăți
Xi ni
80-100 9
100-120 15
120-140 21
140-160 18
160-180 7
Total 70
Nota: limita inferioară inclusă în interval
Rezolvare:
• Deoarece nu cunoaștem dispersia dintr-o cercetare totală anterioară, vom folosi
dispersia de selecție pentru calculul erorii medii și erorii limită.
• Efectuând calculele aferente mediei eșantionului și dispersiei acestuia se obțin:
130
xi 130 mii lei/societate com. și i2 554
• Pentru exemplificarea calculelor și în cazul unei caracteristici alternative, împărțim
colectivitatea în două grupe în funcție de poziționarea unităților față de media
calculată.
25
w=70 = 0,35 w2 =0,35*(1-0,35)= 0,2275
• Ne propunem să calculăm indicatorii de selecție ( x și x , respectiv, w și w ) în
condițiile în care rezultatele vor fi garantate cu o probabilitate P=0,95 la care
corespunde z = 1,96.
Pentru o selecție repetată:
i2 554
x 2,81 mii lei / soc. com.
n 70
x z x 2,81*1,96 5,51 mii lei / soc. com.
i2 N n 554 467 70
x 2,59 mii lei / soc. com.
n N 1 70 467 1
x z x 2,59 *1,96 5,07 mii lei / soc. com.
• Se poate aprecia, pe baza probabilității cu care se garantează rezultatele, că în 95 de
cazuri din 100 posibile, media de selecție se va abate de la volumul vânzărilor din
colectivitatea generală cu cel mult ±5,51 mii lei în cazul în care eșantionul s-a
construit după procedeul selecției repetate și ±5,07 mii lei când eșantionul s-a format
după procedeul selecției nerepetate.
• Eroarea medie și eroarea limită a greutății specifice a societăților comerciale cu un
volum al vânzărilor mai mare decât media (în cazul caracteristicii alternative) vor fi:
selecția repetată
w 1 w 0,2275
w 0,057
n 70
w z w 0,057 *1,96 0,1117
selecția nerepetată
w 1 w N n 0,2275 467 70
w 0,053
n N 1 70 467 1
w z w 0,053 *1,96 0,1039
• Deci, greutatea specifică a societăților comerciale care obțin un volum al vânzărilor
mai mare decât media, se va abate într-un sens sau altul cu ±11,17% în cazul selecției
repetate și cu ±10,39% în cazul selecției nerepetate, rezultatele fiind garantate cu
aceeași probabilitate de 0,95.
• Rezultatele obținute evidențiază faptul că în cazul selecției nerepetate erorile sunt mai
mici. Ca urmare a acestui fapt intervalul de încredere pentru estimarea parametrilor
131
colectivității generale va fi mai mic, deci rezultatele vor avea un grad de precizie mai
ridicat atât pentru caracteristica nealternativă cât și pentru cea alternativă.
• Astfel, vom obține următoarele intervale de încredere pentru
selecția repetată
xi x xo xi x
130 5,51 xo 130 5,51
124,49 xo 135,51mii lei / soc. com.
selecția nerepetată
xi x xo xi x
130 5,07 xo 130 5,07
124,93 xo 135,07 mii lei / soc. com.
selecția nerepetată
467
467 *124,93 x i 467 *135,07
i 1
467
58342,31 mii lei x i 63077,69 mii lei
i 1
• Proporția societăților care au realizat un volum al desfacerilor mai mare decât media,
în colectivitatea generală, se va situa între următoarele valori pentru:
selecția repetată
w w p w w
0,35 0,1117 p 0,35 0,1117
0,2383 p 0,4617
selecția nerepetată
0,35 0,1039 p 0,35 0,1039
132
0,2461 p 0,4539
• În continuare să se considere necesar reluarea cercetării și, astfel, să se determine
volumul necesar pentru proiectarea noului sondaj dacă rezultatele se garantează cu
aceeași probabilitate iar eroarea limită se micșorează de 1,5 ori.
• Aplicând formulele de calcul vom obține pentru:
selecția repetată
𝑧 2 𝜎𝑖2 1,962 ∗ 554
𝑛′ = 2 = = 158 societăți comerciale
∆ 5,51 2
( 𝑥) ( )
1,5 1,5
selecția nerepetată
𝑧 2 𝜎𝑖2 1962 ∗ 554
𝑛′ = 2 = = 133 societăți comerciale
∆ 𝑧2𝜎 2 5,07 2 1962 ∗ 554
( 𝑥 ) + 𝑁𝑖 ( ) +
1,5 1,5 467
Una dintre căile de mărire a preciziei eșantionului simplu aleator este creșterea
dimensiunilor sale. O altă metodă de mărire a preciziei este stratificarea.
Selecția tipică se aplică cel mai frecvent în studiul fenomenelor social-economice care,
în prealabil, au fost împărțite în grupe omogene (straturi sau tipuri de unități) - după o
caracteristică esențială - notate cu N1,N2,...,Nr și reprezentate în sondaje prin volumul
subeșantioanelor n1 , n 2 ,..., n r .
Stratificarea presupune divizarea populației (colectivității generale) în "straturi" cât mai
omogene, cu caracteristici cât mai asemănătoare, astfel încât unitățile statistice din interiorul
fiecărui strat să prezinte, cel puțin din punct de vedere teoretic, caracteristici comune. Prin
creșterea omogenității, împrăștierea din interiorul diverselor straturi este sensibil inferioară față
de împrăștierea totală a populației. Apoi este ales la întâmplare un eșantion din interiorul
fiecărui strat.
Selecția tipică asigură astfel reprezentarea exactă a diferitelor straturi ale populației în
eșantion. Dacă grupele în care a fost împărțită colectivitatea sunt omogene, mediile de grupă (
xi )au valori apropiate de valorile individuale din care s-au calculat, abaterile într-un sens sau
altul sunt mici, iar gradul de variație este mic.
În acest caz, variația mediilor de selecție posibile va fi în funcție de variația fiecărei
grupe, măsurată prin dispersiile de grupă ( i ), și sintetizată prin media dispersiilor parțiale (
2
2 ). Deci, pentru calculul erorilor medii de sondaj se va folosi media dispersiilor de grupă din
colectivitatea totală ( )sau cea din colectivitatea de selecție ( i ). Media dispersiilor de
2 2
grupă astfel:
0
2 i20 N i
(5.22)
Ni
133
n 2
respectiv: , i 1, r
2 i i
(5.23)
n
i
i
unde ”r” este numărul grupelor din colectivitatea generală sau cea de selecție. Media de selecție
( x ) se va calcula ca o medie aritmetică ponderată a mediilor subeșantioanelor,
respectiv: x
x ni i
, i 1, r (5.24)
n i
În scopul creșterii preciziei datorate stratificării, trebuie să existe o legătură cât mai
puternică între criteriul care servește stratificării și variabila studiată.
Prin intermediul stratificării, cercetătorul are siguranța că diferitele straturi vor fi
reprezentate în eșantion, reducând astfel jocul șansei asupra compoziției sondajului. În acest
mod, variația între straturi nu va influența eroarea de reprezentativitate, deoarece această
variație este precis reflectată în eșantion. În calculul erorii medii de reprezentativitate va intra
numai împrăștierea din interiorul straturilor.
Din regula de adunare a dispersiilor, media dispersiilor parțiale este o componentă a
dispersiei totale, adică:
02 02 2 , i 1, r (5.25)
ceea ce înseamnă că 0 0 . Rezultă că, în cazul selecției tipice, eroarea medie de selecție
2 2
iar structura pe grupe este aceeași atât în colectivitatea generală cât și în colectivitatea
de selecție.
Selecția tipică optimă este acea selecție în care, la formarea eșantionului se ia în
considerație ponderea grupelor în colectivitatea generală și mărimea variației din interiorul
grupelor măsurată prin abaterea medie pătratică. Volumul subeșantioanelor pe grupe (ni) se va
calcula după relația:
N i i 0
ni n , i 1, r
N i i 0 ,
(5.28)
unde:
Ni = numărul unităților pe grupe din colectivitatea totală;
i 0 = abaterea medie pătratică pe grupe ale colectivității totale.
Ținând seama de particularitățile unui sondaj tipic, indicatorii de selecție se vor calcula
folosind media dispersiilor parțiale, respectiv:
134
a) pentru caracteristica nealternativă:
- selecția repetată:
2 2
0 i
x (5.29)
n n
- selecția nerepetată:
2 2
0 n i n
x 1 1 (5.30)
n N n N
Exemplul 5.2
Tabel 5-4
Volumul vânzărilor (Yi)
80-100 100-120 120-140 140-160 160-180 Total
Nr. salariați (Xi)
<9 8 12 12 8 40
>9 1 3 9 10 7 30
Total 9 15 21 18 7 70
Rezolvare:
Se calculează mediile de grupă, mediile producțiilor pentru cele două grupe de
vechime evidențiate:
r
y
j 1
i nij
yi r
n
j 1
ij
135
90 1 110 3 130 9 150 10 170 7
y2 142,67 mii lei/soc. com.
30
Media mediilor de grupă:
y n
y n 120 40 142,67 30
i i
129,71 130 mii lei/soc. com.
70 i
Dispersiile de grupă
2
∑6𝑗=1(𝑦𝑗 − ̅̅̅)
𝑦1 𝑛1𝑗
𝜎12
= =
∑ 𝑛1𝑗
(90 − 120)2 ∗ 8 + (110 − 120)2 ∗ 12 + (130 − 120)2 ∗ 12 + (150 − 120)2 ∗ 8
= 420
40
2
∑6𝑗=1(𝑦𝑗 −𝑦
̅̅̅2̅) 𝑛2𝑗
𝜎22 = ∑ 𝑛2𝑗
=
(90−142,67)2 ∗1+(110−142,67)2 ∗3+(130−142,67)2 ∗9+(150−142,67)2 ∗10+(170−142,67)2 ∗7
=
30
439,56
2
n i
2
i
420 40 439,56 30
428,38
n
i
i 70
Eroarea medie de reprezentativitate (𝜎𝑦̅ )
̅̅̅̅
𝜎2 𝑛 428.38 70
𝜎𝑦̅ = √ 𝑛𝑖 (1 − 𝑁) = √ (1 − 467) = 2,281 mii lei/soc. com.
70
y
y
y y 0
y
- de unde:
136
467
58622,51 mii lei xi 62797,49 mii lei
i 1
Să se considere necesar reluarea cercetării și, astfel, să se determine volumul necesar
pentru proiectarea noului sondaj dacă rezultatele se garantează cu aceeași
probabilitate iar eroarea limită se micșorează de 1,5 ori.
𝑧 2 ̅̅̅̅
𝜎𝑖2 1,962 ∗428.38
𝑛′ = 2 ̅̅̅̅
2
= 4,47 2 1,962 ∗428.38
≈133 societăți comerciale
∆𝑥 𝑧2 𝜎 ( 1,5 ) +
( 1,5 ) + 𝑁 𝑖 467
Se folosește când colectivitatea generală este formată din unități complexe numite și
serii (echipe, societăți comerciale etc.). Unitățile complexe sunt formate la rândul lor din unități
simple ce posedă caracteristici (însușiri) ce le deosebesc una de alta, au caracter eterogen, în
raport cu unitățile componente ale grupelor tipice care se caracterizează prin omogenitate.
Constituirea eșantionului se face prin procedeele cunoscute, selectând unități complexe sau serii
întregi de unități simple.
Caracteristic pentru acest tip de selecție este faptul că, în locul variantelor concrete ale
caracteristicilor de la sondajele bazate pe unități simple, se vor folosi indicatori de selecție
calculați la nivelul seriei. Cerința reprezentativității se va asigura prin apropierea mediilor din
seriile de unități selectate de mediile colectivității generale. Mediile de serii x s se calculează
prin formula mediei aritmetice simple sau ponderate și servesc la estimarea mediei de sondaj.
Eșantionarea făcându-se pe bază de serii, numărul acestora se va nota cu "r" în
colectivitatea de selecție și cu "R" în colectivitatea totală.
Abaterile dintre mediile seriilor selectate și media de sondaj se măsoară sintetic prin
dispersia dintre serii . Deci, în acest tip de sondaj dispersia dintre serii înlocuiește dispersia
2
generală 0 din sondajul simplu și, ca atare, erorile de reprezentativitate vor fi mai mici sau
2
02 (5.33)
Rr
Coeficientul de corecție finită va fi , nu se mai renunță la "1" de la numitor,
R 1
deoarece el reprezintă o serie ca unitate complexă.
Dispersia dintre serii o vom nota cu x (pentru caracteristica nealternativă) și cu w
2 2
(pentru caracteristica alternativă). Ea reflectă variația dintre mediile seriilor selectate și media
pe întregul eșantion și se calculează după una din formulele:
x
2
i xs
2
x (5.34)
r
137
x x n
2
i s
2
i
(5.35)
n
x
i
unde:
r = numărul seriilor selectate;
ni = numărul unităților simple din fiecare serie.
Pentru verificarea greutății medii a unui produs s-a organizat un sondaj de 10%
dintr-un lot de 1000 de produse ambalate în cutii de câte 10 bucăți. În urma
măsurării greutății produselor din fiecare cutie (serie) s-a calculat greutatea
medie exprimată în grame
Tabel 5-5
Nr. crt. Greutate medie
𝒙𝒔 𝟐
(𝒙̅𝒊 − ̅̅̅)
al seriei (𝒙̅𝒊 )
1. 1524 26896
2. 1741 2809
3. 1615 5329
4. 1722 1156
5. 1810 14884
6. 1755 4489
7. 1685 9
8. 1589 9801
9. 1665 529
10. 1774 7396
Total 16880 73298
Rezolvare:
• Cutiile (seriile) având aceeași dimensiune, pentru calculul mediei pe total se va
folosi relația mediei aritmetice simple
xs
x i 16880
1688 g. / produs
r 10
• Pentru calcularea erorii medii este necesară calcularea dispersiei dintre serii
xs x xo xs x
de unde:
1688 50,59 xo 1688 50,59
1637,41 xo 1738,59 g. / produs
138
5.4 EXTINDEREA REZULTATELOR SELECȚIEI ASUPRA COLECTIVITĂȚII
GENERALE
x x N
N
N x x i x (5.40)
i 1
N
N w w M i w w N (5.41)
i 1
139
5.5 APLICAȚII
Rezolvare
Cerința nr. 1
2 152
x 1,74 buc/salariat
n 50
x 1,74∙2 = 3,48. Deoarece producția este o caracteristică statistică cu variație
discretă (discontinuă), se va rotunji rezultatul obținut la valoarea întreagă 4.
140
Interpretare: Se garantează cu o probabilitate de 95,45% o eroare maximă între media
producției descoperită la nivelul eșantionului și media producției realizată la nivelul întregii
colectivități de salariați, în cazul unei extrageri nerepetate, de 3 buc/ salariat.
Cerința nr. 2
2 2 152
n 85,14 .
2 2 152
2,17
2
250
Fiind vorba despre un număr de salariați, va trebui sa rotunjim rezultatul la 85 persoane,
eșantion necesar a fi extras pentru a se garanta cu o probabilitate de 95,45% o eroare maximă
admisibilă de 2,17 buc/salariat.
De reținut!
Rezultatele obținute dintr-o cercetare selectivă pot fi extinse la întreaga colectivitate, dacă
eșantionul este reprezentativ. Un eșantion este considerat reprezentativ atunci când structura
colectivității de selecție este identică cu structura colectivității generale sau diferă foarte puțin
de aceasta.
Eroarea reprezintă diferența dintre valoarea indicatorilor obținuți în urma prelucrării datelor
din eșantion și valoarea acelorași indicatori obținuți în urma observării totale.
141
Aplicații propuse
Aplicația 5.1
Distribuția unui eșantion de unități comerciale (selectat întâmplător și nerepetat, de
volum 10% din colectivitatea generală), după valoarea desfacerilor lunare, se prezintă astfel:
Tabel 5-6
Intervale de variație a Nr. unități comerciale
desfacerilor (mii. lei)
<10 5
10-20 10
20-30 18
30-40 32
40-50 20
50 și peste 15
Total 100
Se cere:
Să se estimeze limitele între care se va încadra valoarea totală a desfacerilor de mărfuri
în întreaga rețea de unități comerciale, dacă rezultatele sunt garantate cu o probabilitate P =
0,9545, pentru care z = 2.
Aplicația 5.2
Ancheta cu privire la vârsta cititorilor rubricii de știri din economie a unui cotidian local
a condus la următoarele rezultate:
Tabel 5-7
Vârsta Nr persoane
(ani)
Sub 20 10
20 - 30 15
30-40 40
40-50 50
50 – 60 25
Peste 60 10
Total 150
Se cere:
a) Să se caracterizeze omogenitatea seriei de repartiție;
b) Considerând că cele 150 de persoane reprezintă un eșantion obținut prin extragere
simplă, aleatoare, nerepetată (N = 1000 persoane), să se estimeze cu o probabilitate P = 0,9545
(z = 2) limitele intervalului în care se încadrează vârsta medie a întregii populații statistice de
cititori;
c) Care este volumul eșantionului necesar a fi extras pentru o nouă cercetare pentru
care eroarea maximă admisibilă să se reducă cu un procent de 20% față de nivelul determinat
la cerința anterioară.
142
Aplicația 5.3
Distribuția a 40 de studenți după notele obținute la examenul de statistică în sesiunea de
examene din iunie 2012, se prezintă în felul următor:
Tabel 5-8
Grupe studenți după notele Număr studenți
obținute
Pana la 4 6
4,01-6 17
6,01 - 8 10
8,01 - 10 7
Total 40
Se cere:
a) Să se determine indicatorii tendinței centrale și să se interpreteze rezultatele;
b) Dacă presupunem că cei 40 de studenți constituie un eșantion reprezentativ format
simplu, aleator și nerepetat dintr-o colectivitate de 500 studenți, să se estimeze nota medie
corespunzătoare colectivității generale de 500 studenți, cu probabilitatea P = 0,9545 (z=2).
Aplicația 5.4
Într-o localitate, la nivelul unor gospodării, s-a efectuat un sondaj simplu repetat în
vederea stabilirii calității unui nou produs de întreținere (pastă de dinți). Dintre cele 400
persoane intervievate 280 sunt mulțumite de calitatea acestui produs.
Să se estimeze proporția persoanelor mulțumite de produs la nivelul tuturor
gospodăriilor localității în care a fost extras eșantionul (rezultatele se garantează cu o
probabilitate P = 0,95 pentru care z = 1,96).
Aplicația 5.5
Derularea unui studiu realizat pe un eșantion de 120 studenți, anul I, ai unei facultăți cu
profil economic, s-a bazat pe următoarea distribuție:
Tabel 5-9
Grupe studenți după Intervale de variație a vârstei studenților (ani)
mediul de proveniență 18-20 20-22 22-24 24-26 26-28 Peste 28
Rural 17 28 23 8 1 1
Urban 15 10 8 7 2 -
Se cere:
a) Să se estimeze intervalul de încredere al vârstei medii a studenților, având în vedere
că eșantionul reprezintă 20% din totalul studenților admiși în anul I și este format prin selecție
nerepetată, iar rezultatele se garantează cu o probabilitate P = 0,9973 (z = 3);
b) Estimați valoarea medie a vârstei studenților pentru persoanele care provin din
mediul rural;
c) Precizați care va fi volumul eșantionului în condițiile asigurării aceleiași precizii a
rezultatelor, dacă pentru cercetare ar fi necesară derularea unui sondaj aleator simplu nerepetat;
d) Să se precizeze procentul minim al studenților care au vârsta sub 24 ani.
143
TEMA DE CONTROL NR. 2
OBIECTIV: Prin intermediul TC2 studenții vor putea sa-si verifice cunoștințele
acumulate in cadrul întâlnirilor tutoriale, în vederea pregătirii examenului la disciplina
Statistica
CERINTE:
TC2 presupune realizarea unei analize statistice la nivelul unei colectivităţi statistice
formate din 300 de salariaţi din perspectiva veniturilor realizate în luna calendaristică
precedentă. Se presupune ca această colectivitate nu a putut fi analizată în totalitate, din cauza
resurselor fiinanciare şi umane limitate şi, astfel, s-a recurs la extragerea unui eşantion format
din 50 de persoane.
Datele statistice pe baza cărora se va face analiza vor fi generate individual de către
fiecare student cu ajutorul funcţie RANDOM NUMBER GENERATION din cadrul MS Excel.
Accesarea butonului Office (situat în partea stângă-sus a ferestrei Excel) > Excel options >
Add-Ins
Fig.: 1
144
Din lista afişată în fereastra nou apărută bifăm ANALYSIS TOOLPACK, apăsăm butonul OK
şi....aşteptăm să se instaleze.
Fig.: 2
Fig.: 3
145
-
Fig.: 4
3. Deoarece valorile generate nu vor fi în general valori numere întregi, pentru a obţine
acest lucru vom utiliza funcţia ROUND. Aceasta este disponibilă în pachetul de
formule MATH&TRIG
Fig.: 5
146
Pentru această funcţie, ca argumente, este necesar să precizăm valoarea ce dorim să fie
transformată şi numărul de zecimale la care dorim să fie transformată valoare (se va trece 0).
Sintaxa utilizată este ROUND (referinta_celula;numar_zecimale)
După realizarea transformării pentru prima valoare din listă, pentru aplicarea acestei
transformări şi restului de valori este necesar doar să aplicăm procedeul dragării.
O a doua modalitate de transformare a valorilor generate în valori întregi presupune
următoarele etape:
Selectarea serie de valori
Click dreapta şi alegerea opţiunii FORMAT CELLS...
Se alege opţiunea NUMBER şi în câmpul DECIMAL PLACES se va trece
valoarea 0.
Sarcini de realizat:
147
PRECIZARI:
• Referatul va fi redactat de mână.
• Referatul va fi predat î prin intermediul platformei e-learning si ulterior, la data
examenului, in format fizic. Pe platforma e-learning se va încărca o copie scanata a
referatului.
148
BIBLIOGRAFIE
1. Andrei T., Stancu S., Pele D.T. - Statistică. Teorie și aplicații, Ed. Economică, București,
2002.
2. Baron T., Biji E. - Statistică teoretică și economică, Ed. Didactică și Pedagogică, București,
1996.
3. Bădiță M., Baron T., Cristache S.E. - Statistică pentru afaceri în comerț – turism, vol. 1, 2,
Ed. Luceafărul, București, 2002.
4. Bădiță M., Baron T., Korka M. - Statistică pentru afaceri, Ed. Eficient, București, 1998.
5. Biji E.(coordonator) - Statistică teoretică și economică, Ed. Didactică și Pedagogică,
București, 1991.
6. Cristache, S.E. - Metode de calcul și analiză statistică a eficienței economice în Comerț, Ed.
ASE, București, 2003.
7. Cristache S.E., Șerban D. - Lucrări aplicative de statistică și econometrie pentru
administrarea afacerilor, Ed. ASE, București, 2007.
8. Gogonea RM., Zaharia M – Econometrie cu aplicații în activitatea de comerț-turism-
servicii,Editura Universitară, București, 2008.
9. Hapenciuc C.V. - Elemente de analiză și prognoză în turism, Ed. Junimea, Iași, 2004.
10. Hapenciuc C.V. - Cercetarea statistică în turism, Ed. Didactică și Pedagogică, București,
2003.
11. Isaic-Maniu A., Mitruț C., Voineagu V. - Statistică, Ed. Universitară, București, 2003.
12. Isaic-Maniu A., Mitruț C., Voineagu V., Statistica pentru managementul afacerilor,
ediția a II-A, Ed. Economică, București, 2000.
13. Isaic-Maniu A., Grădinaru A., Voineagu V., Mitruț C. - Statistică teoretică și economică,
Ed. Tehnică, Chișinău, 1994.
14. Jaba E. – Statistică, Ed. Economică, București, 1998.
15. Korka M., Begu L., Tușa E., Manole C. – Bazele statisticii pentru economiști, Ed. Tribuna
Economică, București, 2005.
16. Mitruț C., Șerban D. - Statistics for Bussiness Administration, Ed. ASE, București, 2003.
17. Novak, A. - Statistică – teorie, aplicații, exerciții, Ed. Sylvi, București, 2001.
18. Rotariu T., Iluț P. - Ancheta sociologică și sondajul de opinie, Ed. Polirom, Iași, 2001.
19. Secăreanu C., Gruiescu M. - Statistică. Concepte, metode și tehnici de bază, Ed.
Enciclopedică, București, 2007.
20. Șerban D. - Statistică pentru studii de marketing și administrarea afacerilor, Ed. ASE,
București, 2004.
21. Tővissi L., Isaic- Maniu A. - Statistică, Ed. ASE, București, 1994.
22. Trebici, V. - Mică enciclopedie statistică, Ed. Științifică și Enciclopedică, București,
1985.
23. Țarcă M., Țarcă V.– Elemente de statistică, Ed. Junimea, Iași, 2005.
24. Țarcă M. - Tratat de statistică aplicată, Ed. Didactică și Pedagogică, București, 1998.
25. Voineagu V, Țițan E., Șerban R., Ghiță S., Tudose D., Boboc C., Pele D. - Teorie și
practică econometrică, Ed. Meteor Press, 2007.
26. Wagner P. - Bazele statisticii, Ed. Universității Titu Maiorescu, București, 2005.
27. *** - Anuarul Statistic al României, 2010.
28. *** - https://statistici.insse.ro --- TEMPO-Online
149
Anexa 1
Distribuția normală.
x2
Funcția integrală a lui Laplace z
z 1 2
e dx
0 2
150
Distribuția normală
x2
Funcția integrală a lui Laplace z
z 1 2
e dx
0 2
(continuare)
151