Documente Academic
Documente Profesional
Documente Cultură
Reproducerea conţinutului acestei publicaţii, integrală sau parţială, în forma originală sau
modificată, precum şi stocarea într-un sistem de regăsire sau transmitere sub orice formă şi prin
orice mijloace sunt interzise fără autorizarea scrisă a autorului şi a Universităţii „Petru Maior” din
Tîrgu Mureş.
Utilizarea conţinutului acestei publicaţii, cu titlu explicativ sau justificativ, în articole, studii, cărţi
este autorizată numai cu indicarea clară şi precisă a sursei.
CUPRINS
Capitolul I.
Statistica şi cunoaşterea realităţii social-economice 5
I.1. Scurt istoric al dezvoltării statisticii 5
I.1.1. Organizarea statisticii în România 8
I.2. Obiectul de studiu şi metoda statisticii. 9
I.3. Concepte de bază utilizate în statistică 10
I.4. Cercetarea statistică 13
I.5. Observarea statistică. Controlul datelor statistice 14
Capitolul II.
Sistematizarea şi prezentarea datelor statistice 21
II.1. Sistematizarea datelor prin centralizare şi grupare 21
II.2. Serii statistice 28
II.3. Vizualizarea datelor statistice cu ajutorul tabelelor şi a 30
reprezentărilor grafice
II.4. Indicatori statistici rezultaţi din prelucrarea primară a 36
datelor
Capitolul III.
Analiza statistică a seriilor de distribuţie cu frecvenţe 45
III.1. Necesitatea analizei seriilor de distribuţie cu 45
frecvenţe
III.2. Indicatorii de frecvenţe 47
III.3. Indicatorii tendinţei centrale 48
III.3.1. Mediile 48
III.3.1.1 Media aritmetică 49
III.3.1.2. Proprietăţile mediei aritmetice 51
3
III.3.1.3. Media armonică 56
III.3.1.4. Media pătratică 57
III.3.1.5. Media geometrică 58
III.3.1.6. Media cronologică 59
III.3.2. Indicatorii medii de poziţie 60
III.4. Indicatorii variaţiei 65
III.4.1. Proprietăţile dispersiei 70
III.5. Analiza asimetriei repartiţiilor empirice 74
Capitolul IV.
Indicatori şi metode statistice de analiză a legăturilor 78
dintre fenomenele economico-sociale
IV.1. Prezentarea şi clasificarea legăturilor dintre 78
caracteristicile social-economice
IV.2. Identificarea legăturilor. Exprimarea formei 81
legăturilor.
IV.3. Metoda regresiei 85
IV.3.1. Modelul regresiei simple 85
IV.3.1.1. Modelul liniar 85
IV.3.1.2. Regresia simplă neliniară 88
IV.3.2. Modelul regresiei multiple 90
IV.4. Măsurarea intensităţii legăturilor. Metoda corelaţiei 91
Capitolul V.
Sondajul statistic 98
V.1. Concepte de bază 98
V.2. Tipuri de sondaje şi procedee de alcătuire a 99
eşantioanelor
V.3. Estimarea mediei şi dispersiei. Eroarea medie de
reprezentativitate 101
V.4. Precizia estimaţiei. Eroarea limită 105
V.5. Determinarea volumului eşantionului 106
Bibliografie 110
4
CAPITOLUL I
5
În Evul Mediu dezvoltarea cunoaşterii statistice a vieţii
sociale, economice şi politice ia un avânt deosebit, mai ales ca urmare
a creşterii schimburilor economice dintre state, care necesită
informaţii cât mai complete despre partenerii comerciali efectivi şi
potenţiali.
Evidenţele din această perioadă au avut un caracter
demografic (ţinute de preoţi despre căsătorii, naşteri, decese), contabil
(inventarierea de bunuri ale feudelor, mănăstirilor) şi statistic (din
iniţiativa statului privind descrierea patrimoniilor, veniturilor,
pământului).
2). Statistica descriptivă reprezintă cea mai veche rădăcină
teoretică a statisticii care apare odată cu practica statistică în cadrul
universităţilor, în secolele XVI – XVIII, când descrierea cantitativă,
numerică, a statelor privind populaţia, armata, bogăţiile solului,
activitatea productivă şi comercială desfăşurată s-a amplificat,
atingând perfecţiunea.
Reprezentanţi ai acestei perioade sunt Francesco Sansovino
(1521 –1583) şi Giovani Botero (1533- 1517) care în lucrările lor au
luat în considerare la descrierea statelor: bogăţiile, populaţia,
comerţul, finanţele.
O contribuţia remarcabilă la dezvoltarea statisticii descriptive
aduce Dimitrie Cantemir (1673- 1723) prin lucrarea “Descrierea
Moldovei”, care poate fi considerată o monografie cu caracter
geografic, economic, politic, social şi cultural.
Statistica descriptivă s-a numit şi statistică universitară,
întrucât teoreticienii săi de bază erau profesori universitari dintre care
amintim:
- olandezul Hermann Conring (1606-1681), fondatorul şcolii
descriptive germane, de la Universitatea Helmstedt, care ţinea cursuri
universitare despre ştiinţa descriptivă a statului
-germanul Gottfried Achenwall (1719-1772) de la
Universitatea din Gottingen, care defineşte statistica1 drept “ştiinţa
derscriptivă folosită pentru prezentarea particularităţilor unui stat” şi
este cel care dă numele acestei discipline de “statistică” pornind de la
1
G. Anchenwall a promovat denumirea acestei discipline de “statistică”, pe
care a preluat-o de la profesorul său Martin Schmeitzel (1679-1747) de la
universitatea din Halle.
6
cuvântul de origine latină “status” care înseamnă stare şi de la
cuvântul italienesc “stato” care înseamnă stat.
Cu toate că școala germană a ridicat statistica la rang de
ştiinţă, ea încă nu avea drept scop esenţial descoperirea, cunoaşterea
legităţilor statistice, a legăturilor cauzale dintre fenomene.
3). Aritmetica politică s-a dezvoltat în Anglia în parale cu
şcoala descriptivă germană. Statistica apărută în Anglia este deosebită
şi reprezintă un nou mod de cercetare, specific ştiinţelor naturii, fizicii,
chimiei orientat spre descoperirea legilor care guvernează fenomenele
economico-sociale şi a legităţilor ce se manifestă în cadrul lor, care
permit formularea de concluzii şi chiar previziuni, depăşind faza de
descriere prin folosirea datelor şi procedeelor bazate pe experimente.
Denumirea acestui curent vine de la lucrarea lui William Petty (1623-
1687), “Aritmetica politică”, sugerând semnificaţia statisticii de
analiză a datelor de observaţie prin metode matematice. Alături de
William Petty, alţi reprezentanţi de seamă au fost John Graunt (1620-
1674), Edmund Halley (1656-1742). Ei au pus accentul pe studiul
fenomenelor demografice şi îşi fundamentează concluziile pe un
număr mare de cazuri individuale cu care, prin generalizare, se pot
interpreta tendinţele de producere a fenomenelor.
4). Statistica probabilistă sau a calculului probabilităţilor
corespunde secolului al XVIII-lea, odată cu creşterea rolului
metodelor netematico-statistice în cunoaşterea fenomenelor şi cu
apariţia calculului probabilităţilor. Jacob Bernoulli (1654-1705) a
formulat faimoasa “lege a numerelor mari” şi atrage atenţia asupra
posibilităţii utilizării calculului probabilităţilor în economie.
Dintre reprezentanţii importanţi ai acestei etape fac parte:
Pierre-Simon Laplace (1749-1829), Karl Friedrich Gauss (1777-1855)
care definesc legea normală de repartiţie, Simeon Denis Poisson
(1781-1840) care a stabilit ecuaţia cu derivate parţiale, Adolf
Quetelet 2 (1796-1874) a folosit în lucrările sale din domeniul
demografiei şi criminalităţii, calculul probabilităţii şi legea numerelor
mari.
2
Adolf Quetelet- statistician, matematician şi astronom belgian, fondator al
statisticii moderne, a organizat împreună cu demograful englez William Farr,
primul Congres Internaţional de statistică la Bruxelles, în anul 1853.
7
5). Statistica modernă corespunde apariţiei în secolul al
XIX-lea a birourilor sau oficiilor de statistică pe plan naţional şi
internaţional, odată cu organizarea congreselor internaţionale de
statistică şi cu apariţia revistelor de specialitate. S-au formulat
principiile teoriei selecţiei şi a extinderii rezultatelor acestora asupra
întregului, s-a fundamentat teoria corelaţiei statistice şi a analizei
factoriale.
La sfârşitul secolului al XIX-lea şi începutul secolului XX,
prin contribuţiile teoretice şi metodologice ale lui Karl Pearson (1857-
1936), Ronald Fisher (1890-1962), Francis Galton (1822-1911),
statistica face progrese remarcabile şi îşi cucereşte statutul actual de
disciplină ştiinţifică şi metodă de cercetare utilizată în multe
discipline.
8
drept bază juridică Ordonanţa Guvernamentală 9/1992 şi Legea
nr.11/1994.
INSSE este organizat pe domenii de activitate şi în teritoriu, în
direcţii judeţene de statistică.
Rezultatele activităţii INSSE se regăsesc în Anuarul Statistic al
României, Anuarul Demografic, Buletin de Informare, Revista de
Statistică.
În vederea aderării la Uniunea Europeană, ţările candidate trebuie
să adopte modelul şi standardele statistice ale acesteia, astfel încât să
se folosească de către toate ţările membre şi asociate, măsurători
comparabile şi compatibile.
9
variaţiile întâmplătoare de la tendinţa generală se compensează
reciproc dacă există un număr suficient de mare de cazuri individuale
luate în studiu.
Obiectul de cercetare al statisticii îl reprezintă studiul
cantitativ al fenomenelor economico-sociale de masă în scopul
cunoaşterii şi exprimării legităţilor manifestate la nivelul întregului
ansamblu.
Statistica utilizează metode şi modele matematice, dar
elaborează şi o serie de metode specifice. Totalitatea operaţiilor,
tehnicilor şi procedeelor de investigare a fenomenelor de masă cu care
operează statistica, formează metodologia ei. Statistica se preocupă de
elaborarea şi perfecţionarea unei metodologii ştiinţifice
corespunzătoare schimbărilor continue ce au loc în societate, a
proceselor informaticii şi a tehnicii de calcul.
10
faptul că volumul lor poate fi determinat prin măsurare sau numărare
la un moment dat.
Colectivităţile dinamice (de flux) exprimă un proces, o
devenire în timp, evoluţia lor desfăşurându-se pe o scară a timpului,
într-un anumit interval de timp. Ele reprezintă manifestări ale
colectivităţilor de fiinţe sau de lucruri şi se caracterizează prin esenţa
lor nematerială, faptică şi prin aceea că, volumul lor nu poate fi
determinat prin măsurare sau numărare la un moment dat, ci prin
înregistrarea curentă, continuă a evenimentelor ce se produc într-un
interval de timp şi într-un spaţiu determinat.
În cazul colectivităţilor statice timpul este constant, iar în cazul celor
dinamice spaţiul şi forma de manifestare sunt constante.
11
I. După conţinutul lor, pot fi:
- caracteristici de timp: arată momentul sau perioada în care au
existat unităţile statistice;
De exemplu: data naşterii-pentru studenţi, anul înfiinţării pentru o societate
bancară;
- caracteristici de spaţiu: desemnează un teritoriu, un loc, un
spaţiu unde există unităţile statistice;
De exemplu: liceul absolvit, sediul băncii, secţia, atelierul etc.
- atributive cantitative (numerice), exprimate cu ajutorul cifrelor, a
numerelor
Exemple: numărul de credite acumulat în sesiune, număr de clienţi,
număr de angajaţi, cifra de afaceri, etc.
- atributive calitative, exprimate cu ajutorul cuvintelor, literal,
altele decât cele de spaţiu sau de timp.
Exemple: regimul de studii (bugetar sau cu taxă), profilul liceului
absolvit, specializarea universitară, tipuri de credite acordate, natura
capitalului social, etc.
II. După natura variaţiei, caracteristicile atributive cantitative pot
fi:
- cu variaţie continuă dacă valorile posibile sunt în număr infinit
sau sunt cunoscute ca făcând parte dinainte dintr-un şir de valori
posibile;
- discrete, cu variaţie discontinuă, dacă valorile sau variantele ei
posibile sunt valori izolate pe un anumit interval.
III. După numărul formelor de manifestare există următoarele
tipuri de caracteristici:
- caracteristici alternative, care pot avea doar două forme de
manifestare. Exemplu: genul – feminin sau masculin, mediul de
provenienţă – urban sau rural, starea civilă – căsătorit, necăsătorit .
- caracteristici nealternative, ce au o formă sau mai mult de două
forme de manifestare. De exemplu: natura capitalului social: public,
privat, mixt.
Formele concrete de manifestare ale caracteristicilor
corespunzătoare fiecărei unităţi statistice se numesc variante sau
valori.
Numărul de unităţi la care se înregistrează aceeaşi valoare sau
variantă poartă denumirea de frecvenţă sau pondere.
12
4). Datele statistice sunt caracterizări numerice ale unităţilor,
grupelor şi colectivităţilor obţinute prin observare şi prelucrare.
Mesajul datelor statistice îl reprezintă informaţia numerică.
13
Schematic cele trei etape ale cercetării statistice şi operaţiile specifice
fiecăreia dintre ele pot fi prezentate ca în figura nr.1.1:
- sistematizarea datelor
individuale prin centralizare
şi grupare
PRELUCRAREA -calcularea sistemului de
STATISTICĂ indicatori statistici
-prezentarea rezultatelor
prelucrării sub formă de
tabele, grafice , serii
14
- organizatorice;
- metodologice.
Problemele organizatorice se referă la:
- elaborarea şi tipizarea documentelor de înregistrare
(centralizatoare, chestionare, formulare) şi a instrucţiunilor;
- sectorizarea teritoriului;
- recrutarea şi instruirea personalului care va executa
observarea;
- popularizarea observării (dacă este cazul), prin mass-media,
despre scopul şi natura observării, în vederea obţinerii unor date
autentice.
Problemele metodologice se referă la:
a) stabilirea obiectului de investigaţie, prin delimitarea colectivităţii
supuse cercetării;
b) alegerea unităţii de observare, a elementului individual al
colectivităţii supuse cercetării, de la care se culeg datele statistice
individuale. În funcţie de scopul observării se va stabili tipul
unităţii statistice: simple sau complexe;
c) precizarea caracteristicilor utile cercetării, identificându-le
denumirea şi variantele formelor de manifestare. Ele se
formulează sub formă de întrebări clare, explicite.
d) timpul observării ce trebuie privit din două puncte de vedere:
timpul la care se referă datele înregistrate şi timpul în care se
înregistrează datele.
Timpul la care se referă datele poate fi un interval sau un moment.
În cazul anumitor fenomene, datele se pot referi la o perioadă de timp:
lună, trimestru, an, iar în alte cazuri se referă la un moment dat, numit
moment de referinţă sau moment critic. De exemplu, la recensământul
populaţiei României, organizat în luna martie 2002, ora 0 din data de
18 spre 19 martie, reprezintă momentul critic la care se referă toate
datele înregistrate.
Timpul în care se efectuează înregistrarea este întotdeauna o
perioadă mai mare de timp şi logic este ulterior producerii
fenomenului studiat.
e) locul observării coincide, de regulă, cu locul producerii
fenomenelor, însă diferă atunci când observarea se realizează prin
prelucrarea datelor din diferite surse de informaţii deja existente
(anuare, reviste, publicaţii, etc.)
15
f) purtătorii de informaţii, respectiv documentele de înregistrare pot
fi formulare statistice, benzi magnetice, dischete, CD-uri.
Formele tradiţionale de documente sunt fişele şi listele.
Fişele sunt formulare individuale, completate pentru o singură
unitate statistică şi se utilizează atunci când unităţile supuse cercetării
sunt dispersate în spaţiu.
Listele sunt formulare colective, completate pentru mai multe
unităţi statistice şi se utilizează atunci când unităţile statistice sunt
concentrate în spaţiu.
Formularele de observare sunt însoţite de norme metodologice şi
tehnice privind completarea lor.
16
III. În funcţie de modul de organizare, se identifică următoarele
categorii de observări statistice:
1).Raportările statistice;
2).Recensământul;
3).Sondajul;
4).Ancheta;
5).Monografia.
17
Perioada de pregătire şi organizare a recensământului este foarte
mare şi vizează următoarele lucrări:
- elaborarea calendarului recensământului;
- întocmirea listelor pe localităţi, clădiri;
- sectorizarea teritoriului;
- elaborarea şi furnizarea formularelor şi instrucţiunilor;
- recrutarea şi pregătirea personalului;
- popularizarea recensământului în rândul populaţiei.
Principala formă de recensământ o constituie recensământul
populaţiei. Acesta se mai organizează pentru caracterizarea şeptelului,
pentru inventarierea produselor finite, pentru evaluarea mijloacelor
fixe.
18
5) Monografia presupune studierea exhaustivă a unei singure
unităţi statistice complexe, cum ar fi o unitate economico-socială,
unitate administrativ-teritorială.
Se efectuează monografii pentru studierea fenomenelor
demografice, ce din punct de vedere al sferei de cuprindere pot fi:
- monografii ce studiază un singur fenomen demografic (natalitate,
mortalitate) în cadrul întregii populaţii sau a unei părţi a acesteia, în
corelaţie cu toţi factorii sociali-economici care îl determină;
- monografii ce studiază un ansamblu de fenomene demografice
interdependente, în cadrul unei unităţi teritoriale sau zone geografice,
la nivelul cărora fenomenele demografice se diferenţiază cel mai mult,
în plus sau în minus faţă de media lor pe ţară.
Monografia necesită colaborarea şi conlucrarea unor cercetători din
mai multe domenii.
I.5.1.Controlul datelor
19
Controlul datelor statistice este o acţiune ulterioară
înregistrării şi se efectuează cu scopul de a asigura volumul complet şi
calitatea datelor înregistrate.
Datele statistice obţinute prin înregistrare sunt supuse unui
control cantitativ pentru a constata dacă au fost cuprinse toate unităţile
colectivităţii cercetate şi dacă la fiecare unitate au fost înscrise date
pentru toate caracteristicile cuprinse în formulare. Prin controlul
cantitativ se verifică dacă este complet volumul informaţiilor
statistice.
Pe lângă controlul cantitativ se efectuează şi un control
calitativ (logic) ce constă în verificarea valorilor pentru diferite
caracteristici între care există anumite relaţii de interdependenţă. Prin
control logic pot fi depistate eventuale erori sistematice, dacă se
compară în timp sau în spaţiu, unităţi statistice ce au condiţii
asemănătoare dar la care apar variaţii foarte mari în privinţa
indicatorilor înregistraţi.
20
CAPITOLUL II
SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE
21
Tabel 2.1.
Unităţile colectivităţii Caracteristicile observate (xj)
ui
x1 x2 . . . xj . . . xm
u1 x11 x12 . . . x1j . . . x1m
u2 x21 x22 . . . x2j ……… x 2m
.
. . . .
.
. . . .
.
xi1 xi2 . . . xij . . . xim
ui
. . . .
.
. . . .
.
. . . .
.
xn1 xn2 . . . xnj . . . xnm
un
22
1) Scala nominală constă în atribuirea de variante caracteristicilor
nenumerice, astfel încât toţi indivizii aparţinând aceleiaşi clase
să aibă aceeaşi valoare atribuită.
De exemplu, pentru caracteristica “domiciliu”, studenţii vor forma
două grupe. Prima grupă cuprinde studenţii din mediul urban, care se
poate codifica drept clasa 1 şi o grupă care cuprinde studenţii din
mediul rural, notată drept clasa 2.
Volumul de informaţii obţinut prin sistematizarea datelor cu
ajutorul scalei nominale este direct proporţional cu numărul
claselor construite; aşadar cu cât numărul claselor creşte, cu atât
analiza este mai amănunţită.
2) Scala ordinală se aplică tot în cazul caracteristicilor
nenumerice calitative, unităţile statistice putând fi ordonate
crescător sau descrescător şi li se pot atribui ranguri sau
numere de ordin.
De exemplu: ordonarea gimnaştilor după numărul de medalii
obţinute:
1. nici o medalie;
2. o medalie;
3. două medalii;
4. trei sau mai multe medalii.
3) Scala de interval se utilizează pentru caracteristicile atributive
cantitative şi presupune introducerea între valorile
caracteristicii a distanţei dintre ele. Aplicarea acestei scale
constă în atribuirea de valori caracteristicii măsurate în funcţie
de intervalul dintre valori. În acest caz, punctul zero al scalei şi
unitatea de măsură se pot alege arbitrar sau convenţional. Scala
de interval se aplică la cuantificarea curgerii timpului
calendaristic sau la măsurarea temperaturii.
4) Scala de raport (metrică) este cea mai înaltă treaptă de
măsurare, cu ajutorul acesteia se exprimă cele mai multe
caracteristici numerice economice. În cazul acestei scale,
punctul zero este dat în mod natural, semnificând efectiv
absenţa fenomenului.
Valorile măsurate pe scala de raport pot fi: cantităţile executate,
vândute, venituri realizate, preţuri unitare, vârsta, vechimea mică.
Sistematizarea datelor se efectuează prin centralizare şi grupare.
23
Centralizarea datelor constă în strângerea datelor la locul
prelucrării a tuturor informaţiilor şi determinarea totalurilor pentru
caracteristicile direct însumabile sau care devin însumabile, prin
aplicarea unor coeficienţi de echivalenţă.
Centralizarea datelor poate fi: - simplă;
- pe grupe.
Centralizarea simplă înseamnă agregarea valorilor individuale
ale caracteristicilor pentru toate unităţile de colectivităţi care permit
însumarea din punct de vedere al conţinutului, în scopul obţinerii
indicatorilor totalizatori. În urma centralizării simple se obţin
informaţii privind volumul colectivităţii şi valoarea totalizată a
caracteristicilor cuprinse în planul observării şi care sunt exprimate în
unităţi de măsură însumabile.
Centralizarea pe grupe are drept scop cunoaşterea mai
detaliată a fenomenului, permiţând analiza structurii colectivităţii.
Aceasta constă în gruparea datelor şi în calcularea indicatorilor
totalizatori pe fiecare grupă, iar pe baza lor a indicatorilor totalizatori
pe întreaga colectivitate. Centralizarea pe grupe include mai multe
centralizări simple.
În urma centralizării se obţin indicatori statistici totalizatori ce
au un conţinut concret şi o formă specifică de exprimare, motiv pentru
care sunt denumiţi indicatori absoluţi. Ei constituie baza
informaţională a cunoaşterii statistice şi sunt urmăriţi statistic la toate
structurile organizatorice ale economiei naţionale.
Gruparea statistică (clasificare, stratificare) constă în
împărţirea colectivităţilor statistice în grupe omogene de unităţi
statistice, după variaţia uneia sau mai multor caracteristici de grupare.
La aplicarea grupărilor se operează cu noţiunile următoare:
- caracteristica de grupare;
- variaţia;
- amplitudinea;
- grupa omogenă.
Caracteristica de grupare este acea însuşire în funcţie de care
unităţile statistice se separă pe clase sau pe grupe omogene.
Variaţia este proprietatea caracteristicilor de grupare, de a
înregistra mai multe valori sau mai multe forme de manifestare.
24
Amplitudinea,notată cu A, reprezintă câmpul de variaţie a
tuturor valorilor individuale ale unei caracteristici şi se determină ca
diferenţă între valoarea maximă şi minimă.
Grupa omogenă reprezintă clasa de unităţi statistice la care
variaţia caracteristicii de grupare este minimă.
Grupările statistice se pot clasifica după mai multe criterii.
TOTAL ∑fi
25
Tabelele obţinute după o grupare combinată se numesc tabele cu dublă
intrare (vezi tabelul nr.2.3.).
Tabel 2.3.
Caracteristica Total după
Caracte- yj y1 y2 . . . yj . . . ym caracteristica x
-ristica
xi
x1 f11 f12 . . . . f1j . . . f1m fx1
x2 f21 f22 . . . f2j . . . f2m fx2
. . . . . .
. . . . . .
xi fi1 fi2 . . . fij . . . fim fxi
. . . . . .
. . . . . .
xn fn1 fn2 . . . fnj . . . fnm fxn
Total după caracteristica y fy1 fy2 . . . fyj . . . fym ΣΣfij
∑∑ i =1 j =1
f ij = ∑ f xi = ∑ f yj
i =1 j =1
26
Gruparea numerică pe intervale egale se realizează parcurgând mai
multe etape:
1. Se calculează amplitudinea (A), ca diferenţă între valoarea
maximă (xmax) şi valoarea minimă (xmin) a caracteristicii de
grupare:
A=xmax-xmin
2. Se determină numărul de grupe în care se va împărţi colectivitatea
după relaţia lui H. D. Sturges:
ng=1+3.322lgn
unde : ng- numărul de grupe
n – numărul de unităţi statistice din care este alcătuită
colectivitatea.
3. Se determină mărimea intervalelor de grupare (h), după formula :
A
h=
1 + 3.322 lg n
4. Se construiesc intervalele de grupare prin adunarea succesivă a
mărimii intervalelor de grupare pornind de la valoarea minimă a
caracteristicii de grupare (xinf), care devine limită inferioară a primului
interval de grupare.
În vederea obţinerii unei grupări corecte trebuie respectate câteva
reguli , cum ar fi:
- limita inferioară a primului interval se poate stabili mai mică
decât xinf;
- mărimea intervalului de grupare (k) trebuie să fie un număr
întreg, dacă este număr zecimal întotdeauna se rotunjeşte în sus;
- limita superioară a unui interval poate fi egală sau neegală cu
limita inferioară a intervalului imediat următor.
Forma unui tabel care prezintă o grupare pe intervale este
următoarea: Tabel 2.4.
Intervale de grupare după caracteristica xi Număr de unităţi statistice fi
x1inf-x1sup f1
x2inf-x2sup f2
… ...
xIinf-xIsup fi
... ...
xminf-xmsup fm
Total ∑fi
27
II.2. Serii statistice
x1 x2 ... xi…. xn
X:
f1 f2 … fi…. fn
28
unde:xi -reprezintă valorile individuale ale caracteristicii;
fi-reprezintă frecvenţele de apariţie ale valorilor caracteristicii.
Un exemplu de serie de distribuţie pe variante este prezentat în tabelul
nr.2.2,iar tipul seriei de distribuţie pe intervale este exemplificat în
tabelul nr.2.4.
b) Seriile descriptive prezintă o colectivitate prin enumerarea
unităţilor componente şi a valorilor principalelor caracteristici
înregistrate.
c) Seriile cronologice se elaborează pentru a descrie evoluţia în
timp a unui fenomen sau proces.
În funcţie de timpul la care se referă datele, seriile cronologice
pot fi:
- serii cronologice de momente, în cazul în care valorile
caracteristicii au fost înregistrate la anumite momente determinate de
timp. Termenii unei serii de momente nu se pot însuma direct, pentru
că ar duce la înregistrări repetate.
- serii cronologice de intervale, care prezintă valorile unei
caracteristici înregistrată pentru intervale de timp (luni, trimestre,
semestre, ani). Termenii unei serii de intervale sunt însumabili,
obţinându-se valoarea centralizată pentru întreaga perioadă.
Forma generală a unei serii dinamice este prezentată în tabelul
nr.2.5. :
Tabel 2.5.
Timpul (ti) Valorile caracteristicii xi
t0 x0
t1 x1
... . ... .
. .
ti xi
.. . ... .
.
tn xn
29
Modelul unei serii teritoriale este cel prezentat în tabelul nr.2..6:
Tabel 2.6.
Unitatea teritorială Valorile
caracteristicii
A xA
B xB
. .
. .
Z xZ
30
Principalele tipuri de tabele statistice sunt:
1) Tabele statistice simple sunt folosite pentru înregistrarea şi
prezentarea datelor primare. Prezentarea colectivităţii în acest
caz se face prin simpla enumerare a unităţilor statistice,
înscriind în dreptul fiecărei unităţi valorile caracteristicilor
observate.
Tabelele statistice simple pot fi:
- enumerative;
- teritoriale, dacă datele numerice se repartizează în
funcţie de unităţi de spaţiu;
- cronologice, dacă valorile caracteristicilor se
înregistrează în funcţie de timp.
2) Tabelele statistice pe grupe cuprind datele numerice
referitoare la o colectivitate despărţită pe grupe omogene după
o singură caracteristică.
3) Tabelele statistice combinate (cu dublă intrare) sunt rezultatul
împărţirii colectivităţii în grupe omogene, după cel puţin două
caracteristici.
Reprezentările grafice, denumite şi diagrame sau grafice,
redau într-o formă expresivă evoluția unor fenomene, constituind nu
numai o formă de prezentare a rezultatelor cercetării, dar şi un suport
logic inductiv sau deductiv de analiză şi interpretare a fenomenelor
studiate.
Elementele constructive ale unui grafic sunt:
- titlul graficului, care trebuie să corespundă conţinutului datelor
prezentate;
- scara de reprezentare este locul geometric al punctelor cotate.
Aceasta se alege în funcţie de mărimea datelor de reprezentat, de
gradul de variaţie dintre ele, de spaţiul disponibil astfel încât să
asigure proporţionalitatea dimensiunii lor graficului.
- reţeaua graficului – poate fi reprezentată de sistemul axelor de
coordonate rectangulare Ox, Oy, primul cadran sau poate fi formată
din linii paralele verticale, orizontale, oblice pentru a distinge
diferitele părţi ale graficului.
- legenda are rolul de a explica semnificaţia simbolurilor utilizate,
semnelor convenţionale utilizate, haşurări, culori, reţele.
În funcţie de natura datelor de reprezentat există mai multe
tipuri de grafice:
31
a) diagrame prin areale se utilizează pentru reprezentarea
grafică a indicatorilor de volum unidimensionali,
înregistraţi pentru un număr redus de unităţi statistice (3-
5) sau pentru unităţi de timp. Aria figurii geometrice alese
trebuie să fie proporţională cu mărimea indicatorilor de
reprezentat. Există două tipuri de diagrame prin areale:
a1) diagrama prin pătrate;
a2) diagrama prin cercuri.
b) diagrame structurale evidenţiază raportul care există
între părţile componente ale colectivităţii. Fiecare figură
geometrică aleasă se va diviza în atâtea părţi câte grupe
omogene are colectivitatea cercetată.
Se disting trei categorii de diagrame structurale:
b1) dreptunghiul de structură;
De exemplu: reprezentarea grafică a structurii unei
colectivităţi formată din 8 unităţi statistice, respectiv 8
companii în funcţie de cifra de afaceri înregistrată în 2000 şi
2001 se ilustrează grafic ca în figura 2.1.:
32
b2) cercul de structură;
De exemplu: structura unei firme industriale în funcţie de
producţia fizică realizată de cele 3 secţii productive pe parcursul unei
luni se poate reprezenta grafic ca în figura 2.2.:
Fig. 2.2. Structura producţiei fizice realizată în cadrul unei firme industriale de 3
secţii productive în luna ianuarie 2004
33
Fig. 2.3. Distribuţia studenţilor unei grupe în funcţie de media de la
bacalaureat
34
e) Diagrame prin benzi şi coloane: se construiesc în cazul
în care se reprezintă valori ale unor serii teritoriale sau
serii cronologice de intervale egale. Acestea permit
reprezentarea în acelaşi sistem de axe a doi sau mai mulţi
indicatori între care există anumite interdependenţe.
De exemplu: Studenţii unei grupe în funcţie de profilul liceului
absolvit pot fi reprezentaţi grafic cu ajutorul diagramei prin benzi,
precum în figura 2.5.
Fig. 2.5. Repartizarea studenţilor unei grupe în funcţie de profilul liceului absolvit
35
Fig. 2.6. Legătura dintre suprafaţa comercială şi valoarea vânzărilor pentru 10 magazine
36
Indicatorii primari se obţin în urma prelucrării datelor
individuale, fie prin înregistrare directă, rezultaţi din observare, fie
prin însumare parţială, pe grupe sau totală, pe întreaga colectivitate a
datelor individuale de acelaşi fel.
Aceştia sunt exprimaţi în unităţi de măsură specifice caracteristicii
observate sau în cazul în care sunt caracteristici ale căror valori nu pot
fi însumate direct, se folosesc unităţi natural-convenţionale sau
valorice. De aceea indicatorii primari se mai numesc indicatori
absoluţi, cu un conţinut real şi o formă de exprimare concretă, care
reflectă volumul colectivităţii (pe total sau pe grupe) şi nivelul
cumulat al diferitelor caracteristici observate (pe total colectivitate sau
pe grupe de unităţi).
În activitatea social-economică, indicatorii primari absoluţi,
rezultaţi în urma sistematizării datelor, pot fi folosiţi ca atare, fără nici
o prelucrare suplimentară sau pot fi supuşi diferitelor prelucrări şi
procedee de calcul, obţinându-se indicatori derivaţi.
Indicatorii derivaţi se obţin prin prelucrarea indicatorilor
absoluţi prin diferite procedee de calcul şi au drept scop evidenţierea
aspectelor calitative ale fenomenelor şi proceselor cercetate, aspecte
ce nu pot fi surprinse de indicatorii absoluţi, cum ar fi: componenţa
structurală, intensitate, dinamică, nivel mediu, etc.
Indicatorii derivaţi se obţin, în general, într-un proces de
comparaţie realizat pe bază de diferenţă sau de raport.
Compararea datelor se poate face:
- la nivelul unităţii statistice pentru una sau mai multe
caracteristici
- la nivelul unei grupe omogene, din punct de vedere al uneia
sau mai multor caracteristici sau în ce priveşte numărul unităţilor
statistice ce compun grupa respectivă
- la nivelul întregii colectivităţi cercetate, de asemenea pentru
una sau mai multe caracteristici sau a numărului de unităţi statistice
componente.
Compararea pe bază de diferenţă se poate efectua, numai
atunci când datele sunt comparabile din punct de vedere al
conţinutului şi al unităţilor de măsură. Compararea pe bază de raport
se poate face atât în cazul datelor cu acelaşi conţinut, cât şi în cazul
datelor cu conţinut diferit dar interdependente între ele.
37
Indicatorii derivaţi ce se pot determina din prelucrarea
primară a datelor sunt:
a) modificarea absolută;
b) mărimile relative.
a) Modificarea absolută (∆) se calculează ca diferenţă între date de
acelaşi tip din punct de vedere al conţinutului şi al unităţii de măsură.
În cazul în care se referă la evoluţia în timp a unei caracteristici, se
mai numeşte spor sau reducere absolută. Diferenţa se efectuează între
mărimea comparată şi mărimea bază de comparaţie cu ajutorul
următoarelor formule:
∆x=xc – xbc=± , unde xc- este mărimea comparată
xbc- este mărimea bază de comparaţie
sau
∆∑x=∑xc - ∑xbc=±
sau
∆f=fc -fbc=± unde f-numărul de unităţi statistice
comparate.
b) Mărimile relative sunt indicatori derivaţi, rezultaţi din compararea
sub formă de raport a doi indicatori statistici şi exprimă printr-un
singur număr proporţiile indicatorului raportat faţă de indicatorul bază
de raportare. Formula generală de calcul:
xc
⋅ 10 k
xbc
unde k=0,1,2,3,…
Rezultatul raportării poate fi un număr întreg sau zecimal şi se poate
exprima sub formă de cât, coeficient, procent, promile, procentimile
sau în unităţi de măsură combinate.
Mărimile relative sunt instrumente necesare şi utile în analiza
întregii activităţi economice, dar construcţia lor simplă, permite
posibilitatea obţinerii unor indicatori ce estompează, uneori
denaturează aspectele reale. De aceea, calcularea lor trebuie precedată
de alegerea atentă a bazei de comparaţie şi verificarea comparabilităţii
datelor raportate. Drept bază de comparaţie se aleg acei indicatori faţă
38
de care indicatorii comparaţi permit obţinerea unor mărimi relative cu
grad mare de sintetizare şi care au sens economic.
Principalele tipuri de mărimi relative sunt:
∑x
j =1
ij
gi = n m
⋅ 100
∑∑ x
i =1 j =1
ij
unde:
m - reprezintă numărul de unităţi statistice din cadrul unei grupe
omogene;
n – reprezintă numărul de grupe omogene în care este împărţită
colectivitatea;
xij – valoarea individuală a caracteristicii pentru unitatea statistică i din
grupa j.
39
Rezultatul arată ponderea valorii caracteristicii (a unui indicator) unei
grupe omogene în totalul valorii caracteristicii, la nivelul întregii
colectivităţi.
În cazul în care colectivitatea este prezentată în cadrul unei serii
descriptive, în care fiecare unitate statistică este evidenţiată separat,
xi
gi = n
⋅ 100
∑x
i =1
i
∑
i =1
fi
xA
k A/ B = ⋅ (100)
xB
40
sau
x1
k1 / 0 = ⋅ (100)
x0
Dacă se compară între ei toţi termenii unei serii cronologice, se obţin
mărimi relative de dinamică cu baza fixă, în cazul în care se
raportează fiecare termen la termenul iniţial şi respectiv mărimi
relative cu baza mobilă, în cazul în care se raportează fiecare termen la
termenul din perioada precedentă.
Formulele de calcul sunt:
xi xi
ki / 0 = ⋅ (100) k i / i −1 = ⋅ (100)
x0 xi −1
41
Rezultatul sub formă de coeficient, arată de câte ori a crescut sau a
scăzut nivelul fenomenului în perioada curentă faţă de perioada de
bază. Dacă rezultatul se exprimă sub formă de procent, arată cu cât la
sută a crescut sau a scăzut, nivelul din perioada curentă faţă de nivelul
din perioada de bază.
Mărimile relative de dinamică, nu admit proprietatea de reversibilitate,
exprimându-se într-un singur sens.
x pl
k pl / 0 = ⋅ (100)
x0
Rezultatul arată cu cât la sută este mai mic sau mai mare
nivelul planificat faţă de nivelul realizat în perioada de bază.
Mărimea relativă a îndeplinirii planului se obţine prin
raportarea nivelului efectiv realizat în perioada curentă, la nivelul
planificat pentru perioada curentă.
Formula de calcul este:
x1
k1 / pl = ⋅ 100
x pl
Rezultatul poate fi interpretat astfel:
dacă este: - mai mare de 100%, s-a înregistrat o depăşire de plan;
-egal cu 100%, planul a fost realizat integral;
- mai mic de 100%, planul nu a fost îndeplinit.
42
5). Mărimile relative de intensitate se calculează ca raport între doi
indicatori absoluţi, de natură diferită, dar între care există o relaţie de
interdependenţă. Cei doi termeni ai raportului au unităţi de măsură
diferite, iar mărimea rezultată prin raportare va avea o unitate de
măsură compusă. Acestea se pot determina la nivelul unităţilor
statistice, a grupelor omogene sau la nivelul colectivităţii.
Formula de calcul pentru o unitate statistică este:
xi
kx/ y = ⋅ 10 k
yi
k = ∑x i
⋅ 10k
∑ y i / ∑ xi ∑y i
În cazul în care valorile caracteristicilor xi, yi sunt agregate la
nivelul unei grupe omogene sau pentru întreaga colectivitate.
Rezultatul sub formă de coeficient arată câte unităţi din
valoarea caracteristicii de la numărător, se cuprind într-o singură
unitate a valorii caracteristicii de la numitor.
Mărimile relative de intensitate admit, în anumite situaţii şi
reversibilitatea:
yi
ky/x = ⋅ 10 k
xi
sau
k = ∑y i
⋅ 10k
∑ y i / ∑ xi ∑x i
Dacă rezultatul se înmulţeşte cu 100 va arăta câte unităţi din
indicatorul raportat revin la 100 unităţi ale indicatorului bază de
raportare.
Dacă rezultatul se înmulţeşte cu 1000 se obţin promile şi se
utilizează în cazul în care indicatorul comparat este mult mai mic
decât cel bază de comparaţie , iar exprimarea sub formă de coeficienţi
43
sau procente ar conduce la obţinerea unor mărimi relative greu de
reţinut şi interpretat.
În cazul în care rezultatul raportului dintre cele două mărimi
comparate are o valoare foarte mică se utilizează procentimile ,
exprimând indicatorul comparat la 10000 sau la 100000 unităţi din
indicatorul bază de comparaţie.
44
CAPITOLUL III
45
Pentru caracterizarea structurii seriei se calculează indicatorii de
frecvenţă, cu scopul de a cunoaşte ceea ce este esenţial şi comun în
formele individuale de manifestare şi care leagă între ele valorile
individuale ale caracteristicii.
Concentrarea sau aglomerarea faţă de unele valori tipice ale seriei
apare atunci când acţiunea factorilor esenţiali sau aleatori este
diferenţiată, cu intensităţi diferite şi seria prezintă o repartiţie
neuniformă a frecvenţelor. Modul de asociere a factorilor de influenţă
determină o tendinţă de concentrare a valorilor individuale spre
anumite valori tipice.
În acest caz, frecvenţele se pot concentra:
a) către una din extremităţile seriei (seria are forma J sau I);
b) către valoarea centrală (de mijloc), obţinându-se pe grafic o
repartiţie simetrică sau normală, numită curbă normală Gauss-
Laplace;
c) către ambele extremităţi, obţinându-se o repartiţie în formă de
“U”.
În cazul în care intensitatea factorilor de influenţă este uniformă,
frecvenţele de apariţie ale valorilor individuale sunt apropiate între ele
şi seria prezintă o repartiţie uniformă a frecvenţelor.
Există şi cazuri când nu se poate observa o regularitate sau când
repartiţia frecvenţelor indică o colectivitate structurată pe mai multe
tipuri calitative, situaţie în care este necesar ca seria respectivă să fie
descompusă în mai multe serii distincte.
Se impune aşadar, ca prin metode statistice corespunzătoare, să se
analizeze seriile de distribuţie cu frecvenţe, să se studieze forma de
repartiţie şi tendinţele de concentrare a frecvenţelor.
Pentru aceasta se utilizează un sistem de indicatori absoluţi, relativi şi
medii, ce vor fi prezentaţi în continuare.
Un rol important în analiza seriilor de repartiţie cu frecvenţe, revine
reprezentărilor grafice, ca prim mijloc de exprimare a formei de
repartiţie.
46
III.2. Indicatorii de frecvenţe
47
x
III.3.1. Mediile
48
III.3.1.1. Media aritmetică se foloseşte, în general, atunci
când fenomenul studiat prezintă modificări aproximativ constante,
apropiate de forma unei progresii aritmetice.
Media aritmetică reprezintă acea valoare la care ar fi ajuns
fiecare unitate statistică, dacă toţi factorii de influenţă ar fi acţionat în
mod constant.
Dacă media aritmetică este o valoare reprezentativă pentru
ansamblul datelor individuale, înseamnă că este acea mărime, cu care
dacă s-ar înlocui valorile individuale ale caracteristicii, suma acestora
ar rămâne constantă.
Fie o colectivitate statistică alcătuită din n unităţi statistice,
pentru care s-au înregistrat valorile unei caracteristici discrete notate
cu xi, x2,…,xi,…,xn. Media aritmetică simplă se determină ca raport
între suma termenilor xi şi numărul de termeni (n) după formula:
n
∑x i
x= i =1
x1 x2 … xi… xn
X:
f1 f2 … fi …fn
unde i=1,2,…,n
iar media se determină cu ajutorul mediei aritmetice ponderate pe
baza frecvenţelor absolute sau a frecvenţelor relative, după caz:
49
n
∑x i fi
∑x i f i*
x= i =1
n x=
∑f
i =1
i
100
fi
f i* = ⋅ 100
∑f i
N M
p= q=
N +M N +M
Aşadar, media caracteristicii alternative se calculează astfel:
50
x=
∑x f i i
=
1⋅ N + 0 ⋅ M
=
N
=p
∑f i N +M N+M
x=
∑x i
=
∑x c
=
xc ⋅ n
= xc
n n n
xmin≤ x ≤ xmax
∑ (x
i =1
i − x) = 0
n n
∑x
∑x −∑x = ∑x − x ⋅n = ∑ xi − ⋅n = 0
i
i i
i =1 i =1 n
51
În cazul unei serii cu frecvenţe:
n
∑ (x
i =1
i − x) ⋅ f i = 0
∑x f ⋅ f
∑x f i − ∑ x ⋅ f i = ∑ xi f i − x ∑ f i = ∑ xi f i − ∑ =0
i i
∑f
i i
i
x=
∑x i ±a
±a
n
xi
∑ h ∑x 1 1 x
x= = ⋅ = x⋅ =
i
n n h h h
xi
∑ h ∑x 1 1 x
x = = i
⋅ = x⋅ =
n n h h h
x = x' ⋅ h
52
Proprietăţile 4 şi 5 se folosesc combinat, obţinându-se relaţia
de calcul simplificat a mediei aritmetice , atât pentru o serie
simplă cât şi pentru o serie cu frecvenţe, pe baza următoarelor
formule:
- pentru o serie simplă:
n
xi − a
∑ h
x= i =1
⋅h + a
n
xi − a
∑( ) ⋅ fi
*
x= h ⋅h + a
100
x=
∑x f i i
∑f i
Iar fi’ – frecvenţele micşorate:
fi 1
∑x i ⋅
c = c
∑ xi f i
x' = =x
fi 1
∑ c c
∑ fi
53
fi
fi =
,
x=
∑x f i i
=
∑x fi c
=
f c ∑ xi
=
∑x i
=x
∑f i ∑f c ∑f c n
Fie seria
x1 x2 … xi…xn împărţită în două grupe:
X:
f1 f2 …fi…fn
54
k n n
f x + f B xB ∑ xi f i + ∑ xi f i ∑x i fi
x= A A = i =1 i = k +1
= i =1
fA + fB k n n
∑f +∑f
i =1
i
i = k +1
i ∑f
i =1
i
∑x i fi k
xA = i =1
⇒ f A x A = ∑ xi f i
fA i =1
n
∑x i fi n
xB = i = k +1
fB
⇒ f B xB = ∑x
i = k +1
i
fi
∑ ( xi ± y i ) ∑ xi ∑y i
x± y = i =1
= i =1
± i =1
= x± y
n n n
x⋅ y = x⋅ y
55
III.3.1.3.Media armonică, xh, se calculează din valorile
inverse ale termenilor unei serii.
În cazul unei serii simple, media armonică se determină astfel:
n
1 1 1 1 1
+ + ... + + ... + =∑
x1 x 2 xi x n i =1 xi
1 1 n
n⋅ = ∑ ⇒ xh = n
1
∑x
xn xi
i =1 i
xh =
∑f i
1
∑x ⋅ f i
i
∑f
*
i
100
xh = n
i =1
= n
1 1 *
∑x ∑
*
fi fi
i =1 i i =1 xi
56
Media armonică se determină în cazul în care se studiază o serie
bidimensională, care cuprinde valorile a două caracteristici xi, yi între
care există un raport de inversă proporţionalitate xi=1/yi. Pentru a
păstra acest raport şi în ce priveşte mediile pentru una dintre
caracteristici, media se va determina cu ajutorul mediei aritmetice, iar
pentru cealaltă cu ajutorul mediei armonice.
Dacă este calculată din aceleaşi valori pozitive, media armonică
este întotdeauna mai mică decât media aritmetică.
i =1
i =1
Formula medie pătratice simple este:
∑x
2
n i
n ⋅ x p = ∑ xi ⇒ x p =
2 2 i =1
i =1 n
∑x f
2
∑x
2 *
xp = fi
i i
∑f xp =
i
i 100
57
În practica statistică, media pătratică se utilizează pentru
calcularea abaterii standard.
Determinată din aceleaşi valori ca şi media aritmetică, media
pătratică este întotdeauna mai mare.
n
x1 ⋅ x 2 ⋅ ... ⋅ xi ⋅ ... ⋅ x n = ∏ xi
i =1
Înlocuind termenii cu media geometrică, se obţine:
n
x g ⋅ x g ⋅ ... ⋅ x g = ∏ xi
i =1
Formula mediei geometrice simple este:
n n
x g = ∏ xi ⇒ x g = n ∏x
n
i
i =1 i =1
n n
x g = ∑ f i ∏ xi x g = 100 ∏ xi
fi f i*
i =1 i =1
Expresiile mediei geometrice se pot logaritma şi se obţin
următoarele formule:
58
-pentru media geometrică simplă:
∑ log x
log( x g ) = log(n ∏ x ) ⇒ log x =
i
i g
n
log( x g ) = log ∑ i xi
f fi
⇒ log x g =
∑ f ⋅ log x
i i
∑f i
59
unde: ti - reprezintă mărimea intervalelor dintre două momente
consecutive, exprimată în număr de zile, număr de luni,număr de ani.
x h ≤ x g ≤ x ≤ x p ≤ xc
III.3.2. Indicatorii medii de poziţie
xM o
inf
+ xM o
sup
∆1
M o = xM o + hM o
inf
Mo = ∆1 + ∆ 2
2
60
În cazul în care frecvenţele sunt aproximativ simetric distribuite
în intervalul modal se utilizează prima formulă, iar dacă frecvenţele au
o distribuţie neuniformă se foloseşte cea de-a doua formulă.
xinfMo – limita inferioară a intervalului modal
xsupMo – limita superioară a intervalului modal
hMo – lungimea intervalului modal hMo=xsupMo - xinfMo
∆1 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa
intervalului precedent
∆2 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa
intervalului următor.
61
frecvenţe cumulate ascendent, ce depăşeşte (Σfi+1)/2, unde Σfi este
numărul total de unităţi statistice.
În anumite situaţii, semnificaţia medianei suferă uneori din cauza
modului de determinare şi se recomandă renunţarea la mediană şi
alegerea altei valori tipice pentru caracterizarea tendinţei centrale.
Pentru o serie de repartiţie cu frecvenţe pe intervale, mediana se
determină astfel:
- se identifică intervalul median, adică intervalul de grupare ce
corespunde primei frecvenţe cumulate ascendent ce depăşeşte
(ΣfI+1)/2;
- se determină valoarea medianei folosind relaţia de calcul:
∑f i +1
− Fa ( M e − 1)
M e = xM e
inf
+ hM e 2
f Me
unde:
xMeinf – limita inferioară a intervalului median
hMe – lungimea intervalului median
fMe – frecvenţa absolută a intervalului median
Σfi – suma totală a frecvenţelor absolute
Fa(Me- 1) – frecvenţele cumulate ascendent până la intervalul
median.
2.2.Cuartilele (în număr de trei Q1, Q2 = Me, Q3) sunt acele valori
ale caracteristicii, ce împart seria ordonată crescător sau descrescător
în patru părţi egale, conţinând fiecare 25% din numărul observaţiilor.
Pentru o serie simplă, cuartilele se determină astfel:
- se stabileşte locul cuartilelor cu ajutorul următoarelor expresii:
(n + 1)/4 – pentru Q1; 2(n + 1)/4 – pentru Q2; 3(n +1)/4 – pentru Q3
În cazul unei serii simple cu un număr impar de termeni, cuartilele
sunt egale cu variantele caracteristicii ce au număr de ordine egal cu
expresiile determinate anterior.
Pentru seriile simple cu număr par de termeni, cuartilele se
calculează ca o medie aritmetică a termenilor vecini poziţiilor aflate
pe baza expresiilor determinate anterior.
Într-o serie de repartiţie pe intervale, cuartilele se calculează astfel:
62
- se identifică intervalele în care se situează Q1, Q2, şi Q3; acestea vor
fi intervalele corespunzătoare primelor frecvenţe cumulate ascendent,
ce depăşesc expresiile precizate la seriile pe variante.
1
(∑ f i + 1)
2
3
(∑ f i + 1) − Fa (Q3 − 1)
Q3 = xQ3
inf
+ hQ3 4
f Q3
63
unde: xQ1inf, xQ2inf, xQ3inf – limita inferioară a intervalului în care se
găseşte Q1, Q2, Q3;
hQ1, hQ2, hQ3 – lungimea intervalului în care se găseşte Q1, Q2, Q3;
fQ1, fQ2, fQ3 – frecvenţa absolută a intervalului în care se găseşte Q1,
Q2, Q3;
Fa(Q1- 1); Fa(Q2-1); Fa(Q3-1) – frecvenţele cumulate până la
intervalul precedent cuartilelor.
2.3.Decilele (în număr de nouă: D1, D2, D3, D4, D5=Me, D6, D7, D8,
D9) sunt acele valori ale caracteristicii ce împart seria în zece părţi
egale, conţinând fiecare 10% din numărul observaţiilor.
În cazul unei serii simple, ordonate crescător sau descrescător,
decilele se determină conform definiţiei.
Pentru seriile de repartiţie cu frecvenţe pe variante, cele două
decile DK, K=1,2,3,…9, vor fi, pe rând, acele valori ale caracteristicii
corespunzătoare primei frecvenţe cumulate ascendent, ce depăşeşte
expresia: K/10(Σfi+1); K=1,2,3,…9.
Pentru seriile de repartiţii cu frecvenţe pe intervale, decilele se
determină după formulele următoare:
1
(∑ f i + 1) − Fa (D1 − 1)
D1 = x D1 + hD21 ⋅ 10
inf
f D1
2
(∑ f i + 1) − Fa (D2 − 1)
D2 = x D2
inf
+ hD2 ⋅ 10
f D2
.....
5
(∑ f i + 1) − Fa (D5 − 1)
D5 = xD5
inf
+ hD5 ⋅ 10 = Me
f D5
......
64
9
(∑ f i + 1) − Fa (D9 − 1)
D9 = x D9
inf
+ hD9 ⋅ 10
f D9
Notaţiile sunt asemănătoare cu cele de la cuartile.
A= xnsup –x1inf
65
Amplitudinea se exprimă în unitatea de măsură a caracteristicii şi
de aceea, ea nu poate fi utilizată în comparaţii, ca măsură a variaţiei,
decât pentru seriile unde caracteristicile sunt exprimate în aceeaşi
unitate de măsură. Pentru a elimina acest inconvenient, se calculează
amplitudinea relativă a variaţiei.
A%= (A / x ) 100
Rezultatul arată ponderea amplitudinii în valoarea mediei.
di= xi-x = ±
Rezultatul arată abaterile valorilor individuale de la media lor.
66
b) Dispersia, σ2;
c) Abaterea medie pătratică, σ;
d) Coeficientul de variaţie, v.
∑ xi − x ∑x i − Me
dx = i =1
dMe = i =1
n n
- pentru o serie de distribuţie cu frecvenţe absolute:
n n
∑ xi − x ⋅ f i ∑x i − M e ⋅ fi
dx = i =1
n
d Me = i =1
n
∑
i =1
fi ∑f i =1
i
∑x
n
− x ⋅ fi
*
∑x − M e ⋅ fi
*
i
i
dx = i =1
n d Me = i =1
∑f
* n
∑f
*
i
i
i =1
i =1
67
aritmetică simplă sau ponderată a pătratelor abaterilor individuale de
la media lor.
Astfel:
- pentru o serie descriptivă:
∑ (x i − xi ) 2
σ2 = i =1
n
∑ (x i − xi ) 2 ⋅ f i
σ2 = i =1
n
∑f i =1
i
∑ (x − xi ) 2 ⋅ f i
*
i
σ2 = i =1
n
∑f
*
i
i =1
∑ (x )
2
−x
σ=
i
68
- pentru o serie de distribuţie cu frecvenţe absolute:
∑ (x − x )
2
⋅ fi
σ=
i
∑f i
∑ (x )
2
− x fi
*
σ=
i
100
69
- ca raport între abaterea medie liniară (d ) şi media colectivităţii
(x ):
d
v= ⋅ 100
x
xi − a
2
∑
h
σ =
2
⋅ f i ⋅ h 2 − ( x − a) 2
∑ fi
- pentru o serie de distribuţie cu frecvenţe relative:
xi − a 2 *
∑( h
) ⋅ fi
σ2 = ⋅ h 2 − ( x − a) 2
100
∑σ ⋅ f.j
2
j
2 j =1
σ = p
∑ f.j
j =1
j=1,2,…,p - numărul grupei
71
Dispersia de grupă,σj2, se calculează ca o medie a pătratelor
abaterilor variantelor variabilei din cadrul unei grupe faţă de media
lor, după formula:
-dispersia de grupă: - media unei grupe j:
n
∑ (x
n
− xj )
2
f ij ∑x i f ij
xj = i =1
i
σ j2 = i =1 n
∑f
n
ij
∑f⋅j
i =1
i =1
unde: i=1,2,…k; j=1,2,…p.
∑ (x )
p
2
j − x ⋅ f.j
j =1
δ2 = p
∑ f.
j =1
j
72
∑ (x )
n
2
i − x ⋅ fi
σ 02 = i =1
n
∑f
i =1
i
δ2 σ2
R2 = ⋅ 100 K2 = ⋅ 100
σ 02 σ 02
R 2 + K 2 = 100
73
III.5. Analiza asimetriei repartiţiilor empirice
74
fi fi fi
fmax
xi Mo Me x xi x Me
x =Me=Mo
x>Mo x< Mo
a.serie perfect simetrică b. asimetrie pozitivă c.asimetrie
negativă
Fig. 3.1. Formele repartiţiilor empirice ale unei serii de distribuţie
C , as =
(
3 x − Me )
σ
unde: C’as ∈[-3;3]
Această formulă se foloseşte pentru seriile uşor asimetrice, în care
pentru un număr mare de cazuri individuale se verifică relaţia :
(Q3 − M e ) − (M e − Q1 )
C asy =
(Q3 − M e ) + (M e − Q1 )
75
unde: Casy ∈[-1; 1]
Dacă Casy =0 → serie simetrică.
Dacă Q3 - Me>Me – Q1 → Casy∈(0;1] → serie cu asimetrie pozitivă.
Dacă Q3 - Me<Me – Q1 → Casy∈[-1;0) →serie cu asimetrie
negativă.
CasB =
(D9 − M e ) − (M e − D1 )
(D9 − M e ) + (M e − D1 )
unde: CasB ∈[-1;1].
Cu cât valoarea coeficientului este mai apropiată de zero, cu atât
repartiţia este mai simetrică, iar cu cât coeficientul este mai apropiat
de ±1, cu atât seria este mai asimetrică.
Gradul şi tendinţa de asimetrie se pot caracteriza cu ajutorul
indicatorului denumit densitatea de repartiţie a frecvenţelor, util în
special în cazul seriilor de repartiţie pe intervale mari sau neegale.
Acest indicator se calculează raportând fiecare frecvenţă absolută
sau relativă, la lungimea intervalului respectiv. Dacă se utilizează
frecvenţele absolute, obţinem densitatea absolută a frecvenţelor (da),
iar dacă se utilizează frecvenţele relative, atunci rezultă densitatea
relativă a frecvenţelor (dr), astfel:
fi
da = f
*
hi dr = i
hi
unde: fi - frecvenţa absolută a intervalului i;
hi – mărimea intervalului i;
fi* - frecvenţa relativă a intervalului i.
76
Dacă valorile acestor indicatori au tendinţă de creştere către
valoarea centrală a caracteristicii, înseamnă că seria de distribuţie are
tendinţă de normalitate.
77
CAPITOLUL IV
78
Legăturile funcţionale sunt legături univoce, realizate direct între
două fenomene, în care unei valori a fenomenului independent x, îi
corespunde o singură valoare a fenomenului dependent y, în cazul în
care condiţiile rămân neschimbate.
Legăturile stohastice, de natură probabilistică, numite legături
statistice, presupun ca unei valori a caracteristicii factoriale x să îi
corespundă o distribuţie de valori a caracteristicii rezultative y, şi
aceasta pentru că y este influenţat nu doar de x ci şi de alţi factori.
Fenomenelor economico-sociale le sunt specifice legăturile
statistice generate de factori multipli, cu influenţe în sensuri şi de
intensităţi diferite. Ca urmare, legătura nu se manifestă în fiecare caz
în parte, ci numai în general şi în medie, pe baza unui număr mare de
cazuri individuale.
Legăturile statistice se pot clasifica după mai multe criterii.
79
exemplu, legătura între venitul populaţiei (x) şi volumul vânzărilor
unui produs (y);
b. legături indirecte, când modificarea caracteristicii factoriale x, are
ca efect modificarea în sens opus a caracteristicii rezultative y; de
exemplu, legătura dintre preţul unui produs (x) şi volumul vânzărilor
(y).
4.După forma modelului matematic prin care se exprimă
legătura:
a. legături liniare, când se exprimă prin ecuaţia liniei drepte; de
exemplu, legătura între veniturile lunare (x) şi cheltuielile lunare (y);
b. legături neliniare, când se exprimă prin ecuaţia unei curbe:
parabolă, hiperbolă, ecuaţie exponenţială; de exemplu, o legătură prin
parabolă poate fi între cantitatea de îngrăşăminte administrate (x) şi
producţia la hectar (y).
80
IV.2. Identificarea şi exprimarea formei legăturilor
81
calculate pentru caracteristica rezultativă (y) în ce priveşte valorile
centralizate pe fiecare grupă, indicatorii medii şi relativi. Pentru
caracterizarea legăturii, ca tendinţă generală, se pot folosi mediile de
grupă. Acestea exprimă ceea ce este esenţial şi tipic în formarea
fenomenului studiat. Cu cât numărul de grupe este mai mare, cu atât
este mai fidel redată tendinţa manifestată în variaţia caracteristicilor,
iar pentru a reda cât mai obiectiv densitatea de repartiţie a frecvenţelor
pe grupe, este necesar ca gruparea să se facă pe intervale egale.
Prin prezentarea în paralel şi compararea variaţiei caracteristicii
rezultative (y), condiţionată de variaţia caracteristicii factoriale, se
asigură verificarea legăturii şi aprecierii direcţiei acesteia.
82
ordonatelor (0y) valorile caracteristicii rezultative y, iar intersecţia
cuplurilor de valori se marchează cu câte un punct. Cu cât dispunem
de un număr mai mare de valori înregistrate, cu atât imaginea este mai
sugestivă, obţinându-se pe grafic un număr mai mare de puncte de
intersecţie, fapt pentru care acest grafic mai este denumit şi “graficul
norilor de puncte”.
Prin imaginea oferită, graficul de corelaţie permite verificarea
existenţei legăturii şi sugerează nu numai sensul legăturii, dar şi forma
de legătură. Astfel:
- dacă punctele sunt dispersate la întâmplare, fără nici o
regularitate, iar linia trasată în mijlocul norului de puncte este paralelă
cu axa absciselor, rezultă că legătura între cele două caracteristici nu
este semnificativă sau nici nu există;
- dacă punctele se dispersează în direcţia unei anumite linii, ce
nu este paralelă cu axa Ox, rezultă că cele două caracteristici sunt
corelate;
- dacă tendinţa de concentrare a punctelor este în jurul
diagonalei ce leagă colţul stâng jos cu colţul drept sus a graficului,
rezultă o legătură liniară directă, iar dacă această diagonală leagă
colţul stâng sus cu colţul drept jos, rezultă o legătură liniară inversă. În
cazul legăturilor de tip liniar (directă sau inversă), variaţia celor două
caracteristici este uniformă.
Formele legăturilor în cazurile prezentate anterior sunt
reprezentate:
yi yi yi
xi xi xi
a.Lipsa legăturii b. Legătură liniară c. Legătură
liniară
directă inversă
Fig. 4.1. Forme ale legăturilor liniare
83
În practică, există situaţii când între x şi y există o legătură
neliniară, de forma unei hiperbole, parabole, funcţii exponenţiale sau
de alt tip şi variaţia caracteristicii rezultative (y), sub influenţa
modificării caracteristicii factoriale (x) este neuniformă.
xi xi xi
a.Legătură hiperbolică b. Legătură parabolică c.legătură
exponenţială
Fig.4.2. Forme de legături neliniare
84
IV.3. Metoda regresiei
85
yxi – valorile ecuaţiei de regresie, calculate pentru toate
unităţile observate, pe baza valorilor individuale xi şi sunt numite
valori teoretice ale lui y în funcţie de x; acestea se notează ca o medie,
întrucât evidenţiază tendinţa de realizare a corelaţiei, respectiv
tendinţa de variaţie a lui y, dacă ar fi depins numai de variaţia lui x;
xi – valorile individuale ale caracteristicii factoriale, obţinute
din observare;
a – parametru cu sens geometric de “ordonata de origine a
dreptei”, fiind valoarea lui y când x = 0; nu are semnificaţie
independentă, putând avea sens pozitiv sau negativ;
b- parametru numit “coeficient de regresie”, ce arată cu cât se
modifică y, dacă x se modifică cu o unitate; în graficul de corelaţie, b
indică panta liniei drepte.
Semnul coeficientului de regresie b, indică sensul legăturii, astfel
dacă:
b>0 ⇒ legătură directă;
b=0 ⇒ lipsa legăturii;
b<0 ⇒ legătură inversă.
Operaţia de înlocuire a termenilor înregistraţi, obţinuţi din
observare (yi), cu termenii teoretici, obţinuţi din calcul (yxi), ce
elimină variaţiile întâmplătoare şi evidenţiază tendinţa esenţială, se
numeşte ajustare.
Funcţia de ajustare, reprezentată printr-o dreaptă de regresie este:
y xi = a + bxi i = 1, n
Iar valorile înregistrate sunt de forma:
y i = a + bxi + ε i i = 1, n
Ajustarea se exprimă astfel:
yi − y xi = a + bxi + ε i − a − bxi = ε i
Se poate spune că estimarea parametrilor se bazează pe determinarea
funcţiei care minimizează erorile de ajustare. În cazul în care factorul
x este determinant pentru y, iar legătura este liniară, atunci valorile
ecuaţiei de regresie (yxi) trebuie să prezinte abateri minime faţă de
valorile înregistrate yi.
86
Întrucât aceste abateri se pot produce într-un sens sau altul, ele
sunt ridicate la pătrat, iar metoda se numeşte metoda celor mai mici
pătrate.
Determinarea parametrilor a şi b se face prin minimizarea funcţiei
de două variabile, ce are forma:
( )
n 2
F (a, b ) = ∑ y i − y xi = min
i =1
sau
∂F (a, b ) ∂F (a, b )
=0 =0
∂a n
∂b
2
2∑ ( y i − a − bxi ) ⋅ 1 = 0
Rezultă sistemul:
Σa + Σbxi - Σyi = 0
Σaxi +Σbxi2 - Σxiyi = 0
na + bΣxi = Σyi
aΣxi + bΣxi2 = Σxiyi
x=
∑x i
y=
∑y i
n n
yxi = a + bxi , iar apoi se trece la ajustare.
87
Dacă funcţia de ajustare (yxi ) este corect aleasă şi datele utilizate
satisfac condiţia de omogenitate şi volum, atunci seria ajustată
exprimă clar tendinţa manifestată în dependenţa fenomenului.
Având calculate Σxi , Σyi şi cunoscând valoarea lui n, se pot
determina:
Înlocuind aceste valori în ecuaţia dreptei de regresie se obţine:
b=
∑ (x − x )(y − y )
i i
∑ (x − x )
2
i
y = a +bx +cx2 + ε
( )
n 2
F(a ,b ,c ) = ∑ y i − y xi
i =1
obţinând sistemul de ecuaţii normale:
na + bΣxi + cΣxi2 = Σy
aΣxi +bΣxi2 +cΣxi3 = Σxiyi
aΣxi2 +bΣxi3 + cΣxi4 =Σxi2yI
88
Valorile obţinute pentru parametrii a,b,c se introduc în ecuaţia de
regresie şi se determină valoarea ecuaţiei pentru fiecare valoare a
caracteristicii xI , după care se trece la ajustare.
atunci se obţine:
y’ = a’ +b’ xi
Se aplică în continuare metoda celor mai mici pătrate, ca şi în cazul
regresiei liniare simple şi se obţine sistemul de ecuaţii normale:
b'
y =a+ +ε
x
89
În continuare ajustarea se realizează prin parcurgerea aceloraşi
paşi ca la modelele anterioare.
1 1 y
1 a∑ + b∑ 2 = ∑ i
na + b∑ = ∑ y i xi xi xi
xi
∑ (y ) = ∑ [y
n
− (a + b1 x1i + b2 x 2i + ... + bm x mi )]
2 2
i − y xi i
i =1
Similar modelului regresiei simple liniare, prin derivarea funcţiei
în raport cu toţi parametrii a, bk, se obţine sistemul de ecuaţii normale
cu k = 1, 2,…,m caracteristici factoriale şi m + 1 ecuaţii:
na + b1Σx1i + b2Σx2i + …+ bmΣxmi = Σyi
aΣx1i + b1Σx1i2 +b2Σx1ix2i +…+ bmΣx1ixmi = Σx1iyi
aΣx2i + b1Σx1ix2i + b2Σx2i2 +…+ bmΣx2ixmi = Σx2iyi
.
.
aΣxmi + b1Σx1Ixmi +…+ bmΣxmi2 = Σxmiyi
90
2. Regresia multiplă curbilinie se utilizează în cazul când
caracteristicile factoriale acţionează prin multiplicarea lor, iar
influenţele sunt proporţionale cu valoarea acestora.
Modelul are forma:
III(-,-) IV(+,-)
91
Formula de calcul a covariaţiei este:
COV( x , y ) =
∑ (x i − x yi − y)( )
n
xi − x y i − y
∑ σ σ
rx , y =
x y = ∑ (x i )(
− x yi − y ) = cov(x, y )
n nσ x σ y σ xσ y
n∑ xi yi − ∑ xi ∑ yi
rx , y =
[n∑ x i
2 2
][
− (∑ xi ) n∑ yi − (∑ yi )
2 2
]
In practica statistică se utilizează frecvent această formulă, deoarece
conţine elemente deja calculate la ecuaţiile de regresie.
Coeficientul de corelaţie ia valori în intervalul [-1, 1].
Dacă: r∈(0, 1] → legătură directă;
92
r∈[-1, 0) → legătură inversă;
r=0 →x şi y sunt caracteristici independente sau
necorelate liniar.
Cu cât rezultatul coeficientului r se apropie de 1 sau de –1, cu atât
legătura este mai intensă.
r 2 y / x1 + r 2 y / x2 − 2ry / x1 ⋅ ry / x2 ⋅ rx1 / x2
ry / x1 , x2 =
1 − r 2 x1 / x2
unde:
n∑ x1 y − ∑ x1 ∑ y
ry / x1 =
[n∑ x 1
2 2
][
− (∑ x1 ) n∑ y 2 − (∑ y )
2
]
n∑ x 2 y − ∑ x 2 ∑ y
ry / x 2 =
[n∑ x 2
2 2
][
− (∑ x 2 ) n∑ y 2 − (∑ y )
2
]
n∑ x1 x 2 − ∑ x1 ∑ x 2
rx1 / x2 =
[n∑ x 1
2 2
][
− (∑ x1 ) n∑ x 2 − (∑ x 2 )
2 2
]
Rezultatul se interpretează în acelaşi mod ca şi cel al coeficientului
de corelaţie simplă.
93
d) Raportul de corelaţie este indicatorul utilizat pentru
măsurarea intensităţii în cazul legăturilor neliniare. Calculul se
bazează pe descompunerea dispersiei totale a caracteristicii rezultative
y (σy2), în dispersia valorilor observate faţă de valorile estimate,
printr-o ecuaţie de regresie (σ2y/r) şi dispersia valorilor estimate faţă de
medie (σ2r/y), utilizând formula:
sau
∑ (y y ) ∑ (y ) + ∑ (y )
2 2 2
− y xi −y
=
i i xi
n n n
∑ (y )
2
−y
∑ (y )
xi 2
σ 2r / y n −y
= 2 = =
2 xi
∑( ) ∑ (y − y)
R x, y
σ y yi − y
2
i
2
94
∑ (y ) 2
− y xi
∑ (y − y )
i 2
σ 2y/r n
= 2 = =
2 i xi
∑( ) ∑ (y − y )
K x, y
σ y yi − y
2
i
2
n
Între R2 şi K2 se stabilesc următoarele relaţii:
R2x,y + K2x,y = 1 R2xy = 1 – K2x,y
Dacă R2x,y > K2x,y ⇒ caracteristica factorială (K) este factor
determinant pentru variaţia caracteristicii rezultative.
Raportul de corelaţie (Rx,y) se obţine ca rădăcină pătrată a
coeficientului de determinaţie:
R xy = R 2 xy Rx, y = 1 − K 2 x, y
∑ (y ) ∑ (y − y )
2 2
−y
Rx, y = Rx, y =
xi i xi
∑ (y − y) ∑ (y − y )
2 2
i i
Unde: Rx,y ∈ [0, 1]. Cu cât valoarea lui Rxy este mai apropiată de 1,
cu atât legătura este mai strânsă.
95
Gradul de asociere dintre cele două caracteristici x şi y se măsoară
cu ajutorul coeficientului de asociere Yule, notat Cay obţinut pe baza
următoarei formule:
f11 f 22 − f 21 f12
C ay =
f11 f 22 + f 21 f12
f11 f 22 − f 21 f12
Cc =
( f11 + f12 )( f 21 + f 22 )( f11 + f 21 )( f12 + f 22 )
96
- rangul pentru y va fi Ry = 1, 2, …, n;
3) se determină diferenţele de rang pentru fiecare cuplu de valori
(xi, yi): Di = Ryi - Rxi ;
4) se stabileşte pentru fiecare valoare a caracteristicii rezultative
(yi) asociată caracteristicii factoriale (xi):
- numărul de ranguri superioare, notat P;
- numărul de ranguri inferioare, notat Q;
5) se calculează scorul S, după formula:S = P - Q
Legătura dintre x şi y se caracterizează cu ajutorul următorilor
coeficienţi de corelaţie a rangurilor:
- Coeficientul lui Spearman care are formula:
n
6∑ Di
2
CS = 1 − i =1
n3 − n
97
CAPITOLUL V
SONDAJUL STATISTIC
98
Diferenţa dintre media colectivităţii şi media eşantionului se
numeşte eroare de reprezentativitate.
Erorile de reprezentativitate pot fi:
- sistematice, care provin din nerespectarea principiului
fundamental al eşantionării şi anume nerespectarea caracterului aleator
al prelevării unităţilor;
-întâmplătoare, care nu pot fi evitate, şi sunt cauzate de un
număr mare de factori, dar ele sunt previzibile.
99
înregistrarea caracteristicilor urmărite sunt reintroduse în colectivitate,
atunci se aplică sondajul simplu “nerepetat”.
Procedeele ce pot fi utilizate pentru alcătuirea eşantionului
sunt:
1) Procedeul bilei revenite şi nerevenite;
2) Procedeul tabelului numerelor aleatoare;
3) Procedeul mecanic.
100
3) Procedeul mecanic este mai rapid şi presupune stabilirea
pasului de numărare şi a unităţii de la care se va porni, întrucât
includerea unităţilor în eşantion se face asemănător unei progresii
aritmetice.
Aplicarea acestui procedeu presupune parcurgerea
următoarelor etape:
- Se calculează raţia progresului, respectiv pasul de numărare,
cu relaţia:
p = N/n, unde N – volumul colectivităţii totale
n – volumul eşantionului
- dispersia eşantionului:
- dispersia colectivităţii:
101
σ2 = Σ(xi - m) / N
102
potrivit căreia dispersia mediilor tuturor eşantioanelor de la media
colectivităţii generale (∆(x) sau σ2x ) înmulţită cu volumul
eşantionului (n):
σ2 σ S
σx = = ≅
n n n
Sˆ 2 =
1
n −1
∑ xi − x( )
2
103
extragerilor, volumul colectivităţii generale micşorându-se treptat cu
câte o unitate.
Probabilităţile de a fi incluse în eşantion vor fi pe rând:
- pentru prima extragere: p1 = 1 / N p=1/N
- pentru a doua extragere: p2 = 1 / (N – 1) p = 1 / (N – 1)
- pentru a treia extragere: p3 = 1 / (N – 2) p = 1 / (N – 2)
1
- pentru a n-a extragerea p n =
N − (n − 1)
N!
CnN =
n!( N − n )!
S2 =
1
n
(
∑ xi − x )2
este estimatorul dispersiei σ2, stabilit pe
σ2 N −n σ N −n S N −n
σx = ⋅ = ⋅ ≈ ⋅
n n −1 n N −1 n n −1
104
N −n
Raportul se numeşte coeficient de corecţie a erorii
N −1
medii de reprezentativitate.
Pentru colectivităţile mari, nu se mai scade 1 de la numitor, iar
coeficientul de corecţie a erorii de reprezentativitate devine:
N −n n
= 1−
N N
unde raportul n / N poartă denumirea de proporţie de sondaj.
N −n
În calcule, pentru n / N <0,2 – coeficientul nu se ia
N −1
în considerare.
Coeficientul de corecţie a erorii medii de reprezentativitate
este întotdeauna subunitar, de aceea eroarea sondajului nerepetat este
întotdeauna mai mică decât eroarea sondajului repetat.
În general, precizia estimaţiei mediei colectivităţii generale
(m) prin media eşantionului (x ), exprimată sintetic cu ajutorul erorii
medii de reprezentativitate (σx) depinde mai mult de volumul
eşantionului (n) decât de volumul colectivităţii generale (N).
105
În cazul formării tuturor eşantioanelor posibile, suma probabilităţilor
de apariţie este egală cu 1. În practică însă, nu se cunosc aceste medii
de sondaj şi nici probabilităţile lor de apariţie, de aceea în calcularea
erorii limită (δ) se porneşte de la relaţia erorii medii de
reprezentativitate (σx) căreia se aplică un coeficient z.
σ2
Astfel: δ = σx ⋅ z , respectiv δ = z ⋅ → pentru sondajul
n
aleator repetat
σ2 N −n
δ =z ⋅ pentru sondajul aleator nerepetat
n N −1
Coeficientul z se determină în funcţie de probabilitatea cu care
se garantează rezultatele şi este tabelat, fiind argumentul funcţiei de
repartiţie normală Gauss-Laplace:
z 1
− z2
φ (z ) =
1
⋅ ∫e 2
dz
2π −z
106
σ σ2
δ =z , relaţia ridicată la pătrat, devine: δ 2 = z 2 ⋅ , de
n n
unde se obţine volumul eşantionului:
z 2 ⋅σ 2
n= , unde z se citeşte în tabelele funcţiei Gauss-
δ2
Laplace.
Dacă dispersia, în colectivitate generală presupusă normală,
nu este cunoscută, atunci ea poate fi estimată cu ajutorul dispersiei de
sondaj, calculată pe baza unui eşantion de volum redus, extras din
colectivitatea de bază.
Astfel, n = (z2 ⋅ σ2) / δ2 devine:
t n −1,γ ⋅ Sˆ 2
n= , unde,
δ2
t2n-1 este valoarea tabelară a variabilei Student cu n-1 grade de libertate
corespunzătoare nivelului de încredere γ.
b) Cazul sondajului nerepetat
Pentru determinarea volumului eşantionului în cazul sondajului
nerepetat este necesar să se cunoască şi volumul colectivităţii
generale.
Formulele cu ajutorul cărora se calculează volumul eşantionului în
acest caz, sunt următoarele:
σ2 n 2 σ
2
n
δ =z 1 − se ridică la pătrat δ = z
2
1 −
n N n N
N ⋅ z 2 ⋅σ 2 z 2σ 2
n= ⇒ n=
N δ 2 + z 2σ 2 z 2σ 2
δ2 +
N
107
Dispersia generală a colectivităţii (σ2), se poate afla din
cercetări anterioare, dintr-o cercetare prealabilă organizată pentru
estimarea dispersiei sau se determină cu ajutorul formulei:
σ max 2
=
(x min ) (
2
− x + x max − x )
2
σ2 = σ2 + δ2
Volumul eşantionului se determină după formulele:
108
serii se aleg întâmplător r serii, folosind unul din procedeele
prezentate. Seriile selectate fac parte din eşantion şi se
înregistrează întregul.
109
BIBLIOGRAFIE
110
Isaic-Maniu Al., Grădinaru A., Voineagu V., Mitruţ C-tin,
Statistică teoretică şi economică, Ed. Tehnică, Chişinău, 1994
Isaic- Maniu Al., Mitruţ C-tin, Voineagu V., Statistica pentru
managementul afacerilor, ediţia a II-A, Ed. Economică, Bucureşti,
2000
Isaic- Maniu Al., Mitruţ C-tin, Voineagu V., Statistică, ediţia a II-
A, Ed. Universitară, Bucureşti, 2004
Ivănescu I. (coordonator), Statistică, Ed. Didactică şi Pedagogică,
Bucureşti, 1980
Jaba E., Statistica, Ed. Economică, Bucureşti, 1998
Kaufmann P., Statistique. Information. Estimation, Dunod, Paris,
1994
Lilea E., Goschin Z., Vătui M., Boldeanu D., Statistică aplicată, Ed.
Tribuna Economică, Bucureşti, 2002
Marin G., Puiu Al., Dicţionar de relaţii economice internaţionale,
Ed. Enciclopedică, Bucureşti, 1993
Mihoc Gh., Urseanu V., Urseanu E., Modele de analiză statistică,
Ed. Ştiinţifică şi Enciclopedică, Bucureşti, 1982
Negoescu Gh., Statistică, Ed. Zigotto, Galaţi, 1994
Negoescu Gh., Statistica ramurilor, Ed. Zigotto, Galaţi, 1995
Negoescu Gh., Ciobanu R., Bontaş A.C., Bazele statisticii pentru
afaceri, Ed. ALL BECK, Bucureşti, 1999
Niculescu I., Grădinaru G., Analiza statistică a activităţii economice
a întreprinderii, Ed. ASE, Bucureşti, 2001
Novak, Andrei, Statistică – teorie, aplicaţii, exerciţii, Ed. Sylvi,
Bucureşti, 2001
Quinet E., Series temporelles et decisions economiques, Ed. Dunod,
Paris, 1969
Roman M., Statistică financiar-bancară şi bursieră, Ed. ASE,
Bucureşti, 2003
Rotariu T., Iluţ P., Ancheta sociologică şi sondajul de opinie, Ed.
Polirom, Iaşi, 2001
Resa I.D., Statistică, Universitatea din Timişoara, 1986
Semenescu A., Statistică teoretică, statistică economic, matematici
financiare, aplicaţii informatice specializate, Ed. Matrix Rom,
Bucureşti, 2004
Şerban D., Statistica pentru studii de marketing şi administrarea
afacerilor, Ed. ASE, Bucureşti, 2004
111
Tővissi L., Isaic- Maniu Al., Statistica, ASE Bucureşti, 1994
Trebici, V., Mică enciclopedie statistică, Ed. Ştiinţifică şi
Enciclopedică Bucureşti, 1985
Yule G.U., Kendall, M.G., Introducere în teoria statisticii, Ed.
Ştiinţifică, Bucureşti, 1969
Ţarcă M., Statistică, Universitatea “Al. I. Cuza” Iaşi, 1984
Ţarcă M., Tratat de statistică aplicată, Ed. Didactică şi Pedagogică,
Bucureşti, 1998
Vaşloban E., Vaşloban G., Statistică, Ed. Univ. “Petru Maior”,
Tg.-Mureş, 1998
Voineagu V., Colibabă D., Grădinaru G., Statistică. Noţiuni
fundamentale şi aplicaţii, Ed. ASE, Bucureşti, 2002
Voineagu V., Ţiţan E., Ghiţă S., Statistică aplicată, Ed. Fundaţiei
“România de mâine”, Bucureşti, 2000
*** - Anuarul Statistic al României, 1989-2007
***- Dicţionar statistico-economic, D.C.S., Bucureşti, 1969
112