Sunteți pe pagina 1din 102

UNIVERSITATEA EFTIMIE MURGU REIA

DEPARTAMENTUL DE INVMNT LA DISTAN

STATISTIC

prof. univ.dr. LIVIU SPTARU

2014

CUPRINS
Unitate
de
nvare
1.
1.1
1.2
1.3
1.4
1.5
2.
2.1
2.2
2.3
2.4
2.5
3.
3.1.
3.2.
3.3.
3.4.
3.5.
4.
4.1.
4.2.
4.3.
4.4.
4.5.

5.
5.1.
5.2.
5.3.
5.4.
5.5.

Titlul

Pagina

INTRODUCERE N STATISTIC
Obiectivele unitii de nvare Nr.1
Apariia i dezvoltarea. Obiect. Metod.
Teste de evalure 1 a unitii de nvare Nr.1
Rezumat
Bibliografia unitii de nvare

7
7
7
10
10
10

DEFINIREA PRINCIPALELOR CONCEPTE FOLOSITE N


STATISTIC. LIMBAJUL STATISTIC
Obiectivele unitii de nvare Nr.2
Concepte de baz utilizate n statistic
Teste de evalure 1 a unitii de nvare Nr.2
Rezumat
Bibliografia unitii de nvare
OBSERVAREA STATISTIC
Obiectivele unitii de nvare Nr.3
Locul i rolul observrii statistice. Metode de observare. Eroarea
statistic
Teste de evalure 1 a unitii de nvare Nr.3
Rezumat
Bibliografi unitatii de invatare Nr. 4
PRELUCRAREA DATELOR STATISTICE
Obiectivele unitii de nvare Nr.4
Planul prelucrrii. Tehnici de prelucrare. Centralizare. Metoda
gruprii.
Teste de evalure 1 a unitii de nvare Nr.4
Rezumat
Bibliografia unitii de nvare
TEMA DE CONTROL NR. 1 (TC1)
GRUPAREA DATELOR STATISTICE
CLASIFICAREA I GRUPAREA STATISTIC PRINCIPALELE
TEHNICI DE ORGANIZARE A DATELOR N VEDEREA
PRELUCRRII
Obiectivele unitii de nvare Nr.5
Generaliti. Clasificare. Modaliti de obinere a gruprii
Teste de evalure 1 a unitii de nvare Nr.5
Rezumat
Bibliografia unitii de nvare
3

11
11
11
13
13
13
15
15
15
22
22
23
24
25
25
29
30
30
30
31
31
31
36
36
36

6.
6.1.
6.2.
6.3.
6.4.
6.5.
7.
7.1.
7.2.
7.3.
7.4.
7.5.
8.
8.1.
8.2.
8.3.
8.4.
8.5.
9.
9.1.
9.2.
9.3.
9.4.
9.5.
10.
10.1.
10.2.
10.3.
10.4.
10.5.
11.
11.1.
11.2.
11.3.
11.4.
11.5.

12.
12.1.
12.2.

INDICATORI STATISTICI
Obiectivele unitii de nvare Nr.6
Mrimile relative
Teste de evalure 1 a unitii de nvare Nr.6
Rezumat
Bibliografia unitii de nvare
MRIMILE MEDII. MEDIA CA INDICATOR STATISTIC
ESENIAL
Obiectivele unitii de nvare Nr.7
Mrimile medii
Teste de evalure 1 a unitii de nvare Nr.7
Rezumat
Bibliografia unitii de nvare
SERII DE REPARTIIE DE FRECVENE
Obiectivele unitii de nvare Nr.8
Indicatori ai tendinei centrale
Teste de evalure 1 a unitii de nvare Nr.8
Rezumat
Bibliografia unitii de nvare
VARIAIA N COLECTIVITILE MPRITE PE GRUPE I
MSURAREA EI
Obiectivele unitii de nvare Nr.9
Indicatori ai variaiei
Teste de evalure 1 a unitii de nvare Nr.9
Rezumat
Bibliografia unitii de nvare
METODE DE EANTIONARE PENTRU EFECTUAREA
SONDAJELOR STATISTICE
Obiectivele unitii de nvare Nr.10
Generaliti. Noiuni. Modaliti de alctuire a eantioanelor
Teste de evalure 1 a unitii de nvare Nr.10
Rezumat
Bibliografia unitii de nvare
ESTIMAREA MEDIEI I DISPERSIEI I MSURAREA
PRECIZIEI LOR N SONDAJUL STATISTIC
Obiectivele unitii de nvare Nr.11
Sondajul. Probabiliti i intervalle de ncredere
Teste de evalure 1 a unitii de nvare Nr.11
Rezumat
Bibliografia unitii de nvare
TEMA DE CONTROL NR.2 (TC 2)
EANTIONAREA
SIMPL
ALEATOARE
NEREPETAT.ESTIMAREA MEDIEI I DISPERSIEI N BAZA
ACESTORA
LEGTURILE DINTRE VARIABILELE ECONOMICE
Obiectivele unitii de nvare Nr.12
Concept. Tipuri de legturi. Metode de caracterizare a legturilor
4

37
37
37
41
41
41
43
43
43
45
47
48
49
49
49
52
54
55
57
57
57
62
66
66
67
67
67
71
71
72
73
73
73
79
81
82
82

83
83
83

12.3. Teste de evalure 1 a unitii de nvare Nr.12


12.4. Rezumat
12.5. Bibliografia unitii de nvare
TEMA DE CONTROL NR. 3 (TC 3)
EXPLICAI NATURA PRINCIPALELOR LEGTURI NTRE
VARIABILELE ECONOMICE I ESENA ACSTORA
13.
METODE COMPLEXE DE ANALIZ A LEGTURILOR.
METODA REGRESIEI.
13.1. Obiectivele unitii de nvare Nr.13
13.2. Metoda regresiei
13.3. Teste de evalure 1 a unitii de nvare Nr.13
13.4. Rezumat
13.5. Bibliografia unitii de nvare
14.
MSURAREA INTENSITII
LEGTURILOR
DINTRE
VARIABILELE ECONOMICE
14.1. Obiectivele unitii de nvare Nr.14
14.2. Indicatorii statistici ai corelaiei
14.3. Teste de evalure 1 a unitii de nvare Nr.14
14.4. Rezumat
14.5. Bibliografia unitii de nvare

86
86
86
86
87
87
87
91
92
92
93
93
93
100
101
102

Obiectivele cursului
Dupa finalizarea cursului, cursantii vor fi capabili sa:
utilizaze corect limbajul impus de disciplina Statistic;
delimiteze corect obiectul de studiu, domeniul de cercetare, obiectivele si
metodologia implicata de disciplina Statistic;
aplice tipurile de analiza specifice pe diverse situatii ;
valorifice informatiile transmise prin acest material pentru dezvoltarea
competentelor proprii
Competene conferite
Competente cognitive :
- cunoaterea metodelor statistice ;
Competente practic-aplicative :
- rezolvarea unor aplicaii aferente cursului ;
Competente de comunicare si relationare :
- nsuirea limbajului specific.
Cerinte preliminare
Este necesara actualizarea tuturor cunostintelor la disciplina Statistic acumulate
pe parcursul studiilor anterioare.

Resurse si mijloace de lucru


Parcurgerea unitatilor de invatare necesita (sau nu) existenta unor mijloace sau
instrumente speciale (laborator, software etc.). Metoda este cea a studiului
individul, combinata cu metodele folosite in timpul activitatilor tutoriale (activitati
desfasurate in grupe, invatarea prin cooperare, metode care vor putea fi utilizate si
in propria activitate didactica, ulterioara absolvirii studiilor de licenta).

Structura cursului
Cursul este structurat pe 14 unitati de invatare, pentru fiecare fiind indicat timpul
alocat studiului individual.
Sunt propuse 2-3 Teme de control, plasate dupa anumite unitati de invatare, a
caror rezolvare se realizeaza strict conform indicatiilor profesorului (ca manual
scris/ca manual tehnoredactat) date de catre studenti tutorelui sau incarcat de catre
studenti pe platforma e-learning, pana la o data prestabilita, predandu-se conform
termenelor propuse in cadrul unitatilor respective (calendarului disciplinei).
Rezultatele obtinute la temele de control vor fi transmise la maxim doua
saptamani dupa predarea fiecaru material. Rezolvarea acestor teme este
obligatorie (nepredarea atragand nefinalizrea notei ce reprezinta 30% din nota
finala la aceasta disciplina).

Durata medie de studiu individual


Se estimeaza 2 ore ( ca fiind necesare pentru parcurgerea unei unitati de invatare,
pentru cele 14 unitati de invatare vor fi alocate 28 ore de studiu individual (SI).
Recomandare : benzile goale (din stanga in special) pot fi folosite pentru adnotari
facute in timpul studiului, in vederea dezbaterii in cadrul tutorialelor a eventualelor
nelamuriri.

Evaluarea
6

Componenta notei finale :


Ponderea evaluarii finale 70% (forma - scris) ; testul va contine pe langa
subiectele propriu-zise un subiect eliminatoriu a carui cerinta va consta din
(ceva specific disciplinei);
Ponderea evaluarii pe parcurs (temele de control 30%)

Unitatea de invatare nr.1.


7

INTRODUCERE N STATISTIC
Cuprins
1.1
Obiectivele unitatii de invatare Nr.1
7
1.2
Apariia i dezvoltarea. Obiect. Metod.
7
1.3
Teste de evalure 1 a unitatii de invatare Nr.1
10
1.4
Rezumat
10
1.5
Bibliografie
10
1
1.1. Principalele obiective ale Unitii de nvare nr. 1
- prezentarea istoriei tiinei statisticii, ca una dintre cele mai vechi i
importante tiine;
- prezentarea i nsuirea de ctre studeni a definirii statisticii ca tiin;
- prezentarea, nelegerea i definirea metodologiei statistice.

Durata medie de parcurgere a unitatii de invatare este de 2 ore.

1.2 Coninut
Capitolul 1
INTRODUCERE N STATISTIC

1. APARIIA I DEZVOLTAREA STATISTICII


Statistica este o tiin, avnd un obiect propriu de studiu i o metodologie
bine dezvoltat, n multe privine dedicat, dar avnd i puncte comune cu ale
altor tiine. Ea studiaz aspectele cantitativ - numerice ale fenomenelor i
proceselor naturale , tehnologice i mai ales sociale ,cu un accent deosebit pe
partea economic, statistica economic avnd un rol bine determinat n cadrul
statisticilor sociale.
Cunoaterea i transformarea istoric a societii omeneti a constituit i
constituie obiectul primordial de preocupare al tuturor tiinelor.
De-a lungul evoluiei istorice a tiinelor asistm la un proces de difereniere a
acestora, pe de o parte prin cristalizarea unor noi ramuri n cadrul tiinelor clasice cu
metodologie n permanent evoluie, pe de alt parte la apariia i dezvoltarea unor
tiine noi, acest proces de difereniere fiind continuu i practic infinit ,dac procesul
evoluiei umane are aceast caracteristic.
Alturi de medicin i matematic ,statistica este una dintre cele mai vechi
8

tiine ,cercettorii neputnd aprecia dect la scara unor aproximri grosolane care ar
putea fi epoca istoric creia omenirea i datoreaz apariia statisticii ca tiin
distinct.
n cadrul evoluiei ei ,statistica i-a cristalizat treptat un rol aparte ,studiind
fenomenele ntr-o viziune sistematic la nivelul micro, mezzo i macrosistemic.
Rdcinile istorice ale statisticii moderne sunt urmtoarele:
a) statistica practic;
b) statistica descriptiv;
Statistica modern.
c) aritmetica politic;
d) calculul probabilitilor.
Rdcinile istorice ale
Aritmetica politic i calculul probabilitilor alctuiesc baza conceptual
a
statisticii moderne.
Baza
conceptual
statisticii aducnd contribuii decisive n analiza i modul de interpretare statistic a a statisticii.
fenomenelor naturale i socio-economice.
a) Statistica practic: se pierd practic n timp primele izvoare ale statisticii,
existnd diverse forme de statistic cu o vechime de peste 4 milenii. Scopurile
statisticii practice erau n primul rnd fiscale
dar i cele demografice i
administrative. Astfel ,n Egiptul antic se practica inventarierea aurului i a
pmntului din doi n doi ani inventariere prezent n principal ntre anii 2650-2190
pe cursul Nilului inferior.
n China antic n mileniul 4 i 3 . Hr. se fcea recensmntul populaiei.
Acelai recensmnt al populaiei s-a practicat i la romani n timpul Republicii ,n
jurul anului 550 .e.n. Practic recensmntul populaiei i al diferitelor forme ale
avuiei constituiau primele forme de statistic organizat.
b) Statistica descriptiv este cea mai veche rdcin teoretic a statisticii. Ea
a aprut n universiti i s-a ocupat n principal de descrierea situaiei geografice,
demografice, economice i politice ale unui stat.
Reprezentanii de seam ai colii statisticii descriptive sunt: Francisco
Sansovino (1521-1586), Giovanni Bottero (1540-1617), Herman Conring (16061681), acesta scriind primul curs de statistic, Gottfried Achenwall (1719-1772),
considerat printele statisticii, deoarece a dat numele acestei tiine pornind de la
cuvntul status" (care n latina nseamn "stare".)
Statistica descriptiv a determinat apariia statisticilor naionale n cadrul
oficializat. Prima ar n care apare statistica naional este Suedia (1796); urmeaz
Norvegia (1797) , apoi Frana (1800).
c) Aritmetica politic i are ca principal reprezentant pe matematicianul i
statisticianul William Petty (1623-1687) , care n 1690 public o carte intitulat
chiar Aritmetica politic. Dei coexistente n timp, aritmetica politic difer total
de statistica descriptiv ,tinznd spre exactitate i cunoatere social, obiectivul ei
principal constituindu-l cunoaterea regularitilor n evoluia fenomenelor i
proceselor naturale i socio-economice.
ntemeietorul colii aritmeticii politice este considerat John Ground (16201674) ,care a cutat regulariti n mortalitatea i natalitatea din Londra ,n jurul
anului 1600.
ntre 1796-1874 n Frana triete Louis Quetelet, considerat de muli cercettori
fondatorul statisticii moderne pentru c e primul care materializeaz utilizarea
metodelor cantitativ numerice i analiza statistic. Caracteristic pentru statistica
din mijlocul secolului al 18-lea i nceputul secolului al 19-lea este folosirea
metodei matematice i a calcului probabilitilor n aa numita statistic

Statistica inductiv.

inductiv, ai crei promotori sunt: Fischer, Youle, Pearson, Cebev, Markov.


Aceasta este etapa care cristalizeaz statistica n forma ei tiinific i n care
crete foarte mult aria de cuprindere i aplicabilitate a acesteia.
2. OBIECTUL SI METODA STATISTICII
Principala proprietate a fenomenelor de mas este variabilitatea n timp i
spaiu, precum i posibilitatea apariiei ntr-o multitudine de forme
organizatorice.
Legea apariiei se bazeaz n cazul acestor fenomene pe aa-numita lege a
numerelor mari, care presupune c pentru descoperirea legturii dintre cauz i
efect trebuie studiat o mulime relativ mare de evenimente distincte ale
aceluiai fenomen sau proces, fie el natural, fie social sau economic.
Particularitile statisticii sunt urmtoarele:
a) statistica studiaz fenomenele de mas din punctul de vedre al
variabilitii lor n timp i spaiu i sub raport organizatoric;
b) caracterizeaz latura cantitativ-numeric a fenomenelor i nu
ierarhizeaz atributele calitative ale acestora.

Prin definiie, obiectul de studiu al statisticii este constituit din aspectele


cantitative ale determinrilor calitative ale fenomenelor de mas, Definiia
fenomene
care
obiectului
de studiu al
statisticii.concrete,
sunt expuse aciunii legilor statistice, care se manifest n condiii
variabile n timp, spaiu i n raport cu formele de organizare socio-economic.
Principalele ramuri de statisticii sunt :

statistica economic;
statistica teoretic;
statistica matematic;
statistica indicilor sociali;
statistica serviciilor;
statistica mediului nconjurtor;
statistici teritoriale.

Prin metodologie statistic se nelege totalitatea operaiilor, tehnicilor i


procedeelor de calcul i interpretare statistic. Pe baza acestei metodologii statistica
devine un instrument eficient i indispensabil tuturor tiinelor empirice. La limit ,
toate legile i legitile tiinelor empirice sunt legi statistice ,pentru c se bazeaz pe
un numr suficient de mare de observaii independente ale realitii pentru a fi
descoperite.
Statistica se perfecioneaz continuu, ntr-un proces complet dialectic. ntr-o
concepie modern ea trebuie privit ca o tiin de grani care asigur cercetrii
tiinifice un caracter interdisciplinar, ntr-un proces de cvasireciprocitate cu multe
alte tiine.
10

1.3. Test de autoevaluare 1.1


Test de autoevaluare 1.1
Care credei c sunt momentele eseniale n evoluia Statisticii. ncercai s le marcai
n timp.

1.4. Rezumat
Unitatea de invatare Nr.1. prezinta principalele momente ale istoriei ndelungate a
acestei importante tiine, fiind prezentate succint rdcinile istorice ale statisticii
moderne. Partea a doua a cursului, esenial pentru tot ce va urma , definete obiectul
i metoda de studiu ale Statisticii. n partea a treia sunt descrise conceptele de baz
utilizate n Statistic : colectivitatea, unitatea statistic, variabila, indicatorul statistic.
1.5. Bibliografia Unitatii de invatare Nr.1
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.

11

Unitatea de invatare nr.2


DEFINIREA PRINCIPALELOR CONCEPTE FOLOSITE N STATISTIC. LIMBAJUL
STATISTIC.
Cuprins
2.1
Obiectivele unitatii de invatare Nr.2
11
2.2
Concepte de baz utilizate n statistic
11
2.3
Teste de evalure 1 a unitatii de invatare Nr.2
13
2.4
Rezumat
13
2.5
Bibliografia unitatii de invatare
13
2.1. Principalele obiective ale unitatii de invatare nr.2
- perceperea limbajului statistic ca un cumul de categorii i concepte cu care
se opereaz dup reguli tiinifice ;
- prezentarea, nelegerea i nsuirea conceptelor de baz utilizate n
Statistic .

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

2.2. Coninut
Capitolul 2
DEFINIREA PRINCIPALELOR CONCEPTE FOLOSITE N STATISTIC.
LIMBAJUL STATISTIC.
1. CONCEPTE DE BAZ FOLOSITE N
STATISTIC

Principalele concepte folosite n


statistic.

Principalele concepte folosite n statistic sunt urmtoarele:


1. colectivitatea statistic;
2. unitatea statistic;
3. variabila (caracteristica) statistic;
4. indicatorul statistic.
1. Colectivitatea statistic, numit i populaie statistic, reprezint masa total
sau global a evenimentelor distincte din cadrul unui fenomen sau proces
natural sau socio-economic ,supus cercetrii statistice.
Colectivitatea este de doua feluri :
- colectivitate total;
12

- colectivitate parial.
Colectivitatea total reprezint situaia n care toate apariiile fenomenelor
i proceselor cu aceeai caracteristic studiat sunt supuse cercetrii .
Colectivitatea parial reprezint situaia n care doar o parte din
manifestrile individuale vor intra sub incidena cercetrii statistice.
Ambele colectiviti pot fi statice sau dinamice ,n funcie de variabilitatea
lor n timp.
2. Prin unitate statistic se nelege entitatea component a unei
colectiviti, purttoare a unei nsuiri care o face interesant studiului statistic.
Unitatea statistic poate fi:
- simpl (unitatea student in colectivitatea grup);
-complex (unitatea grup n universitate).
3. Variabila statistic, numit i caracteristic statistic, reprezint atributul
sau nsuirea pe care o are unitatea statistic i care este supus cercetrii statistice,
fiind de mai multe tipuri:
- variabile de timp (an, lun, zi, etc.);
- variabile de spaiu (unitile administrativ-teritoriale);
- variabile atributive.
Variabilele atributive sunt de 2 tipuri
- alternative;
- nealternative.
Variabilele alternative sunt cele care au doar dou posibiliti
de
reprezentare (da-nu, 0-1, alb-negru), ele grupndu-se la rndul lor n variabile :
- numerice;
- nenumerice (alfanumerice).
Variabilele nealternative acoper ntreaga gam de trsturi i caracteristici
calitative ale fenomenelor care pot fi studiate cantitativ.
i ele la rndul lor se clasific n variabile numerice i nenumerice.
Variabilele nealternative numerice sunt de dou tipuri :
- continue;
- discontinue (discrete).
4. Indicatorii statistici reprezint msura numeric a variabilelor statistice.
Indicatorii statistici sunt de dou tipuri :
- indicatori primari;
- indicatori derivai.
Indicatorii primari sunt extrai direct din realitatea sub toate formele ei de
organizare.
Indicatorii derivai sunt obinui prin transformarea logico- matematic a
indicatorilor primari , ei gsindu-se sub urmtoarele forme:
- indicatori absolui;
- indicatori relativi;
- mediile statistice;
- indicii statistici;
- ecuaiile de estimare.

13

2.3 Testul de evaluare 1


Test de autoevaluare 2.1
Explicai coninutul celor patru concepte de baz i sesizai i exprimai ntr-un
cuvnt esena fiecruia.
2.4. Rezumat
Unitatea de invatare Nr.2. prezint n prima parte a capitolului cercetarea statistic i
sunt fixate locul i rolul observrii ca etap de nceput a cercetrii. n continuare se
prezint, fr detalii inutile, structura i funcionarea sistemului informaional statistic
n cadrul sistemului informaional economic general. Sunt apoi trecute n revist
principalele metode de observare statistic , precum i etapele proiectrii unei
observri; ntru-ct n etapa observrii se strecoar cele mai multe erori, este definit
eroarea n statistic i este prezentat cazuistica erorilor statistice.
Partea a doua a capitolului este rezervat prelucrrii statistice. Dup definirea
prelucrrii sunt prezentate etapele unei prelucrri, apoi sunt detaliate principalele
tehnici de prelucrare utilizate n practica statistic.
2.5. Bibliografia Unitatii de invatare Nr.2
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.

14

Unitatea de invatare nr.3


15

OBSERVAREA STATISTIC
Cuprins
3.1
Obiectivele unitatii de invatare Nr.3
3.2
Concepte de baz utilizate n statistic
3.3
Teste de evalure 1 a unitatii de invatare Nr.3
3.4
Rezumat
3.5
Bibliografia unitatii de invatare

15
15
22
22
23

3.1. Principalele obiective ale unitatii de invatare nr.3


- definirea observrii i nelegerea importanei ei n procesul prelucrrii i
analizei statistice ;
- prezentarea, nelegerea i nsuirea organizrii observrii statistice n mod
tiinific ;
- nelegerea legturii logice dintre observarea statistic i prelucrarea datelor
statistice
Durata medie de parcurgere a primei unitati de invatare este de 2 ore

3.2 Coninut
Capitolul 3
OBSERVAREA STATISTIC

1. Locul i rolul observrii n cadrul


cercetrii statistice
Economia de pia nseamn o realitate economic n care dominante printre
variabile sunt riscul i incertitudinea . Procesele economice care ngemneaz i
concur la ceea ce n mod generic numim pia sunt extrem de complexe, permind
vehicularea unui volum imens de informaii , n cadrul unor subprocese de reglare , a
cror bun funcionare depinde de cunoaterea veridic a realitii.
Nevoia de informaii n special n domeniul economic este n continu
cretere de unde deriv nevoia organizrii i structurrii acestor informaii.
16


Sistemul informaional static.

Definiia cercetrii statistice.

Se apreciaz n general c volumul de cunotine al omenirii se dubleaz la


fiecare 4-5 ani, procesul n economie avnd un ritm mult mai alert, cunotinele
economice dublndu-se la fiecare interval de 2 ani aproximativ. n consecin
economia poate fii vzut ca o sum de fluxuri permanente de informaie care pleac
de la furnizori, sunt prelucrate de uniti i instituii mai mult sau mai puin
specializate, ajungnd apoi la beneficiarii acestor informaii care le analizeaz, le
interpreteaz i eman decizii. Datele i informaiile necesare cunoaterii procesului
de dezvoltare a economiei i a societii n general se elaboreaz n cadrul sistemului
informaional statistic. Acest sistem informaional cuprinde 2 elemente de baz:
1. Subsistemul informrilor statistice periodice (cunoscut odinioar ca
subsistem al drilor de seam statistice);
2. Subsistemul cercetrilor statistice special organizate.
Prin
definiie cercetarea statistic nseamn totalitatea aciunilor depuse n cadrul
unor organizaii i organisme specializate create n acest scop, desfurate prin
operaii corelate, temeinic organizate i riguros programate.
n literatura de specialitate, cercetarea statistic mai este ntlnit i sub
numele de investigaie statistic sau demers statistic.
ntr-o alt formulare cercetarea statistic reprezint totalitatea
operaiunilor de culegere i observare, sistematizare i prelucrare, stocare i
regsire, analiz i interpretare a informaiilor necesare pentru cunoaterea i
conducerea proceselor social economice.
nceputul oricrei cercetri
statistice este constituit de faza culegerii, adunrii efective a datelor necesare. Aceste
date se regsesc n principal n evidenele financiar-contabile ale instituiilor
patrimoniale de stat sau private ale instituiilor publice (de stat i particulare).
Pe lng aceste surse de
date, fiecare gospodrie a populaiei poate fii privit ca o mic ntreprindere, ca un
mic agent economic, furnizor de date i informaii statistice. Prin observarea
statistic se nelege dup o metodologie unitar pentru toate unitile
populaiei cercetate a valorilor i variantelor caracteristicilor incluse n
programul cercetrii.
Observarea statistic se desfoar prin metode specifice diferite ca form i
coninut, i anume :
a) nregistrarea direct a descrierilor prin date a fenomenelor socioeconomice;
b) nregistrarea indirect pe baz de chestionare n general completate
benevol;
c) nregistrarea direct pe baz de documente.
Prin identificarea i separarea etapei observrii statistice, cercetarea statistic n
ansamblul ei se contureaz ca un demers tiinific separabil n 3 etape succesive i
anume:
A) observarea sau nregistrarea datelor;
B) prelucrarea i obinerea indicatorilor statistici i a celor derivai;
C) analiza i interpretarea rezultatelor cercetrii.
Aceste etape se desfoar separat n timp i loc i se condiioneaz din punct de
vedere al volumului i locului.
Principiul care urmrete toate etapele este principiul autenticitii datelor necesar
a fi respectat nc din faza de observare.
17

n multe ri civilizate, transmiterea cu bun tiin sau din neglijen a unor


date statistice eronate ctre foruri ndreptite prin lege a le prelua, se pedepsete
aspru prin normativele legale n vigoare.
2. Structura i funcionarea sistemului informaional statistic
Culegerea i prelucrarea datelor constituie acte permanente de conducere sau
n slujba conducerii. Din aceast caracteristic important a lor deriv necesitatea
procurrii i preparrii informaiilor pe baze organizatorice sntoase. Aceast
cerin este satisfcut prin intermediul sistemului informatic statistic, conceput
i organizat ca subsistem al sistemului de conducere al organizaiilor i
organismelor economico-sociale.
Sistemul informaional al oricrei uniti are o structur extrem de complex, n
care se integreaz mai multe subsisteme.
Unul dintre aceste subsisteme, cu rol primordial n procesul conducerii este
Subsistemul Informaiilor Economice (SIE). Acesta include la rndul su
componenta financiar-contabil, compartimentul de programare a produciei i
urmrire a ei, compartimentul de personal, componenta comercial i de
marketing.

Un alt subsistem este Subsistemul Informaional Statistic care are urmtoarele


caracteristici :
Caracteristicile Subsistemului
Informaional Statistic.

a) utilizeaz metode i procedee de observare i prelucrare a datelor de


mas precum i de modelare i analiz statistic a acestora;
b) se desfoar n principal pentru urmrirea proceselor economice ,
fapt din care deriv importana statisticii economice n cadrul
ramurilor statisticii ;
c) particip la efectuarea cercetrilor statistice special organizate.
Suportul material al Sistemului Informaional Statistic este astzi reprezentat de
tehnica de calcul care introduce o serie de faciliti, att n sensul creterii vitezei
de calcul i transmitere a informaiei, ct i n sensul unei creteri substaniale a
posibilitilor de nmagazinare i stocare a datelor.
Avantajele suportului material informatizat sunt cu mult potenate de oferirea unor
programe inteligente, specializate att n calcul statistic ct i n analiza i
interpretarea datelor statistice.
Din punct de vedere instituional, activitatea statistic naional n Romnia este
acoperit prin existena unui organism central , Agenia Naional de Statistic
(ANS). La nivel judeean exist aa numitele Direcii Judeene pentru Statistic
(DJS), organisme centralizate n teritoriu, cu rol primordial n culegerea datelor
statistice necesare subsistemului informrilor periodice, dar i n organizarea unor
cercetri speciale pe cont propriu sau participarea la cercetrile organizate de
instituia central.
Datele i informaiile statistice sunt organizate n baze de date i bnci de date.
Datele de intrare n aceste bnci i baze de date constituie indicatori primari.
18

Indicatorii primari agregai , n general prin operaiuni de nsumare, precum i


indicatorii derivai , se obin din indicatori elementari prin interogarea bazei de
date respective.
3. Metode de observare statistic
Observarea statistic mbrac forme variate, potrivit naturii fenomenelor
studiate, scopului urmrit, modului de organizare a activitii economico-sociale
i posibilitilor practice de cuprindere i nregistrare. Ele sunt urmtoarele:
a) recensmntul: cea mai veche metod de observare statistic. El a
nceput s se aplice cu referire la populaie, extinzndu-se treptat i n
domeniul economic. Recensmntul reprezint practic o fotografiere a
unui fenomen la un moment dat, numit moment critic. Este o observare
total care se desfoar cu o anumit periodicitate, care este n Romnia
de 10 ani la populaie i de 5 ani n domeniul economic. Recensmntul
se desfoar dup o metodologie proprie, relativ vast care trebuie s
asigure comparabilitatea datelor i s corespund standardelor interne i
internaionale n domeniu. Asigurarea recensmntului se face printr-o
lege special care stabilete programul, metodologia i fondurile. Pentru
reuita recensmntului foarte important este alegerea momentului
critic, alegere care trebuie fcut astfel nct n acel moment populaia
statistic s aib maximul de stabilitate. n general, momentul critic difer
n timp de perioada de nregistrare.
b) sistemul informrilor statistice periodice (sistemul rapoartelor
statistice): asigur n principal datele necesare mersului economiei n
sectorul public. Informrile se fac pe documente oficiale, nscrise pe
formulare tipizate , cu forma i coninutul stabilite prin lege. Indicatorii
cuprini n aceste formulare sunt definii n termen i coninut prin
nomenclatoare speciale de indicatori. Aceast observare este total , pe
baz de documente, iar n cadrul ei , falsul se pedepsete.
c) sondajul statistic: este utilizat din diferite motive. Observarea total
trebuie nlocuit cu o observare parial efectuat pe o subcolectivitate
numit eantion. Aceasta trebuie s ndeplineasc o aa numit condiie
de reprezentativitate, care cere ca n cadrul eantionului s se ntlneasc
aceleai proprieti, structuri, trsturi eseniale i valori tipice ca i n
cadrul populaiei totale. n cadrul metodei sunt des ntlnite aa numitele
erori de sondaj sau de reprezentativitate , induse de modalitile de
formare a eantionului . Sondajul este o metod selectiv, utilizat n
studiul bugetelor de familie, nregistrarea preurilor de pe piaa liber,
controlul statistic al calitii mrfurilor , etc.
d) ancheta statistic: este metoda prin care sunt culese informaiile de la
populaie, prin utilizarea unor chestionare trimise direct sau prin pot.
Rspunsul la aceste chestionare este benevol, iar metoda se utilizeaz
pentru obinerea unor informaii orientative cu caracter preliminar.
e) observarea prii principale sau a masivului principal de date:
reprezint o metod de observare special organizat , parial , aplicat
19

pentru obinerea operativ a informaiilor despre o populaie structurat


pe grupe, cu o importan diferit. n cadrul metodei se nregistreaz
datele numai pentru grupele cu cea mai mare pondere.
f) monografia: metod prin care se studiaz n mod aprofundat o unitate
economic, social, teritorial, n cadrul creia au aprut elemente noi n
modul de organizare al produciei i al muncii, n derularea activitii.
Monografia are un caracter mult mai larg, cuprinznd i elemente de
prelucrare i analiz.
Metodele de observare prezentate pot fi utilizate fie mpreun , fie separat, n
funcie de volumul informaiei necesare.
4. Proiectarea unei observri statistice
Observarea presupune efectuarea unor cheltuieli consistente , motiv pentru care se
pune serios problema desfurrii ei eficiente.
Punctul de plecare n proiectarea unei observri este stabilirea obiectivelor
acesteia, care deriv din scopul cercetrii:
a) delimitarea populaiei studiate: etap important deoarece costurile sunt
proporionale cu valoarea acestora.
b) definirea unitii de observare, ca unitate simpl sau complex ;
c) stabilirea
programului
observrii,
sub
forma
nsuirii
caracteristicilor pentru care vor fi nregistrate date.
Formularele pe care se face nscrierea sunt de dou tipuri:
de tip fi ;
de tip list.
Fia este un formular individual care se completeaz pentru o singur unitate,
atunci cnd programul de observare este mai bogat.
Lista este un formular colectiv n care se nregistreaz rspunsurile pentru
mai multe uniti concentrate parial.
nregistrrile din fie i din liste dispun de norme metodologice i tehnici de
completare individuale.
d) timpul observrii : se stabilete prin diferenierea timpului la care se
refer datele , numit i moment critic, de perioada n care se desfoar
observarea propriu-zis.
e) delimitarea spaial a locului observrii ;
f) stabilirea msurilor organizatorice care se impun pentru buna
desfurare a observaiei.
5. Eroarea n statistic
Ca n toate domeniile, eroarea este prezent i n statistic. Din acest motiv
controlul calitii datelor statistice trebuie realizat pe parcursul cercetrii statistice.
20

Notnd cu x0 o valoare real i cu x o valoare statistic determinat, valoarea


e = x x0

Eroarea absolut.

se numete eroare absolut.

Eroarea relativ.

Valoarea:
e = x / x0
se numete eroare relativ.
Eroarea relativ poate fi exprimat i n procente.
n statistic se opereaz cu noiunea de eroare absolut limit; modulul erorii
absolute trebuie s nu depeasc eroarea absolut limit:
IeI <=
6. Generaliti privind prelucrarea datelor
statistice
Prelucrarea statistic este etapa cercetrii n care se trece de la datele
individuale, obinute n etapa observrii la indicatorii care caracterizeaz
colectivitatea n ntregul ei sub form de indicatori totalizatori, absolui sau
indicatori derivai.
De regul aceti indicatori sunt calculai ca valori sintetice obinute prin
aplicarea unor abstractizri i comparri succesive prin care se elimin ceea ce
este ntmpltor i neesenial n apariia i dezvoltarea fenomenelor studiate.
Prin prelucrare se obine sistemul de indicatori statistici ca parte integrant a
sistemului informaional naional necesar pentru fundamentarea deciziilor la toate
nivelurile de conducere. Coninutul prelucrrii unei observaii se rezum la
urmtoarele elemente:
a) centralizarea materialului observrii
b) gruparea unitilor colectivitii dup anumite criterii i reguli
c) obinerea sistemului de indicatori care caracterizeaz fiecare grup i
ntreaga colectivitate.
d) prezentarea rezultatelor prelucrrii sub form de serii, tabele i
grafice.
21

e)
7. Planul prelucrrii statistice
Planul sau programul prelucrrii ntregului material al unei observri
statistice cuprinde urmtoarele: programul propriu-zis al prelucrrii; metodele i
procedeele de calcul statistic care vor fi aplicate pentru calculul sistemului de
indicatori; formele de prezentare ale rezultatelor prelucrrii; aspectele organizatorice
ale acesteia.
a) programul prelucrrii: const n enumerarea caracteristicilor primare i
derivate care se folosesc pentru calcularea indicilor totalizatori i derivai.
b) metodele i procedeele de calcul: se aleg pentru fiecare prelucrare n
parte n funcie de scopul cercetrii, de natura specific a fenomenelor i
de specificul i de volumul informaiilor disponibile. Scopul principal al
aplicrii metodelor de prelucrare statistic l constituie redarea
ntr-o imagine ct mai sintetic i ct mai obiectiv a fenomenelor
studiate corespunznd ntr-un sens mai larg noiunii de modelare statistic.
c) formele de prezentare ale rezultatelor statistice sunt: seriile, tabelele
statistice i graficele.
Seriile statistice-sunt liste paralele, n prima list fiind nregistrat valoarea
caracteristicii, iar n celelalte ori alte valori caracteristice derivate ori numrul de
operaii corespunztoare fiecrei valori n parte, numit generic frecven.
Tabelele statistice-cuprind mai multe caracteristici ale aceleiai
uniti,
- Serii statistice
fiecrei
- Tabele statistice
caracteristici putndu-I fi ataat eventual i o informaie referitoare la
numrul
de
- Grafice
statistice
operaii.
Graficele statistice-sunt de diverse tipuri, cele mai frecvente fcnd legtura
ntre
valorile caracteristicii i frecvena de apariie.

Exist grafice reprezentate prin bare verticale care au n general frecvena pe


ordonat i caracteristica pe abscis. Altele au bare orizontale iar frecven este pe
abscis.
Reprezentarea grafic a dependenei dintre caracteristic i frecven se
numete histogram. Dac unim mijloacele segmentelor din barele orizontale sau
verticale se obine poligonul frecvenelor.
Atunci cnd una din variante este timpul, graficul se numete historiogram
sau cronogram. Cronograma este utilizat n general pentru prezentarea seriilor
cronologice.
d) problemele organizatorice ale prelucrrii: se refer la locul i timpul,
unde i cnd se face prelucrarea, la transmiterea rezultatelor i la
resursele angrenate.

e)
8. Tehnici de prelucrare
22


Procedeul fielor i al tabelrii.

Prelucrarea statistic uzeaz de tehnici specializate, motiv pentru care se


desfoar n instituii specializate. Dezvoltarea rapid a tehnicii de calcul a pus la
dispoziia statisticii un instrumentar adecvat, att n ceea ce privete resursele tehnicii
i tehnologice (fizice) ct i programele i rutinele specializate n calculul i analiza
statistic.
Prelucrarea statistic poate fi manual (tot mai rar) sau automatizat.
Procedural, la baza prelucrrii st prelucrarea manual bazat pe 2 procedee.
Procedeul fielor i cel al tabelrii.
Procedeul fielor-presupune ntocmirea unei fie pentru fiecare unitate de
observare n care sunt trecute de obicei codificat toate caracteristicile din programul
observri. n cadrul acestui procedeu se pot face grupri simple sau combinate.
Procedeul se aplic atunci cnd numrul unitilor observate este mai mic. El
prezint avantajul oricrui numr de variante i dezavantajul imposibilitii eliminrii
erorilor.
Procedeul tabelrii manuale-se folosete cnd volumul colectivitii observate
este mare i nu exist posibilitatea de prelucrare automatizat. Prin acest procedeu se
obin grupri simple. n fapt se produce un tabel, n capul coloanelor vin trecute
caracteristicile iar pe rnduri vin trecute succesiv unitile de observare i
informaiile despre caracteristici. Procedeul prezint avantajul depistrii facile a
erorilor i dezavantajul necesitii refacerii tabelrii n condiiile n care se schimb
structura grupelor sau apar / dispar anumite caracteristici de grupare.

3.3 Testul de evaluare 1


Test de autoevaluare 3.1
Imaginai-v o observare statistic i ntocmii planul ei.
3.4. Rezumat
Unitatea de invatare Nr.2. prezinta n prima parte a acestui capitol este definit
cercetarea statistic i sunt fixate locul i rolul observrii ca etap de nceput a
cercetrii. n continuare se prezint, fr detalii inutile, structura i funcionarea
sistemului informaional statistic n cadrul sistemului informaional economic
general. Sunt apoi trecute n revist principalele metode de observare statistic ,
precum i etapele proiectrii unei observri; ntru-ct n etapa observrii se strecoar
cele mai multe erori, este definit eroarea n statistic i este prezentat cazuistica
erorilor statistice.
Partea a doua a capitolului este rezervat prelucrrii statistice. Dup definirea
prelucrrii sunt prezentate etapele unei prelucrri, apoi sunt detaliate principalele
tehnici de prelucrare utilizate n practica statistic.
3.5. Bibliografia Unitatii de invatare Nr.3
23

Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.

24

Unitatea de invatare nr. 4


PRELUCRAREA DATELOR STATISTICE
Cuprins
4.1
Obiectivele unitatii de invatare Nr.4

25
25

4.2
3.3
3.4.
3.5.

Planul prelucrrii. Tehnici de prelucrare. Centralizare. Metoda gruprii


Teste de evalure 1 a unitatii de invatare Nr.4
Rezumat
Bibliografia

25
29
30
30

4.1. Principalele obiective ale unitatii de invatare nr.4


- prezentarea prelucrrii datelor ca etap esenial a cercetrii statistice ;
- contientizarea de ctre studeni a faptului c prelucrarea datelor nu se poate
face dect n urma unei serioase i pertinente observri i numai prin metode
tiinifice ;
- prezentarea i nsuirea principalelor metode i tehnici de prelucrare a datelor.
Durata medie de parcurgere a primei unitati de invatare este de 2 ore

4.2 Coninut
Capitolul 4
PRELUCRAREA DATELOR STATISTICE
Prelucrarea statistic este etapa cercetrii n care se trece de la datele individuale,
obinute n etapa observrii la indicatorii care caracterizeaz colectivitatea n ntregul ei
sub form de indicatori totalizatori, absolui sau indicatori derivai.
De regul aceti indicatori sunt calculai ca valori sintetice obinute prin aplicarea
unor abstractizri i comparri succesive prin care se elimin ceea ce este ntmpltor i
neesenial n apariia i dezvoltarea fenomenelor studiate.
Prin prelucrare se obine sistemul de indicatori statistici ca parte integrant a
sistemului informaional naional necesar pentru fundamentarea deciziilor la toate
nivelurile de conducere. Coninutul prelucrrii unei observaii se rezum la urmtoarele
elemente:

f) centralizarea materialului observrii


g) gruparea unitilor colectivitii dup anumite criterii i reguli
h) obinerea sistemului de indicatori care caracterizeaz fiecare grup i ntreaga
colectivitate.
i) prezentarea rezultatelor prelucrrii sub form de serii, tabele i grafice.

1. Planul prelucrrii statistice

Planul sau programul prelucrrii ntregului material al unei observri statistice


cuprinde urmtoarele: programul propriu-zis al prelucrrii; metodele i procedeele de calcul
statistic care vor fi aplicate pentru calculul sistemului de indicatori; formele de prezentare ale
26

rezultatelor prelucrrii; aspectele organizatorice ale acesteia.


f) programul prelucrrii: const n enumerarea caracteristicilor primare i derivate
care se folosesc pentru calcularea indicilor totalizatori i derivai.
g) metodele i procedeele de calcul: se aleg pentru fiecare prelucrare n parte n
funcie de scopul cercetrii, de natura specific a fenomenelor i de specificul i
de volumul informaiilor disponibile. Scopul principal al aplicrii metodelor de
prelucrare statistic l constituie redarea
ntr-o imagine ct mai sintetic i ct mai obiectiv a fenomenelor studiate
corespunznd ntr-un sens mai larg noiunii de modelare statistic.
h) formele de prezentare ale rezultatelor statistice sunt: seriile, tabelele statistice
i graficele.

Seriile statistice-sunt liste paralele, n prima list fiind nregistrat valoarea


caracteristicii, iar n celelalte ori alte valori caracteristice derivate ori numrul de operaii
corespunztoare fiecrei valori n parte, numit generic frecven.
Tabelele statistice-cuprind mai multe caracteristici ale aceleiai
uniti, fiecrei
- Serii statistice
caracteristici putndu-I fi ataat eventual i o informaie referitoare la- numrul
de operaii.
Tabele statistice
Graficele statistice-sunt de diverse tipuri, cele mai frecvente fcnd
- Graficelegtura
statisticentre
valorile caracteristicii i frecvena de apariie.
Exist grafice reprezentate prin bare verticale care au n general frecvena pe ordonat
i caracteristica pe abscis. Altele au bare orizontale iar frecven este pe abscis.
Reprezentarea grafic a dependenei dintre caracteristic i frecven se numete
histogram. Dac unim mijloacele segmentelor din barele orizontale sau verticale se obine
poligonul frecvenelor.
Atunci cnd una din variante este timpul, graficul se numete historiogram sau
cronogram. Cronograma este utilizat n general pentru prezentarea seriilor cronologice.
i) problemele organizatorice ale prelucrrii: se refer la locul i timpul, unde i
cnd se face prelucrarea, la transmiterea rezultatelor i la resursele angrenate.

2. Tehnici de prelucrare

Procedeul fielor i al tabelrii.

Prelucrarea statistic uzeaz de tehnici specializate, motiv pentru care se desfoar n


instituii specializate. Dezvoltarea rapid a tehnicii de calcul a pus la dispoziia statisticii un
instrumentar adecvat, att n ceea ce privete resursele tehnicii i tehnologice (fizice) ct i
programele i rutinele specializate n calculul i analiza statistic.
Prelucrarea statistic poate fi manual (tot mai rar) sau automatizat. Procedural, la
baza prelucrrii st prelucrarea manual bazat pe 2 procedee. Procedeul fielor i cel al
tabelrii.
Procedeul fielor-presupune ntocmirea unei fie pentru fiecare unitate de observare n
care sunt trecute de obicei codificat toate caracteristicile din programul observri. n cadrul
acestui procedeu se pot face grupri simple sau combinate. Procedeul se aplic atunci cnd
numrul unitilor observate este mai mic. El prezint avantajul oricrui numr de variante i
dezavantajul imposibilitii eliminrii erorilor.
Procedeul tabelrii manuale-se folosete cnd volumul colectivitii observate este
mare i nu exist posibilitatea de prelucrare automatizat. Prin acest procedeu se obin grupri
simple. n fapt se produce un tabel, n capul coloanelor vin trecute caracteristicile iar pe
27

rnduri vin trecute succesiv unitile de observare i informaiile despre caracteristici.


Procedeul prezint avantajul depistrii facile a erorilor i dezavantajul necesitii refacerii
tabelrii n condiiile n care se schimb structura grupelor sau apar / dispar anumite
caracteristici de grupare.
2.1. Centralizarea datelor statistice

Centralizarea simpl i centralizarea pe


grupe.

Prin centralizare se nelege strngerea la locul de prelucrare a tuturor informaiilor,


eventual depuse n prealabil pe formulare ,alturi de operaia de obinere a indicatorilor
totalizatori. Centralizarea statistic a datelor este de dou tipuri: simpl i pe grupe.
Centralizarea simpl presupune numai obinerea indicatorilor totalizatori la nivelul
ntregului ansamblu de uniti care au fost supuse observrii. Aceast centralizare presupune
stabilirea volumului unitilor simple i complexe care formeaz colectivitatea i valoarea
totalizat a caracteristicilor care au fost incluse n programul observrii i care sunt exprimate
n uniti de msur direct nsumabile. n cazul n care nu exist posibilitatea efecturii sumei
directe se recurge la o serie de coeficieni de echivalen care transform valorile nregistrate
pentru unele uniti n alte valori, transformarea bazndu-se pe alegerea unei uniti etalon
care are frecvena cea mai mare de apariie sau e definitorie pentru colectivitatea supus
cercetrii.
Centralizarea simpl se folosete pentru obinerea unor informaii generale , cu mult
nainte de a se finaliza ntreaga operaie de prelucrare.
Centralizarea pe grupe presupune aplicarea metodei gruprii, n urma creia se obin
indicatori totalizatori pariali , pe fiecare grup, iar pe baza lor se obin apoi indicatori
totalizatori generali pe ntreaga colectivitate.
Centralizarea pe grupe include i centralizarea simpl i presupune o abordare distinct i
detaliat.

2.2. Metoda gruprii-metod de baz n prelucrarea datelor statistice

Gruparea reprezint prima sistematizare a datelor i const n mprirea unitilor n


grupe omogene n funcie de variaia uneia sau mai multor caracteristici.
Caracteristica n funcie de care se face separarea unitilor se mai numete i factor
de grupare. Petru a realiza o grupare n sens statistic este necesar alegerea acelor
caracteristici eseniale care au caracter stabil, determin n mod hotrtor fenomenul care se
studiaz, i dau posibiliti obinerii unei grupe omogene n funcie de variaia lor.
Din punct de vedere statistic, prin grup omogen se nelege clasa de uniti n
interiorul creia variaia caracteristicii este minim. Aceast variaie din interiorul grupei
este interpretat statistic drept rezultat al factorilor ntmpltori , care se compenseaz
reciproc la nivelul ntregului ansamblu.
Definiia grupei omogene din
de vedere statistic.
Problemele care trebuie rezolvate n cadrul operaiei de gruparepunct
sunt
urmtoarele:
1. alegerea i folosirea caracteristicilor de grupare;
2. stabilirea numrului de grupe n care urmeaz s se mpart
unitile
colectivitii;
3. alegerea mrimii intervalului de grupare;

28

4. precizarea scopului pentru care se face ntreaga operaiune.


2.2.1 Alegerea i folosirea caracteristicilor de grupare
Caracteristicile de grupare se mpart in dou categorii:
a) caracteristici eseniale, definitorii pentru toate unitile colectivitii;
b) caracteristici secundare , cu rol de control.
Acest grad de esenialitate este relativ , caracteristica putnd s i-l schimbe n funcie se
scopul gruprii. Alegerea caracteristicilor de grupare trebuie s se fac astfel nct ele s
corespund scopului analizei statistice i totodat s mpart unitile caracteristicii n
grupe omogene.
2.2.2 Stabilirea numrului de grupe

Numrul grupelor n care urmeaz a fii mprit colectivitatea e n strns


dependen cu modul n care se face gruparea, respectiv de tipul grupei care a fost ales.
Gruprile statistice se mpart dup mai multe criterii, astfel:
a) dup numrul caracteristicilor folosite: grupri simple i grupri combinate.
Gruprile simple sunt acelea n care gruparea unitilor se face n funcie de variaia
Gruprile statistice.
unei singure caracteristici , cu care varianta de grupare se afl n interdependen.
Gruprile combinate sunt acele grupri n care se folosesc mai multe caracteristici
pentru formarea grupelor. Operaiunea n acest caz se desfoar recursiv, n primul pas
alegndu-se o prim caracteristic de grupare i repartizndu-se unitile colectivitii dup
valorile ei, iar n paii urmtori fiecare grup sau subgrup fiind mprit n alte subgrupe , n
funcie de variaia altor caracteristici. Spre exemplu , populaia poate fi mprit pe grupe de
vrst ,aceasta fiind prima caracteristic, iar pentru fiecare grup poate fi mprit n funcie
se sex, acesta reprezentnd a doua caracteristic de grupare. Pentru a nu frmia foarte mult
colectivitatea i pentru a pstra un echilibru ntre sintetic i analitic ,se recomand s nu se
depeasc 3 max. 4 caracteristici de grupare.
b) dup coninutul caracteristicii de grupare exist :
b1) grupri cronologice, n funcie de variabila timp;
b2) grupri
teritoriale, n funcie de variabila spaiu;
b3) grupri dup o caracteristic
atributiv.
Gruprile cronologice i cele teritoriale sunt determinate de condiiile obiective de
timp i de loc n care se produc fenomenele i procesele economico-sociale.
Pentru o grupare cronologic este nevoie ca variaia n timp s constituie o caracteristic
determinant pentru toate unitile supuse observrii.

Dac variaia teritorial este semnificativ pentru formarea fenomenelor i proceselor


sociale, atunci utilizarea ei conduce la o grupare spaial sau tipologic.
Gruprile dup o caracteristic atributiv se ntlnesc cel mai frecvent n cercetarea
statistic fie ca grupri simple, fie ca grupri combinate ,ajutnd la caracterizarea
independent sau interdependent a fenomenelor.
Caracteristicile atributive sunt de 2 tipuri: exprimate prin cuvinte, respectiv exprimate
numeric.
Caracteristicile atributive exprimate prin cuvinte se ntlnesc n statistica social29

economic sub denumirea de clasificri, cuprinse n nomenclatoare. Gruprile fcute dup


asemenea caracteristici sunt cele mai omogene, n interiorul grupelor neexistnd variaii de
nici un fel.
Pentru definirea caracteristicilor atributive exprimate numeric este necesar
definirea n prealabil a unor noiuni utilizate n calculul i analiza statistic.
Varianta este nivelul sau valoarea prin care se manifest o caracteristic statistic
nregistrat ntr-o anumit observare.
Variabila reprezint caracteristica statistic valabil pentru toate unitile observate ,
care prezint proprietatea de a-i modifica nivelul de la o unitate la alta.
Variaia este proprietatea caracteristicii se a-i modifica nivelul de dezvoltare ntr-un
interval de valori ,n condiii date de timp i spaiu , n funcie de gradul de influen al
factorilor determinani.
Amplitudinea variaiei reprezint cmpul de mprtiere a variantelor ntr-o
nregistrare statistic fiind notat cu "A":
A = x max x min.
Frecvena sau ponderea reprezint numrul de uniti la care se ntlnete acelai
nivel de dezvoltare sau aceeai form de manifestare. Aceast mrime poate fi exprimat fie
prin valori absolute (n care o anumit valoare se nregistreaz de un anumit numr de ori) ,
fie prin mrimi relative de structur (n care o anumit valoare se nregistreaz n x% din
cazuri).

Dup modul de variaie, pentru caracteristica exprimat numeric, n practica statistic


se ntlnesc 3 tipuri de grupri:
1. grupri pe variante, n care numrul unitilor poate s fie orict de mare, dar
caracteristica are un numr restrns de valori particulare dup care pot fi grupate aceste
Cele trei tipuri de grupri:
uniti;
2. gruprile pe intervale egale de variaie folosite n situaia n care gradul de
variaie al caracteristicii permite alegerea unei mrimi egale a intervalelor, astfel nct
numrul grupelor s nu modifice forma ei de variaie.
3. grupri pe intervale neegale, care se folosesc fie pentru cazul unui grad mare de
variaie, fie pentru gruprile tipologice, n care diferenierea pe tipuri calitative cere intervale
inegale.

4.3 Testul de evaluare 1


Test de autoevaluare 3.1
Prezentai trei pn la cinci condiii prin ndeplinirea crora se poate aprecia c o
prelucrare a datelor este pertinent.

4.4. Rezumat

30

Unitatea de nvare Nr. 4 prezint etapa prelucrrii statistice, ca etap necesar, dar
nu i suficient pentru ca demersul statistic s fie reuit. Sunt aduse n context
principalele metode de prelucrare a datelor .

4.5 Bibliografia Unitatii de invatare Nr. 4


Agresti, Allan (1990) Categorical Data Analzsis, New Zork, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.

TEMA DE CONTROL NR. 1 (TC)


GRUPAREA DATELOR STATISTICE

31

Unitatea de invatare nr. 5


CLASIFICAREA I GRUPAREA STATISTIC PRINCIPALELE TEHNICI DE
ORGANIZARE A DATELOR N VEDEREA PRELUCRARII
Cuprins
5.1
Obiectivele unitatii de invatare Nr. 5
31
5.2. Generaliti. Clasificare. Modaliti de obinere a gruprii
31
5.3
Teste de evalure 1 a unitatii de invatare Nr.5
36
5.4
Rezumat
36
5.5
Bibliografie
36

5.1. Obiective
-

contientizarea de ctre studeni a faptului c premiza unei prelucrri rapide


i eficiente este o organizare prealabil de foarte bun calitate ;
prezentarea i nsuirea clasificrii i gruprii datelor ca principale
modaliti de organizare tiinific.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

5.2 Coninut
Capitolul 5
CLASIFICAREA I GRUPAREA STATISTIC - PRINCIPALELE TEHNICI
DE ORGANIZARE DATELOR N VEDEREA PRELUCRARII

1. GENERALITI
Clasificarea i gruparea sunt instrumente de baz al prelucrrii i analizei datelor
privind economia i societatea. Prin intermediul lor se asigur sistematizarea pe
grupe sau clase omogene din punct de vedere statistic a colectivitilor statistice ,
orict ar fi ele de numeroase.
Prin omogenitate se nelege asemnarea ct mai mare, respectiv variaia ct
mai mic a elementelor n cadrul grupelor sau claselor.
Prin definiie, gruparea i clasificarea statistic reprezint procedee de
sistematizare a colectivitilor statistice n pri statistice omogene , n funcie de

32

Definiia gruprii i clasificrii


statisticii.

variaia unei caracteristici sau a mai multora.


Clasificarea i gruparea statistic ndeplinesc urmtoarele funcii:
a) sistematizarea datelor individuale prin restrngerea numrului de valori ale
caracteristicii de grupare;
b) structurarea colectivitii n pri omogene;
Funciile clasificrii i gruprii
c) prezentarea i descrierea structurii colectivitii;
statistice.
d) relevarea tipurilor socio-economice , acolo unde exist;
e) caracterizarea legturii dintre caracteristicile statistice.
Att gruparea ct i clasificarea se declaneaz prin analiza teoretic a populaiei
studiate. n urma acestei analize se stabilete sistemul de caracteristici care
intereseaz n spea respectiv, apoi se trece la efectuarea iterativ, prin tatonri, a
gruprii propriu-zise.

Dac numrul posibilitilor de grupare e mic, gruparea se face pe variante. Dac


numrul acestora este mai mare se stabilesc intervale de grupare numite i grupe
de variante.
Gruparea se ncheie cu ncadrarea unitilor n grupe i cu centralizarea valorilor
tuturor caracteristicilor cu care este descris populaia n ansamblul ei.
2. CLASIFICAREA STATISTIC
n viaa de zi cu zii oamenii fac tot felul de comparri i interpretri , care nu sunt
altceva dect clasificri naive. Acest lucru se produce n principal datorit faptului
c gndirea uman n cea mai mare parte a ei nu este o gndire matematic,
algoritmic, ci e o niruire de conjuncii i disjuncii, afirmaii i negaii.
nonalgoritmice; se spune c gndirea este inferenial.
Aceste clasificri naive au fost nlocuite n procesul cristalizrii statisticii ca tiin
prin clasificri obiective, naturale bazate pe date despre structura intern a
lucrurilor. Pe lng acestea, sub aspect operaional mai sunt admise i clasificri
subiective, artificiale.

Definiia clasificrii statistice.

Prin definiie, clasificarea statistic este operaia de sistematizare a unui


ansamblu de elemente, pe baza atributelor comune, n clase, distincte urmat
eventual de clasificarea acestor clase n subclase, procesul putnd continua
pn la o limit determinat de necesitatea ca fiecare clas s ocupe un loc
precis i stabil, iar elementele ncadrate n ea s fie ct mai omogene.
Clasificarea trebuie s ndeplineasc cteva cerine formale i anume:
a) completitudinea, care impune ca fiecare element s aparin unei clase;
b) unicitatea , care impune ca fiecare element s aparin unei singue clase;
c) omogenitatea, care cere ca elementele asemntoare s aparin aceleiai
clase iar elementele diferite s aparin claselor diferite.
n practica statistic sunt utilizate sisteme standardizate de clasificare, care
constituie componente de baz ale sistemului informaional economic i
33

instrumente indispensabile ale prelucrrii statistice. Ansamblul acestor standarde


alctuiesc sistemul unitar de clasificri i nomenclatoare social-economice,
care funcioneaz la nivelul macro-economic.

3. MODALITI PRACTICE
DE OBINERE A GRUPRII STATISTICE
Intervin n prelucrarea datelor de mas culese ntr-o observare special organizat.
n asemenea cazuri, de obicei, nu exist grupri cu caracter permanent i fiecare
grupare se elaboreaz ca un element de sine stttor.
Practic gruparea statistic presupune mprirea colectivitii n funcie de o
caracteristic numeric , mprire necesar n cazul unui numr mare sau foarte
mare de valori distincte ale caracteristicii de grupare ntlnite la nivelul respectivei
colectiviti. n prealabil colectivitatea trebuie supus unei serioase analize
teoretice care trebuie s rspund cel puin la urmtoarele ntrebri:
Ce fel de grupe exist n colectivitate?
n cte grupe se face mprirea colectivitii?
Dup care caracteristic s se fac gruparea?
Un procedeu des utilizat de grupare este gruparea mecanic, n care se aplic n
mod mecanic intervale de grupare egale. n stabilirea acestor intervale se pornete
de la amplitudinea variaiei a, crei valoare d lrgimea de band care trebuie
mprit n grupe. Aceast lrgime sau diapazon se mparte n intervale egale cu
respectarea urmtoarelor condiii:
a. limitele de interval trebuie s se exprime pe ct posibil n valori rotunde;
b. trebuie s se obin suficient de multe intervale de grupare pentru a se obine
informaii suficient de analitice;
c. intervalele trebuie s permit la nevoie regruparea datelor prin contopirea a
dou sau mai multe intervale, fr a fi nevoie de reluarea operaiei de grupare sau
de spargerea n dou a unor intervale;
d. n fiecare interval trebuie s se regseasc, pe ct posibil, un numr suficient de
mare de valori individuale, care s permit interpretarea statistic
n urma gruprii se obine seria de repartiie a frecvenelor pe intervale
de valori, serie care se numete de variaie dac repartiia este fcut dup o
caracteristic numeric.

34

Intervale de grupare
inf
sup
x i x i xi

Nr. Uniti
Fi

X1 inf x1 sup
X2 inf x2 sup
Xi inf xi sup
Xn inf xn sup

F1
F2
Fi
Fn

Total

fi
i 1

n prima coloan sunt trecute intervalele de grupare ntre o limit inferioar


i una superioar, iar n coloana a doua sunt trecute frecvenele, de cele mai multe
ori n form absolut.
Indicarea corect a limitelor de interval se poate face n dou moduri:
a) limita superioar a intervalului se repet ca limita inferioar a
intervalului urmtor, caz n care trebuie precizat cu claritate care dintre cele 2
limite incluse n interval;
b) limita superioar se difereniaz de limita inferioar a intervalului
urmtor cu o unitate sau cu o fracie de unitate, n funcie de mrimea
caracteristicii de grupare.
Lungimea intervalului de grupare, notat cu hi, se stabilete astfel:
sup
inf
- n primul caz: hi xi xi
inf

sup

- n al doilea caz: hi xi 1 xi 1
n statistica economico-social este posibil ca limita inferioar a primului
interval, notat cu x1inf, sau limita superioar a ultimului interval (x n sup) s fie
omise. Se spune c respectivele intervale sunt deschise, fiind necesar nchiderea lor
pe baza ipotezei egalitii intervalelor vecine.
n calculele ulterioare, intervalul de grupare este reprezentat prin centrul sau
mijlocul intervalului, stabilit astfel:
Caz I: prin media aritmetic simpl a limitelor de interval;
Caz II: prin adunarea la limita inferioar a jumtii intervalului respectiv.
Reprezentarea grafic a seriilor de repartiie se face prin histogram sau
poligonul frecvenelor, situaie n care pe axa absciselor se reprezint caracteristica,
iar pe axa ordonatelor se va reprezenta frecvena acesteia.
Reprezentarea grafic a seriilor e foarte important i sugestiv, fiind deseori
utilizat n vederea creterii expresivitii i puterii de nelegere a fenomenelor
social-economic. n multe situaii, gruparea pe intervale egale este neconcludent.
n procesul de elaborare a gruprii apar intervale neegale de grupare. Acestea
nu rezult prin aplicarea unor reguli mecanice i se fundamenteaz pe argumentele
analizei calitative de coninut a materialului statistic.
Dac scopul gruprii este evidenierea tipurilor calitative, vor fi utilizate
intervale neegale. n acest caz, gruparea se numete tipologic. n statistica socioeconomic apar adesea i grupri dup o caracteristic teritorial. Aceste grupri sunt
35

n general grupri mecanice. Tot prin acest procedeu se fac i gruprile dup o
caracteristic temporal.

Definiia gruprii
combinate.

Prin definiie gruparea realizat simultan dup dou sau mai multe
caracteristici se numete grupare combinat.
Aceast metod de grupare este cea mai evoluat i se poate efectua dup un
graf arborescent, n care grupele obinute n urma mpririi dup o prim
caracteristic se mpart la rndul lor n subgrupe dup o a doua caracteristic, .a.
Aceast grupare este avantajoas deoarece se poate introduce relativ uor n
completare o coloan pentru valorile agregate ale caracteristicii, n vederea
caracterizrii grupelor i a subgrupelor i a deducerii indicatorilor derivai.
De menionat c adncimea gruprii dup mai multe caracteristici prezint un
pericol deoarece ngreuneaz mult posibilitatea perceperii i cuprinderii informaiilor
n tabel.
Modelul gruprii combinate se reprezint astfel:
PRIMA
A DOUA
FRECVENELE
CARACTERITIC CARACTERISTIC CORESP.
DE GRUPARE xi
DE GRUPARE yj
COMBINAIEI DE
VALORI xi yj
X1
Y11
F11
Y12
F12
.
.
f1j
y1j
.
.
f1m
y
1m

Total grupa 1

n1 f 1 j
j 1

X1

Y21
Y22
.
y2j
.
y2m

TOTAL
GRUPA 2
..
Xi

F21
F22

.
f2j
.
f2m
n

n2 f 2 j
j 1

.
Yi1
Yi2
.
yij
.
yim
36

Fi1
Fi2
.
fij

.
fim

TOTAL
GRUPA i
Xk

ni f ij
j 1

Yk1
Yk2
.
ykj
.
ykm

TOTAL
GRUPA k

Fk1
Fk2
.
fkj
.
fkm
n

n k f kj
j 1

TOTAL
GENERAL

n ni f ij
i 1

i 1 j 1

5.3 Testul de evaluare 1


Test de autoevaluare 5.1
Prezentai, n opinia dumneavoastr, etapele prin care ar trebui s trecei pentru a afce
o grupare combinat dup dou variabile.

5.4 Rezumat
Unitatea de invatare Nr.4. prezinta n prima parte a cursului sunt prezentate
clasificarea i gruparea statistic, tehnici de baz n prelucrarea datelor statistice, a
cror utilizare contribuie decisiv la sistematizarea datelor i, pe aceast cale, la
simplificarea tuturor procedurilor ulterioare. ntregul demers se bazeaz pe conceptul
de omogenitate, a crui corect nelegere poate contribui la desluirea importanei
ambelor proceduri. Partea a doua i a treia a cursului prezint laturile practice ale
clasificrii i gruprii, modelele gruprii simple i combinate, stabilirea lungimii
intervalului de grupare, etc.

5.5 Bibliografia Unitatii de invatare Nr.4


Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.
Unitatea de invatare nr. 6
37

INDICATORII STATISTICI
Cuprins
6.1
Obiectivele unitatii de invatare Nr.6
6.2
Mrimile relative
6.3
Teste de evalure 1 a unitatii de invatare Nr.6
6.4
Rezumat
6.5
Bibliografie

37
37
41
41
41

6.1. Principalele obiective ale unitatii de invatare nr. 6


- prezentarea, nelegerea i nsuirea noiunii de indicator i a importanei
ei n limbajul i demersul statistic ;
- obinuirea studenilor de a distinge ntre coninutul i importana
diferitelor categorii de indicatori.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

6.2 Coninut
Capitolul 6
INDICATORII STATISTICI
1. Necesitatea folosirii indicatorilor statistici
Obiectul de studiu la statisticii l constituie fenomenele i procesele de mas, a cror
proprietate principal este variabilitatea formelor individuale de manifestare n timp, spaiu
i sub raport organizatoric.
Pornind de la aceast variabilitate rezult c pentru caracterizarea unei colectiviti nu
se poate folosi o singur expresie numeric , cu aceeai dimensiune ca i colectivitatea, fiind
necesare mai multe expresii de acest tip. De aici rezult nevoia statisticii de a elabora
metodologii i tehnici de obinere a acestor determinri cantitativ-numerice, denumite generic
indicatori statistici
.
Prin definiie indicatorul statistic este expresia numeric a unor fenomene,
procese, activiti sau categorii economice i sociale, definite in timp , spaiu i structur
indicatorului
statistic.
organizatoric i care se regsesc cu o anumit periodicitate nDefiniia
statisticile
oficiale,
naionale si internaionale.

Funciile indicatorilor statistici sunt urmtoarele:


a)
funcia de msurare;
b)
funcia de comparare;
38

c)
funcia de analiz i sintez;
d)
funcia de estimare;
e)
Funcia de verificare a ipotezelor i de
parametrilor utilizai.

testare

2. Indicatorii statistici primari i derivai


Dup etapa n care apar n procesul de cercetare statistic indicatorii statistici sunt de
dou categorii:
- indicatori primari;
- indicatori derivai.
a) Indicatorii primari se obin in cadrul prelucrrii primare a datelor statistice, ca
urmare a proceselor de centralizare a datelor unei observri statistice. Aceti indicatori au
coninut concret i form concret de exprimare. In practic se pot ntlni mai multe cazuri:
a.1) Indicatorii primari obinui din agregarea unor valori individuale, cu acelai
coninut calculat la treptele inferioare din punct de vedere ierarhic (spre exemplu, costurile
totale, calculate ca suma costurilor pe secii).
a.2) Indicatorii primari obinui prin observare, atunci cnd se face un studiu
monografic al unei uniti statistice (exemplu: ntr-o ntreprindere, indicatorii valorici ai
produciei sunt i indicatori absolui primari, i indicatori nregistrai direct la nivelul unitii
b) Indicatorii derivai se obin in faza de prelucrare statistic a mrimilor absolute,
prin aplicarea variatelor metode i procedee de calcul statistic: comparaiile, generalizrile,
abstractizrile. Aceti indicatori au menirea de a pune n lumin i de a face posibil analiza
aspectelor calitative ale fenomenelor si proceselor cercetate. Indicatorii derivai se obin n
urma aplicrii unui model de calcul statistic de comparare sau estimare.
Compararea a 2 sau mai muli indicatori se poate face fie sub form de diferen, fie sub
form de raport.
Comparaia pe baz de diferen este restrictiv, n sensul c trebuie s ndeplineasc
condiii de comparabilitate att din punct de vedere al coninutului, ct i al unitii de
msur. Spre exemplu, in cazul sporului produciei vndute QV, diferena

i 1

i 1

QV qi1 pi1 qi1 pi0 (unde: i = contorul produselor; qi1 pi1 = producia
n

i 1

vndut la momentul t;

i1

pi 0

= producia vndut la momentul de referin):

i 1
Se observ c indicatorii compar 2 valori i nu producia fizic cu cea valoric, iar
rezultatul comparaiei este tot o valoare, exprimat n uniti monetare.
Comparaia pe baz de raport se poate face att pentru indicatorii cu acelai coninut,
ct i pentru indicatorii cu coninut diferit, dar independeni din punct de vedere economicosocial. Exemplu: raportarea produciei la numrul salariailor este posibil i va rezulta un
indicator numit productivitate a muncii. Apar astfel in statistica mrimile relative i indicii.
Indicatorii derivai au un caracter abstract, chiar daca uneori cum este cazul mediilor,
39

sunt exprimai in uniti specifice de msur.

3. Mrimile relative ca indicatori derivai


Mrimile relative se exprim n general sub form de rapoarte.

Mrimea relativ sau indicatorul relativ este rezultatul comparrii sub form de
raport a 2 indicatori statistici i se exprim printr-un singur numr, artnd, n general,
proporia indicatorului raportat fa de indicatorul baz de raportare.
Mrimea relativ
indicatorul relativ
Mrimile relative sunt folosite n toate domeniile n care se utilizeaz metodele i
tehnicile de calcul i analiz statistic.
Forma de exprimare a mrimilor relative se stabilete n report cu gradul de variaie a
fenomenelor, scopul urmrit, precum i particularitile specifice ale fenomenelor cercetate.
Rezultatul raportrii poate fi un numr ntreg, sau o fracie. Deseori, pentru a mri
expresivitatea rezultatului, acesta se nmulete cu 100, 1000, 10000 sau 100000, obinnduse astfel: procentele, promilele, prodecimilele i procentimile.
Forma cea mai simpl de exprimare este sub form de uniti sau coeficieni. In aceasta
situaie, rezultatul raportului arat cte uniti din indicatorul raportat revin la o singura
unitate a indicatorului baza de raportare.
Forma cea mai obinuit i sugestiv, utilizat pentru exprimarea mrimilor relative
este aceea a procentelor, care arat cte uniti din indicatorul raportat revin la 100 de uniti
ale indicatorului baz de raportare. Aceasta este forma de exprimare a majoritii mrimilor
relative.
Promilele se utilizeaz atunci cnd indicatorul comparat este mult prea mic fa de
indicatorul baz de raportare. Exemplu: indicatorul eficienei utilizrii fondurilor fixe se
calculeaz ca producie obinut la 1000 lei fonduri fixe.
Prodecimilele i procentimilele se utilizeaz n principal n demografie i statistica
medical.
Mrimile relative se mpart in:
a) mrimi relative de structur;
b) mrimi relative de coordonare;
c) mrimi relative ale dinamicii;
d) mrimi relative ale programrii (planificrii);
e) mrimi relative de intensitate
a) Mrimile relative de structur sunt acele mrimi n care calculul este impus de
necesitatea cunoaterii aprofundate a compoziiei colectivitilor care au fost separate n
grupe i subgrupe, dup variaia uneia sau a mai multor caracteristici.
Acestea pot fi:
- ponderi, numite i greuti specifice;
- frecvene relative.
Ponderile sunt regsite n seriile statistice atributive, n seriile teritoriale sau pentru
variabilele statistice, construite pe baza unor componente. Ele se calculeaz procentual astfel:

40

yi

xi
n

xi

100

i 1

n aceast exprimare, la numitor se gsete ntregul, xi este partea i din ntreg, iar yi
este ponderea procentual a pri n ntreg.
Mrimile relative de structur au proprietatea c suma lor, calculat fa de aceeai
baz, este egal cu 1, in cazul exprimrii sub forma de coeficieni, sau cu 100, in cazul
exprimrii procentuale.
b) Mrimile relative de coordonare caracterizeaz raportul numeric n care se
gsesc 2 indicatori de acelai fel, aparinnd unor grupe ale aceleiai colectiviti statistice sau
unor colectiviti statistice de acelai fel, dar situate in spaii diferite.
Exemplu: raportul dintre populaia din mediul urban i populaia din mediul rural este o
mrime relativ de coordonare. Mrimile relative de coordonare admit proprietatea
reversibilitii:
x
1
1
K A/ B A

xB K A / B xB
xA
c) Mrimile relative ale dinamicii se utilizeaz pentru caracterizarea fenomenelor in
timp i se obin ca raport intre nivelul fenomenului intr-o anumit perioad i nivelul aceluiai
x
nivelul perioadei curente
K1 / 0 1
fenomen sau proces n perioada anterioar.
x0 nivelul perioadei de baza
Cea mai des ntlnit esre situaia prezentat n urmtorul cap de tabel:
Perioada
Perioada curent
de baz
x programat x realizat
x0
x0
Xpr
X1
Mrimile reale ale dinamicii pot fii mrimi ale sarcinii de plan (Isp) i mrimi ale
dinamicii de realizare a planului (Ir): I sp

Definiia mrimii relative de


intensitate

x pl
x0

100

Ir

xi
x0 100

d) Mrimile relative de intensitate sunt considerate caracteristici derivate i se obin


prin raportarea a 2 indicatori absolui, de natur diferit, care se afl intr-o relaie de
interdependen din punct de vedere al logicii social-economice.
Spre exemplu: productivitatea muncii: W

Q
productivitate

N
numar salariati

In aceasta relaie N este i frecvena pe baza creia se face calculul nivelului mediu al
productivitii muncii, la nivelul ramurii, constituita din ageni economici cu acelai obiect de
activitate principal.
In cazul mrimilor relative de intensitate, intre factorii raportai trebuie s existe
obligatoriu o relaie de interdependen: xi

yi
zi

De aici rezult c y 0 xi z i deci se va putea obine o relaie de descompunere pe


factori de influen pentru mrimea rezultativ yi considerat ca factor dependent. Astfel
indicele mrimii yi se va descompune ntr-o component yi pe seama lui xi i yi pe seama lui
zi.
41

I yi

I yi / xi
I yi / zi

yi yi / xi yi / zi

De asemenea variaia absolut total va fi suma algebric a variaiei cauzate de


modificarea primului factor ,xi, notat cu yi / xi i a variaiei datorat modificrii celui deal doilea factor yi / zi .

6.3 Testul de evaluare 1


Test de autoevaluare 6.1
Prezentai care sunt principalele mrimi relative, coninutul lor i modul de
calcul.
6.4 Rezumat
Unitatea de invatare Nr.6 - debuteaz prin definirea importantei categorii statistice
care este indicatorul i cu prezentarea ulterioar a funciilor acestuia. n partea a
doua sunt detaliate categoriile indicatorilor.

6.5 Bibliografia Unitatii de invatare Nr. 6


Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.

42

43

Unitatea de invatare nr. 7


MRIMILE MEDII. MEDIA CA INDICATOR STATISTIC ESENIAL
Cuprins
7.1. Obiectivele unitii de nvare Nr.7
7.2.
7.3.
7.4.
7.5.

Mrimile medii
Teste de evalure 1 a unitii de nvare Nr.7
Rezumat
Bibliografie

43
43
45
47
48

7.1 Principalele obiective ale unitatii de invatare nr. 7


- prezentarea, nelegerea i nsuirea noiunii de mrime medie, a mediei
ca indicator statistic esenial ;
- nsuirea metodelor de calcul a acestora.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

7.2 Coninut
Capitolul 7
MRIMILE MEDII. MEDIA CA INDICATOR STATISTIC ESENIAL
1. Mrimile medii
Un loc important n categoria indicatorilor derivai i n categoria
indicatorilor sintetici l ocup mrimile medii, utilizate pe scara larga, att in
activitatea de planificare i conducere, ct si n cercetrile statistice diverse.
Mrimile medii constituie instrumente principale de cunoatere a
fenomenelor de mas i au un grad mare de aplicabiliti n activitatea
practic. Ele redau ceea ce este tipic, comun i generalDefiniia
n evoluia
mrimii medii
fenomenelor i proceselor social-economice. Pentru a asigura un coninut ct

44

mai real, ct mai semnificativ, pentru mediile calculate, este nevoie ca valorile
individuale din care se obin s fie ct mai apropiate ntre ele.
Totodat, trebuie s se in seama de gradul de omogenitate al colectivitii
supuse cercetrii. In cazul n care aceasta colectivitate este eterogen, se vor
calcula mai nti medii pariale, iar media pe ansamblu va aprea ca o sinteza a
mediilor pariale.
Prin definiie, media valorilor individuale ale unei variabile sau
caracteristici statistice este expresia sintetizrii intr-un singur nivel
reprezentativ a tot ceea ce este esenial, tipic i obiectiv in apariia,
manifestarea si dezvoltarea variabilei.
De reinut c media msoar influenta cauzelor eseniale, fcnd abstracie
de cele ntmpltoare.
n statistic, media poate fi interpretat drept nivelul la care ar fi ajuns
caracteristica nregistrat dac in toate cazurile, toi factorii eseniali i neeseniali
ar fi acionat constant, deci s-ar fi obinut o valoare identic. De aceea media mai
este numit i "sperana matematic" ctre care tind toate valorile unei serii.
Cele mai des utilizate medii sunt:
a) media aritmetic;
b) media armonic;
c) media ptratic;
d) media geometric;
e) media cronologic.
Toate mediile pot fi calculate ca medii simple i medii ponderate.
Tabelul urmtor red formulele de calcul ale principalelor medii:
a) Media aritmetic :
b) Media armonic
a1) Media aritmetic simpl

b1) Media armonic simpl

xh

xi

i 1

n
n

i 1

a2) Media aritmetic ponderat


x

xi f i

i 1

xh

fi

i 1

fi

d) Media geometric

c1) media ptratic simpl

d1) Media geometric simpl


n

i 1

i 1

c) Media ptratic

xp

b2) Media armonic ponderat

xg

xi2

i 1

i 1

c2) media ptratic ponderat


45

d2)
Media
ponderat

geometric

xp

xi2

fi

x g i 1

fi

i 1

fi

i 1

i 1

ntre medii exist o relaie de ordine: x h x g x x p


Dac toate valorile caracteristicii pentru care se calculeaz media sunt
egale, cele 4 medii sunt egale.

7.3 Testul de evaluare 1


Test de autoevaluare 7.1
Calculul mediilor n statistic
Media este valoarea care conine tot ceea ce este esenial i stabil ntr-o mulime de valori
individuale care caracterizeaz un fenomen sau un proces statistic.
Media mai este numit sperana matematic a datelor i reprezint valoarea cu care sar putea nlocui toi termenii unei serii de distribuie dac aceti termeni nu ar fii supui unor
factori compleci de influen, care difereniaz valorile individuale ale seriilor dup diferite
atribute.
Cele mai utilizate medii n statistic sunt: media aritmetic, media armonic, media
ptratic, media geometric. Toate pot fii calculate ca medii simple sau medii ponderate.
Mediile simple se calculeaz n cazul seriilor simple, n care fiecare valoare
particular apare o singur dat sau de un numr limitat de ori, n aa fel nct s poat fi
introdus separat n calcul.
Mediile ponderate se calculeaz n cazul seriilor de repartiie de frecvene, n care
valorile individuale sunt grupate pe intervale, fiecrui interval findu-i asociat o valoare care
indic numrul unitilor statistice care apar i aparin intervalului respectiv, aceste valori
numindu-se frecvene absolute.
Media aritmetic se calculeaz dup urmtoarele modele:
n

a) media aritmetic simpl

x
i 1

x1 , x 2 x i x n

n
n
Media aritmetic se calculeaz astfel
xi se not valoarea individuala i a caracteristicii x

b) media aritmetic ponderat se calculeaz dup formula

46

x
i 1
n

f
i 1

fi

x1 f 1 x 2 f 2 xifi xnfn
f 1 f 2 fi fn

n acest model:- fi reprezint frecvena absolut a intervalului i, cu alte cuvinte numrul de


elemente ale colectivitii studiate care aparin intervalului i;
- n este numrul intervalelor de grupare n care a fost mprit colectivitatea
statistic.
Calculul mediei aritmetice simple nu comport nici un fel de dificulti; n vederea
calculrii mediei ponderate se dau urmtoarele date ale unei colectiviti statistice ,mprit
pe vrste, solicitndu-se media de vrst a ntregii colectiviti.
1
1
Nr. Grupa x Frecvena xi f I
xi a
(xifi
fi
fi
,
x
i
crt
de
i
absolut
(a=25)
a)fi
xi
xi
k
k
vrst
k 4
1
20-30 25
44
1100
0
0
11
275
0,04
1,76
2
30-40 35
104
3640
10
1040
26
910 0,028 2,912
3
40-50 45
168
7560
20
3360
42
1890 0,022 3,696
4
50-60 55
160
8800
30
4800
40
2200 0,018 2,88
5
60-70 65
64
4160
40
2560
16
1040 0,015 0,96
6
70-80 75
32
2400
50
1600
8
600 0,013 0,416
Total
572
27660
13360 143
6915
12,624
n

x
i 1

fi

27660
48,35
572

OBS: media aritmetic ponderat se plaseaz de obicei n vecintatea intervalului/intervalelor


care au frecvenele absolute cele mai mari.
Media aritmetic ponderat are urmtoarele proprieti de baz:
a) dac adunm sau scdem o anumit valoare la toi termenii seriei (o constant notat cu a)
atunci media obinut cu noii termeni va fii mai mare sau mai mic cu acea constant:
13360
( xi a) f i x a
x'
x'
23,25 48,35 25
572
fi
b) dac nmulim sau mprim frecvenele absolute ale unei serii de repartiie cu aceeai
constant k, media recalculat a seriei pe baza noilor frecvene rmne nemodificat.
f
xi ki 6915
x' '

48,35
fi
143
k
Cele dou proprieti ale mediei aritmetice ponderate sunt utilizate pentru aplicarea unei a
formule de calcul prescurtat mediei,scznd eventual o anumit valoare sau termenul cel mai
mic al seriei din toi termenii seriei i adugndu-l la media final obinut i simplificnd de
obicei frecvenele absolute cu cel mai mare divizor comun al acestora.
47

Media armonic.
Se aplic n general n seriile de distribuie care au repartiie hiperbolic a termenilor.
a) media armonic simpl: f I
1
n
xh n
n
1
1

i 1 x i
i 1 x i
n
fI

Xi

xi

xi

b) media armonic ponderat:

xi

fi

1
i 1
x hp n
n
1
1
fi fi

i 1 x i
i 1 x i

x hp

572
4,31
12,624

x hp x

f
i 1

Observaie: media armonic este mai mic sau cel mult egal cu media aritmetic a aceleiai
serii de repartiie.

7. 4 Rezumat
Unitatea de invatare Nr.7. prezinta media ca indicatorul statistic cel mai important
care sintetizeaz ceea ce este esenial n colectivitile statistice. Sunt apoi prezentate
n form simpl i ponderat principalele medii utilizate n metodologia statistic,
insistndu-se asupra mediei aritmetice i a mediei standard.

48

7.5 Bibliografia Unitatii de invatare Nr. 7


Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs

49

Unitatea de invatare nr. 8


SERII DE REPARTIIE DE FRECVENE
Cuprins
8.1. Obiectivele unitii de nvare Nr.8
8.2. Indicatori ai tendinei centrale
8.3. Teste de evalure 1 a unitii de nvare Nr.6
8.4. Rezumat
8.5. Bibliografie

49
49
52
54
55

8.1. Principalele obiective ale unitatii de invatare nr. 8


- contientizarea dectre studeni a faptului c seriile sunt principala form
de organizare a datelor ;
- prezentarea i nelegerea proprietilor seriilor care definesc esena
acestora ;
- prezentarea, nelegerea i nsuirea conceptului de omogenitate i a
posibilitilor de msurare a acestuia.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

8.2 Coninut :
Capitolul 8
SERII DE REPARTIIE DE FRECVENE
.
1.Probleme generale ale seriilor de repartiie de frecvene
Sistematizarea datelor observrii sub form de serii de repartiie de frecven se face pentru
fiecare variabil atributiv, fie cantitativ, fie calitativ.
Principalele proprieti ale seriilor de repartiie sunt:
- omogenitatea;
- variabilitatea;
independena;
- tendina de concentrare a frecventelor ataate valorilor
nregistrate.
Omogenitatea reprezint faptul c seriile au acelai coninut, fiind rezultatul combinrii
50

acelorai factori determinani.


Variabilitatea deriv din faptul c fenomenele de tip statistic sunt determinate nu numai de
aciunile unor factori eseniali, ci i de combinarea acestora cu o serie de factori neeseniali.
Independena variantelor seriei de distribuie se bazeaz pe faptul c variantele au fost
nregistrate pentru uniti de observare existente, independente una fa de alta, chiar dac aparin
aceleiai colectiviti statistice.
Tendina de concentrare a frecvenelor ataate valorilor nregistrate ale unei serii statistice
este rezultatul combinrii tuturor unitilor observate; n cazul n care factorii de influen au o
intensitate relativ constant in cadrul fiecrei uniti nregistrate, seria va prezenta o tendin de
repartiie uniform a frecvenelor, indicnd un proces de diversificare relativ
constant a variantelor nregistrrii.
Indicatorii seriilor statistice se grupeaz n:
- indicatori de frecven;
Indicatorii seriilor
statistice se grupeaz n 5
- indicatori ai tendinei centrale;
indicatori
-indicatori ai mediilor de structur;
indicatori de variaie;
- indicatori ai
formei de repartiie.

2. Indicatori de frecven
O serie de frecvene arat astfel:
Intervale de
grupare
Grupa 1
Grupa 2

i 1

Frecventele
absolute
cumulate

Frecventele
relative
cumulate

f1

f1r

f1

f1rc f i r

f2

f 2r

f 2c f1 f 2

f 2rc f1r f 2r

fi

f ir

f nc

fn

Grupa I
Grupa n
TOTAL

Frecventele Frecventele
absolute
relative

fi F

f nr
n

f*
i 1

f
i 1

f nrc 1

1(100)

Pentru a analiza structura seriei este necesar s se calculeze frecvenele relative dup formula:

f *i

fi

f
i 1

fi
F

O alt modalitate de a caracteriza structura unei serii const n calcularea frecvenelor cumulate.
Cumularea poate fi fcut fie pentru frecventele absolute ct i pentru frecvenele relative.

Cumularea frecvenelor, respectiv a greutilor specifice ajut pentru a evidenia care este
numrul de uniti sau ponderea lor pn la valoarea absolut sau relativ totalizatoare.
51

2. Indicatori ai tendinei centrale


Principalul indicator a tendinei centrale este media aritmetic. Pe lng ea, pentru caracterizarea
unei serii de repartiie este necesar s se calculeze valoarea median i valoarea modal.
n

Media simpl:

i 1

n
n

fi

i 1

Media ponderat:

i 1

n primul caz, n repryint numrul termenilor seriei ; n cazul al doilea n repreyint numarul
intervalelor de grupare.
Pentru cazul n care seriile sunt mprite pe intervale de variaie, valorile x luate n calcul sunt
date de centrele de intervale, calculate ca medii aritmetice simple intre limitele de interval.
Media se exprim n aceleai uniti de msur ca i valoarea variabilei statistice din care s-a calculat.
In analiza seriilor se pot utiliza i celelalte tipuri de medii: media armonic, ptratic, geometric.
Mediana este valoarea seriei care o mparte pe aceasta n 2 pri egale. Pentru seriile simple,
dac numrul termenilor seriei e impar, atunci mediana este dat de termenul de mijloc al seriei.
Dac numrul termenilor seriei este par, mediana se va calcula ca medie aritmetic simpl a celor
Definiia medianei
2 termeni din mijloc ai seriei.
Practic mediana se va plasa n intervalul care include acea valoare n frecvene cumulate
(frecvena cumulat a intervalului anterior este mai mic iar frecvena cumulat a intervalului respectiv e
mai mare sau egal cu valoarea dat de locul medianei).

Locul medianei:

U Me

f
i 1

Me x 0 h

50.5 (33 35)

1
2

i 1

me 1
f i 1 f i
i 1

f me

Valoarea medianei:
h lungimea intervalului medianei;
f me index, frecvena intervalului medianei;
me 1

- suma frecvenelor anterioare intervalului medianei.


Modul reprezint valoarea seriei cu probabilitatea cea mai mare de apariie
Modulul se va plasa n intervalul cu frecvena cea mai mare din cadrul seriei.
i 1

52

Formula de calcul:
Mo x0 h

1 2

1 f mo f mo1
2 f mo f mo1

( frecventa

int ervalului precedent celui mod al )

(int ervalul succesor celui mod al )

h repreyint amplitudinea intervalului modal;


x0 repreyint limita inferioar a intervalului modal

8.3 Testul de evaluare 1


Testul de evaluare 8.1.
GRUPE DE UNITI
Nr. Uniti
Vnzri total
COMERCIALE DUP
(f i)
(mil lei)
VALOAREA
VNZRILOR
REALIZATE (mii lei)
Sub 31
18
500
31-33
24
750
33-35
25
1000
35-37
13
450
37-39
8
300
39-41
7
280
Peste 41
5
220
TOTAL
100
3500
Xh = 33,89
Xg = 34,04
X = 34,20
Xp = 34,47
Pe baza algoritmului de calcul al medianei pot fii calculate i cuartilele,
decilele i centilele.
Centilele sunt acele valori care mpart seria n 4 pri egale. Exist 3 cuartile, a
doua fiind evident egal cu mediana.
Locul primei cuartile va fii:
( cu 1)
1

fi
i

fI 1
4

i 1
U CU 1
formula de calcul x 0 h
4
f cu1
- decilele vor mpri seria n 10 pri egale<
- centilele vor mpri seria n 100 pri egale.
Exist 9 decile, a cincea fiind egal cu mediana i 99 de centile, a 50-a
fiind egal cu mediana.

53

Indicatorii variaiei
Pe lng indicatorii tendinei centrale, o importan deosebit pentru
caracterizarea seriilor o au indicatorii variaiei.
Acetia se mpart n 2 categorii: indicatori simplii ai variaiei i indicatori
sintetici.
Indicatorii simplii sunt: amplitudinea A = x max x min (diferena dintre
valoarea maxim i valoarea minim a seriei), i abaterile individuale liniare ale
valorilor seriei de la medial lor.
Indicatorii sintetici sunt:
- abaterea medie liniar calculat ca media aritmetic simpl sau ponderat
ntre valorile absolute ale abaterilor liniare ale valorilor seriei de la media
acesteia.
n

Pentru o serie simpl:


n

absolute: d

x
i 1

i 1

; pentru o serie de distribuie cu frecvene

x fi

..

f
i 1

- dispersia al doilea indicator sintetic al variaiei, foarte important deoarece


calculeaz i estimeaz gradul de mprtiere a valorilor seriei fa de media lor.
Pentru o serie simpl, dispersia se calculeaz astfel:
n

(x
i 1

x) 2

n
Scriei dispersia pentru o serie de repartiie cu frecvene absolute!

abaterea medie ptratic


se calculeaz astfel

- abaterea medie ptratic, numit i abatere standard, notat cu se


calculeaz scond rdcina ptrat din media aritmetic simpl sau ponderat a
ptratelor abaterilor liniare ale valorilor seriei de la media lor. Cu alte cuvinte,
abaterea medie ptratic este radicalul dispersiei:
n

(x
i 1

x)

(x
i 1

x) 2 f i
--- coeficientul

f
i 1

de variaie, al patrulea indicator al variaiei seriei, a fost introdus din necesitatea


de a introduce nite limite ntre indicatorii variaiei ,pentru a putea aprecia
omogenitatea seriei.
Coeficientul de variaie se calculeaz n 2 moduri:
V

d
daca se cunoaste doar abaterea medie liniara
x

sau : V

daca se cunoaste abaterea s tan dard

54

Coeficientul de variaie ia valori ntre 0 i 100%


Dac acest coeficient este sub 10% seria este foarte omogen
Dac este sub 35% se apreciaz c seria e omogen.
Exemplu:
X
30
32
34
36
38
40
42

( x i x)

( x i x) f i

( x i x) 2 f i

4,2
2,2
0,2
1,8
3,8
5,8
7,8

75,6
52,8
5
23,4
30,4
40,6
39
= 266,8

317,5
116,16
1
42,12
115,52
235,48
304,2
= 1132

266,8
2.668
100
1132
2
11,32
100
11,32 3,36
d

V
V

d
x

100 7,8%
100 9,82%

Prin ambele metode coeficientul de variaie este sub 10% deci, seria poate
fii apreciat ca o serie foarte omogen.

8.4 Rezumat
Unitatea de invatare Nr.8. face prezentarea principalelor proprieti ale seriilor
de repartiie: omogenitatea, variabilitatea, independena variantelor, tendina de
repartiie, fcnd ulterior i o grupare a indicatorilor. sunt prezentai apoi indicatorii
de frecvene, precum i indicatorii tendinei centrale. O deosebit importan n
studiul seriilor o au indicatorii variaiei, grupai in indicatori simpli i indicatori
sintetici. O atenie deosebit le este acordat acestora din urm, insistndu-se asupra
abaterii medii liniare, abaterii medii ptratice, dispersiei i coeficientului de variaie.
n final , n vederea nelegerii profunde a variaiei n cadrul seriilor este prezentat
regula adunrii dispersiilor.
8.5.Bibliografia Unitatii de invatare Nr. 8
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
55

Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs

56

Unitatea de invatare nr. 9


VARIAIA I COLECTIVITILE MPRITE PE GRUPE I MSURAREA EI
Cuprins
9.1. Obiectivele unitii de nvare Nr.9
57
57

9.2.
9.3.
9.4.
9.5.

Indicatori ai variaiei
Teste de evalure 1 a unitii de nvare Nr.9
Rezumat
Bibliografie

57
62
66
66

9.1. Principalele obiective ale unitatii de invatare nr. 9


- nelegerea i nsuirea de ctre studeni a legturii totale dintre serie i
colectivitate mprit pe grupe ;
- prezentarea, nelegerea i nsuirea mprtierii (variaiei) n cadrul
acestei colectiviti ;
- prezentarea, nelegerea i nsuirea modalitilor de calcul a
indicatorilor care msoar mprtierea.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

9.2 Coninut :
Capitolul 9
VARIAIA I COLECTIVITILE MPRITE PE GRUPE I MSURAREA EI
1. Indicatori ai variaiei
Media nu este o valoare reprezentativ dect pentru cazul n care ea este calculat din
mrimi omogene, cu un grad de variaie ct mai redus. Pentru a verifica gradul de
omogenitate al caracteristicilor pentru care se determin media, este necesar s se calculeze
indicatori de variaie, de asimetrie i de exces
Aceti indicatori permit separarea modului de aciune a factorilor eseniali de
aciunea factorilor ntmpltori, ajungnd la identificarea felului n care acioneaz factorii
eseniali de la o grup la alta.
Indicatorii variaiei sunt de 2 tipuri: simpli i sintetici.

Utilizarea indicatorilor
simpli ai variaiei

1.1. Indicatori simpli ai variaiei


Sunt utilizai pentru a caracteriza gradul de mprtiere a unitilor purttoare a
caracteristicii studiate. Se pot exprima n mrimi absolute, dar i mrimi relative sau
procente.
Indicatorii simplii sunt:
a) Amplitudinea absolut a variaiei (A) se calculeaz ca diferen intre nivelul
A x max x min
maxim i nivelul minim al caracteristicii.
Se exprim n aceiai unitate de msur ca i variabila.

58

A%

A
100
x

b) Amplitudinea relativ a variaiei (A%) se calculeaz dup formula:


Se exprim in procente.
c) Abaterile individuale absolute (d) se calculeaz ca diferena intre fiecare variant
di
nregistrat i media aritmetic a variantelor
Se exprima n aceiai unitate de msur.
d) Abaterile individuale relative (d%) se calculeaz astfel:

d%

di
x

100

xi x
x

xi x

100

In analiza variaiei, intereseaz n mod special abaterile maxime intr-un sens sau
altul.
Abaterea maxim negativ dmax(-)

()
d max
x min x

Abaterea maxim negativ relativ::


Abaterea maxim pozitiv dmax(+)

( )
d max
%

x min x
x

100

()
d max
x max x

Abaterea maxima negativ relativ :

()
d max
%

x max x
x

100

1.2 Indicatori sintetici ai variaiei


Se utilizeaz pentru a sintetiza ntr-o singur expresie numeric ntreaga variaie a
unei caracteristici, scop n care statistica recurge tot la valoarea medie, calculat din
abaterile individuale ale variantelor de la media lor.
Se utilizeaz 4 indicatori sintetici:
1. Abaterea medie linear;
2. Abaterea medie ptratic;
3. Dispersia;
4. Coeficientul de variaie.
1. Abaterea medie linear de noteaz cu d i se calculeaz ca o medie aritmetic
simpl sau ponderat din abaterile termenilor seriei de la media lor n valoare absolut.
n

1.1. Pentru o serie simpl :

i 1

n
n

1.2.Pentru o serie cu frecvene absolute:

x fi

i 1

i 1

x x f
i

1.3.Pentruo serie de frecvene relative exprimate n procente:

i 1

100

2. Abaterea medie ptratic, numit i abatere medie tip sau abaterea standard; se
noteaz cu (sigma) i se calculeaz ca o medie ptratic din abaterile tuturor variantelor
59

seriei de la media lor aritmetic.


n

(x

x) 2

i 1

2.1. Pentru o serie simpl

n
n

(x

x) 2 f i

i 1

i 1
2.2. Pentru o serie de frecvene absolute:
2.3. Pentru o serie de frecvene relative exprimate n procente:
n

( x x)
i

( x x)

f i (%)

i 1

f i r (%)

i 1

100

10

De menionat c abaterea medie ptratic va fi ntotdeauna mai mare dect abaterea


medie linear.
Prin ridicarea la ptrat a abaterilor liniare, abaterea medie ptratic scoate n eviden
tocmai valorile cele mai mari ale acestora. Din acest motiv, abaterea medie ptratic va fi
totdeauna mai mare dect abaterea medie liniar.

3. Dispersia este un indicator sintetic al variaiei extrem de important deoarece


dispersiei
cumuleaz gradul de mprtiere al valorilor seriei fa de media lor.Definiia
Ea este
legat de
abaterea medie ptratic fiind practic ptratul acesteia, n consecin, calculul abaterii medii
ptratice presupune n primul rnd calculul dispersiei.
3.1. Pentru seriile simple, formula de calcul este:
n

( x x)
i 1

n
n

( x x)
i 1

fi

i 1
3.2. Pentru seriile de repartiie cu frecvene absolute:
3.3. Pentru seriile de repartiie de frecvene relative exprimate in procente:
n

( x x)
i

f ir %

i 1

100

4. Coeficientul de variaie se noteaz cu V i se calculeaz ca raport intre abaterea


V

100
x

medie ptratic i nivelul mediu al seriei. De obicei se exprim procentual:


Poate lua valori pozitive sau negative, ncepnd cu 0.
Se apreciaz c o serie este omogen dac valoarea acestui coeficient n valoare
absolut nu depete 30%. n caz contrar se apreciaz c media nu mai este reprezentativ,
deci seria este eterogen, singura modalitate de cretere a omogenitii fiind refacerea
60

mpririi pe grupe. Dac nu avem la dispoziie dect abaterea medie liniar, coeficientul de
Vd`

100

x
variaie poate fi calculat i pe baza ei:
Coeficientul astfel calculat va fii mai mic dect cel calculat pe baza abaterii medii
ptratice.

2. Indicatorii variaiei intr-o colectivitate mprit


adunrii dispersiilor

pe grupe. Regula

Cu ct fenomenele sunt mai complexe, cu att gradul de variaie al caracteristicilor


care le definesc prezint o amplitudine mai mare a variaiei.
Din acest motiv, unitile la care s-a fcut observaia trebuie mprite n grupe, n
funcie de variaia factorilor determinani. In cazul n care s-a aplicat n prealabil metoda
gruprii, se pot calcula att medii pe fiecare grup n parte, ct i o medie a colectivitii
totale, lund n calcul toate valorile individuale ale seriei.
In mod corespunztor se vor calcula indicatorii de variaie pentru fiecare grup n
parte i indicatorii variaiei pentru ntreaga colectivitate.
Indicatorii de variaie pentru ntreaga colectivitate se pot calcula n 2 moduri:
a) fcnd abstracie de faptul c ea este compus din mai multe grupe;
b) lund n calcul variaia din interiorul grupelor i cea ntre grupe.
Intre indicatorii de variaie, calculai la nivelul fiecrei grupe i indicatorii ntregii
colectiviti exist anumite relaii bazate pe aa-numita regul a adunrii dispersiilor.

Numrul unitilor pe
Valoarea
variantele caracteristicii
caracteristici
y1
y2
yi
ym
de grupare
(xi)
n11

x1

ij

ni

i 1

Medii
de
grup

yi

n1m

n1

n 22

n 2i

n2m

n2

ni 2

nii

nim

nj

nk 2

n ki

n km

nk

n 1 n 2

ni

n m n n k nij

n k1

xk

n1i

ni1

xi

grupe

n12

n 21

x2

Total uniti pe

Dispersii
de
grup
i2

y1

12

y2

22

yj

2j

yk

k2

i n j

j 1

y y/ x y/x
Dac se studiaz variaia caracteristicii y in funcie de variaia factorilor de grupare
x, atunci se pot calcula medii i dispersii condiionate pentru fiecare grup, prin care se va
pune n eviden interdependena dintre cele 2 caracteristici.
2

61

Dac x este factorul de grupare, frecvenele pe fiecare grup se obin prin nsumarea
m

frecvenelor din interiorul grupelor adic:

ij

ni

. Pentru o astfel de situaie, se obine

Dispersiile se calculeaz

o medie general y , care sintetizeaz att variaia tuturor valorilor individuale ale
colectivitii totale, ct i valorile mediilor de grup, numite i medii condiionate de factorul
de grupare yi.
Pentru caracteristica y se pot calcula 3 feluri de indicatori, care s
caracterizeze:
a) variaia valorii yi in jurul mediei lor de grup ( y i y i )
b) variaia valorilor mediilor de grup in jurul mediei colectivitii totale ( y i y )
( yi y)
c) variaia valorilor individuale yi in jurul mediei colectivitii totale
La nivelul fiecrei uniti observate, variaia total ( y i y ) , se poate descompune in
variaia fa de media de grup i variaia mediilor de grupare fa de media colectivitii
totale. y i y ( yi y i ) ( y i y )
Variaia valorilor individuale din fiecare grup n jurul mediilor va msura gradul de
influen a factorilor variabili, prezeni in interiorul grupei.
Pe de alt parte, variaia mediilor de grup fa de media colectivitii totale este
interpretat ca rezultat al factorului de grupare, deoarece n acest caz factorii variabili din
interiorul grupei s-au pstrat la un nivel constant.
Dispersia total calculat pe baza abaterilor valorilor individuale fa de media
m

colectivitii totale este urmtoarea:

2
y

(y

y) n j

j 1

j 1

Cu ct aceast valoare y este mai mare, cu att colectivitatea e mai eterogen


Dispersia de grup sau parial i2 se calculeaz pe baza abaterilor tuturor
variantelor dintr-o grup fa de media lor, ponderate cu frecventele de grup:
2

i2

(y

y i ) nij

j 1

. Vor exista k astfel de dispersii de grup, deci se poate calcula o medie

nij

j 1

a acestor dispersii notat cu i


Aceast dispersie permite msurarea influentei factorilor variabili prezeni n
interiorul fiecrei grup,( se mai numete i dispersia din interiorul grupei) i cu ct este mai
mare, cu att grupa este mai eterogen.
Dispersia dintre grupe se calculeaz pe baza abaterilor mediilor de grup de la
media colectivitii totale msurnd gradul de influent a factorilor de grupare asupra
k

2
variabilei studiate. y / x

(y
i 1

y ) 2 ni

n
i 1

i
2

ntre cele 3 dispersii funcioneaz regula adunrii dispersiilor:


62

y2 i y2 / x

Dispersia total = cu media dispersiilor din interiorul grupelor + dispersia


dintre grupe.

9.3 Testul de evaluare 1


Testul de autoevaluare 9.1

Considerm 400 de salariai care formeaz un eantion de 10% selectat ntmp


nerepetat din numrul total al salariailor unei firme. Se cunosc urmtoarele date
referitoare la vechimea n munc i timpul nelucrat:
GRUPE
TIPICE
DUP
VECHIME
(ANI)
Sub 10
10-20
Peste 20

SUBGRUPE DUP TIMPUL


NELUCRAT (minute)
TOTAL
sub 45

45-55

peste 55

15%
90%

25%
50%
10%

75%
35%
-

100%
100%
100%

tiind c eantionul este structurat astfel: grupa sub 10 ani are o pondere d
grupa ntre 10 i 20 ani are o pondere de 40%, grupa peste 20 ani are o pondere de
cere:
1. Timpul mediu nelucrat pe grupe de vechime i timpul mediu nelu
eantionului, precizndu-se dac sunt valori reprezentative
2. Felurile dispersiilor i verificarea regulii de adunare a dispersiilor.
3 S se verifice semnificaia factorului principal de grupare (vechimea)
variaia timpului nelucrat, prin calcularea coeficientului de determinaie i criteri
analiz dispersional.

Pentru a verifica dac mediile sunt reprezentative, verificm dac grupr


omogene, verificare care se produce prin calculul coeficientului de variaie i ver
ncadrrii lui sub 35%.
63

GRUPE
0-10
10-20
20-30
Total

SUBGRUPE
45-55
25
80
14
119

35-45
0
24
126
150

x1
distributia X
f1
y
distributia Y 1
f1

55-65
75
56
0
131

x2
f2

xi
fi

xp
pe grupe;
f p

y2
f2

yi
fi

yn
pe subgrupe
f n

TOTAL
100
160
140
400

Pentru fiecare subgrup trebuie s calculm: x, y ,2 ,,i , Vi


Subgrupa I
Yi
40
50
60

Frecvene
0
25
75

(50 x 25) 60 x75)


57,5 min ute
100
(7,5) 2 25 2,5 2 7,5
2
18,75
100
18,75 4,330 Vi 7,5%
yi

Subgrupa II
Yi
40
50
60

Frecvene
24
80
56

960 4000 3360


52 2 46
160
6,78
6,78 V2
100 13,04
52
y2

Subgrupa III
Yi
40
50
60
y3

Frecvene
126
14
0

5740
41 2 9 3
140

Colectivitatea general
64

Yi
40
50
60

frecvene
150
119
131

y 49,525

2 70,02

8,36

Vi 7,31

Indicatori

yi

Vi

Grupa
0-10
10-20
20-30
Colectiv.

57,5
52
41
49,52

18,75
46
9
70,02

4,33
6,78
3
8,36

7,5
13,04
7,31
16,88

Total

Avnd n vedere c, att pentru toate grupele, ct i pentru colectivitatea g

coeficientul de variaie este de sub 30%, toate omogen grup d.p.d.v. al timpului n

este ultima cu mediile calculate sunt reprezentative, grupele fiind omogene. C


omogen grup va fi aceea cu coeficientul de variaie cel mai mic.
2

Regula adunrii dispersiilor: T2 i 2


Dispersia colectiviti totale este egal cu suma dintre media dispersiilor de
dispersia dintre grupe.
T2 70,02 .

Media dispersiilor de grup se calculeaz ca o medie ponderat, po


dispersiile fiecrei grupe cu frecvenele de apariie.
i2

18,75
46,0
9

100
160
140

i2

18.75 x100 46,0 x160 9 x140


26,23
400

Dispersia dintre grupe 2 se va calcula pe baza abaterilor mediilor fiecrei g


la media general.

65

(y
i 1

y) 2 f i

f
i 1

(57,5 49,52) 2 x100 (52 49,5) 2 x160 (41 49,52) 2 x140


400

Regula adunrii dispersiilor se verific, eventualele infime diferene proven


calculul cu un numr insuficient de zecimale.!

n final, un sfat : aprecierea omogenitii unei serii este vital pentru orice ec
care dorete s-i argumenteze cunotinele !

9.4 Rezumat
Unitatea de invatare Nr.8. prezinta seriile ca metoda cea mai des utilizat pentru
sistematizarea datelor, ele fiind direct legate de gruparea statistic. In aceast unitate
se prezint conceptul de mprtiere sau de variaie i modalitile de calcul i
interpretare a indicatorilor simpli i sintetici ai acesteia.

9.5 Bibliografia Unitatii de invatare Nr.9


Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs
66

Unitatea de invatare nr. 10


METODE DE EANTIONARE PENTRU EFECTUAREA SONDAJELOR STATISTICE
Cuprins
10.1. Obiectivele unitii de nvare Nr.10
67
10.2. Generaliti. Metode de alctuire a eantioanelor
67
10.3. Teste de evalure 1 a unitii de nvare Nr.9
71
10.4. Rezumat
71
10.5. Bibliografia
72
67

10.1. Principalele obiective ale unitatii de invatare nr. 10


- prezentarea metodei sondajului i nelegerea faptului c este una dintre
cele mai utilizate metode statistice n economie i societate ;
- nelegerea
principiilor
eantionrii
i a conceptului
de
reprezentativitate ;
- prezentarea i nelegerea principalelor metode de eantionare.
Durata medie de parcurgere a primei unitati de invatare este de 2 ore

10.2. Coninut
Capitolul 10
METODE DE EANTIONARE PENTRU EFECTUAREA SONDAJELOR STATISTICE
1. Generaliti
Necesarul de informaie n continu cretere, coroborat cu faptul c sursele economice (n principal cele
financiare) sunt de regul limitate, determin creterea gradului de utilizare a metodei sondajului statistic
ca form a observrii pariale.
Sondajul statistic este uneori singura form de obinere a informaiei i este cu att mai avantajoas
cu ct presupune un consum redus de resurse, oferind posibilitatea de a obine informaii referitoare la
ntreaga colectivitate, prin observarea i cercetarea unei pri a acesteia.
Partea cercetat este numit subpopulaie sau eantion, fiind ntlnit n literatura de specialitate sub
numele de sondaj sau selecie.
In practica cel mai des se folosete sintagma "colectivitate de selecie" pentru eantion.
Toate ipotezele, afirmaiile, clasele stabilite pe baza unui sondaj nu pot fi considerate de tip
determinist, ele avnd caracterul unor ipoteze, afirmaii de tip statistic, efectuate in condiiile unei anumite
probabiliti, deci cu un anumit nivel de ncredere.
2. Noiuni si importan
Culegerea datelor se face prin observaii totale i pariale. Dac observaia parial se face n scopul
nlocuirii unei observri totale, atunci statistica folosete metoda selectiv, care presupune obinerea unor
eantioane reprezentative, extrase dup criterii strict elaborate, i care se supun observrii n conformitate cu
o serie de reguli prestabilite.
Reprezentativitatea este proprietatea conform creia, intr-un numr mai mic de uniti, care
formeaz mpreun un eantion, se regsesc aceleai trasaturi eseniale ca si n ntreaga populaie supusa
68

cercetrii statistice.
Se consider suficient de reprezentativ, sondajul care conduce la erori de cel mult 5 % ntre
colectivitatea de selecie i colectivitatea general.
La aplicarea metodei sondajului statistic, se utilizeaz o serie de noiuni-perechi ale colectivitii de
selecie i colectivitii generale dup cum urmeaz:
Colectivitatea Volum
Caracteristica nealternativ
Caracteristica alternativ
Medie
Dispersie
Medie
Dispersie
n

s2

Colectivitatea
de selecie

xi

s2

x0

x
j 1

i 1

x) 2

m
n
m
f
n

n
n

j 1

Colectivitatea
general

(x

( xi x) 2
i 1

S 2 f (1 f )

n 1
N

2
sW
W (1 W )

(x
i 1

x0 )

M
N

P2 P (1 P)

De reinut c, n orice condiii volumul colectivitii totale este o constant, deci parametrii
colectivitii totale (media, dispersia) pot lua fiecare cate o singur valoare distinct. In acelai timp, dintr-o
populaie total de N uniti pot fi extrase mai multe eantioane de acelai volum sau de volum diferit.
Rezult de aici c media i dispersia colectivitii de sondaj se transform n variabile aleatoare, cu valori i
frecvene diferite de apariie.
Dintr-un volum de N uniti pot fii extrase C Nn eantioane. Numrul total al eantioanelor este 2 n .
De aici rezult c media i dispersia colectivitii de sondaj se transform n variabile aleatoare cu
valori diferite i cu frecvene diferite.
Pentru fiecare indicator calculat la nivel de colectivitate general sau eantion, exist diferene in plus
sau in minus. Aceste diferene se numesc erori de selecie i sunt: de sondaj sau de reprezentativitate.
Erorile de sondaj sunt erori de care i au sursa in nclcarea principiului fundamental al sondajului
i anume caracterul aleator al prelucrrilor. Ele se concretizeaz in deplasri ale valorilor parametrilor
stabilii pentru colectivitatea de selecie, comparativ cu parametrii existeni pentru populaia originar.
Definiie erori de sondaj
Datorit proprietilor mediei, la calculul erorii de sondaj se ia in discuie ca principal msurtor al
erorii, diferena dintre media de selecie i media general.
Eroarea de reprezentativitate reprezint diferena dintre media general a populaiei i media
eantionului, aceasta din urm fiind calculat pe baza sondajului.
Aceast eroare este expresia in uniti concrete de msur, considerndu-se c media x a
colectivitii de selecie este reprezentativa pentru media general (m) a colectivitii generale, dac este
reflectat relaia:

5%

xm
5%
m

sau

d x (%)

xm
m

5%

Diferena x m se numete eroare de eantionare sau eroare de reprezentativitate si este de 2 tipuri:


b1) eroare de reprezentativitate sistematic, provenind de la nerespectarea principiilor fundamentale
ale efecturii sondajului: alegerea la ntmplare a unitilor eantionului.
eroarea de eantionare este de 2
b2) eroare de reprezentativitate ntmpltoare, care nu poate fi evitat
tipurii care ine de natura
eantionrii ca cercetare parial.
Practica demonstreaz c indiferent de precauiile luate, nu este posibil reproducerea pn la

69

identitate a structurii populaiei totale i de aici rezult c eroarea de reprezentativitate poate fi calculat
dac media general este cunoscut dintr-o cercetare anterioara, comparndu-se media eantionului
nregistrat, calculat n cursul cercetrii, cu aceast medie general recunoscut.
In acest caz se spune ca a fost calculata eroarea efeectiv de sondaj i dac ea se ncadreaz in marja
de 5% este verificat i gradul de reprezentativitate.
Nu n toate cazurile exist o medie precalculat a colectivitii generale. Din acest motiv se utilizeaz
mai multe sondaje de prob, verificndu-se stabilitatea mediei i a dispersiei acestor sondaje prin metode
cunoscute de la seriile de distribuie.
Avantajul seleciei statistice const n faptul c permite calcularea mrimii erorii i stabilirea
prealabil a mrimii acesteia, cu condiia ca la formarea eantionului s se foloseasc o schema probabilistic
sau un procedeu derivat dintr-o schem probabilist.
In acest caz, se pot interpreta si calcula erorile de selecie, cu ajutorul proprietilor diferitelor funcii
de probabilitate.
3. Procedee i modaliti de alctuire a eantioanelor
Metoda sondajului ofer tehnici variate de prelucrare, difereniate i adaptate diferitelor tipuri de
populaie, astfel nct s se asigure caracterul aleator al seleciei unitilor i reprezentativitatea eantionului.
Dup modul de prelucrare sau extragere, exist urmtoarele tipuri de sondaje:
a) sondaj simplu aleator
- repetat
- nerepetat
b) sondaj tipic (stratificat):
c) sondaj de serie
d) sondaj in mai multe trepte
e) sondaj secvenial utilizat la controlul calitii
f) sondaj subiectiv (organizat sau dirijat)
g) sondaj sistematic sau mecanic
In practic, n marea majoritate a cazurilor, eantioanele se extrag din populaii finite. Aceste
eantioane se trateaz prin analogie cu extragerea sondajelor din populaii infinite.
In funcie de revenirea sau nerevenirea fiecrei uniti in baza de extragere, sondajele sunt repetate,
daca unitatea extras revine n baza in vederea unei noi extrageri, i nerepetate n caz contrar.
Sondajul repetat este sondajul n care fiecare unitate extras din populaia general este introdus
din nou n aceasta, n vederea unei noi extrageri. n acest caz, variabilele sunt independente ntre ele i
fiecare unitate poate fi extras de mai multe ori.
defiie sondajul repetat
n sondajul simplu repetat varianta de sondaj da natere unei repartiii teoretice dup modelul
Bernoulli.
Dintr-o colectivitate care conine N uniti se pot extrage mai multe eantioane de volum n, care pot
s fie diferite ca structur una de cealalt ,deci succesiunea probelor de sondaj este infinit. Numrul de
variante de eantionare este totui finit i este egal cu: C Nn .

Prin sondaj nerepetat se nelege un sondaj analog cu modelul bilei extrase din urna, fr ca ea s
mai fie pus napoi.
In acest caz, variantele sunt dependente intre ele, i fiecare unitate poate aprea o singur dat n irul
definiie sondajul
succesiv
al probelor. Este practic un sondaj efectuat dintr-o populaie finit , cu fracia de sondaj depinznd
nerepetat
de volumul eantionului.
Att n cazul bilei revenite, ct i in cel al bilei nerevenite se obin mai multe eantioane de acelai
70

volum. Efectund toate eantioanele posibile cu acelai volum, mediile de selecie pot fi considerate ca valori
diferite ale unei variabile statistice aleatoare, care pot estima media general cu o abatere mai mare sau mai
mic. Rezult de aici c exist sondaje mai eficiente sau mai puin eficiente.
Prin definiie, un sondaj A de volum n, in baza cruia se estimeaz media m a unei populaii
pentru variabila x prin estimaia x A este mai eficace dect sondajul B, de acelai volum n, n baza
cruia se estimeaz aceeai medie m a caracteristici x, dac exist relaiile:
M (x A ) m
M (x B ) m
D( x A ) D( x B )

Acest lucru se explic pe baza inegalitii lui Cebev, care exprim cu o probabilitate mai mare dect
1

1
1
p 1 2 urmtoarele:
2
k
k

- in cazul sondajului A media teoretic m se gsete cuprins n intervalul x A kD ( x A ), x A kD( x A


;

- in cazul sondajului B x B kD( x B ), x B kD( x B ..


Concluzie:
Cu aceeai probabilitate, se gsete pentru media teoretic un interval mai mic de acoperire n cazul
sondajului A dect n cazul sondajului B, motiv pentru care spunem c sondajul A este mai eficient i l
preferm sondajului B.
ntreaga metodologie de calcul si interpretare statistica a rezultatelor unei cercetri selective, se
bazeaz pe sondajul simplu, aleator, care corespunde cel mai bine schemei Bernoulli i are ca model teoretic
repartiiile binomial i hipergeometric.
Alctuirea eantioanelor poate fi fcut prin mai multe procedee:

a) procedeul bilei revenite i nerevenite procedeu n care Procedee


elementele
populaiei generale se
pentru alctuirea
noteaz de la 1 la N, i fiecare nr. se noteaz pe un cartona. Toate cartonaele seeantioanelor
introduc ntr-o anumit urn
(urna lui Bernoulli) i se amestec bine. Extragerile se fac la ntmplare.
Elementul extras se consider component al eantionului. Dac elementele nu se mai introduc in urna
lui Bernoulli, sondajul aleator este nerepetat. In caz contrar, sondajul este repetat.
La sondajul repetat, dup fiecare reintroducere, cartonaele din urna lui Bernoulli sunt din nou
amestecate.
b) procedeul tabelului numerelor aleatoare reprezint o variant de selecie probabilist, care
pornete de la conceptul de nr. aleator i care are sens prin asociere cu anumite experimente i anumite
consemnri, privind frecvena de apariie a unui fenomen sau a unei anumite caracteristici intr-un proces.
Utilizarea tabelelor cu numere aleatoare const n preluarea din cadrul populaiei a unitilor ale cror
numere de ordine prestabilite printr-o numrtoare prealabil au fost citite dup o anumit ordine din tabel.
Citirea se face de sus n jos i de la stnga la dreapta.
Exist algoritmi care genereaz numere aleatoare. Pentru ca selecia s fie riguros ntmpltoare,
punctul de pornire in acest tabel se alege tot ntmpltor.
Daca nu exist corespondeni intre numrul citit din tabel i numrul elementului, se trece mai
departe la alt numr aleator.
71

c) procedeul mecanic de formare a eantionului solicit ca elementele colectivitii generale


supuse cercetrii sa fie prelevate dup un interval determinat, denumit frecvent " pas de numrare", care se
aplic bazei de sondaj.
Spre exemplu, dac volumul eantionului ar fi de 1/10 din cel al colectivitii generale, preluarea
elementelor n eantion se face din 10 n 10, pornindu-se dintr-un punct al colectivitii ales ntmpltor.

10.3 Testul de evaluare 1


Test de autoevaluare 10.1
Care sunt principalele metode de eantionare i care credei c este metoda cel mai
des folosit n practic.

10.4 Rezumat
Unitatea de invatare Nr.9. prezinta unul dintre capitolele eseniale ale
statisticii, menit s uureze consistent munca cercettorului, este sondajul. n cadrul
lui, o bun cunoatere i nelegere presupune stpnirea riguroas a noiunilor
teoretice, alturi de nelegerea conceptelor de reprezentativitate i estimaie. n
vederea efecturii n bune condiii a unui sondaj este important alegerea procedurii
corecte de alctuire a eantionului i dimensionarea corect a acestuia. n vederea
calculului i estimrii ct mai aproape de adevr a mediei i dispersiei colectivitii
generale este pus la dispoziie aparatul statistico-matematic adecvat.

10.5 Bibliografia Unitii de invatare Nr. 10


Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
72

Sptaru, Liviu Note de curs

Unitatea de invatare nr. 11


ESTIMAREA MEDIEI I PRECIZAREA EI N SONDAJUL STATISTIC
Cuprins
11.1. Obiectivele unitii de nvare Nr.11
11.2. Sondajul. Proabiliti i intervalle de ncredere
11.3. Teste de evalure 1 a unitii de nvare Nr.10
73

73
73
79

11.4. Rezumat
11.5. Bibliografie

81
82

11.1. Principalele obiective ale unitatii de invatare nr. 11


- nelegerea noiunilor de estimare i precizie a estimrilor ;
- prezentarea modalitilor de calcul i nsuirea lor ;
- nelegerea i nsuirea diferenelor existente ntre estimrile din cadrul
diferitelor tipuri de sondaje.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

11.2. Coninut
Capitolul 11
ESTIMAREA MEDIEI I DISPERSIEI I MSURAREA PRECIZIEI LOR N
SONDAJUL STATISTIC

1. Estimarea mediei i dispersiei populaiei generale folosind sondajul


statistic
1.1. Sondajul aleator simplu repetat
Analiza formulelor de estimare pentru medie i dispersie duce la concluzia c
sondajul aleator simplu repetat este cel mai apropiat ca estimare pentru medie i
dispersie, fiind de asemenea cel mai acoperitor din punctul de vedere al bazei teoretice
i pentru celelalte procedee. n acest caz media de selecie este o variabil care
urmeaz o anumit lege de probabilitate. Se demonstreaz c funcia de probabilitate
depinde de volumul eantionului. Acest principiu st la baza calculului erorii probabile
de reprezentativitate.

Definiia estimaiei

Prin estimaie se nelege operaia de extindere, in limitele specificate de


incertitudinea exprimat n termeni probabilistici, a rezultatelor obinute n
sondaj asupra ntregii populaii.
Estimaiile reprezint evaluri aproximative ale adevratelor valori ale
74

parametrilor estimai, deoarece sunt afectate de erori.


Eroarea estimaiei afecteaz precizia ei. Rezult de aici c estimarea
parametrului general se face printr-un interval de estimare numit i interval de
ncredere.
Acest interval va avea 2 limite: limita inferioar , limita superioar .
Pentru parametrul real este ndeplinit urmtoarea relaie de probabilitate:
P ( 0 ) 1

In acest caz ,1- este nivelul de ncredere, iar se mai numete prag de
semnificaie.
Jumtatea intervalului de ncredere se numete eroare limit admis i se
noteaz cu:

( )
2

Folosind independenta valorilor variabilelor din eantion, notate cu x 1,x2....xn,


se arat c media de sondaj va fii :
x

x1 x 2 ..... x n
1

n
n

i 1

Dispersia mediei de sondaj:


D( x)

Abaterea medie ptratica a mediei de sondaj:

s
( x)

n
n

1.2. Sondajul aleator simplu nerepetat


n caracterizarea i calculul parametrilor acestui tip de sondaj se consider c X
este o caracteristic de tip cantitativ. Problema principal a sondajului este estimarea
mediei m a colectivitii generale pe baza mediei x a colectivitii de selecie, precum
i a unor parametrii rezultai n urma aplicrii metodei seleciei statistice.
Este evident c numai din punct de vedere pur teoretic sau absolut ntmpltor
este posibil ca m s fie egal cu x. n general, media colectivitii de selecie sau a
eantionului se apropie mai mult sau mai puin de media colectivitii generale, deci va
aparine unei varieti a acesteia. Cu ct aceast varietate este mai restrns, cu att
estimarea este mai constant iar selecia mai reuit.
Dac N este volumul colectivitii generale atunci probabilitatea producerii
fenomenului xi = 1/N, iar X2 = x2 n condiiile n care deja X1 = x1 = 1/N
P ( X 2 x 2 / X 1 x1)

1
N 1

Cu alte cuvinte, dac n momentul iniial probabilitatea extragerii unui anumit


element din cadrul eantionului este egal cu 1/volumul colectivitii, dup ce aceast
extragere s-a produs probabilitatea extragerii unui alt element crete deoarece volumul
colectivitii s-a diminuat cu o unitate i numitorul fiind mai mic, expresia e mai mare.
Acest lucru e valabil pentru sondajul aleator simplu nerepetat.
Media de selecie va fii o variabil aleatoare a crei dispersie este dat de
relaia:
75

2x D ( x)

2 N n S 2 N n

n N 1 n N 1

unde: 2 este dispersia colectivitii generale


De
asemenea
abaterea
medie
ptratic
x

N n
S

N 1
n

mediei

de

selecie

N n
S
n

1
N 1
N
n

Dac raportul dintre colectivitatea de selecie i cea general (n/N) < 0,2,
adesea n calcule factorul

N n
nu se mai ia n consideraie.
N 1

De aici rezult un paradox care arat c erorile sondajelor care cuprind o parte
nensemnat din colectivitatea general depind numai de numrul absolut al variaiilor
colectivitii de selecie i de mrimea abaterii medii ptratice a colectivitii generale.
De altfel, precizia estimaiei mediei m a colectivitii generale prin media x a
colectivitii de selecie depinde foarte puin de volumul N al colectivitii generale;
aceast precizie depinde mult mai mult de valoarea absolut a volumului n a
eantionului.
Cnd volumul eantionului (n) crete, precizia crete de aproximativ n ori,
dup cum n aproximativ acelai raport se micoreaz abaterea mediei ptratic a
mediei de selecie. Aceast dependen a abaterii medie ptraticea mediei de selecie
de volumul colectivitii de selecie d posibilitatea utilizrii n practic a unor sondaje
nu foarte mari ca volum, deoarece creterea cu puin a volumului colectivitii de
selecie nu influeneaz cu aproape nimic precizia.
Concluzie: dac volumul N al colectivitii generale este foarte mare, i
volumul n al colectivitii de selecie este foarte mic, atunci expresia:

N n
1
N 1

De aici rezult c n astfel de situaii n care n este foarte mic, rezultatele


sondajului repetat i a celui nerepetat difer foarte puin.
De reinut i faptul c n totdeauna

N n
1 , motiv pentru care eroarea
N 1

sondajului nerepetat va fii totdeauna mai mic dect eroarea sondajului repetat sau cu
revenire.
Acest lucru se explic prin faptul c revenirea acelorai uniti n sondaj
nrutete reprezentativitatea, apariia repetat n urna lui Bernoulii a aceleiai uniti
ducnd la o pierdere substanial de informaii.
n general eroarea de
reprezentativitate a
Adugnd acestor avantaje i faptul c extracia nerepetat se realizeaz mai
extragerii fr revenire este uor din punct de vedere organizatoric rezult evantaiul complet al argumentelor care
mai mic dect cea a
determin ca n practic sondajul nerepetat s fie mai utilizat dect cel repetat.
extraciei cu revenire.
n ultima instan se remarc faptul c precizia sondajului, eroarea medie a
acestei precizii depinde nu de proporia de sondaj n/N, ci de volumul n al sondajului,
2 fiind o constant.

1.3. Estimarea dispersiei


ntreaga procedur utilizat pentru estimarea mediei m presupunea c dispersia
2
a colectivitii generale era aprioric cunoscut.
Dac nu este cunoscut aceast dispersie, n locul ei se utilizeaz estimatorul
76

1 n
( xi x) 2 ; unde x i x reprezint abaterile

n i 1
individuale ale valorilor colectivitii de sondaj xi fa de media lor x .
Pentru un sondaj repetat, dispersia S 2 este un estimator deplasat al dispersiei
2
a colectivitii generale.
Aplicnd regulile de calcul ale dispersiei i introducnd m al colectivitii
generale de obine:
1 n
S ( xi m) 2 ( x m) 2 ceea ce arat c S2 este un estimator deplasat,
n i 1
utilizarea lui comportnd anumite riscuri referitoare la eroarea de reprezentativitate.
Un estimator nedeplasat, mai exact se obine n cazul sondajelor de volum
n
1 n
S 2
S2
redus cu formula:
( x i x) 2
n 1
n 1 i 1
Dac volumul colectivitii de selecie este mic, sub o zecime, sau chiar mai
mic, atunci acest estimator pentru dispersia colectivitii generale este mult mai realist,
mai aproape de valoarea real a acesteia.
2
Concluzie: n cazul sondajului nerepetat, dispersia medie de sondaj x poate fii
numit dispersia de sondaj:

S2

estimat din urmtoarele mrimi: a ) 2x


ptratic este: a) x

S
n

; b) x

S2
S
; b) 2x , iar abaterea media
n
n

S
n

2. Precizia estimaiei, probabilitatea de ncredere, intervalul de ncredere.


2.1 Estimarea mediei
Sigurana estimrii mediei m prin intermediul mediei de selecie este
probabilitatea cu care este ndeplinit inegalitatea: x m . n general aceast
probabilitate este cunoscut dinainte. Cu ct probabilitatea este mai mare cu att x
este mai apropiat de m.
Acest fapt se scrie astfel:
P( x m ) 1

echivalent

cu P ( x m x ) 1

( x , x ),

Intervalul
care acoper parametrul mediu m cu o probabilitate
dat P se numete interval de ncredere pentru media m.
n vederea stabilirii acestui interval se precizeaz c variabila de sondaj

xm
are
x

o repartiie normal.
Fie urmtoarele 2 cazuri:
a) dac eantionul este extras dintr-o populaie cu o distribuie normal cu
media m i dispersia 2
b) dac eantionul este extras dintr-o populaie oarecare dar volumul n a
eantionului este suficient de mare, iar dispersia 2 a colectivitii
generale dac este necunoscut, este estimat cu dispersia de sondaj.
77

n aceste condiii
P ( x m ) P ( x m )

xm

x
x
x

) 1

innd seama de normalitatea variabilei de selecie, rezult, conform legii de


distribuie normal c:

xm

2
1;

x
x
x
x

no tan d
z z x
x

z - valoarea tabelar a distribuiei normale care satisface ecuaia:

2 z 1

De aici rezult c intervalul de ncredere pentru medie este urmtorul:


x z x m x z x

De asemenea lungimea intervalului de ncredere corespunztor volumului n al


eantionului i probabilitii P va fii dat de relaia:
x z x x z x 2 z x 2

2.2. Determinarea volumului n al eantionului


Pentru o eantionare de volum mare se pornete de la relaia:
unde, prin transformri rezult n final n

, de

z 2 2
.
2

n cazul sondajului nerepetat, pentru determinarea volumului n al eantionului


se pornete de la relaia:
N n
2 z 2
dar n( N 1) 2 z 2N nz 2
n N 1
Nz 22
de unde scoatem n
N 1 2 z 22
n baza acestei relaii, cunoscnd volumul colectivitii generale, dispersia acestei
colectiviti, intervalul de ncredere pe care trebuie s-l respectm (z), se poate
determina volumul eantionului, volum necesar pentru ca selecia s duc la valori
reprezentative.
Pentru ca media s fie cuprins n intervalul de ncredere, volumul eantionului
trebuie s fie cel puin egal cu cel stabilit prin aceste relaii.
Pentru dimensionarea raional a volumului n al eantionului sunt necesare
urmtoarele informaii cunoscute aprioric: eroarea limit admisibil , probabilitatea
de ncredere 1 , sau sigurana notat cu P, dispersia colectivitii generale 2 ,
volumul N al colectivitii generale.
Cunoscnd 1 din tabelul distribuiei normale n baza relaiei
2 ( z ) 1 , se scoate variabila z din tabel, pentru a fii apoi introdus n
formula de calcul a colectivitii de selecie.
Aceste informaii por fi asigurate fie din cercetri anterioare, fie din cercetri
special organizate.
Pentru caracteristicile numerice msurabile se presupune stabilirea mrimii:
78

2
max

xl

min

x
2

max

2
Pentru caracteristicile binare 2max f (1 f ) 0,5(1 0,5) 0.25

unde f este

frecvena relativ a caracteristicii binare creia i s-ar atribui codul X1=1


2.3 Estimarea preciziei n cazul caracteristicii binare (alternative)
Dac n sondajul (x1, x2, ..xn)un nr. de k uniti posed o anumit caracteristic
i dac n k nu o posed, i mai mult x1, x2, xk sunt egale cu 1, i x k+1xk+2-xn =0,
proporia din eantion a elementelor care posed caracteristica X este egal cu:
1 n
1
k
k
x x i 1 k 0(n k ) x
n i 1
n
n
n
Cu alte cuvinte media este egal cu frecvena relativ a caracteristicii cercetare
n eantion notat cu f sau fn.
Teorema lui Bernoulli P( nf P ) 1 stabilete c f este un estimator
consistent pentru probabilitatea P.
Intervalul de ncredere pentru probabilitatea P, n cazul sondajului repetat este:
f z

P 1 P
P f z
n

P 1 P
n

n cazul sondajului nerepetat, cel mai des utilizat, volumul n al colectivitii de


selecie se stabilete prin relaia:
z2 P1 P N
P 1 P
N n
z

z f n
n
N 1
N 1 2 z2 P1 P
Cu aceast formul se calculeaz volumul colectivitii de selecie pentru
caracteristica alternativ n cazul unui sondaj aleator nerepetat.

11.3 Testul de evaluare 1


Test de autoevaluare 11.1
un nou sistem de normare a muncii ntr-o ntreprindere cu 550 muncitori de
aceeai meserie s-a efectuat un sondaj cu volumul n=75 muncitori , nregistrndu-se
pentru fiecare numrul pieselor realizate.
Se cere s se stabileasc limitele de ncredere pentru nivelul mediu al ndemnrii
muncitorilor.
Determinarea intervalului de ncredere i a volumului colectivitii de sondaj n

79

selecia statistic
Sunt 2 dintre cele mai importante i frecvent ntlnite probleme din sfera seleciei
aplicate, rezolvarea lor presupunnd vehicularea unui numr mare de informaii care
acoper practic cea mai mare parte a problematicii specifice seleciei statistice.
Intervalul de ncredere este intervalul n care se cuprinde cu o anumit
probabilitate, media colectivitii generale, dar dac acest interval este calculat numai
pe baza datelor obinute din eantionul selectat.
n vederea determinrii acestui interval sunt necesare ns i o serie de date
ale colectivitii generale, cunoscute eventual dintr-o observaie anterioar.
Intervalul de ncredere este de forma: m [ x x z ; x x z ]
Aici, m este media colectivitii generale, x - este media colectivitii eantionului
de selecie ,x abaterea medie ptratic,
z argumentul funciei de distribuie Gauss-Laplace pentru o probabilitate dat.
- de obicei avem: = 1% sau 1,5%
1 - = p (probabilitatea cu care apreciem c ceea ce facem e adevrat)
1 - = p = ( z )
Funcia Gauss-Laplace este tabelat, i ntre probabilitatea p care este valoarea
funciei, i argumentul z , exist o coresponden biunivoc. Cunoscnd una, o
scoatem pe cealalt.
n vederea determinrii intervalului de ncredere trebuie cunoscute dintr-o
selecie anterioar urmtoarele date:
- volumul colectivitii generale N;
- eventual dispersia acestei colectiviti;
Determinarea acestui interval depinde de tipul colectivitii de selecie
utilizat , deoarece abaterea ptratic x se ajusteaz diferit de la o metod la alta.
Exemplu: Pentru a stabili
Rezolvare:
determinarea intervalului de ncredere presupune parcurgerea
urmtoarelor etape:
1. Determinarea metodei de eantionare utilizat sondajul aleatoriu nerepetat
2. Determinarea volumului colectivitii generale, N=550
75

3. Determinarea mediei colectivitii de selecie

x
i 1

75

17,449

1 n
2
4. Determinarea dispersiei colectivitii de selecie S
( xi x) 2 0,6197
n 1 i 1
5. Determinarea abaterii mediei ptratice a mediei de sondaj; n acest scop se
utilizeaz
formula
de
calcul
specific
seleciei
x

S
N

N n 0,6197

N 1
550

550 75
0,08455
550 1

6. Determinarea argumentului z al funciei Gauss-Laplace.


Presupunnd c probabilitatea pentru care se face calculul este de 99%, din tabele
scoatem z
80

P=99% = ( z ) = 2,58.
7.Calcularea intervalului de ncredere:
19,479]

m [ x x z ; x x z ]

m [15,418;

Determinarea volumului colectivitii de selecie


Importana problemei deriv din faptul c un volum de selecie mai mare nu
influeneaz n proporie semnificativ exactitatea rezultatelor, dar influeneaz n
mod direct cheltuielile ocazionate de cercetarea statistic.
Este practic principala problem care trebuie rezolvat atunci cnd s-a luat
decizia de a efectua o selecie statistic.
n vederea determinrii volumului n al eantionului este necesar cunoaterea
unor date din eventuale cercetri anterioare care s se refere la colectivitatea general
i anume: volumul colectivitii generale, abaterea medie ptratic a caracteristicii
studiate, nivelul de ncredere sau probabilitatea de decizie, eroarea probabil n
vederea calculrii erorii limite maxim admis.
Exemplu: n vederea determinrii timpului mediu de funcionare a unor lmpi
cu incandescen se efectueaz o cercetare prin sondaj, cunoscndu-se urmtoarele
date:
Cercetare prin sondaj
- Volumul colectivitii generale este 7500 lmpi;
- Abaterea medie ptratic a duratei de funcionare este de 150 ore;
- Probabilitatea de decizie este de 99%.;
- Eroarea probabil pentru un timp mediu de funcionare de 1000 de ore este de
5%.
Determinarea volumului n al eantionului se face n urmtoarele etape:
1. stabilirea tipului de sondaj aleatoriu nerepetat pentru c reintroducerea
lmpilor n volumul colectivitii generale diminueaz rezultatul.
2. volumul lotului complet N=7500 lmpi
3. abaterea medie ptratic a timpului de funcionare 150 ore
4. probabilitatea ( z )=99% z =2,58
5. calculm eroarea limit admis ca 5% 5 x 100/100=50 ore
6. se aplic formula de calcul pentru volumul eantionului pentru selecia

nerepetat:

N 2 z2
( N 1) 2 2 z

59,44 n 60 lampi

este

suficient

extragerea i testarea a 60 lmpi pentru ca datele s fie valabile pentru


ntregul volum de 7500 lmpi. Altfel spus, cu o probabilitate de 99%, timpul
mediu de ardere al lotului de 7500 lmpi este identic sau foarte apropiat de
timpul mediu de ardere a eantionului de 60 de becuri.
n vederea creterii exigenelor calitative, societatea comercial productoare i
propune o mai mare exactitate a calculelor schimbnd probabilitatea de decizie la
99,9%. S se determine noul volum al eantionului n baza noii probabiliti.
z = 3,40

N 2 z2
( N 1) 2 2 z

102,63 n 103 lampi

n general eantionarea se face nerepetat, repetat (cel mai frecvent),


stratificat.
81

11.4 Rezumat
Unitatea de invatare Nr.11 prezinta metodele de estimare ale mediei i dispersiei n
sondajul aleator simplu repetat i nerepetat, precum i de evluare a preciziei acestor
estimri.

11.5 Bibliografia Unitatii de invatare Nr.11


Agresti, Allan (1990) Categorical Data Analzsis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs

82

TEMA DE CONTROL NR. 2 (TC2)


EANTIONAREA SIMPL ALEATOARE NEREPETAT.
ESTIMAREA MEDIEI I DISPERSIEI N BAZA ACESTORA

Unitatea de invatare nr. 12


LEGTURILE DINTRE VARIABILELE ECONOMICE
Cuprins
12.1. Obiectivele unitii de nvare Nr.12
12.2. Concepte. Tipuri de legturi
12.3. Teste de evalure 1 a unitii de nvare Nr.12
12.4. Rezumat
12.5. Bibliografie

83
83
86
86
86

12.1. Principalele obiective ale unitatii de invatare nr.12


- nelegerea faptului c ntre factorii economici exist legturi cauzale de diferite
tipuri;
- prezentarea, nelegerea i nsuirea tipului de legturi;
- nelegerea de ctre studeni i nsuirea celei mai simple metodologii de
evideniere a legturilor dintre factori.
Durata medie de parcurgere a primei unitati de invatare este de 2 ore

12.2 Coninut

Capitolul 12
83

LEGTURILE DINTRE VARIABILELE ECONOMICE

1. Conceptul de legtur statistic. Tipuri de legturi.


Variabilele economice reprezint rezultatul unei multitudini de factori, unii principali, alii
secundari, sau ntr-o alt accepiune, unii eseniali, alii neeseniali.
Una dintre preocuprile majore ale statisticii este evidenierea i msurarea influenei acestor
factori asupra variabilelor, demers care comport o serie de dificulti legate n primul rnd de
complexitatea relaiilor, precum i de faptul c relaiile de cauzalitate nu sunt deterministe i se
manifest n general tot sub form de tendin. n plus, se manifest, cu predilecie ntre factorii
calitativi, o serie ntreag de interdependene care nu pot fii msurate cu exactitate, ducnd la
acceptarea msurilor inexacte ca msuri variabile pentru legturile dintre variabile.
Legturile de tip statistic sunt diferite de cele tehnice, a cror manifestare este n general
matematic, algoritmic i parametric.
De asemenea, exist diferene majore ntre legturile de tip statistic i cele de tip funcional.
n cazul legturilor funcionale exist o relaie de tipul :
yi=f(xi) ,
care stabilete o coresponden ntre argumentul xi i valoarea yi a funciei, coresponden care
poate fi formalizat. Aceast form de legtur nu e proprie fenomenelor social-economice,
legturile dintre acestea fiind legturi statistice sau stohastice. n cadrul acestui gen de legturi:
x este o caracteristic factorial (factor);
y este caracteristica rezultativ,
astfel nct x l influeneaz pe y, (x y), sau cu alte cuvinte variaia caracteristicii rezultative
depinde ntr-o anumit msur de variaia caracteristicii factoriale y x
.
Legturile statistice pot fii clasificate dup mai multe criterii:
a) dup numrul caracteristicilor factoriale: legturi simple x y i multiple: x1, x2, .xn
y;
b) dup felul de exprimare a variabilelor: legturi ntre variabile numerice i legturi nte
variabile exprimate prin cuvinte;
c) dup direcia legturilor:
legturi directe la care creterea, respectiv descreterea caracteristicii factoriale determin
creterea, respectiv descreterea caracteristicii rezultative;
legturi inverse creterea/descreterea caracteristicii factoriale determin descreterea/creterea
caracteristicii rezultative;

d) dup expresia analitic : legturi liniare exprimate printr-o funcie de gradul I i legturi
neliniare exprimate printr-o funcie hiperbolic, .a;
e) dup timpul n care se produce legtura:
legturi concomitente sau sincrone n care variaia caracteristicii rezultative se produce
concomitent cu cea a caracteristicii funcionale;
legturi asincrone sau cu decalaj n care variaia caracteristicii rezultative se produce la un
anumit interval de timp fa de variaia factorului .
84

2. Metode elementare de caracterizarea a legturilor dintre variabile


Exist 4 metode elementare care arat cu un anumit grad de certitudine c ntre unele
variabile exist legturi de tip statistic i anume:
A. metoda seriilor paralele sau interdependente;
B. metoda gruprilor;
C. metoda tabelului de corelaie;
D. metoda grafic.
A. Metoda seriilor paralele
Presupune scrierea n paralel a seriilor care reprezint caracteristica presupus factorial i
caracteristica presupus rezultativ.
n funcie de evoluia valorilor celor 2 serii, se poate deduce cu un anumit grad de certitudine
dac ntre cele 2 variante exist o legtur i ce fel de legtur ar putea exista.
B. Metoda gruprilor
Deja studiat, este o metod calitativ surprinznd esena fenomenelor.
n gruparea statistic se poate vedea caracterul legturilor, direcia lor, deoarece grupele sunt
ordonate automat i se poate estima chiar intensitatea legturii.
C. Tabelul de corelaie
Este un tabel cu dubl intrare, sinonim cu o form special a gruprii combinate n care
separarea pe grupe a unitilor se face dup variaia ambelor caracteristici (factorial i rezultativ).
Valoarea caracteristicilor factoriale se trece n capul coloanelor n ordine descresctoare, iar
valoarea caracteristicilor rezultative se trece n capul liniilor n aceeai ordine.
La intersecia dintre linii i coloane se trec frecvenele absolute de apariie.
n funcie de modul n care se grupeaz aceste frecvene, se poate trage o concluzie
referitoare la direcia legturii i forma ei.
x
ym
ym-1
.
.
.
.
y2
y1

xn xn-1 x2 ,
x1
fmn fm,n-1
0
fm-1,n-1

f22
f11

D1

D2

Astfel dac frecvenele se grupeaz n jurul primei diagonale D1, legtura este invers; iar
dac se grupeaz n jurul diagonalei D2, legtura este direct.
D. Graficul de corelaie (numit i corelogram sau graficul norilor de puncte).
Este un grafic obinuit format dintr-un sistem de axe rectangulare, caracteristica factorial
fiind trecut pe axa absciselor i rezultativ pe axa ordonatelor.
Fiecare coresponden ntre x i y se numete unitate i se reprezint printr-un punct.
85

y
**
**
**
*
x

Dac punctele se distribuie aproximativ n jurul primei diagonale, atunci legtura este
direct, iar dac se distribuie n jurul celei de-a doua, legtura estre invers.
Distribuirea aproximativ uniform n tot cadranul arat fie absena legturii, fie neconsistena
datelor.
Corelograma este cea mai apropiat de adevr dintre toate metodele elementare de
caracterizare a legturilor dintre variabile.
12.3 Test de evaluare
Test de autoevaluare 12.1
Explicai care este opinia dumneavoastr asupra fiecrei tip de legtur prezentat n
unitatea de nvare.
12.4 Rezumat
Unitatea de invatare Nr.11. prezinta existena legturilor dintre variabilele
economice, dar mai ales msurarea intensitii acestor legturi rmn dou dintre
principalele obiective ale statisticii practice. Din acest motiv, nelegerea conceptului
de legtur statistic, prezentat pe larg n debutul acestui capitol, precum i a
diversitii legturilor statistice posibile , sunt eseniale pentru ntregul demers viitor.
Dup o scurt trecere n revist a metodelor elementare, mai mult intuitive, de
caracterizare a legturilor dintre variabile, este prezentat metoda regresiei, pe
exemplul concret al regresiei de tip liniar, dar cu scurte introspecii i n alte tipuri de
regresie. n final, sunt reliefai indicatorii statistici ai corelaiei (raportul i
coeficientul de corelaie), insistndu-se i pe metodele neparametrice i parametrice
de verificare a semnificaiei ecuaiei de regresie, coeficienilor de corelaie i
intensitii legturilor dintre variabile n general.

12.5 Bibliografia Unitatii de invatare Nr.12

86

Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs

TEMA DE CONTROL NR. 3 (TC3)


EXPLICAI NATURA PRINCIPALELOR LEGTURI INTRE VARIABILELE
ECONOMICE I ESENA ACESTORA

Unitatea de invatare nr. 13


METODE COMPLEXE DE ANALIZ A LEGTURILOR. METODA REGRESIEI
Cuprins
13.1. Obiectivele unitii de nvare Nr.13
87
13.2. Metoda regresiei
87
13.3. Teste de evalure 1 a unitii de nvare Nr.13
91
13.4. Rezumat
92
13.5. Bibliografie
92
12.1. Principalele obiective ale unitatii de invatare nr.13
- contientizarea de ctre studeni a faptului c legturile dintre variabilele
economice poate fi abordat nu numai intuitiv sau prin metode simple, ci i prin
metode complexe, statistico-matematice ;
- prezentarea, nelegerea i nsuirea principalelor metode utilizate pentru a
analiza tiinific legturile economice.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

87

13.2 Coninut

Capitolul 13

METODE COMPLEXE DE ANALIZ A LEGTURILOR. METODA REGRESIEI


1. Metoda regresiei
Este o metod statistic de cercetare a legturilor dintre variabile cu ajutorul unor funcii
numite funcii de regresie.
Este de fapt o generalizare a analizei dispersionale.
Fie y variabila dependent i x1, x2,... xi,... xn variabile independente.
Metoda regresiei consider c y este o funcie de variabile independente y=f(x1, x2, .. xi ,..
,xn)
n funcie de forma i gradul funciei, precum i de numrul variabilelor, ecuaia de regresie poate
s defineasc o curb, o suprafa, sau chiar un poliedru.
Modelul de dependen statistic n cazul metodei regresiei nlocuiete modelul teoretic cunoscut:
y=f(x1,x2,xi,xn)+ n care - reprezint o eroare aleatoare sau mai exact o variabil rezidual cu
dispersia constant i cu media nul.
n funcie de numrul factorilor x1, x2,..., xn care influeneaz caracteristica rezultativ,
exist:
- regresie unifactorial sau simpl;
- regresie multifactorial sau multipl.
a) modele de regresie unifactoriale
Metodele unifactoriale descriu legtura dintre dou variabile x i y, ceilali factori
considerndu-se cu aciune constant. Ecuaia teoretic a acestei regresii este:
y=f(x)+.
Modelele de regresie unifactorial sunt:
a1) modelul liniar:

+x

n acest model: y=+x; , - coeficienii unei funcii de gr I, tg=


88

Acest model teoretic se estimeaz printr-o ecuaie medie de tendin: y=a+bx+, apare sub
forma y x a bx .
n acest caz, a i b sunt coeficieni care se calculeaz cu ajutorul metodei anulrii
determinanilor sau cu ajutorul metodei anulrii derivatelor de ordinul I, formulele care rezult n
urma calcului fiind relativ simple. Acest model este specific tipului de legtur dintre 2 caracteristici
care se modific n progresie aritmetic.
Cunoscnd coeficienii a i b ai ecuaiei de regresie se poate determina oricnd valoarea lui y
n funcie de valoarea variabilei independente x: y a b x .
Coeficientul a reprezint ordonata la origine, semnificnd valoarea lui y cnd x =0. Poate lua
att valori pozitive ct i negative.
Coeficientul b se mai numete i coeficient de regresie i arat msura n care se modific
valoarea caracteristicii dependente y n cazul n care caracteristica independent se modific cu o
unitate.
Dup semnul coeficientului de regresie exist 2 tipuri de legtur i anume:
- corelaie direct cnd coeficientul de regresie are valoare pozitiv( b>0);
- corelaie invers cnd coeficientul b are valoare negativ (b<0)..
Dac b=,0, x i y sunt variabile independente. Se mai spune din matematic despre
coeficientul de regresie c indic panta liniei drepte rezultat prin ecuaia de regresie.
Cu ajutorul coeficienilor a i b se calculeaz valoarea ecuaiei de regresie, mulimea acestor
valori numindu-se i mulimea valorilor teoretice ale caracteristicii y n funcie de x, iar operaia
de nlocuire a termenilor reali y cu valorile ecuaiei de regresie se numete ajustare.
Cnd legturile dintre fenomenele i procesele economice i sociale se fac prin intermediul
unui numr mare de date, intervin frecvenele absolute, ceea ce impune, n vederea calculrii
parametrilor economici de regresie, folosirea tabelului de corelaie, tabel din care se scot i se
introduc n sistemul de ecuaii frecvenele dup valorile x ( fx), frecvenele dup valorile y ( fy) i
frecvenele corespunztoare perechilor x i y (fxy).
Acest caz ,considerat general, duce la urmtorul sistem de ecuaii

a f xy b xf x yf y

2
a xf x b x f x yf x f y

n baza acestui model general urmeaz s se calculeze coeficienii a i b.


De notat c pentru determinarea unei ecuaii de regresie care s permit ajustarea pertinent,
se recomand utilizarea a cel puin 15 observri,pentru care s se foloseasc datele n vederea
calculrii parametrilor a i b.
a2) modelul exponenial
Se bazeaz pe ecuaia y x , corespunztoare modelului teoretic Y ab x .
Modelul exponenial se transform ntr-un model cvasiliniar prin operaia de logaritmare :
lg y lg a x lg b

Notnd cu y=lgy, a=lga i b=lgb y=a+bx de unde s-a ajuns la modelul liniar (aceasta fiind
ecuaia unei drepte)
Sistemul de ecuaii normale dup care se calculeaz a i b este acelai din modelul liniar, iar
dup determinarea parametrilor a i b se ajunge la parametrii iniiali a i b prin operaia de
antilogaritmare.
89

Exist o serie de curbe care nu se pot transforma nici cu largi aproximaii ntr-o dreapt , aa
cum s-a procedat n cazul modelului exponenial. Apar astfel parabole i hiperbole care se modeleaz
diferit.
a3) modelul teoretic al parabolei de gradul II.
y=+x+x2

Y=a+bx+cx2

Parametrii a, b, i c se calculeaz folosind tot metoda celor mai mici ptrate, anulnd
2 2
derivatele de ordin 1 i 2, minimiznd n esen funcia: ( y i a bx i cxi ) .

na b xi c xi2 y i

Sistemul obinut este urmtorul:

rezolvnd sistemul.

2
3
a x i b x i c x i x i y i

; a , b i c se scot

2
3
4
2
a xi b xi c xi xi y i

a4) n cazul n care legturile dintre fenomenele economice sunt de forma unei hiperbole
(dac dependena dintre cele dou variabile este invers), ecuaia de regresie se exprim dup
formula:
1
, corespunztor funciei de estimaie teoretic:
x
1
Y a b
x
y

Sistemul de ecuaii normale n cazul hiperbolei este:

1
na

b
yi

xi

a 1 b 1 1 y
i

xi
xi
x2

; a i b se

obin prin rezolvarea sistemului.

a5) modelul logaritmic, dat de expresia y=+log x care se estimeaz dup modelul teoretic
Y=a+blogx+ reinndu-se urmtoarele cazuri:
-

cnd a i b sunt ambele pozitive, curba este cresctoare;


cnd a>0 i b<0, curba este descresctoare.

90

Folosind

metoda

celor

na b log xi y i

mai

mici

ptrate

rezolvnd

sistemul

de

ecuaii

normale:

2
a log xi b (log xi ) y i log xi

vor rezulta coeficienii a i b.


n toate sistemele de ecuaii prezentate, n este numrul observrilor pe care se bazeaz
cercetarea statistic, iar sumele sunt sumele corespunztoare datelor din aceste observri, cu
meniunea c e bine ca acest numr s fie minim 15.
b) regresia multifactorial
Conine modele n care legturile dintre variabile sunt foarte complexe, caracterizndu-se prin
influenarea variabilei rezultative de ctre un numr mare de variabile independente, n acest caz
obinndu-se ecuaii de regresie multipl:
y=f(x1,x2,xi,xn)+ unde x1,...,xn sunt caracteristicile factoriale, iar - variabila rezidual
n cazul regresiilor multiple se utilizeaz deseori modelul liniar, a crui expresie se d cu relaia:
y a 0 a1 x1 a 2 x 2 ... a p x p n acest model a0 este coeficientul care exprim influena factorilor

neinclui n model iar ai, i=1,n se numesc coeficieni de regresie multipl i arat influena
caracteristicii factoriale asupra caracteristicii rezultative.
i n acest caz parametrii a0, a1, ap, se calculeaz pe baza metodei celor mai mici ptrate.
Sistemul la care se ajunge dup minimizarea funciei va fii un sistem cu p+1 ecuaii i p+1
necunoscute de forma:

a 0 n a1 x1 a 2 x 2 ... a p x p y

2
a 0 x1 a1 x1 a 2 x1 x 2 ... a p x1 x p x1 y

2
a 0 x 2 a1 x1 x 2 a 2 x 2 ....

2
a
x

a
x
x

a
x
x

...

a
x

0
p
1
1
p
2
2
p
p
p xp y

Legtura multifactorial liniar se poate reprezenta grafic sub forma unui plan. Fiecare din aceste
ecuaii d o dreapt. Intersecia acestor drepte va furniza o suprafa, soluia fiind pe marginea
acestuia.
Se
x1

utilizeaz
x2

practic

un

model

xp

multifactorial

exponenial

de

forma:

y a 0 a1 a 2 ...a p , care, prin logaritmare se transform ntr-un model liniar care se rezolv
conform procedeului anterior.
91

13.5 Test de autoevaluare 1


Test de autoevaluare 13.1
Din bugetul de familie se cunosc urmtoarele date pentru 15 familii:
Nr.
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
TOT.

Venitri lunare ce
revin n medie pe
persoan(x)
mii lei 72
99
85
118
192
109
134
125
115
161
175
182
190
136
148
2041

Cheltuieli
lunare pe
persoan (y)
- mii lei 32
38
40
55
62
41
54
59
60
63
65
70
71
55
56
822

Xi2

Xiyi

297855

117504

S se caracterizeze i s se msoare legtura dintre venituri i cheltuieli


folosind metoda regresiei;

13.4 Rezumat
Unitatea de nvare nr.12 prezint metoda regresiei liniare i succint regresia
multiliniar. In cadrul regresiei liniare sunt prezentate metoda i metodologia de
calcul a coeficienilor de regresie.
13.5 Bibliografia Unitatii de invatare Nr.13

92

Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs

Unitatea de invatare nr. 14


MSURAREA
INTENSITILOR
LEGTURILOR
ECONOMICE
Cuprins
14.1. Obiectivele unitii de nvare Nr.14
14.2. Indicatorii statistici ai corelaiei
93

DINTRE

VARIABILELE
93
93

14.3. Teste de evalure 1 a unitii de nvare Nr.14


14.4. Rezumat
14.5. Bibliografie

100
101
102

14.1. Principalele obiective ale unitatii de invatare nr.14


- nelegerea de ctre studeni a necesitii msurrii intensitii legturilor dintre
factorii economici;
- prezentarea i nsuirea modelelor de calcul a raportului i coeficientului de
corelaie;
- prezentarea i nsuirea modalitilor de estimare a semnificaiei indicatorilor
calculai.

Durata medie de parcurgere a primei unitati de invatare este de 2 ore

14.2 Coninut
Capitolul 14
MSURAREA INTENSITILOR LEGTURILOR DIINTRE
VARIABILELE ECONOMICE

1. Indicatori statistici ai corelaiei


Pentru calculul indicatorilor statistici ai corelaiei se folosesc metodele
parametrice, pentru a msura intensitatea legturilor de tip statistic dintre 2 sau mai
multe variabile care urmeaz o lege de repartiie de tip normal sau asimptotic normal.
Cea mai utilizat metod este metoda corelaiei. Pentru explicarea acestei metode se
pornete de la legtura dintre dou variabile corelate (x i y) , reprezentate n graficul
de corelaie n jurul mediilor lor x si y .
Se obine astfel diagrama de corelaie alctuit din
Y
4 sectoare (cadrane), n fiecare din aceste cadrane,
IV
I
abaterile valorilor individuale fa de media lor
(-,+)
(+,+)
avnd semnificaii
Diagrama de corelaie este
dxi xi x si dyi yi y
III
II
alctuit din 4 sectoare
diferite dup cum urmeaz:
(-,-)
(+,-)
-n cadranul I, dxi i dyi sunt pozitive;
-n cadranul II dxi pozitiv, dyi negativ;
x
-n cadranul III; (-,-):
-n cadranul IV (-,+).
Msurarea intensitii legturii se face cu
ajutorul urmtorilor indicatori: covariana,

94

coeficientul de corelaie, raportul de corelaie.


a) covariana se noteaz: cov sau cov(x,y),; se obine ca o medie aritmetic a
produselor
abaterilor
variabilelor
fa
de
media
lor:
1 n
cov( x, y ) ( x i x)( y i y )
n i 1
Semnul indicatorului arat direcia legturii, respectiv + pentru legtura
direct i pentru cea invers. Covariana poate fii nul, caz n care cele dou
variabile sunt independente.
n cazul unei legturi funcionale liniare valoarea absolut maxim a
covarianei variabilelor x i y este: n general ns valoarea absolut a covarianei nu
are limit superioar.
b) coeficienii de corelaie liniar simpl
Se noteaz cu rxy sau r i msoar intensitatea de tip liniar dintre dou
variabile x i y, calculndu-se ca o medie aritmetic a produsului abaterilor normale
normate a celor dou variabile.
Abaterile normale normate ale variabilelor x i y notate cu zx i zy sunt date de
relaiile:
zx

xi x
;
x

zy

yi y
y

n consecin modelul de calcul al coeficienilor de corelaie este urmtorul:


n

rxy

(x
i 1

x)( y i y )

nxy

unde xy sunt abaterile medii ptratice ale variabilelor x i y.


cov( x, y )

Fa de covarian, relaia dintre coeficient i aceasta este: rxy


x
y
Altfel spus, covariana abaterilor normate, zx i zy se transform n coeficientul
de corelaie liniar simpl. n vederea calculrii facile a coeficientului de corelaie, n
practic
se
utilizeaz
urmtoarea
relaie:
n

rxy

i 1

i 1

n xi y i xi y i
i 1

2
n 2 n
n x x i n y i y i
i 1 i 1
i 1
i 1
Cnd intervin seriile de distribuie cu frecvene absolute aceast relaie
devine:
n

2
i

rxy

n f xy xi y i
x

f xi

y
y


n x f xi xi f xi n y i2 f yi
x
x
y

2
i

95

f yi

y
y

f yi

Coeficientul de corelaie liniar simpl se mai poate calcula i cu relaia: rxy b

x
y

unde: b este coeficient de regresie liniar simpl.


Coeficientul de corelaie liniar simpl satisface inegalitile: -1 r xy 1 cu
urmtoarea tipologie valoric:
- dac rxy se apropie de 1, ntre variabile exist o corelaie liniar, simpl, invers
i puternic;
- dac rxy se apropie de 1, variabilele sunt direct i puternic corelate;
- dac valoarea coeficientului este 1, n valoare absolut, ntre variabile exist o
dependen funcional.
n practic, pe o scal de la [0,1], lund coeficientul n valoarea absolut, de
utilizeaz urmtoarele subintervale:
0 rxy 0,2 situaie n care nu exist o legtur ntre variabile;
o,2 < rxy < 0,5 ntre variabile exist o legtur slab;
0,5 < rxy < 0,75 legtura dintre variabile e de intensitate medie;
0,75 < rxy < 0,95 legtur puternic ntre cele dou variabile;
0,95 < rxy < 1 legtura dintre variabile este determinist, funcional.
NOT: n literatura de specialitate poate fii notat i ryx rxy= ryx
Indiferent de notaie, x se consider caracteristica factorial, iar y caracteristica
rezultativ.
c) raportul de corelaie notat cu (eta), mai e numit i coeficient de
corelaie Pearson. Acest coeficient msoar intensitatea legturilor liniare i
curbilinii dintre dou variabile statistice.
n literatura de specialitate se noteaz cu R.
1

(y Y )
( y y)
i

xi

sau 1

(Y
(y

xi

y) 2

y) 2

Calculul acestui indicator se bazeaz pe descompunerea dispersiei totale a


2
variabilei dependente notate cu y , n dispersia valorilor empirice fa de valorile
2
2
teoretice notat cu y / Y i dispersia valorilor teoretice fa de medie y / Y

2
y

2
y /Y

2
y /Y

( y y)

(y Y)

(Y y)

din aceast relaie rezult valoarea calculat a coeficienilor, care se poate nota
astfel:

2y / Y
2y

sau 1

Y2 / y
2y

acest

caz

dispersiile

au

urmtoarele

semnificaii:
2
- y - este dispersia total i msoar aciunea factorilor, luai n totalitatea lor,
care au influenat variabila rezultativ.
2
- y / Y - msoar variaia valorilor y sub influena celorlali factori, a cror
aciune este considerat constant. Se mai numete i dispersie rezidual.
2

Y2 / y msoar numai influena variabilei independente (factoriale, x)


y /Y
asupra variabilei rezultative y.
Raportul de corelaie poate lua valori ntre 0 i 1. Cu ct valoarea acestui
96

raport este mai apropiat de 1 corelaia este mai puternic, iar cu ct raportul este mai
aproape de 0, corelaia este mai slab (se pierde).
d) raportul de corelaie multipl.
Msoar intensitatea legturii dintre o caracteristic rezultativ y i 2 sau mai
multe caracteristici factoriale notate cu x1, x2, .... xi ,....i = 1,p.
Se noteaz cu

R x1, x 2, xp

( y1 Y
1
y y)

x1, x 2 ,.. xp
2

)2

, unde Yx1, x 2... xp este

valoarea ajustat a caracteristicii teoretice dup funcia de ajustare gsit anterior.


Dac se folosete ecuaia de regresie multipl i variaia factorial, se obine
urmtoarea relaie:
( y i ) 2
( a0 y i a1 y i xi ........ a p y i x p )
n
R
; acest raport de corelaie
2
(
y
)

i
2
yi n
multipl are totdeauna valori pozitive i este mai mare dect oricare coeficient de
corelaie simpl: R ry , xi , i 1, p
Ptratul coeficientului de corelaie multipl este cunoscut sub numele de
coeficient de determinaie multipl; se noteaz cu R2 i exprim ponderea cu
care influeneaz caracteristica factorial asupra caracteristicii rezultative.
Ponderea pe care o au ceilali factori asupra caracteristicii rezultative se
obine ca diferen ntre unitate (1) i R2, obinndu-se n felul acesta coeficientul de
nedeterminaie multipl , notat cu N2=1-R2
Pe lng coeficienii de corelaie simpl i multipl, care caracterizeaz
intensitatea corelaiei liniare ntre 2 sau mai multe caracteristici se pot calcula i
coeficienii de corelaie parial. Aceti coeficieni caracterizeaz intensitatea
legturilor dintre 2 caracteristici n condiiile n care variabila rezultativ este
influenat de mai muli factori, dar influena celorlali factori este considerat
constant.
Coeficienii de corelaie parial se calculeaz pe baza coeficienilor de
corelaie liniar simpl. Astfel coeficienii de corelaie parial dintre caracteristicile y
i x1, y = f(x1,x2) n condiiile eliminrii influenei lui x2 se noteaz cu:
ry , x1x 2

ryx1 ryx 2 rx1x 2

(1 ryx2 2 )(1 rx21 y 2 )

. Reciproc, coeficienii de corelaie ntre y i x2 n

condiiile eliminrii influenei lui x1 se calculeaz: ry , x 2 x1

ryx 2 ryx1rx 2 x1
(1 ryx2 1 )(1 rx22 y1 )

2. Verificarea semnificaiei ecuaiei de regresie i a coeficienilor de


corelaie.
n calculul i analiza statistic e necesar s se verifice dac ecuaia de regresie
i coeficientul de corelaie obinui sunt real semnificativi sau, dimpotriv, valorillor
se datoreaz erorilor ntmpltoare de selecie.
Pentru a verifica ipoteza conform creia parametrul a din cadrul ecuaiei de
97

regresie liniar, difer semnificativ de 0, se utilizeaz criteriul t

(y Y)

a
s

n n care

i semnific abaterea medie ptratic a valorilor nregistrate ale

n2

caracteristicii y fa de lina de regresie Y, n fiind numrul perechilor x,y nregistrate.


Valoarea t astfel calculat se compar cu valoarea tabelar t qf (corespunztoare
nivelului de semnificaie q i numrului f de grade de liberate (f = (n-2)).
Dac valoarea calculat este < dect valoarea tabelar, se consider ipoteza
a=0 just, n caz contrar t.calc. > t tabelat, se consider c difer semnificativ de 0
deci ecuaia de regresie e bine aleas.
Intervalul de ncredere pentru parametrul teoretic a se definete cu relaia:
s

a t qf

a t qf

intervalul [a t qf

n
s

; cu alte cuvinte parametrul teoretic trebuie s se cuprind n


s

; a t qf

] , n caz contrar ecuaia de regresie fiind

invalidat.
Acelai criteriu t se aplic i pentru verificarea ipotezei c b coeficient de
t calc

regresie liniar simpl difer semnificativ de 0:

b
( x i x) 2 .

Intervalul de ncredere pentru coeficientul de regresie teoretic este

b t qf

( xi x)

; b t qf

( xi x)

n funcie de valorile caracteristicii y se calculeaz limitele de ncredere pentru


linia de regresie teoretic Y astfel:

1
Y y t qf s

( xi x ) 2

( xi x)

; y t qf s

( xi x) 2

( xi x)

Verificarea semnificaiei coeficientului de regresie se poate face i cu


ajutorul analizei dispersionale. n acest scop suma ptratelor abaterilor valorilor
caracteristicii y fa de medie se noteaz ( yi y ) care se descompune n sume
de ptrate de abateri. ( yi y ) (Y y ) ( y Y ) 2 .
Cu ajutorul acestor sume de ptrate se calculeaz urmtoarele dispersii corectate:
S
2
y

( y y)

n 1

- dispersie care are n-1 grade de libertate;

(Y y ) ,cu f grade de libertate;


f
2

Y2 / y S 1
2

2y / Y S 2

(y Y)

n f 1

cu n-f-1 grade de libertate.


98

n aceste relaii n, este numrul valorilor observate ale caracteristicii y iar f este
numrul coeficienilor ecuaiei de regresie liniar.
Pentru verificarea semnificaiei coeficienilor corelaiei simple i pariale se
folosete tot testul t:
t calc

r
1 r2

n 2 n care n reprezint volumul eantionului.

Valoarea calculat cu aceast relaie se compar cu valoarea tabelar


corespunztoare nivelului de semnificaie q i numrului de grade de liberate f1=p
i f2=n-p-1
t tabelat = tqf1,f2
Dac t calculat > ca t tabelat, se consider c variabilele xi; i= 1,p au o influen
semnificativ asupra caracteristicii rezultative y, iar n caz contrar influena lor e
nul.
(q= nivelul de semnificaie = 1 p).

1.
2.
3.

200
215
230

Y1=16,58+0,58 . 200
Y2=16,58+0,58 . 215
Y3=16,58+0,58 . 230

Raportul de corelaie se utilizeaz indiferent de forma dependenei dintre cele


2 variabile n timp ce coeficientul de corelaie se calculeaz doar pentru corelaia
liniar simpl.

( yi Y )
1
( yi y)

Rxy

Yx 16,585 0,28.xi;

0,89
y 54,8

Fiind vorba de o corelaie liniar, se poate calcula coeficientul de corelaie


liniar simpl reprezentnd media aritmetic simpl a abaterilor normale normate ale,
variabilelor de la media lor.
rxy

( xi x)( yi y ) Pentru
nx y

evita

calcularea

unor

indicatori

intermediari, abateri medii ptratice i cele dou medii ale variabilelor, n practic se
utilizeaz:
rxy

n xiyi xi yi
2

n x xi n y i2

2
i

yi

n = 15

O alt modalitate de calcul a coeficientului de corelaie dac sunt cunoscute


x
abaterile medii ptratice i coeficientul de corelaie liniar simpl. rxy b
y
99

rxy = 0,89
n cazul corelaiei liniar simpl, raportul de corelaie este egal cu coeficientul
de corelaie, fiind cuprins ntre 0,75 i 0,95. Coeficientul de corelaie arat o legtur
puternic de tip liniar i direct ntre venituri i cheltuieli. De altfel reprezentativitatea
acestui coeficient poate fii demonstrat aplicnd testul t bazat pe funcia de
distribuie Student.
Aceast funcie este tabelat pentru un anumit nivel de semnificaie i un
numr egal cu n-2 grade de libertate. n funcie de i n-2 se gsete argumentul t al
funciei Student din tabel. Aceast valoare se compar cu un t calculat

rxy
1 rxy2

n2

.
Dac t calculat este mai mare dect t tabelat, valoarea coeficientului de
corelaie este reprezentativ pentru analiza legturii dintre cele 2 variante.
t calculat = 7,037
t tabelat = 0,05 ( 13 grade de libertate).
Rezult c valoarea coeficientului de corelaie este reprezentativ.

14.3 Test de autoevaluare 1


Test de autoevaluare 14.1
Din bugetul de familie se cunosc urmtoarele date pentru 15 familii:
Venitri lunare ce
Cheltuieli
Xi2
xiyi
revin n medie pe
lunare pe
persoan(x)
persoan (y)
mii lei - mii lei 1
72
32
2
99
38
3
85
40
4
118
55
5
192
62
6
109
41
7
134
54
8
125
59
9
115
60
10
161
63
11
175
65
12
182
70
13
190
71
14
136
55
15
148
56
TOT.
2041
822
297855 117504
Nr.
crt.

100

S se caracterizeze i s se msoare legtura dintre venituri i cheltuieli


folosind metoda coeficientului de corelaie.
Graficul de corelaie
- se utilizeaz pentru a estima existena i forma legturii dintre o variabil
factorial cauzal x i o variabil dependent sau rezultativ y.
- cheltuielile depind de venituri;
80
70
60
50
40
30
20
10
0
0

50

100

150

200

250

Se poate observa amplasarea punctelor n form de elips. Apare ipoteza dependenei


liniare.
Yxi = a + bxi, b coef. de regresie liniar simpl. Pentru a descoperi legea dup care
x l determin pe y trebuie determinai a i b. Aceti coeficieni se determin prin
metoda celor mai mici ptrate i vor fi soluiile sistemului de 2 ecuaii cu 2
necunoscute: vom calcula xi2i yixi:

na b xi yi

15a 2041b 822

2
a xi b xi xi yi 2041a 297855b 117504
a = 16,58, b = 0,28
folosim metoda lui Cramer: Y = 16,58 + 0,28bxi
Ex. S se estimeze cheltuielile totale efectuate de 3 familii care au urmtoarele
venituri:
Nr.
crt.

Venituri

14.4 Rezumat
Unitatea de invatare Nr.13. prezint principalele posibilitati de calcul a intensitii
legturilor dintre raportul i coeficientul de corelaie precum i modalitatea de
estimare a semnificaiei logico-economice a indicatorilor calculai din prisma
probabilistic.

14.5 Bibliografia Unitatii de invatare Nr.14


101

Agresti, Allan (1990) Categorical Data Analzsis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs

102

S-ar putea să vă placă și