Documente Academic
Documente Profesional
Documente Cultură
I MK Statistica Spataru 2012-2013
I MK Statistica Spataru 2012-2013
STATISTIC
2014
CUPRINS
Unitate
de
nvare
1.
1.1
1.2
1.3
1.4
1.5
2.
2.1
2.2
2.3
2.4
2.5
3.
3.1.
3.2.
3.3.
3.4.
3.5.
4.
4.1.
4.2.
4.3.
4.4.
4.5.
5.
5.1.
5.2.
5.3.
5.4.
5.5.
Titlul
Pagina
INTRODUCERE N STATISTIC
Obiectivele unitii de nvare Nr.1
Apariia i dezvoltarea. Obiect. Metod.
Teste de evalure 1 a unitii de nvare Nr.1
Rezumat
Bibliografia unitii de nvare
7
7
7
10
10
10
11
11
11
13
13
13
15
15
15
22
22
23
24
25
25
29
30
30
30
31
31
31
36
36
36
6.
6.1.
6.2.
6.3.
6.4.
6.5.
7.
7.1.
7.2.
7.3.
7.4.
7.5.
8.
8.1.
8.2.
8.3.
8.4.
8.5.
9.
9.1.
9.2.
9.3.
9.4.
9.5.
10.
10.1.
10.2.
10.3.
10.4.
10.5.
11.
11.1.
11.2.
11.3.
11.4.
11.5.
12.
12.1.
12.2.
INDICATORI STATISTICI
Obiectivele unitii de nvare Nr.6
Mrimile relative
Teste de evalure 1 a unitii de nvare Nr.6
Rezumat
Bibliografia unitii de nvare
MRIMILE MEDII. MEDIA CA INDICATOR STATISTIC
ESENIAL
Obiectivele unitii de nvare Nr.7
Mrimile medii
Teste de evalure 1 a unitii de nvare Nr.7
Rezumat
Bibliografia unitii de nvare
SERII DE REPARTIIE DE FRECVENE
Obiectivele unitii de nvare Nr.8
Indicatori ai tendinei centrale
Teste de evalure 1 a unitii de nvare Nr.8
Rezumat
Bibliografia unitii de nvare
VARIAIA N COLECTIVITILE MPRITE PE GRUPE I
MSURAREA EI
Obiectivele unitii de nvare Nr.9
Indicatori ai variaiei
Teste de evalure 1 a unitii de nvare Nr.9
Rezumat
Bibliografia unitii de nvare
METODE DE EANTIONARE PENTRU EFECTUAREA
SONDAJELOR STATISTICE
Obiectivele unitii de nvare Nr.10
Generaliti. Noiuni. Modaliti de alctuire a eantioanelor
Teste de evalure 1 a unitii de nvare Nr.10
Rezumat
Bibliografia unitii de nvare
ESTIMAREA MEDIEI I DISPERSIEI I MSURAREA
PRECIZIEI LOR N SONDAJUL STATISTIC
Obiectivele unitii de nvare Nr.11
Sondajul. Probabiliti i intervalle de ncredere
Teste de evalure 1 a unitii de nvare Nr.11
Rezumat
Bibliografia unitii de nvare
TEMA DE CONTROL NR.2 (TC 2)
EANTIONAREA
SIMPL
ALEATOARE
NEREPETAT.ESTIMAREA MEDIEI I DISPERSIEI N BAZA
ACESTORA
LEGTURILE DINTRE VARIABILELE ECONOMICE
Obiectivele unitii de nvare Nr.12
Concept. Tipuri de legturi. Metode de caracterizare a legturilor
4
37
37
37
41
41
41
43
43
43
45
47
48
49
49
49
52
54
55
57
57
57
62
66
66
67
67
67
71
71
72
73
73
73
79
81
82
82
83
83
83
86
86
86
86
87
87
87
91
92
92
93
93
93
100
101
102
Obiectivele cursului
Dupa finalizarea cursului, cursantii vor fi capabili sa:
utilizaze corect limbajul impus de disciplina Statistic;
delimiteze corect obiectul de studiu, domeniul de cercetare, obiectivele si
metodologia implicata de disciplina Statistic;
aplice tipurile de analiza specifice pe diverse situatii ;
valorifice informatiile transmise prin acest material pentru dezvoltarea
competentelor proprii
Competene conferite
Competente cognitive :
- cunoaterea metodelor statistice ;
Competente practic-aplicative :
- rezolvarea unor aplicaii aferente cursului ;
Competente de comunicare si relationare :
- nsuirea limbajului specific.
Cerinte preliminare
Este necesara actualizarea tuturor cunostintelor la disciplina Statistic acumulate
pe parcursul studiilor anterioare.
Structura cursului
Cursul este structurat pe 14 unitati de invatare, pentru fiecare fiind indicat timpul
alocat studiului individual.
Sunt propuse 2-3 Teme de control, plasate dupa anumite unitati de invatare, a
caror rezolvare se realizeaza strict conform indicatiilor profesorului (ca manual
scris/ca manual tehnoredactat) date de catre studenti tutorelui sau incarcat de catre
studenti pe platforma e-learning, pana la o data prestabilita, predandu-se conform
termenelor propuse in cadrul unitatilor respective (calendarului disciplinei).
Rezultatele obtinute la temele de control vor fi transmise la maxim doua
saptamani dupa predarea fiecaru material. Rezolvarea acestor teme este
obligatorie (nepredarea atragand nefinalizrea notei ce reprezinta 30% din nota
finala la aceasta disciplina).
Evaluarea
6
INTRODUCERE N STATISTIC
Cuprins
1.1
Obiectivele unitatii de invatare Nr.1
7
1.2
Apariia i dezvoltarea. Obiect. Metod.
7
1.3
Teste de evalure 1 a unitatii de invatare Nr.1
10
1.4
Rezumat
10
1.5
Bibliografie
10
1
1.1. Principalele obiective ale Unitii de nvare nr. 1
- prezentarea istoriei tiinei statisticii, ca una dintre cele mai vechi i
importante tiine;
- prezentarea i nsuirea de ctre studeni a definirii statisticii ca tiin;
- prezentarea, nelegerea i definirea metodologiei statistice.
1.2 Coninut
Capitolul 1
INTRODUCERE N STATISTIC
tiine ,cercettorii neputnd aprecia dect la scara unor aproximri grosolane care ar
putea fi epoca istoric creia omenirea i datoreaz apariia statisticii ca tiin
distinct.
n cadrul evoluiei ei ,statistica i-a cristalizat treptat un rol aparte ,studiind
fenomenele ntr-o viziune sistematic la nivelul micro, mezzo i macrosistemic.
Rdcinile istorice ale statisticii moderne sunt urmtoarele:
a) statistica practic;
b) statistica descriptiv;
Statistica modern.
c) aritmetica politic;
d) calculul probabilitilor.
Rdcinile istorice ale
Aritmetica politic i calculul probabilitilor alctuiesc baza conceptual
a
statisticii moderne.
Baza
conceptual
statisticii aducnd contribuii decisive n analiza i modul de interpretare statistic a a statisticii.
fenomenelor naturale i socio-economice.
a) Statistica practic: se pierd practic n timp primele izvoare ale statisticii,
existnd diverse forme de statistic cu o vechime de peste 4 milenii. Scopurile
statisticii practice erau n primul rnd fiscale
dar i cele demografice i
administrative. Astfel ,n Egiptul antic se practica inventarierea aurului i a
pmntului din doi n doi ani inventariere prezent n principal ntre anii 2650-2190
pe cursul Nilului inferior.
n China antic n mileniul 4 i 3 . Hr. se fcea recensmntul populaiei.
Acelai recensmnt al populaiei s-a practicat i la romani n timpul Republicii ,n
jurul anului 550 .e.n. Practic recensmntul populaiei i al diferitelor forme ale
avuiei constituiau primele forme de statistic organizat.
b) Statistica descriptiv este cea mai veche rdcin teoretic a statisticii. Ea
a aprut n universiti i s-a ocupat n principal de descrierea situaiei geografice,
demografice, economice i politice ale unui stat.
Reprezentanii de seam ai colii statisticii descriptive sunt: Francisco
Sansovino (1521-1586), Giovanni Bottero (1540-1617), Herman Conring (16061681), acesta scriind primul curs de statistic, Gottfried Achenwall (1719-1772),
considerat printele statisticii, deoarece a dat numele acestei tiine pornind de la
cuvntul status" (care n latina nseamn "stare".)
Statistica descriptiv a determinat apariia statisticilor naionale n cadrul
oficializat. Prima ar n care apare statistica naional este Suedia (1796); urmeaz
Norvegia (1797) , apoi Frana (1800).
c) Aritmetica politic i are ca principal reprezentant pe matematicianul i
statisticianul William Petty (1623-1687) , care n 1690 public o carte intitulat
chiar Aritmetica politic. Dei coexistente n timp, aritmetica politic difer total
de statistica descriptiv ,tinznd spre exactitate i cunoatere social, obiectivul ei
principal constituindu-l cunoaterea regularitilor n evoluia fenomenelor i
proceselor naturale i socio-economice.
ntemeietorul colii aritmeticii politice este considerat John Ground (16201674) ,care a cutat regulariti n mortalitatea i natalitatea din Londra ,n jurul
anului 1600.
ntre 1796-1874 n Frana triete Louis Quetelet, considerat de muli cercettori
fondatorul statisticii moderne pentru c e primul care materializeaz utilizarea
metodelor cantitativ numerice i analiza statistic. Caracteristic pentru statistica
din mijlocul secolului al 18-lea i nceputul secolului al 19-lea este folosirea
metodei matematice i a calcului probabilitilor n aa numita statistic
Statistica inductiv.
statistica economic;
statistica teoretic;
statistica matematic;
statistica indicilor sociali;
statistica serviciilor;
statistica mediului nconjurtor;
statistici teritoriale.
1.4. Rezumat
Unitatea de invatare Nr.1. prezinta principalele momente ale istoriei ndelungate a
acestei importante tiine, fiind prezentate succint rdcinile istorice ale statisticii
moderne. Partea a doua a cursului, esenial pentru tot ce va urma , definete obiectul
i metoda de studiu ale Statisticii. n partea a treia sunt descrise conceptele de baz
utilizate n Statistic : colectivitatea, unitatea statistic, variabila, indicatorul statistic.
1.5. Bibliografia Unitatii de invatare Nr.1
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.
11
2.2. Coninut
Capitolul 2
DEFINIREA PRINCIPALELOR CONCEPTE FOLOSITE N STATISTIC.
LIMBAJUL STATISTIC.
1. CONCEPTE DE BAZ FOLOSITE N
STATISTIC
- colectivitate parial.
Colectivitatea total reprezint situaia n care toate apariiile fenomenelor
i proceselor cu aceeai caracteristic studiat sunt supuse cercetrii .
Colectivitatea parial reprezint situaia n care doar o parte din
manifestrile individuale vor intra sub incidena cercetrii statistice.
Ambele colectiviti pot fi statice sau dinamice ,n funcie de variabilitatea
lor n timp.
2. Prin unitate statistic se nelege entitatea component a unei
colectiviti, purttoare a unei nsuiri care o face interesant studiului statistic.
Unitatea statistic poate fi:
- simpl (unitatea student in colectivitatea grup);
-complex (unitatea grup n universitate).
3. Variabila statistic, numit i caracteristic statistic, reprezint atributul
sau nsuirea pe care o are unitatea statistic i care este supus cercetrii statistice,
fiind de mai multe tipuri:
- variabile de timp (an, lun, zi, etc.);
- variabile de spaiu (unitile administrativ-teritoriale);
- variabile atributive.
Variabilele atributive sunt de 2 tipuri
- alternative;
- nealternative.
Variabilele alternative sunt cele care au doar dou posibiliti
de
reprezentare (da-nu, 0-1, alb-negru), ele grupndu-se la rndul lor n variabile :
- numerice;
- nenumerice (alfanumerice).
Variabilele nealternative acoper ntreaga gam de trsturi i caracteristici
calitative ale fenomenelor care pot fi studiate cantitativ.
i ele la rndul lor se clasific n variabile numerice i nenumerice.
Variabilele nealternative numerice sunt de dou tipuri :
- continue;
- discontinue (discrete).
4. Indicatorii statistici reprezint msura numeric a variabilelor statistice.
Indicatorii statistici sunt de dou tipuri :
- indicatori primari;
- indicatori derivai.
Indicatorii primari sunt extrai direct din realitatea sub toate formele ei de
organizare.
Indicatorii derivai sunt obinui prin transformarea logico- matematic a
indicatorilor primari , ei gsindu-se sub urmtoarele forme:
- indicatori absolui;
- indicatori relativi;
- mediile statistice;
- indicii statistici;
- ecuaiile de estimare.
13
14
OBSERVAREA STATISTIC
Cuprins
3.1
Obiectivele unitatii de invatare Nr.3
3.2
Concepte de baz utilizate n statistic
3.3
Teste de evalure 1 a unitatii de invatare Nr.3
3.4
Rezumat
3.5
Bibliografia unitatii de invatare
15
15
22
22
23
3.2 Coninut
Capitolul 3
OBSERVAREA STATISTIC
Sistemul informaional static.
Eroarea absolut.
Eroarea relativ.
Valoarea:
e = x / x0
se numete eroare relativ.
Eroarea relativ poate fi exprimat i n procente.
n statistic se opereaz cu noiunea de eroare absolut limit; modulul erorii
absolute trebuie s nu depeasc eroarea absolut limit:
IeI <=
6. Generaliti privind prelucrarea datelor
statistice
Prelucrarea statistic este etapa cercetrii n care se trece de la datele
individuale, obinute n etapa observrii la indicatorii care caracterizeaz
colectivitatea n ntregul ei sub form de indicatori totalizatori, absolui sau
indicatori derivai.
De regul aceti indicatori sunt calculai ca valori sintetice obinute prin
aplicarea unor abstractizri i comparri succesive prin care se elimin ceea ce
este ntmpltor i neesenial n apariia i dezvoltarea fenomenelor studiate.
Prin prelucrare se obine sistemul de indicatori statistici ca parte integrant a
sistemului informaional naional necesar pentru fundamentarea deciziilor la toate
nivelurile de conducere. Coninutul prelucrrii unei observaii se rezum la
urmtoarele elemente:
a) centralizarea materialului observrii
b) gruparea unitilor colectivitii dup anumite criterii i reguli
c) obinerea sistemului de indicatori care caracterizeaz fiecare grup i
ntreaga colectivitate.
d) prezentarea rezultatelor prelucrrii sub form de serii, tabele i
grafice.
21
e)
7. Planul prelucrrii statistice
Planul sau programul prelucrrii ntregului material al unei observri
statistice cuprinde urmtoarele: programul propriu-zis al prelucrrii; metodele i
procedeele de calcul statistic care vor fi aplicate pentru calculul sistemului de
indicatori; formele de prezentare ale rezultatelor prelucrrii; aspectele organizatorice
ale acesteia.
a) programul prelucrrii: const n enumerarea caracteristicilor primare i
derivate care se folosesc pentru calcularea indicilor totalizatori i derivai.
b) metodele i procedeele de calcul: se aleg pentru fiecare prelucrare n
parte n funcie de scopul cercetrii, de natura specific a fenomenelor i
de specificul i de volumul informaiilor disponibile. Scopul principal al
aplicrii metodelor de prelucrare statistic l constituie redarea
ntr-o imagine ct mai sintetic i ct mai obiectiv a fenomenelor
studiate corespunznd ntr-un sens mai larg noiunii de modelare statistic.
c) formele de prezentare ale rezultatelor statistice sunt: seriile, tabelele
statistice i graficele.
Seriile statistice-sunt liste paralele, n prima list fiind nregistrat valoarea
caracteristicii, iar n celelalte ori alte valori caracteristice derivate ori numrul de
operaii corespunztoare fiecrei valori n parte, numit generic frecven.
Tabelele statistice-cuprind mai multe caracteristici ale aceleiai
uniti,
- Serii statistice
fiecrei
- Tabele statistice
caracteristici putndu-I fi ataat eventual i o informaie referitoare la
numrul
de
- Grafice
statistice
operaii.
Graficele statistice-sunt de diverse tipuri, cele mai frecvente fcnd legtura
ntre
valorile caracteristicii i frecvena de apariie.
e)
8. Tehnici de prelucrare
22
Procedeul fielor i al tabelrii.
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs.
24
25
25
4.2
3.3
3.4.
3.5.
25
29
30
30
4.2 Coninut
Capitolul 4
PRELUCRAREA DATELOR STATISTICE
Prelucrarea statistic este etapa cercetrii n care se trece de la datele individuale,
obinute n etapa observrii la indicatorii care caracterizeaz colectivitatea n ntregul ei
sub form de indicatori totalizatori, absolui sau indicatori derivai.
De regul aceti indicatori sunt calculai ca valori sintetice obinute prin aplicarea
unor abstractizri i comparri succesive prin care se elimin ceea ce este ntmpltor i
neesenial n apariia i dezvoltarea fenomenelor studiate.
Prin prelucrare se obine sistemul de indicatori statistici ca parte integrant a
sistemului informaional naional necesar pentru fundamentarea deciziilor la toate
nivelurile de conducere. Coninutul prelucrrii unei observaii se rezum la urmtoarele
elemente:
2. Tehnici de prelucrare
28
4.4. Rezumat
30
Unitatea de nvare Nr. 4 prezint etapa prelucrrii statistice, ca etap necesar, dar
nu i suficient pentru ca demersul statistic s fie reuit. Sunt aduse n context
principalele metode de prelucrare a datelor .
31
5.1. Obiective
-
5.2 Coninut
Capitolul 5
CLASIFICAREA I GRUPAREA STATISTIC - PRINCIPALELE TEHNICI
DE ORGANIZARE DATELOR N VEDEREA PRELUCRARII
1. GENERALITI
Clasificarea i gruparea sunt instrumente de baz al prelucrrii i analizei datelor
privind economia i societatea. Prin intermediul lor se asigur sistematizarea pe
grupe sau clase omogene din punct de vedere statistic a colectivitilor statistice ,
orict ar fi ele de numeroase.
Prin omogenitate se nelege asemnarea ct mai mare, respectiv variaia ct
mai mic a elementelor n cadrul grupelor sau claselor.
Prin definiie, gruparea i clasificarea statistic reprezint procedee de
sistematizare a colectivitilor statistice n pri statistice omogene , n funcie de
32
3. MODALITI PRACTICE
DE OBINERE A GRUPRII STATISTICE
Intervin n prelucrarea datelor de mas culese ntr-o observare special organizat.
n asemenea cazuri, de obicei, nu exist grupri cu caracter permanent i fiecare
grupare se elaboreaz ca un element de sine stttor.
Practic gruparea statistic presupune mprirea colectivitii n funcie de o
caracteristic numeric , mprire necesar n cazul unui numr mare sau foarte
mare de valori distincte ale caracteristicii de grupare ntlnite la nivelul respectivei
colectiviti. n prealabil colectivitatea trebuie supus unei serioase analize
teoretice care trebuie s rspund cel puin la urmtoarele ntrebri:
Ce fel de grupe exist n colectivitate?
n cte grupe se face mprirea colectivitii?
Dup care caracteristic s se fac gruparea?
Un procedeu des utilizat de grupare este gruparea mecanic, n care se aplic n
mod mecanic intervale de grupare egale. n stabilirea acestor intervale se pornete
de la amplitudinea variaiei a, crei valoare d lrgimea de band care trebuie
mprit n grupe. Aceast lrgime sau diapazon se mparte n intervale egale cu
respectarea urmtoarelor condiii:
a. limitele de interval trebuie s se exprime pe ct posibil n valori rotunde;
b. trebuie s se obin suficient de multe intervale de grupare pentru a se obine
informaii suficient de analitice;
c. intervalele trebuie s permit la nevoie regruparea datelor prin contopirea a
dou sau mai multe intervale, fr a fi nevoie de reluarea operaiei de grupare sau
de spargerea n dou a unor intervale;
d. n fiecare interval trebuie s se regseasc, pe ct posibil, un numr suficient de
mare de valori individuale, care s permit interpretarea statistic
n urma gruprii se obine seria de repartiie a frecvenelor pe intervale
de valori, serie care se numete de variaie dac repartiia este fcut dup o
caracteristic numeric.
34
Intervale de grupare
inf
sup
x i x i xi
Nr. Uniti
Fi
X1 inf x1 sup
X2 inf x2 sup
Xi inf xi sup
Xn inf xn sup
F1
F2
Fi
Fn
Total
fi
i 1
sup
- n al doilea caz: hi xi 1 xi 1
n statistica economico-social este posibil ca limita inferioar a primului
interval, notat cu x1inf, sau limita superioar a ultimului interval (x n sup) s fie
omise. Se spune c respectivele intervale sunt deschise, fiind necesar nchiderea lor
pe baza ipotezei egalitii intervalelor vecine.
n calculele ulterioare, intervalul de grupare este reprezentat prin centrul sau
mijlocul intervalului, stabilit astfel:
Caz I: prin media aritmetic simpl a limitelor de interval;
Caz II: prin adunarea la limita inferioar a jumtii intervalului respectiv.
Reprezentarea grafic a seriilor de repartiie se face prin histogram sau
poligonul frecvenelor, situaie n care pe axa absciselor se reprezint caracteristica,
iar pe axa ordonatelor se va reprezenta frecvena acesteia.
Reprezentarea grafic a seriilor e foarte important i sugestiv, fiind deseori
utilizat n vederea creterii expresivitii i puterii de nelegere a fenomenelor
social-economic. n multe situaii, gruparea pe intervale egale este neconcludent.
n procesul de elaborare a gruprii apar intervale neegale de grupare. Acestea
nu rezult prin aplicarea unor reguli mecanice i se fundamenteaz pe argumentele
analizei calitative de coninut a materialului statistic.
Dac scopul gruprii este evidenierea tipurilor calitative, vor fi utilizate
intervale neegale. n acest caz, gruparea se numete tipologic. n statistica socioeconomic apar adesea i grupri dup o caracteristic teritorial. Aceste grupri sunt
35
n general grupri mecanice. Tot prin acest procedeu se fac i gruprile dup o
caracteristic temporal.
Definiia gruprii
combinate.
Prin definiie gruparea realizat simultan dup dou sau mai multe
caracteristici se numete grupare combinat.
Aceast metod de grupare este cea mai evoluat i se poate efectua dup un
graf arborescent, n care grupele obinute n urma mpririi dup o prim
caracteristic se mpart la rndul lor n subgrupe dup o a doua caracteristic, .a.
Aceast grupare este avantajoas deoarece se poate introduce relativ uor n
completare o coloan pentru valorile agregate ale caracteristicii, n vederea
caracterizrii grupelor i a subgrupelor i a deducerii indicatorilor derivai.
De menionat c adncimea gruprii dup mai multe caracteristici prezint un
pericol deoarece ngreuneaz mult posibilitatea perceperii i cuprinderii informaiilor
n tabel.
Modelul gruprii combinate se reprezint astfel:
PRIMA
A DOUA
FRECVENELE
CARACTERITIC CARACTERISTIC CORESP.
DE GRUPARE xi
DE GRUPARE yj
COMBINAIEI DE
VALORI xi yj
X1
Y11
F11
Y12
F12
.
.
f1j
y1j
.
.
f1m
y
1m
Total grupa 1
n1 f 1 j
j 1
X1
Y21
Y22
.
y2j
.
y2m
TOTAL
GRUPA 2
..
Xi
F21
F22
.
f2j
.
f2m
n
n2 f 2 j
j 1
.
Yi1
Yi2
.
yij
.
yim
36
Fi1
Fi2
.
fij
.
fim
TOTAL
GRUPA i
Xk
ni f ij
j 1
Yk1
Yk2
.
ykj
.
ykm
TOTAL
GRUPA k
Fk1
Fk2
.
fkj
.
fkm
n
n k f kj
j 1
TOTAL
GENERAL
n ni f ij
i 1
i 1 j 1
5.4 Rezumat
Unitatea de invatare Nr.4. prezinta n prima parte a cursului sunt prezentate
clasificarea i gruparea statistic, tehnici de baz n prelucrarea datelor statistice, a
cror utilizare contribuie decisiv la sistematizarea datelor i, pe aceast cale, la
simplificarea tuturor procedurilor ulterioare. ntregul demers se bazeaz pe conceptul
de omogenitate, a crui corect nelegere poate contribui la desluirea importanei
ambelor proceduri. Partea a doua i a treia a cursului prezint laturile practice ale
clasificrii i gruprii, modelele gruprii simple i combinate, stabilirea lungimii
intervalului de grupare, etc.
INDICATORII STATISTICI
Cuprins
6.1
Obiectivele unitatii de invatare Nr.6
6.2
Mrimile relative
6.3
Teste de evalure 1 a unitatii de invatare Nr.6
6.4
Rezumat
6.5
Bibliografie
37
37
41
41
41
6.2 Coninut
Capitolul 6
INDICATORII STATISTICI
1. Necesitatea folosirii indicatorilor statistici
Obiectul de studiu la statisticii l constituie fenomenele i procesele de mas, a cror
proprietate principal este variabilitatea formelor individuale de manifestare n timp, spaiu
i sub raport organizatoric.
Pornind de la aceast variabilitate rezult c pentru caracterizarea unei colectiviti nu
se poate folosi o singur expresie numeric , cu aceeai dimensiune ca i colectivitatea, fiind
necesare mai multe expresii de acest tip. De aici rezult nevoia statisticii de a elabora
metodologii i tehnici de obinere a acestor determinri cantitativ-numerice, denumite generic
indicatori statistici
.
Prin definiie indicatorul statistic este expresia numeric a unor fenomene,
procese, activiti sau categorii economice i sociale, definite in timp , spaiu i structur
indicatorului
statistic.
organizatoric i care se regsesc cu o anumit periodicitate nDefiniia
statisticile
oficiale,
naionale si internaionale.
c)
funcia de analiz i sintez;
d)
funcia de estimare;
e)
Funcia de verificare a ipotezelor i de
parametrilor utilizai.
testare
i 1
i 1
QV qi1 pi1 qi1 pi0 (unde: i = contorul produselor; qi1 pi1 = producia
n
i 1
vndut la momentul t;
i1
pi 0
i 1
Se observ c indicatorii compar 2 valori i nu producia fizic cu cea valoric, iar
rezultatul comparaiei este tot o valoare, exprimat n uniti monetare.
Comparaia pe baz de raport se poate face att pentru indicatorii cu acelai coninut,
ct i pentru indicatorii cu coninut diferit, dar independeni din punct de vedere economicosocial. Exemplu: raportarea produciei la numrul salariailor este posibil i va rezulta un
indicator numit productivitate a muncii. Apar astfel in statistica mrimile relative i indicii.
Indicatorii derivai au un caracter abstract, chiar daca uneori cum este cazul mediilor,
39
Mrimea relativ sau indicatorul relativ este rezultatul comparrii sub form de
raport a 2 indicatori statistici i se exprim printr-un singur numr, artnd, n general,
proporia indicatorului raportat fa de indicatorul baz de raportare.
Mrimea relativ
indicatorul relativ
Mrimile relative sunt folosite n toate domeniile n care se utilizeaz metodele i
tehnicile de calcul i analiz statistic.
Forma de exprimare a mrimilor relative se stabilete n report cu gradul de variaie a
fenomenelor, scopul urmrit, precum i particularitile specifice ale fenomenelor cercetate.
Rezultatul raportrii poate fi un numr ntreg, sau o fracie. Deseori, pentru a mri
expresivitatea rezultatului, acesta se nmulete cu 100, 1000, 10000 sau 100000, obinnduse astfel: procentele, promilele, prodecimilele i procentimile.
Forma cea mai simpl de exprimare este sub form de uniti sau coeficieni. In aceasta
situaie, rezultatul raportului arat cte uniti din indicatorul raportat revin la o singura
unitate a indicatorului baza de raportare.
Forma cea mai obinuit i sugestiv, utilizat pentru exprimarea mrimilor relative
este aceea a procentelor, care arat cte uniti din indicatorul raportat revin la 100 de uniti
ale indicatorului baz de raportare. Aceasta este forma de exprimare a majoritii mrimilor
relative.
Promilele se utilizeaz atunci cnd indicatorul comparat este mult prea mic fa de
indicatorul baz de raportare. Exemplu: indicatorul eficienei utilizrii fondurilor fixe se
calculeaz ca producie obinut la 1000 lei fonduri fixe.
Prodecimilele i procentimilele se utilizeaz n principal n demografie i statistica
medical.
Mrimile relative se mpart in:
a) mrimi relative de structur;
b) mrimi relative de coordonare;
c) mrimi relative ale dinamicii;
d) mrimi relative ale programrii (planificrii);
e) mrimi relative de intensitate
a) Mrimile relative de structur sunt acele mrimi n care calculul este impus de
necesitatea cunoaterii aprofundate a compoziiei colectivitilor care au fost separate n
grupe i subgrupe, dup variaia uneia sau a mai multor caracteristici.
Acestea pot fi:
- ponderi, numite i greuti specifice;
- frecvene relative.
Ponderile sunt regsite n seriile statistice atributive, n seriile teritoriale sau pentru
variabilele statistice, construite pe baza unor componente. Ele se calculeaz procentual astfel:
40
yi
xi
n
xi
100
i 1
n aceast exprimare, la numitor se gsete ntregul, xi este partea i din ntreg, iar yi
este ponderea procentual a pri n ntreg.
Mrimile relative de structur au proprietatea c suma lor, calculat fa de aceeai
baz, este egal cu 1, in cazul exprimrii sub forma de coeficieni, sau cu 100, in cazul
exprimrii procentuale.
b) Mrimile relative de coordonare caracterizeaz raportul numeric n care se
gsesc 2 indicatori de acelai fel, aparinnd unor grupe ale aceleiai colectiviti statistice sau
unor colectiviti statistice de acelai fel, dar situate in spaii diferite.
Exemplu: raportul dintre populaia din mediul urban i populaia din mediul rural este o
mrime relativ de coordonare. Mrimile relative de coordonare admit proprietatea
reversibilitii:
x
1
1
K A/ B A
xB K A / B xB
xA
c) Mrimile relative ale dinamicii se utilizeaz pentru caracterizarea fenomenelor in
timp i se obin ca raport intre nivelul fenomenului intr-o anumit perioad i nivelul aceluiai
x
nivelul perioadei curente
K1 / 0 1
fenomen sau proces n perioada anterioar.
x0 nivelul perioadei de baza
Cea mai des ntlnit esre situaia prezentat n urmtorul cap de tabel:
Perioada
Perioada curent
de baz
x programat x realizat
x0
x0
Xpr
X1
Mrimile reale ale dinamicii pot fii mrimi ale sarcinii de plan (Isp) i mrimi ale
dinamicii de realizare a planului (Ir): I sp
x pl
x0
100
Ir
xi
x0 100
Q
productivitate
N
numar salariati
In aceasta relaie N este i frecvena pe baza creia se face calculul nivelului mediu al
productivitii muncii, la nivelul ramurii, constituita din ageni economici cu acelai obiect de
activitate principal.
In cazul mrimilor relative de intensitate, intre factorii raportai trebuie s existe
obligatoriu o relaie de interdependen: xi
yi
zi
I yi
I yi / xi
I yi / zi
yi yi / xi yi / zi
42
43
Mrimile medii
Teste de evalure 1 a unitii de nvare Nr.7
Rezumat
Bibliografie
43
43
45
47
48
7.2 Coninut
Capitolul 7
MRIMILE MEDII. MEDIA CA INDICATOR STATISTIC ESENIAL
1. Mrimile medii
Un loc important n categoria indicatorilor derivai i n categoria
indicatorilor sintetici l ocup mrimile medii, utilizate pe scara larga, att in
activitatea de planificare i conducere, ct si n cercetrile statistice diverse.
Mrimile medii constituie instrumente principale de cunoatere a
fenomenelor de mas i au un grad mare de aplicabiliti n activitatea
practic. Ele redau ceea ce este tipic, comun i generalDefiniia
n evoluia
mrimii medii
fenomenelor i proceselor social-economice. Pentru a asigura un coninut ct
44
mai real, ct mai semnificativ, pentru mediile calculate, este nevoie ca valorile
individuale din care se obin s fie ct mai apropiate ntre ele.
Totodat, trebuie s se in seama de gradul de omogenitate al colectivitii
supuse cercetrii. In cazul n care aceasta colectivitate este eterogen, se vor
calcula mai nti medii pariale, iar media pe ansamblu va aprea ca o sinteza a
mediilor pariale.
Prin definiie, media valorilor individuale ale unei variabile sau
caracteristici statistice este expresia sintetizrii intr-un singur nivel
reprezentativ a tot ceea ce este esenial, tipic i obiectiv in apariia,
manifestarea si dezvoltarea variabilei.
De reinut c media msoar influenta cauzelor eseniale, fcnd abstracie
de cele ntmpltoare.
n statistic, media poate fi interpretat drept nivelul la care ar fi ajuns
caracteristica nregistrat dac in toate cazurile, toi factorii eseniali i neeseniali
ar fi acionat constant, deci s-ar fi obinut o valoare identic. De aceea media mai
este numit i "sperana matematic" ctre care tind toate valorile unei serii.
Cele mai des utilizate medii sunt:
a) media aritmetic;
b) media armonic;
c) media ptratic;
d) media geometric;
e) media cronologic.
Toate mediile pot fi calculate ca medii simple i medii ponderate.
Tabelul urmtor red formulele de calcul ale principalelor medii:
a) Media aritmetic :
b) Media armonic
a1) Media aritmetic simpl
xh
xi
i 1
n
n
i 1
xi f i
i 1
xh
fi
i 1
fi
d) Media geometric
i 1
i 1
c) Media ptratic
xp
xg
xi2
i 1
i 1
d2)
Media
ponderat
geometric
xp
xi2
fi
x g i 1
fi
i 1
fi
i 1
i 1
x
i 1
x1 , x 2 x i x n
n
n
Media aritmetic se calculeaz astfel
xi se not valoarea individuala i a caracteristicii x
46
x
i 1
n
f
i 1
fi
x1 f 1 x 2 f 2 xifi xnfn
f 1 f 2 fi fn
x
i 1
fi
27660
48,35
572
48,35
fi
143
k
Cele dou proprieti ale mediei aritmetice ponderate sunt utilizate pentru aplicarea unei a
formule de calcul prescurtat mediei,scznd eventual o anumit valoare sau termenul cel mai
mic al seriei din toi termenii seriei i adugndu-l la media final obinut i simplificnd de
obicei frecvenele absolute cu cel mai mare divizor comun al acestora.
47
Media armonic.
Se aplic n general n seriile de distribuie care au repartiie hiperbolic a termenilor.
a) media armonic simpl: f I
1
n
xh n
n
1
1
i 1 x i
i 1 x i
n
fI
Xi
xi
xi
xi
fi
1
i 1
x hp n
n
1
1
fi fi
i 1 x i
i 1 x i
x hp
572
4,31
12,624
x hp x
f
i 1
Observaie: media armonic este mai mic sau cel mult egal cu media aritmetic a aceleiai
serii de repartiie.
7. 4 Rezumat
Unitatea de invatare Nr.7. prezinta media ca indicatorul statistic cel mai important
care sintetizeaz ceea ce este esenial n colectivitile statistice. Sunt apoi prezentate
n form simpl i ponderat principalele medii utilizate n metodologia statistic,
insistndu-se asupra mediei aritmetice i a mediei standard.
48
49
49
49
52
54
55
8.2 Coninut :
Capitolul 8
SERII DE REPARTIIE DE FRECVENE
.
1.Probleme generale ale seriilor de repartiie de frecvene
Sistematizarea datelor observrii sub form de serii de repartiie de frecven se face pentru
fiecare variabil atributiv, fie cantitativ, fie calitativ.
Principalele proprieti ale seriilor de repartiie sunt:
- omogenitatea;
- variabilitatea;
independena;
- tendina de concentrare a frecventelor ataate valorilor
nregistrate.
Omogenitatea reprezint faptul c seriile au acelai coninut, fiind rezultatul combinrii
50
2. Indicatori de frecven
O serie de frecvene arat astfel:
Intervale de
grupare
Grupa 1
Grupa 2
i 1
Frecventele
absolute
cumulate
Frecventele
relative
cumulate
f1
f1r
f1
f1rc f i r
f2
f 2r
f 2c f1 f 2
f 2rc f1r f 2r
fi
f ir
f nc
fn
Grupa I
Grupa n
TOTAL
Frecventele Frecventele
absolute
relative
fi F
f nr
n
f*
i 1
f
i 1
f nrc 1
1(100)
Pentru a analiza structura seriei este necesar s se calculeze frecvenele relative dup formula:
f *i
fi
f
i 1
fi
F
O alt modalitate de a caracteriza structura unei serii const n calcularea frecvenelor cumulate.
Cumularea poate fi fcut fie pentru frecventele absolute ct i pentru frecvenele relative.
Cumularea frecvenelor, respectiv a greutilor specifice ajut pentru a evidenia care este
numrul de uniti sau ponderea lor pn la valoarea absolut sau relativ totalizatoare.
51
Media simpl:
i 1
n
n
fi
i 1
Media ponderat:
i 1
n primul caz, n repryint numrul termenilor seriei ; n cazul al doilea n repreyint numarul
intervalelor de grupare.
Pentru cazul n care seriile sunt mprite pe intervale de variaie, valorile x luate n calcul sunt
date de centrele de intervale, calculate ca medii aritmetice simple intre limitele de interval.
Media se exprim n aceleai uniti de msur ca i valoarea variabilei statistice din care s-a calculat.
In analiza seriilor se pot utiliza i celelalte tipuri de medii: media armonic, ptratic, geometric.
Mediana este valoarea seriei care o mparte pe aceasta n 2 pri egale. Pentru seriile simple,
dac numrul termenilor seriei e impar, atunci mediana este dat de termenul de mijloc al seriei.
Dac numrul termenilor seriei este par, mediana se va calcula ca medie aritmetic simpl a celor
Definiia medianei
2 termeni din mijloc ai seriei.
Practic mediana se va plasa n intervalul care include acea valoare n frecvene cumulate
(frecvena cumulat a intervalului anterior este mai mic iar frecvena cumulat a intervalului respectiv e
mai mare sau egal cu valoarea dat de locul medianei).
Locul medianei:
U Me
f
i 1
Me x 0 h
1
2
i 1
me 1
f i 1 f i
i 1
f me
Valoarea medianei:
h lungimea intervalului medianei;
f me index, frecvena intervalului medianei;
me 1
52
Formula de calcul:
Mo x0 h
1 2
1 f mo f mo1
2 f mo f mo1
( frecventa
fi
i
fI 1
4
i 1
U CU 1
formula de calcul x 0 h
4
f cu1
- decilele vor mpri seria n 10 pri egale<
- centilele vor mpri seria n 100 pri egale.
Exist 9 decile, a cincea fiind egal cu mediana i 99 de centile, a 50-a
fiind egal cu mediana.
53
Indicatorii variaiei
Pe lng indicatorii tendinei centrale, o importan deosebit pentru
caracterizarea seriilor o au indicatorii variaiei.
Acetia se mpart n 2 categorii: indicatori simplii ai variaiei i indicatori
sintetici.
Indicatorii simplii sunt: amplitudinea A = x max x min (diferena dintre
valoarea maxim i valoarea minim a seriei), i abaterile individuale liniare ale
valorilor seriei de la medial lor.
Indicatorii sintetici sunt:
- abaterea medie liniar calculat ca media aritmetic simpl sau ponderat
ntre valorile absolute ale abaterilor liniare ale valorilor seriei de la media
acesteia.
n
absolute: d
x
i 1
i 1
x fi
..
f
i 1
(x
i 1
x) 2
n
Scriei dispersia pentru o serie de repartiie cu frecvene absolute!
(x
i 1
x)
(x
i 1
x) 2 f i
--- coeficientul
f
i 1
d
daca se cunoaste doar abaterea medie liniara
x
sau : V
54
( x i x)
( x i x) f i
( x i x) 2 f i
4,2
2,2
0,2
1,8
3,8
5,8
7,8
75,6
52,8
5
23,4
30,4
40,6
39
= 266,8
317,5
116,16
1
42,12
115,52
235,48
304,2
= 1132
266,8
2.668
100
1132
2
11,32
100
11,32 3,36
d
V
V
d
x
100 7,8%
100 9,82%
Prin ambele metode coeficientul de variaie este sub 10% deci, seria poate
fii apreciat ca o serie foarte omogen.
8.4 Rezumat
Unitatea de invatare Nr.8. face prezentarea principalelor proprieti ale seriilor
de repartiie: omogenitatea, variabilitatea, independena variantelor, tendina de
repartiie, fcnd ulterior i o grupare a indicatorilor. sunt prezentai apoi indicatorii
de frecvene, precum i indicatorii tendinei centrale. O deosebit importan n
studiul seriilor o au indicatorii variaiei, grupai in indicatori simpli i indicatori
sintetici. O atenie deosebit le este acordat acestora din urm, insistndu-se asupra
abaterii medii liniare, abaterii medii ptratice, dispersiei i coeficientului de variaie.
n final , n vederea nelegerii profunde a variaiei n cadrul seriilor este prezentat
regula adunrii dispersiilor.
8.5.Bibliografia Unitatii de invatare Nr. 8
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
55
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs
56
9.2.
9.3.
9.4.
9.5.
Indicatori ai variaiei
Teste de evalure 1 a unitii de nvare Nr.9
Rezumat
Bibliografie
57
62
66
66
9.2 Coninut :
Capitolul 9
VARIAIA I COLECTIVITILE MPRITE PE GRUPE I MSURAREA EI
1. Indicatori ai variaiei
Media nu este o valoare reprezentativ dect pentru cazul n care ea este calculat din
mrimi omogene, cu un grad de variaie ct mai redus. Pentru a verifica gradul de
omogenitate al caracteristicilor pentru care se determin media, este necesar s se calculeze
indicatori de variaie, de asimetrie i de exces
Aceti indicatori permit separarea modului de aciune a factorilor eseniali de
aciunea factorilor ntmpltori, ajungnd la identificarea felului n care acioneaz factorii
eseniali de la o grup la alta.
Indicatorii variaiei sunt de 2 tipuri: simpli i sintetici.
Utilizarea indicatorilor
simpli ai variaiei
58
A%
A
100
x
d%
di
x
100
xi x
x
xi x
100
In analiza variaiei, intereseaz n mod special abaterile maxime intr-un sens sau
altul.
Abaterea maxim negativ dmax(-)
()
d max
x min x
( )
d max
%
x min x
x
100
()
d max
x max x
()
d max
%
x max x
x
100
i 1
n
n
x fi
i 1
i 1
x x f
i
i 1
100
2. Abaterea medie ptratic, numit i abatere medie tip sau abaterea standard; se
noteaz cu (sigma) i se calculeaz ca o medie ptratic din abaterile tuturor variantelor
59
(x
x) 2
i 1
n
n
(x
x) 2 f i
i 1
i 1
2.2. Pentru o serie de frecvene absolute:
2.3. Pentru o serie de frecvene relative exprimate n procente:
n
( x x)
i
( x x)
f i (%)
i 1
f i r (%)
i 1
100
10
( x x)
i 1
n
n
( x x)
i 1
fi
i 1
3.2. Pentru seriile de repartiie cu frecvene absolute:
3.3. Pentru seriile de repartiie de frecvene relative exprimate in procente:
n
( x x)
i
f ir %
i 1
100
100
x
mpririi pe grupe. Dac nu avem la dispoziie dect abaterea medie liniar, coeficientul de
Vd`
100
x
variaie poate fi calculat i pe baza ei:
Coeficientul astfel calculat va fii mai mic dect cel calculat pe baza abaterii medii
ptratice.
pe grupe. Regula
Numrul unitilor pe
Valoarea
variantele caracteristicii
caracteristici
y1
y2
yi
ym
de grupare
(xi)
n11
x1
ij
ni
i 1
Medii
de
grup
yi
n1m
n1
n 22
n 2i
n2m
n2
ni 2
nii
nim
nj
nk 2
n ki
n km
nk
n 1 n 2
ni
n m n n k nij
n k1
xk
n1i
ni1
xi
grupe
n12
n 21
x2
Total uniti pe
Dispersii
de
grup
i2
y1
12
y2
22
yj
2j
yk
k2
i n j
j 1
y y/ x y/x
Dac se studiaz variaia caracteristicii y in funcie de variaia factorilor de grupare
x, atunci se pot calcula medii i dispersii condiionate pentru fiecare grup, prin care se va
pune n eviden interdependena dintre cele 2 caracteristici.
2
61
Dac x este factorul de grupare, frecvenele pe fiecare grup se obin prin nsumarea
m
ij
ni
Dispersiile se calculeaz
o medie general y , care sintetizeaz att variaia tuturor valorilor individuale ale
colectivitii totale, ct i valorile mediilor de grup, numite i medii condiionate de factorul
de grupare yi.
Pentru caracteristica y se pot calcula 3 feluri de indicatori, care s
caracterizeze:
a) variaia valorii yi in jurul mediei lor de grup ( y i y i )
b) variaia valorilor mediilor de grup in jurul mediei colectivitii totale ( y i y )
( yi y)
c) variaia valorilor individuale yi in jurul mediei colectivitii totale
La nivelul fiecrei uniti observate, variaia total ( y i y ) , se poate descompune in
variaia fa de media de grup i variaia mediilor de grupare fa de media colectivitii
totale. y i y ( yi y i ) ( y i y )
Variaia valorilor individuale din fiecare grup n jurul mediilor va msura gradul de
influen a factorilor variabili, prezeni in interiorul grupei.
Pe de alt parte, variaia mediilor de grup fa de media colectivitii totale este
interpretat ca rezultat al factorului de grupare, deoarece n acest caz factorii variabili din
interiorul grupei s-au pstrat la un nivel constant.
Dispersia total calculat pe baza abaterilor valorilor individuale fa de media
m
2
y
(y
y) n j
j 1
j 1
i2
(y
y i ) nij
j 1
nij
j 1
2
variabilei studiate. y / x
(y
i 1
y ) 2 ni
n
i 1
i
2
y2 i y2 / x
45-55
peste 55
15%
90%
25%
50%
10%
75%
35%
-
100%
100%
100%
tiind c eantionul este structurat astfel: grupa sub 10 ani are o pondere d
grupa ntre 10 i 20 ani are o pondere de 40%, grupa peste 20 ani are o pondere de
cere:
1. Timpul mediu nelucrat pe grupe de vechime i timpul mediu nelu
eantionului, precizndu-se dac sunt valori reprezentative
2. Felurile dispersiilor i verificarea regulii de adunare a dispersiilor.
3 S se verifice semnificaia factorului principal de grupare (vechimea)
variaia timpului nelucrat, prin calcularea coeficientului de determinaie i criteri
analiz dispersional.
GRUPE
0-10
10-20
20-30
Total
SUBGRUPE
45-55
25
80
14
119
35-45
0
24
126
150
x1
distributia X
f1
y
distributia Y 1
f1
55-65
75
56
0
131
x2
f2
xi
fi
xp
pe grupe;
f p
y2
f2
yi
fi
yn
pe subgrupe
f n
TOTAL
100
160
140
400
Frecvene
0
25
75
Subgrupa II
Yi
40
50
60
Frecvene
24
80
56
Subgrupa III
Yi
40
50
60
y3
Frecvene
126
14
0
5740
41 2 9 3
140
Colectivitatea general
64
Yi
40
50
60
frecvene
150
119
131
y 49,525
2 70,02
8,36
Vi 7,31
Indicatori
yi
Vi
Grupa
0-10
10-20
20-30
Colectiv.
57,5
52
41
49,52
18,75
46
9
70,02
4,33
6,78
3
8,36
7,5
13,04
7,31
16,88
Total
coeficientul de variaie este de sub 30%, toate omogen grup d.p.d.v. al timpului n
18,75
46,0
9
100
160
140
i2
65
(y
i 1
y) 2 f i
f
i 1
n final, un sfat : aprecierea omogenitii unei serii este vital pentru orice ec
care dorete s-i argumenteze cunotinele !
9.4 Rezumat
Unitatea de invatare Nr.8. prezinta seriile ca metoda cea mai des utilizat pentru
sistematizarea datelor, ele fiind direct legate de gruparea statistic. In aceast unitate
se prezint conceptul de mprtiere sau de variaie i modalitile de calcul i
interpretare a indicatorilor simpli i sintetici ai acesteia.
10.2. Coninut
Capitolul 10
METODE DE EANTIONARE PENTRU EFECTUAREA SONDAJELOR STATISTICE
1. Generaliti
Necesarul de informaie n continu cretere, coroborat cu faptul c sursele economice (n principal cele
financiare) sunt de regul limitate, determin creterea gradului de utilizare a metodei sondajului statistic
ca form a observrii pariale.
Sondajul statistic este uneori singura form de obinere a informaiei i este cu att mai avantajoas
cu ct presupune un consum redus de resurse, oferind posibilitatea de a obine informaii referitoare la
ntreaga colectivitate, prin observarea i cercetarea unei pri a acesteia.
Partea cercetat este numit subpopulaie sau eantion, fiind ntlnit n literatura de specialitate sub
numele de sondaj sau selecie.
In practica cel mai des se folosete sintagma "colectivitate de selecie" pentru eantion.
Toate ipotezele, afirmaiile, clasele stabilite pe baza unui sondaj nu pot fi considerate de tip
determinist, ele avnd caracterul unor ipoteze, afirmaii de tip statistic, efectuate in condiiile unei anumite
probabiliti, deci cu un anumit nivel de ncredere.
2. Noiuni si importan
Culegerea datelor se face prin observaii totale i pariale. Dac observaia parial se face n scopul
nlocuirii unei observri totale, atunci statistica folosete metoda selectiv, care presupune obinerea unor
eantioane reprezentative, extrase dup criterii strict elaborate, i care se supun observrii n conformitate cu
o serie de reguli prestabilite.
Reprezentativitatea este proprietatea conform creia, intr-un numr mai mic de uniti, care
formeaz mpreun un eantion, se regsesc aceleai trasaturi eseniale ca si n ntreaga populaie supusa
68
cercetrii statistice.
Se consider suficient de reprezentativ, sondajul care conduce la erori de cel mult 5 % ntre
colectivitatea de selecie i colectivitatea general.
La aplicarea metodei sondajului statistic, se utilizeaz o serie de noiuni-perechi ale colectivitii de
selecie i colectivitii generale dup cum urmeaz:
Colectivitatea Volum
Caracteristica nealternativ
Caracteristica alternativ
Medie
Dispersie
Medie
Dispersie
n
s2
Colectivitatea
de selecie
xi
s2
x0
x
j 1
i 1
x) 2
m
n
m
f
n
n
n
j 1
Colectivitatea
general
(x
( xi x) 2
i 1
S 2 f (1 f )
n 1
N
2
sW
W (1 W )
(x
i 1
x0 )
M
N
P2 P (1 P)
De reinut c, n orice condiii volumul colectivitii totale este o constant, deci parametrii
colectivitii totale (media, dispersia) pot lua fiecare cate o singur valoare distinct. In acelai timp, dintr-o
populaie total de N uniti pot fi extrase mai multe eantioane de acelai volum sau de volum diferit.
Rezult de aici c media i dispersia colectivitii de sondaj se transform n variabile aleatoare, cu valori i
frecvene diferite de apariie.
Dintr-un volum de N uniti pot fii extrase C Nn eantioane. Numrul total al eantioanelor este 2 n .
De aici rezult c media i dispersia colectivitii de sondaj se transform n variabile aleatoare cu
valori diferite i cu frecvene diferite.
Pentru fiecare indicator calculat la nivel de colectivitate general sau eantion, exist diferene in plus
sau in minus. Aceste diferene se numesc erori de selecie i sunt: de sondaj sau de reprezentativitate.
Erorile de sondaj sunt erori de care i au sursa in nclcarea principiului fundamental al sondajului
i anume caracterul aleator al prelucrrilor. Ele se concretizeaz in deplasri ale valorilor parametrilor
stabilii pentru colectivitatea de selecie, comparativ cu parametrii existeni pentru populaia originar.
Definiie erori de sondaj
Datorit proprietilor mediei, la calculul erorii de sondaj se ia in discuie ca principal msurtor al
erorii, diferena dintre media de selecie i media general.
Eroarea de reprezentativitate reprezint diferena dintre media general a populaiei i media
eantionului, aceasta din urm fiind calculat pe baza sondajului.
Aceast eroare este expresia in uniti concrete de msur, considerndu-se c media x a
colectivitii de selecie este reprezentativa pentru media general (m) a colectivitii generale, dac este
reflectat relaia:
5%
xm
5%
m
sau
d x (%)
xm
m
5%
69
identitate a structurii populaiei totale i de aici rezult c eroarea de reprezentativitate poate fi calculat
dac media general este cunoscut dintr-o cercetare anterioara, comparndu-se media eantionului
nregistrat, calculat n cursul cercetrii, cu aceast medie general recunoscut.
In acest caz se spune ca a fost calculata eroarea efeectiv de sondaj i dac ea se ncadreaz in marja
de 5% este verificat i gradul de reprezentativitate.
Nu n toate cazurile exist o medie precalculat a colectivitii generale. Din acest motiv se utilizeaz
mai multe sondaje de prob, verificndu-se stabilitatea mediei i a dispersiei acestor sondaje prin metode
cunoscute de la seriile de distribuie.
Avantajul seleciei statistice const n faptul c permite calcularea mrimii erorii i stabilirea
prealabil a mrimii acesteia, cu condiia ca la formarea eantionului s se foloseasc o schema probabilistic
sau un procedeu derivat dintr-o schem probabilist.
In acest caz, se pot interpreta si calcula erorile de selecie, cu ajutorul proprietilor diferitelor funcii
de probabilitate.
3. Procedee i modaliti de alctuire a eantioanelor
Metoda sondajului ofer tehnici variate de prelucrare, difereniate i adaptate diferitelor tipuri de
populaie, astfel nct s se asigure caracterul aleator al seleciei unitilor i reprezentativitatea eantionului.
Dup modul de prelucrare sau extragere, exist urmtoarele tipuri de sondaje:
a) sondaj simplu aleator
- repetat
- nerepetat
b) sondaj tipic (stratificat):
c) sondaj de serie
d) sondaj in mai multe trepte
e) sondaj secvenial utilizat la controlul calitii
f) sondaj subiectiv (organizat sau dirijat)
g) sondaj sistematic sau mecanic
In practic, n marea majoritate a cazurilor, eantioanele se extrag din populaii finite. Aceste
eantioane se trateaz prin analogie cu extragerea sondajelor din populaii infinite.
In funcie de revenirea sau nerevenirea fiecrei uniti in baza de extragere, sondajele sunt repetate,
daca unitatea extras revine n baza in vederea unei noi extrageri, i nerepetate n caz contrar.
Sondajul repetat este sondajul n care fiecare unitate extras din populaia general este introdus
din nou n aceasta, n vederea unei noi extrageri. n acest caz, variabilele sunt independente ntre ele i
fiecare unitate poate fi extras de mai multe ori.
defiie sondajul repetat
n sondajul simplu repetat varianta de sondaj da natere unei repartiii teoretice dup modelul
Bernoulli.
Dintr-o colectivitate care conine N uniti se pot extrage mai multe eantioane de volum n, care pot
s fie diferite ca structur una de cealalt ,deci succesiunea probelor de sondaj este infinit. Numrul de
variante de eantionare este totui finit i este egal cu: C Nn .
Prin sondaj nerepetat se nelege un sondaj analog cu modelul bilei extrase din urna, fr ca ea s
mai fie pus napoi.
In acest caz, variantele sunt dependente intre ele, i fiecare unitate poate aprea o singur dat n irul
definiie sondajul
succesiv
al probelor. Este practic un sondaj efectuat dintr-o populaie finit , cu fracia de sondaj depinznd
nerepetat
de volumul eantionului.
Att n cazul bilei revenite, ct i in cel al bilei nerevenite se obin mai multe eantioane de acelai
70
volum. Efectund toate eantioanele posibile cu acelai volum, mediile de selecie pot fi considerate ca valori
diferite ale unei variabile statistice aleatoare, care pot estima media general cu o abatere mai mare sau mai
mic. Rezult de aici c exist sondaje mai eficiente sau mai puin eficiente.
Prin definiie, un sondaj A de volum n, in baza cruia se estimeaz media m a unei populaii
pentru variabila x prin estimaia x A este mai eficace dect sondajul B, de acelai volum n, n baza
cruia se estimeaz aceeai medie m a caracteristici x, dac exist relaiile:
M (x A ) m
M (x B ) m
D( x A ) D( x B )
Acest lucru se explic pe baza inegalitii lui Cebev, care exprim cu o probabilitate mai mare dect
1
1
1
p 1 2 urmtoarele:
2
k
k
10.4 Rezumat
Unitatea de invatare Nr.9. prezinta unul dintre capitolele eseniale ale
statisticii, menit s uureze consistent munca cercettorului, este sondajul. n cadrul
lui, o bun cunoatere i nelegere presupune stpnirea riguroas a noiunilor
teoretice, alturi de nelegerea conceptelor de reprezentativitate i estimaie. n
vederea efecturii n bune condiii a unui sondaj este important alegerea procedurii
corecte de alctuire a eantionului i dimensionarea corect a acestuia. n vederea
calculului i estimrii ct mai aproape de adevr a mediei i dispersiei colectivitii
generale este pus la dispoziie aparatul statistico-matematic adecvat.
73
73
79
11.4. Rezumat
11.5. Bibliografie
81
82
11.2. Coninut
Capitolul 11
ESTIMAREA MEDIEI I DISPERSIEI I MSURAREA PRECIZIEI LOR N
SONDAJUL STATISTIC
Definiia estimaiei
In acest caz ,1- este nivelul de ncredere, iar se mai numete prag de
semnificaie.
Jumtatea intervalului de ncredere se numete eroare limit admis i se
noteaz cu:
( )
2
x1 x 2 ..... x n
1
n
n
i 1
s
( x)
n
n
1
N 1
2x D ( x)
2 N n S 2 N n
n N 1 n N 1
N n
S
N 1
n
mediei
de
selecie
N n
S
n
1
N 1
N
n
Dac raportul dintre colectivitatea de selecie i cea general (n/N) < 0,2,
adesea n calcule factorul
N n
nu se mai ia n consideraie.
N 1
De aici rezult un paradox care arat c erorile sondajelor care cuprind o parte
nensemnat din colectivitatea general depind numai de numrul absolut al variaiilor
colectivitii de selecie i de mrimea abaterii medii ptratice a colectivitii generale.
De altfel, precizia estimaiei mediei m a colectivitii generale prin media x a
colectivitii de selecie depinde foarte puin de volumul N al colectivitii generale;
aceast precizie depinde mult mai mult de valoarea absolut a volumului n a
eantionului.
Cnd volumul eantionului (n) crete, precizia crete de aproximativ n ori,
dup cum n aproximativ acelai raport se micoreaz abaterea mediei ptratic a
mediei de selecie. Aceast dependen a abaterii medie ptraticea mediei de selecie
de volumul colectivitii de selecie d posibilitatea utilizrii n practic a unor sondaje
nu foarte mari ca volum, deoarece creterea cu puin a volumului colectivitii de
selecie nu influeneaz cu aproape nimic precizia.
Concluzie: dac volumul N al colectivitii generale este foarte mare, i
volumul n al colectivitii de selecie este foarte mic, atunci expresia:
N n
1
N 1
N n
1 , motiv pentru care eroarea
N 1
sondajului nerepetat va fii totdeauna mai mic dect eroarea sondajului repetat sau cu
revenire.
Acest lucru se explic prin faptul c revenirea acelorai uniti n sondaj
nrutete reprezentativitatea, apariia repetat n urna lui Bernoulii a aceleiai uniti
ducnd la o pierdere substanial de informaii.
n general eroarea de
reprezentativitate a
Adugnd acestor avantaje i faptul c extracia nerepetat se realizeaz mai
extragerii fr revenire este uor din punct de vedere organizatoric rezult evantaiul complet al argumentelor care
mai mic dect cea a
determin ca n practic sondajul nerepetat s fie mai utilizat dect cel repetat.
extraciei cu revenire.
n ultima instan se remarc faptul c precizia sondajului, eroarea medie a
acestei precizii depinde nu de proporia de sondaj n/N, ci de volumul n al sondajului,
2 fiind o constant.
1 n
( xi x) 2 ; unde x i x reprezint abaterile
n i 1
individuale ale valorilor colectivitii de sondaj xi fa de media lor x .
Pentru un sondaj repetat, dispersia S 2 este un estimator deplasat al dispersiei
2
a colectivitii generale.
Aplicnd regulile de calcul ale dispersiei i introducnd m al colectivitii
generale de obine:
1 n
S ( xi m) 2 ( x m) 2 ceea ce arat c S2 este un estimator deplasat,
n i 1
utilizarea lui comportnd anumite riscuri referitoare la eroarea de reprezentativitate.
Un estimator nedeplasat, mai exact se obine n cazul sondajelor de volum
n
1 n
S 2
S2
redus cu formula:
( x i x) 2
n 1
n 1 i 1
Dac volumul colectivitii de selecie este mic, sub o zecime, sau chiar mai
mic, atunci acest estimator pentru dispersia colectivitii generale este mult mai realist,
mai aproape de valoarea real a acesteia.
2
Concluzie: n cazul sondajului nerepetat, dispersia medie de sondaj x poate fii
numit dispersia de sondaj:
S2
S
n
; b) x
S2
S
; b) 2x , iar abaterea media
n
n
S
n
echivalent
cu P ( x m x ) 1
( x , x ),
Intervalul
care acoper parametrul mediu m cu o probabilitate
dat P se numete interval de ncredere pentru media m.
n vederea stabilirii acestui interval se precizeaz c variabila de sondaj
xm
are
x
o repartiie normal.
Fie urmtoarele 2 cazuri:
a) dac eantionul este extras dintr-o populaie cu o distribuie normal cu
media m i dispersia 2
b) dac eantionul este extras dintr-o populaie oarecare dar volumul n a
eantionului este suficient de mare, iar dispersia 2 a colectivitii
generale dac este necunoscut, este estimat cu dispersia de sondaj.
77
n aceste condiii
P ( x m ) P ( x m )
xm
x
x
x
) 1
xm
2
1;
x
x
x
x
no tan d
z z x
x
2 z 1
, de
z 2 2
.
2
2
max
xl
min
x
2
max
2
Pentru caracteristicile binare 2max f (1 f ) 0,5(1 0,5) 0.25
unde f este
P 1 P
P f z
n
P 1 P
n
z f n
n
N 1
N 1 2 z2 P1 P
Cu aceast formul se calculeaz volumul colectivitii de selecie pentru
caracteristica alternativ n cazul unui sondaj aleator nerepetat.
79
selecia statistic
Sunt 2 dintre cele mai importante i frecvent ntlnite probleme din sfera seleciei
aplicate, rezolvarea lor presupunnd vehicularea unui numr mare de informaii care
acoper practic cea mai mare parte a problematicii specifice seleciei statistice.
Intervalul de ncredere este intervalul n care se cuprinde cu o anumit
probabilitate, media colectivitii generale, dar dac acest interval este calculat numai
pe baza datelor obinute din eantionul selectat.
n vederea determinrii acestui interval sunt necesare ns i o serie de date
ale colectivitii generale, cunoscute eventual dintr-o observaie anterioar.
Intervalul de ncredere este de forma: m [ x x z ; x x z ]
Aici, m este media colectivitii generale, x - este media colectivitii eantionului
de selecie ,x abaterea medie ptratic,
z argumentul funciei de distribuie Gauss-Laplace pentru o probabilitate dat.
- de obicei avem: = 1% sau 1,5%
1 - = p (probabilitatea cu care apreciem c ceea ce facem e adevrat)
1 - = p = ( z )
Funcia Gauss-Laplace este tabelat, i ntre probabilitatea p care este valoarea
funciei, i argumentul z , exist o coresponden biunivoc. Cunoscnd una, o
scoatem pe cealalt.
n vederea determinrii intervalului de ncredere trebuie cunoscute dintr-o
selecie anterioar urmtoarele date:
- volumul colectivitii generale N;
- eventual dispersia acestei colectiviti;
Determinarea acestui interval depinde de tipul colectivitii de selecie
utilizat , deoarece abaterea ptratic x se ajusteaz diferit de la o metod la alta.
Exemplu: Pentru a stabili
Rezolvare:
determinarea intervalului de ncredere presupune parcurgerea
urmtoarelor etape:
1. Determinarea metodei de eantionare utilizat sondajul aleatoriu nerepetat
2. Determinarea volumului colectivitii generale, N=550
75
x
i 1
75
17,449
1 n
2
4. Determinarea dispersiei colectivitii de selecie S
( xi x) 2 0,6197
n 1 i 1
5. Determinarea abaterii mediei ptratice a mediei de sondaj; n acest scop se
utilizeaz
formula
de
calcul
specific
seleciei
x
S
N
N n 0,6197
N 1
550
550 75
0,08455
550 1
P=99% = ( z ) = 2,58.
7.Calcularea intervalului de ncredere:
19,479]
m [ x x z ; x x z ]
m [15,418;
nerepetat:
N 2 z2
( N 1) 2 2 z
59,44 n 60 lampi
este
suficient
N 2 z2
( N 1) 2 2 z
11.4 Rezumat
Unitatea de invatare Nr.11 prezinta metodele de estimare ale mediei i dispersiei n
sondajul aleator simplu repetat i nerepetat, precum i de evluare a preciziei acestor
estimri.
82
83
83
86
86
86
12.2 Coninut
Capitolul 12
83
d) dup expresia analitic : legturi liniare exprimate printr-o funcie de gradul I i legturi
neliniare exprimate printr-o funcie hiperbolic, .a;
e) dup timpul n care se produce legtura:
legturi concomitente sau sincrone n care variaia caracteristicii rezultative se produce
concomitent cu cea a caracteristicii funcionale;
legturi asincrone sau cu decalaj n care variaia caracteristicii rezultative se produce la un
anumit interval de timp fa de variaia factorului .
84
xn xn-1 x2 ,
x1
fmn fm,n-1
0
fm-1,n-1
f22
f11
D1
D2
Astfel dac frecvenele se grupeaz n jurul primei diagonale D1, legtura este invers; iar
dac se grupeaz n jurul diagonalei D2, legtura este direct.
D. Graficul de corelaie (numit i corelogram sau graficul norilor de puncte).
Este un grafic obinuit format dintr-un sistem de axe rectangulare, caracteristica factorial
fiind trecut pe axa absciselor i rezultativ pe axa ordonatelor.
Fiecare coresponden ntre x i y se numete unitate i se reprezint printr-un punct.
85
y
**
**
**
*
x
Dac punctele se distribuie aproximativ n jurul primei diagonale, atunci legtura este
direct, iar dac se distribuie n jurul celei de-a doua, legtura estre invers.
Distribuirea aproximativ uniform n tot cadranul arat fie absena legturii, fie neconsistena
datelor.
Corelograma este cea mai apropiat de adevr dintre toate metodele elementare de
caracterizare a legturilor dintre variabile.
12.3 Test de evaluare
Test de autoevaluare 12.1
Explicai care este opinia dumneavoastr asupra fiecrei tip de legtur prezentat n
unitatea de nvare.
12.4 Rezumat
Unitatea de invatare Nr.11. prezinta existena legturilor dintre variabilele
economice, dar mai ales msurarea intensitii acestor legturi rmn dou dintre
principalele obiective ale statisticii practice. Din acest motiv, nelegerea conceptului
de legtur statistic, prezentat pe larg n debutul acestui capitol, precum i a
diversitii legturilor statistice posibile , sunt eseniale pentru ntregul demers viitor.
Dup o scurt trecere n revist a metodelor elementare, mai mult intuitive, de
caracterizare a legturilor dintre variabile, este prezentat metoda regresiei, pe
exemplul concret al regresiei de tip liniar, dar cu scurte introspecii i n alte tipuri de
regresie. n final, sunt reliefai indicatorii statistici ai corelaiei (raportul i
coeficientul de corelaie), insistndu-se i pe metodele neparametrice i parametrice
de verificare a semnificaiei ecuaiei de regresie, coeficienilor de corelaie i
intensitii legturilor dintre variabile n general.
86
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs
87
13.2 Coninut
Capitolul 13
+x
Acest model teoretic se estimeaz printr-o ecuaie medie de tendin: y=a+bx+, apare sub
forma y x a bx .
n acest caz, a i b sunt coeficieni care se calculeaz cu ajutorul metodei anulrii
determinanilor sau cu ajutorul metodei anulrii derivatelor de ordinul I, formulele care rezult n
urma calcului fiind relativ simple. Acest model este specific tipului de legtur dintre 2 caracteristici
care se modific n progresie aritmetic.
Cunoscnd coeficienii a i b ai ecuaiei de regresie se poate determina oricnd valoarea lui y
n funcie de valoarea variabilei independente x: y a b x .
Coeficientul a reprezint ordonata la origine, semnificnd valoarea lui y cnd x =0. Poate lua
att valori pozitive ct i negative.
Coeficientul b se mai numete i coeficient de regresie i arat msura n care se modific
valoarea caracteristicii dependente y n cazul n care caracteristica independent se modific cu o
unitate.
Dup semnul coeficientului de regresie exist 2 tipuri de legtur i anume:
- corelaie direct cnd coeficientul de regresie are valoare pozitiv( b>0);
- corelaie invers cnd coeficientul b are valoare negativ (b<0)..
Dac b=,0, x i y sunt variabile independente. Se mai spune din matematic despre
coeficientul de regresie c indic panta liniei drepte rezultat prin ecuaia de regresie.
Cu ajutorul coeficienilor a i b se calculeaz valoarea ecuaiei de regresie, mulimea acestor
valori numindu-se i mulimea valorilor teoretice ale caracteristicii y n funcie de x, iar operaia
de nlocuire a termenilor reali y cu valorile ecuaiei de regresie se numete ajustare.
Cnd legturile dintre fenomenele i procesele economice i sociale se fac prin intermediul
unui numr mare de date, intervin frecvenele absolute, ceea ce impune, n vederea calculrii
parametrilor economici de regresie, folosirea tabelului de corelaie, tabel din care se scot i se
introduc n sistemul de ecuaii frecvenele dup valorile x ( fx), frecvenele dup valorile y ( fy) i
frecvenele corespunztoare perechilor x i y (fxy).
Acest caz ,considerat general, duce la urmtorul sistem de ecuaii
a f xy b xf x yf y
2
a xf x b x f x yf x f y
Notnd cu y=lgy, a=lga i b=lgb y=a+bx de unde s-a ajuns la modelul liniar (aceasta fiind
ecuaia unei drepte)
Sistemul de ecuaii normale dup care se calculeaz a i b este acelai din modelul liniar, iar
dup determinarea parametrilor a i b se ajunge la parametrii iniiali a i b prin operaia de
antilogaritmare.
89
Exist o serie de curbe care nu se pot transforma nici cu largi aproximaii ntr-o dreapt , aa
cum s-a procedat n cazul modelului exponenial. Apar astfel parabole i hiperbole care se modeleaz
diferit.
a3) modelul teoretic al parabolei de gradul II.
y=+x+x2
Y=a+bx+cx2
Parametrii a, b, i c se calculeaz folosind tot metoda celor mai mici ptrate, anulnd
2 2
derivatele de ordin 1 i 2, minimiznd n esen funcia: ( y i a bx i cxi ) .
na b xi c xi2 y i
rezolvnd sistemul.
2
3
a x i b x i c x i x i y i
; a , b i c se scot
2
3
4
2
a xi b xi c xi xi y i
a4) n cazul n care legturile dintre fenomenele economice sunt de forma unei hiperbole
(dac dependena dintre cele dou variabile este invers), ecuaia de regresie se exprim dup
formula:
1
, corespunztor funciei de estimaie teoretic:
x
1
Y a b
x
y
1
na
b
yi
xi
a 1 b 1 1 y
i
xi
xi
x2
; a i b se
a5) modelul logaritmic, dat de expresia y=+log x care se estimeaz dup modelul teoretic
Y=a+blogx+ reinndu-se urmtoarele cazuri:
-
90
Folosind
metoda
celor
na b log xi y i
mai
mici
ptrate
rezolvnd
sistemul
de
ecuaii
normale:
2
a log xi b (log xi ) y i log xi
neinclui n model iar ai, i=1,n se numesc coeficieni de regresie multipl i arat influena
caracteristicii factoriale asupra caracteristicii rezultative.
i n acest caz parametrii a0, a1, ap, se calculeaz pe baza metodei celor mai mici ptrate.
Sistemul la care se ajunge dup minimizarea funciei va fii un sistem cu p+1 ecuaii i p+1
necunoscute de forma:
a 0 n a1 x1 a 2 x 2 ... a p x p y
2
a 0 x1 a1 x1 a 2 x1 x 2 ... a p x1 x p x1 y
2
a 0 x 2 a1 x1 x 2 a 2 x 2 ....
2
a
x
a
x
x
a
x
x
...
a
x
0
p
1
1
p
2
2
p
p
p xp y
Legtura multifactorial liniar se poate reprezenta grafic sub forma unui plan. Fiecare din aceste
ecuaii d o dreapt. Intersecia acestor drepte va furniza o suprafa, soluia fiind pe marginea
acestuia.
Se
x1
utilizeaz
x2
practic
un
model
xp
multifactorial
exponenial
de
forma:
y a 0 a1 a 2 ...a p , care, prin logaritmare se transform ntr-un model liniar care se rezolv
conform procedeului anterior.
91
Venitri lunare ce
revin n medie pe
persoan(x)
mii lei 72
99
85
118
192
109
134
125
115
161
175
182
190
136
148
2041
Cheltuieli
lunare pe
persoan (y)
- mii lei 32
38
40
55
62
41
54
59
60
63
65
70
71
55
56
822
Xi2
Xiyi
297855
117504
13.4 Rezumat
Unitatea de nvare nr.12 prezint metoda regresiei liniare i succint regresia
multiliniar. In cadrul regresiei liniare sunt prezentate metoda i metodologia de
calcul a coeficienilor de regresie.
13.5 Bibliografia Unitatii de invatare Nr.13
92
Agresti, Allan (1990) Categorical Data Analysis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs
DINTRE
VARIABILELE
93
93
100
101
102
14.2 Coninut
Capitolul 14
MSURAREA INTENSITILOR LEGTURILOR DIINTRE
VARIABILELE ECONOMICE
94
xi x
;
x
zy
yi y
y
rxy
(x
i 1
x)( y i y )
nxy
rxy
i 1
i 1
n xi y i xi y i
i 1
2
n 2 n
n x x i n y i y i
i 1 i 1
i 1
i 1
Cnd intervin seriile de distribuie cu frecvene absolute aceast relaie
devine:
n
2
i
rxy
n f xy xi y i
x
f xi
y
y
n x f xi xi f xi n y i2 f yi
x
x
y
2
i
95
f yi
y
y
f yi
x
y
(y Y )
( y y)
i
xi
sau 1
(Y
(y
xi
y) 2
y) 2
2
y /Y
2
y /Y
( y y)
(y Y)
(Y y)
din aceast relaie rezult valoarea calculat a coeficienilor, care se poate nota
astfel:
2y / Y
2y
sau 1
Y2 / y
2y
acest
caz
dispersiile
au
urmtoarele
semnificaii:
2
- y - este dispersia total i msoar aciunea factorilor, luai n totalitatea lor,
care au influenat variabila rezultativ.
2
- y / Y - msoar variaia valorilor y sub influena celorlali factori, a cror
aciune este considerat constant. Se mai numete i dispersie rezidual.
2
raport este mai apropiat de 1 corelaia este mai puternic, iar cu ct raportul este mai
aproape de 0, corelaia este mai slab (se pierde).
d) raportul de corelaie multipl.
Msoar intensitatea legturii dintre o caracteristic rezultativ y i 2 sau mai
multe caracteristici factoriale notate cu x1, x2, .... xi ,....i = 1,p.
Se noteaz cu
R x1, x 2, xp
( y1 Y
1
y y)
x1, x 2 ,.. xp
2
)2
i
2
yi n
multipl are totdeauna valori pozitive i este mai mare dect oricare coeficient de
corelaie simpl: R ry , xi , i 1, p
Ptratul coeficientului de corelaie multipl este cunoscut sub numele de
coeficient de determinaie multipl; se noteaz cu R2 i exprim ponderea cu
care influeneaz caracteristica factorial asupra caracteristicii rezultative.
Ponderea pe care o au ceilali factori asupra caracteristicii rezultative se
obine ca diferen ntre unitate (1) i R2, obinndu-se n felul acesta coeficientul de
nedeterminaie multipl , notat cu N2=1-R2
Pe lng coeficienii de corelaie simpl i multipl, care caracterizeaz
intensitatea corelaiei liniare ntre 2 sau mai multe caracteristici se pot calcula i
coeficienii de corelaie parial. Aceti coeficieni caracterizeaz intensitatea
legturilor dintre 2 caracteristici n condiiile n care variabila rezultativ este
influenat de mai muli factori, dar influena celorlali factori este considerat
constant.
Coeficienii de corelaie parial se calculeaz pe baza coeficienilor de
corelaie liniar simpl. Astfel coeficienii de corelaie parial dintre caracteristicile y
i x1, y = f(x1,x2) n condiiile eliminrii influenei lui x2 se noteaz cu:
ry , x1x 2
ryx 2 ryx1rx 2 x1
(1 ryx2 1 )(1 rx22 y1 )
(y Y)
a
s
n n care
n2
a t qf
a t qf
intervalul [a t qf
n
s
; a t qf
invalidat.
Acelai criteriu t se aplic i pentru verificarea ipotezei c b coeficient de
t calc
b
( x i x) 2 .
b t qf
( xi x)
; b t qf
( xi x)
1
Y y t qf s
( xi x ) 2
( xi x)
; y t qf s
( xi x) 2
( xi x)
( y y)
n 1
Y2 / y S 1
2
2y / Y S 2
(y Y)
n f 1
n aceste relaii n, este numrul valorilor observate ale caracteristicii y iar f este
numrul coeficienilor ecuaiei de regresie liniar.
Pentru verificarea semnificaiei coeficienilor corelaiei simple i pariale se
folosete tot testul t:
t calc
r
1 r2
1.
2.
3.
200
215
230
Y1=16,58+0,58 . 200
Y2=16,58+0,58 . 215
Y3=16,58+0,58 . 230
( yi Y )
1
( yi y)
Rxy
Yx 16,585 0,28.xi;
0,89
y 54,8
( xi x)( yi y ) Pentru
nx y
evita
calcularea
unor
indicatori
intermediari, abateri medii ptratice i cele dou medii ale variabilelor, n practic se
utilizeaz:
rxy
n xiyi xi yi
2
n x xi n y i2
2
i
yi
n = 15
rxy = 0,89
n cazul corelaiei liniar simpl, raportul de corelaie este egal cu coeficientul
de corelaie, fiind cuprins ntre 0,75 i 0,95. Coeficientul de corelaie arat o legtur
puternic de tip liniar i direct ntre venituri i cheltuieli. De altfel reprezentativitatea
acestui coeficient poate fii demonstrat aplicnd testul t bazat pe funcia de
distribuie Student.
Aceast funcie este tabelat pentru un anumit nivel de semnificaie i un
numr egal cu n-2 grade de libertate. n funcie de i n-2 se gsete argumentul t al
funciei Student din tabel. Aceast valoare se compar cu un t calculat
rxy
1 rxy2
n2
.
Dac t calculat este mai mare dect t tabelat, valoarea coeficientului de
corelaie este reprezentativ pentru analiza legturii dintre cele 2 variante.
t calculat = 7,037
t tabelat = 0,05 ( 13 grade de libertate).
Rezult c valoarea coeficientului de corelaie este reprezentativ.
100
50
100
150
200
250
na b xi yi
2
a xi b xi xi yi 2041a 297855b 117504
a = 16,58, b = 0,28
folosim metoda lui Cramer: Y = 16,58 + 0,28bxi
Ex. S se estimeze cheltuielile totale efectuate de 3 familii care au urmtoarele
venituri:
Nr.
crt.
Venituri
14.4 Rezumat
Unitatea de invatare Nr.13. prezint principalele posibilitati de calcul a intensitii
legturilor dintre raportul i coeficientul de corelaie precum i modalitatea de
estimare a semnificaiei logico-economice a indicatorilor calculai din prisma
probabilistic.
Agresti, Allan (1990) Categorical Data Analzsis, New York, John Wiley&Sons;
Jakobz, W.G. (1991) Data Theory and Dimensional Analysis, Sage University
Paper Series on Quantitative Applications in the Social Science, Newbutz Park, CA,
Sage;
Rotariu, Traian (1994) Curs de metode si tehnici de cercetare sociologica, ClujNapoca, Universitatea Babes-Bolyai.
Sptaru, Liviu Note de curs
102