Documente Academic
Documente Profesional
Documente Cultură
CAPITOLUL 2
CULEGEREA I PRELUCRAREA DATELOR DE SONDAJ
Obiective : nsuirea de ctre studeni a tehnicilor de sondaj, a calculului i
interpretrii indicatorilor de sondaj de repartiie i evoluie , precum i a
calculului i interpetrii indicilor statistici .
Coninut :
2.1 Populaii statistice i sondaje
2.2 Indicatori de sondaj de repartiie
2.2.1 Cazul sondajului de volum mic (n < 30)
2.2.2. Cazul sondajului de volum mare (n > 30)
2.3 Indicatori de sondaj de evoluie
2.3.1. Cazul msurtorilor simple n timp
2.3.2 Cazul msurtorilor multiple n timp
2.4 Rezumat
2.5 ntrebri
2.6 Bibliografie
Cuvinte cheie : populaie statistic , sondaj simplu repetat i nerepetat,sondaj
stratificat tipic,proporional i optim , indicatori de sondaj de repartiie / evoluie ,
indici staistici individuali i sintetici .
2.1 Populaii statistice i sondaje
Populaia statistic este o mulime de exemplare care aparin aceleiai familii i care
fac obiectul cercetrii statistice.
Cercetarea statistic poate fi complet sau exhaustiv (pentru toate exemplarele
populaiei) de tip referendum sau recensmnt sau poate fi parial sau selectiv de tip
sondaj (eantion, prob, sondaj de opinie) (pentru o parte reprezentativ din exemplarele
populaiei).
Exemple de populaii statistice n agricultur: plantele unei culturi ntr-o parcel,
animalele unei ferme zootehnice, mainile agricole care deservesc o suprafa arabil, fermele
vegetale sau zootehnice dintr-un jude, unitile de prelucrare a produselor agricole (mori,
fabrici de ulei, zahr, produse lactate, mezeluri, abatoare, etc.), magazinele care
comercializeaz produse alimentare, reeaua de case de agroturism, reeaua de uniti de
alimentaie public, etc.
Fiecare exemplar al populaiei statistice are o serie de nsuiri cantitative
(msurabile) sau calitative (atributive) notate X, Y, Z, sau X1, X2, , Xn pe care le vom
numi n continuare i caractere.
Pentru populaiile statistice din agricultur, nsuirile admit i alte clasificri:
- dup natur: nsuiri biologice, tehnologice, economice, ecologice;
- dup modul de exprimare numeric: nsuiri bivalente (0 sau 1), ntregi i reale
(fracionare);
- dup modul de apreciere: nsuiri primare (numai msurabile) i nsuiri
derivate (msurabile sau calculabile);
n
(%) se numete cot de
N
n
75
1 : 1000 plante.
N 75000
n1 n
n
;
k
n1
n
n
N
N
... k
deci n1 n 1 ,..., n k n k
N1
Nk N
N
N
n
n1
n
... k
N1 1
N k k N i i
deci
N11
N
,..., n k n k k
Nii
Nii
Aici
1,
k sunt abaterile standard ale exemplarelor din straturi n raport cu
caracterul X ca variabil aleatoare (vezi cap. 2).
Observm c pentru N1 = = Nk =
pentru
= =
N
sondajul tipic i cel proporional coincid iar
k
N1
N
p1 ,..., k p k deci pentru tipurile de sondaj
N
N
n1 = = nk =
n
;
k
250
15 miei i n3 = n n1 n2 = 3 berbeci;
1000
c) Pentru sondajul optim Ni i = 700x1 + 250 x 0.8 + 50x2 =1000 aa c: n1 =
700 1
250 0.8
60
42 mioare; n2 = 60
12 miei i n3 = n n1 n2 = 6 berbeci.
1000
1000
n2 = 60
n1 X 1 ... nk X k
n1 ... nk
media ptratic:
X12 ... X 2n
X 2
n
1
2
Avem X a X g X .
Dac X1,,Xn sunt depuse n celulele A1:An din coloana A n EXCEL
media X este dat de funcia EXCEL scris n celula B1 : = AVERAGE(A1: An) ,
media geometric X g este dat de funcia EXCEL scris n celula B2 : = GEOMEAN
(A1:An) iar media armonic X a este dat de funcia EXCEL scris n celula B3 : =
HARMEAN (A1:An) .
II. Mediana Me este acea valoare fa de care jumtate din numrul valorilor de
sondaj sunt mai mici ca ea i cealalt jumtate din numrul valorilor de sondaj sunt mai mari
ca ea.
Aranjm datele de sondaj n ordine cresctoare: x1 < x2 < < xn.
1
Me X k 1
2
xi X
xi
2
n este variaia ptratic total SPA = (xi - X )
n 1
n 1
raportat la numrul gradelor de libertate GL = n 1.
Datele de sondaj X1, , Xn sunt independente dar satisfac o relaie de dependen:
xi = n . X i de aceea avem GL = n 1 .
IV. Abaterea - standard
V S2
xi X
min
1) Coeficientul de variabilitate c este o valoare mrginit (cuprins ntre X 100 i
max
a max
100 ).
X min
I)
II)
III)
S2
IV)
448
49.8 g 2
10 1
S 49.8 7 g / plant
V)
7
14%
50
Xi
Xi- X
(Xi- X )2
Xi X
S
40
42
45
45
48
51
54
57
58
60
500
-10
-8
-5
-5
-2
1
4
7
8
10
0
100
64
25
25
4
1
16
49
64
100
448
-1.43
-1.14
-0.71
-0.71
-0.29
0.14
0.57
1.00
1.14
1.43
-
151 175
176 200
201 400
401 600
601 800
801 1000
1001 2000
2001 3000
3001 4000
4001 5000
11
12
13
14
15
16
17
18
19
20
X max X min
.
nr. clase de valori k
Centrul clasei de valori Ci , notat cu xi, este mijlocul clasei adic media aritmetic a
valorilor extremitilor clasei Ci.
Centrul clasei xi aproximeaz toate valorile de sondaj n clasa Ci, fiind reprezentantul
acestor valori.
Frecvena absolut ni a valorilor de sondaj ntr-o clas de valori Ci este numrul
datelor de sondaj care cad n clasa respectiv, valori aproximate prin centrul clasei xi.
Frecvena relativ (procentual)fi a valorilor de sondaj ntr-o clas de valori Ci este
fi
astfel:
ni
n
l *
xi ; ni
2
n
;
2
xi
l
2
10
III)
Modul de sondaj:
Clasa modal Mo este acea clas Ci cu ni maxim. Modul Mo se determin grafic n clasa
modal cu ajutorul histogramei :
n 1 i 1
n 1 i 1
11
VI)
S
100
X
1 k X X
A ni i
n i 1
S
1 k
niU i3
n i 1
VII)
1 k X X
B ni i
n i 1
S
1 k
4
niU i
n i 1
12
deoarece f i 1
k 1
Pentru concentrarea maxim avem S= 1 / (k)1/2 iar pentru diversificarea
maxim avem S = 0 .
Abaterea-standard corectat :
S
13
S k .S
k fi 2 1
[0;1]
k 1
este un indicator al concentrrii structurii pe componente i se poate exprima n
procente.
Entropia structurii este dat de relaia :
H
f .l og
i
fi
i=1
k
1
fi .l og2 fi
l og 2 k i 1
k f i gi 1
(k f i 2 1)(k g i2 1)
[1;1]
k fi gi 1
k fi 2 1
f f g
k f 1
2
14
economice n anul de baz i (g1,,gk ) este structura de venituri sau cheltuieli a aceleiai
uniti n anul curent , R msoar gradul de stabilitate a structurii n timp .
Dac caracterul X are numai valori ntregi, datele de sondaj de volum mare (n > 30) se
pot grupa pe valori distincte Xi cu frecvenele absolute ni sau se poate alege un numr de
clase k astfel ca lungimea l a claselor s fie numr ntreg deci i limitele claselor s fie numere
ntregi.
Exemplu
Fie o populaie statistic de plante de porumb la recoltare de pe 1 ha cu volumul
populaiei N = 75000 plante recoltabile. Pentru a studia greutatea boabelor pe plant X n
grame, efectum un sondaj reprezentativ de n = 50 plante deci cota de reprezentare
n
50
1 : 1500 plante.
N 75000
15
Poligonul frecvenelor :
Cumulata :
I) Media de sondaj:
1
X 5 40 9 46 21 50 9 54 6 58 50.16 g/plant
50
II) Mediana de sondaj Me = 50 g
III) Modul de sondaj Mo = 50 g
IV) Abaterea standard de sondaj:
S
1
2
2
2
2
2
5 42 50.16 9 46 50.16 21 50 50.16 9 54 50.16 6 58 50.16 =
49
16
4
4.46 g
12
4.5
9%
50.16
50 4.5
VII) Coeficientul de boltire de sondaj:
B
1
4
4
4
4
4
5 42 50.16 9 46 50.16 21 50 50.16 9 54 50.16 6 58 50.16 =2.41
4
50 4.5
VIII) Coeficientul de concentrare de sondaj:
28.6 %
5 1
Desigur indicatorii X , Me, S, c puteau fi calculai i din cele n = 50 valori de sondaj
nainte de gruparea datelor.
Dac X este nsuire calitativ (atributiv), facem convenia:
1, Exemplarul i are nsuirea X
xi
0, n rest
Efectum un sondaj de volum n deci datele de sondaj vor fi un numr de n cifre egale
cu 0 sau cu 1. Fie k numrul cifrelor Xi = 1 (1 < k < n). Media de sondaj devine f
k
0;1 ,
n
k 6
12%
n 50
17
Dac nsuirea X ia valori ntregi, datele unui sondaj extras din populaie la
momentele de timp t1, t2, , tn sunt valori instantanee x1, , xn msurate n acele momente
de timp.
Dac nsuirea X ia valori reale, datele unui sondaj extras din populaie n intervalele
de timp [t1, t2), [t2, t3), , [tn-1, tn] sunt valori medii x1, , xn msurate n acele intervale de
timp cu lungimile t2-t1, t3-t2, , t n t n 1 .
Exemplu
X = efectivul anual de vaci al unei ferme zootehnice se msoar prin valori instantanee
(la 31 decembrie al anului calendaristic).
X = producia anual de lapte al vacilor dintr-o ferm zootehnic se msoar prin
valori medii pe perioada 1 ianuarie 31 decembrie a anului calendaristic sau pe perioada
medie de lactaie normal de 308 zile.
Msurtorile sunt echidistante dac t2t1 = t3t2 = = tn-tn-1 i neechidistante n caz
contrar.
Exemplu de msurtori echidistante
Producia de lapte a vacilor se controleaz echidistant din 28 n 28 zile astfel c ntr-o
lactaie normal de 308 zile se efectueaz 11 controale ale produciei de lapte.
Prezentarea grafic a datelor de sondaj de evoluie instantanee se face prin poligonul
valorilor n raport cu axele (ti, xi) iar a datelor de sondaj de evoluie se face prin cronograma
n raport cu axele ([ti, ti+1), xi).
Indicatori statistici de sondaj de evoluie
I) Media cronologic
Dac X se msoar prin valori instantanee x1, , xn la momentele de timp t1, , tn
avem:
(1) X C
x1 t 2 t1 x 2 t 3 t 2 ... x n 1 t n t n 1
t n t1
Dac X se msoar prin valori medii x1, , xn n intervalele de timp [t1, t2), [t2, t3), ,
[tn-1, tn] avem:
x1 x 2
t 2 t1 x 2 x 3 t 3 t 2 ... x n 1 x n t n t n 1
(2) X 2
2
2
m
t n t1
n cazul msurtorilor echidistante n timp, avem t2 - t1 = t3 t2 =, ,= t n t n 1 = d i
t n t1 = (n 1 ).d deci :
(3) X C
X1 X 2 ...X n 1
respectiv:
n 1
X1
X
X 2 ... X n 1 n
(4)
2
Xm 2
n 1
Dn 1
x 2 x1 t 2 t1 x 3 x 2 t 3 t 2 ... x n x n 1 t n t n 1
t n t1
18
P
1
D
m m 1
D Q de unde
2
D 2X1 D 2X1 8DQ
mX1
2D
adic numrul de perioade de timp n care se acumuleaz cantitatea final Q a
caracterului X respectiv n care se consum cantitatea iniial Q a caracterului X.
III) Ritmul mediu procentual(relativ) de evoluie
Abaterile procentuale ale datelor de sondaj consecutive sunt:
X
X
X
I1 2 , I 2 3 , ..., I n - 1 n
X1
X2
X n 1
Ritmul mediu procentual de evoluie a datelor de sondaj va fi:
1
tn tn 1 t t
t2 t1
t3 t 2
n 1
Xn
X 3
(7) I X 2
...
X 1
X 2
X n 1
Dac logaritmm relaia precedent, obinem:
logX 2 log X 1 t2 t1 ... logX n log X n1 tn tn1
(8) log I
tn t1
deci logaritmul lui I este ritmul mediu valoric de evoluie al valorilor de sondaj
logaritmate.
Dac msurtorile sunt echidistante avem:
t2 - t1 = t3 t2 = = t n t n 1 = d iar tn t1 = (n 1).d deci avem :
log X n log X 1
log I
adic :
n 1
(9)
X
I n
X 1
1
n 1
19
I m 1
Q de unde
I 1
Q
log I 1
1
X 1 adic numrul de perioade de timp n care se acumuleaz cantitatea
m
log I
final Q a valorilor caracterului X respectiv n care se consum cantitatea iniial Q a valorilor
caracterului X.
Exemplu
Fie X = greutatea porcilor la ngrat (kg).
Fie ti vrsta n zile a porcilor.
Se fac n = 10 controale echivalente din 28 n 28 zile.
ti
28
56
84
112
140
168
196
224
252
280
xi(g/zi)
12
26
42
60
78
94
107
117
120
Se cer X , D, I.
Soluie
1
1
X 1 X 2 ... X n 1 X n
kg
2
X 2
66.4
n 1
log X n log X 1
X n X1
D
13 kg; log I
0.178 deci I = =100.178 =1.57
n 1
n 1
2.3.2. Cazul msurtorilor multiple n timp
Fie o populaie statistic pentru care studiem evoluia caracterului X.
Extragem m exemplare independente din populaie pe care msurm caracterul X n n
momente de timp t1, , tn.
Datele de sondaj au forma:
Timp
Nr.
1
2
t1
t2 ...tn
Medii cronologice
X Ci
X C1
X C2
20
m
Medii de
sondaj X j
.
xm1 xm2 .. xmn
X 1 X 2 . X n
X Cm
X
XC
1 1
X1 X 2 t 2 t1 ... 1 X n 1 X n t n t n 1
t n t1 2
2
1
X 2 X1 t 2 t1 ... X n X n 1 t n t n 1
t n t1
tn t1
Pentru evoluia caracterului X n timp avem pentru exemplarul de sondaj numrul i
media de evoluie:
X Ci
1 1
X i1 X i 2 t 2 t1 ... 1 X i, n 1 X in t n t n 1
t n t1 2
2
m 1 i 1
S
100 (%)
X
Exemplu
X = greutatea porcilor la ngrat (kg).
Fie tj numrul de zile trecute de la data ftrii porcilor pn la data controlului numrul
j.
Se fac n = 10 controale echidistante de 28 zile la m = 5 porci. Data de sondaj:
tj
Repetiia C
1
2
3
4
5
28
56
84
112
140
168
196
224
252
280
3
3
3
4
3
12
13
12
13
12
26
27
25
27
25
42
43
41
43
41
60
61
59
61
59
78
78
77
77
78
94
94
94
92
96
104
106
109
104
111
117
115
118
112
121
120
118
122
115
125
Medii
cronologice
X Ci
66.4
66.4
66.4
65.4
67.4
21
Medii sondaj
Xj
3.2
12.4
26
42
60
77.6
94
107.4
116.6
120
X
=66.4
X C=66.4
22
II. n multe situaii ntlnim caractere Z compuse din rapoarte(rate) ale altor caractere
X,Y : Z=X /Y cu valori diferite : Z0=X0 / Y0 respectiv Z1=X1 / Y1 .
Exemple:
- Rata profitului = Profit / Cheltuieli ;
- Costul unitii de produs = Cheltuieli cu produsul / Producia fizic ;
- Rata omajului = Numr omeri / Numr persoane active .
n acest caz putem calcula :
D(Z)=Z1 - Z0 ; I(Z)= Z1/ Z0 ; R(Z)=D(Z) / Z0 .
Avem relaiile :
I(Z)=I(X /Y)=I(X) / I(Y) ; R(Z)=R(X / Y)=I(X) /I(Y)-1
Avem i mrimile :
- rata medie : PM(Z) = Z0 = X0 / Y0
- rata marginal : PD(Z) = (X1- X0) / (Y1 Y0) = D(X) / D(Y)
- elasticitatea ratei : EP(Z) = PD(Z) / PM(Z) = R(X) / R(Y)
Indicii statistici sunt numere relative rezultate din compararea valorilor unui indicator
statistic la diferite momente de timp,n locuri diferite sau n categorii diferite n raport cu un
criteriu.
Indicii calculai la momente diferite de timp, se numesc indici ai dinamicii.
Indicii calculai n locuri diferite, se numesc indici teritoriali.
Indicii calculai n categorii diferite n raport cu un criteriu,se numesc indici calitativi.
n calculul indicilor se aleg dou momente de timp/locuri/categorii :
1) Momentul de timp/locul/categoria de baz (de referin) , notat cu 0 .
2) Momentul de timp/locul/categoria curent ,notat cu 1
Pentru elemente omogene se calculeaz indici elementari(individuali) iar
pentru elemente neomogene se calculeaz indici sintetici (de grup) .
Caliti i defecte ale indicilor
1. Sunt mrimi mrginite pozitive.
2. Nu au uniti de msur deci se pot compara ntre ei.
3. Nu sunt sensibili la nmulirea i mprirea datelor.
4. Indicii sintetici se pot calcula numai pentru cheltuieli i venituri .
Exemplul 1
Fie trei resurse R1 (motorin n litri/ha ) , R2 (ngrminte chimice NPK n Kg/ha ) i R3
(ap de irigaie n m3/ha ).
Baza este anul 2000 iar anul curent este anul 2003.
Qi (uniti de resurs/ha ) este consumul de resurs Ri ,Ci (lei/unitate de resurs ) este
costul resursei Ri iar CHi=Qi .Ci (milioane lei/ha) este suma cheltuit cu resursa Ri .
Consumuri Qi
Costuri Ci
Resurse
R1
R2
R3
Total
A.
Baz
Qi0
120
210
1000
Curent
Qi1
110
220
800
Indici individuali :
- pentru consumuri :
Baz
Ci0
12000
6000
300
18300
Curent
Ci1
18000
8000
500
26500
Qi0Ci0
Qi0Ci1
Qi1Ci0
Qi1Ci1
1.44
1.26
0.30
3.00
2.16
1.68
0.50
4.34
1.32
1.32
0.24
2.88
1.98
1.76
0.40
4.14
23
24
25
deci (Q)+(C) = 1
Recalculm variaiile relative astfel :
I*L(Q) = IL(Q).[I(QC)](Q) = 0.961
I*L(C) = IL(C).[I(QC)](C) = 1.438
Verificare : IT(CH) = I*L(Q). I*L(C)
Metoda poate fi aplicat i indicatorilor compleci trifactoriali ,
tetrafactoriali , etc.
Exemplul 2
Fie trei produse : T1(Gru) ; T2(Porumb) ; T3(Floarea soarelui).
Baza este anul 2000 iar anul curent este 2003.
Yi este producia fizic a produsului Ti (Kg/ha) , Di este preul de vnzare al unitii de
producie fizic a produsului Ti (lei/kg) iar Vi=Yi.Di este venitul obinut din vnzarea
produsului Ti (milioane lei/ha).
Producii Yi
Produse
T1
T2
T3
T O
Baz
Yi0
3000
5000
1800
T A L
Curent
Yi1
3500
6000
2000
Preuri vnzare
Di
Baz
Curent
Di0
Di1
2000
4000
2500
4000
10000
12000
14500
20000
Venituri
Vi=YiDI
Yi0Di0
Yi0Di1
Yi1Di0
Yi1Di1
6
12.5
18
36.5
12
20
21.6
53.6
7
15
20
42
14
24
24
62
A) Indici individuali :
- pentru producii :
IY(T1) = Y11 / Y10 = 3500/3000 = 1.17
IY(T2) = Y21 / Y20 = 6000/5000 = 1.20
IY(T3) = Y31 / Y30 = 2000/1800 = 1.11
IY = [IY(T1). IY(T2). IY(T3)]1 / 3 = 1.159
- pentru preuri de vnzare :
ID(T1) = D11 / D10 = 4000/2000 = 2.00
ID(T2) = D21 / D20 = 4000/2500 = 1.60
ID(T3) = D31 / D30 = 12000/10000 = 1.20
ID = [ID(T1). ID(T2). ID(T3)]1 / 3 = 1.566
- pentru venituri :
IV(T1) = Y11D11 / Y10D10 = 14/6 = 2.33
IV(T2) = Y21D21 / Y20D20 = 24/12.5 = 1.92
IV(T3) = Y31D31 / Y30D30 = 24/18 = 1.33
IV = [IV(T1). IV(T2). IV(T3)]1 / 3 = 1.814
B) Indici sintetici pentru venituri ca indici agregai :
1) Indicele total :
IT(V) = (Yi1Di1) / (Yi0Di0) = 62/36.5 = 1.70
2) Indicele Laspeyres :
- pentru producii :
IL (Y) = (Yi1Di0) / (Yi0Di0) = 42/36.5 = 1.15
26
27
Baz
Ni0
10
15
20
T A L
Curent
Ni1
8
12
16
Productiviti
Pi
Baz
Curent
Pi0
Pi1
10
15
6
7
10
12
26
34
A) Indici individuali :
- pentru numr de muncitori :
IN(S1) = N11/N10 = 8/10 = 0.80
IN(S2) = N21/N20 = 12/15 = 0.80
IN(S3) = N31/N30 = 16/20 = 0.80
IN = [IN(S1). IN(S2). IN(S3)]1 / 3 = 0.800
- pentru productiviti :
IP(S1) = P11/P10 = 15/10 = 1.50
IP(S2) = P21/P20 = 7/6 = 1.17
IP(S3) = P31/P30 = 12/10 = 1.20
IP = [IP(S1). IP(S2). IP(S3)]1 / 3 = 1.281
- pentru venituri :
IV(S1) = N11P11/N10P10 = 120/100 = 1.20
IV(S2) = N21P21/N20P20 = 84/90 = 0.93
IV(S3) = N31P31/N30P30 = 192/200 = 0.96
IW = [IW(S1). IW(S2). IW(S3)]1 / 3 = 1.024
Venituri Wi =NiPi
Ni0Pi0
Ni0Pi1
Ni1Pi0
Ni1Pi1
100
90
200
390
150
105
240
495
80
72
160
312
120
84
192
396
28
29
30
I U I U
pe produs : I =
U
U
I U I U
pe subgrup : I =
U
U
I U I U ;
pe grup : I =
U
U
I U
5) Calculul IPC : IPC =
U
(0)
j
(0)
j
(0)
p
(0)
p
(0)
p
(0)
j
(0)
s
(0)
s
(0)
p
(0)
s
(0)
s
(0)
g
(0)
g
(0)
g