Documente Academic
Documente Profesional
Documente Cultură
INFORMATICĂ SI NOȚIUNI
DE STATISTICĂ
Coordonator științific:
Prof. univ. dr. DUMITRU ENE
Student:
CRĂCIUN VASILE MDR
-0-
CUPRINS
Introducere................................................................................................................................2
1. Foi de calcul statistic în EXCEL...................................................................................2
2. Funcții EXCEL.............................................................................................................3
3. Baze de date în EXCEL................................................................................................5
4. Diagrame în EXCEL.....................................................................................................5
III. BIBLIOGRAFIE..................................................................................... 28
1
DIGITALIZAREA ANALIZEI STATISTICO-ECOOMICE A
AGRICULTURII ROMANESTI CU PRODUSUL
INFORMATIC EXCEL
Introducere
Pentru a efectua Calcule statistice cu opţiunea DATA ANALYSIS trebuie activata opţiunea
Add- Ins din meniul TOOLS si apoi sunt disponibile urmatoarele:
Analiza varianţei monofactorială (ANOVA:single factor);
Analiza varianţei bifactorială cu interacţiuni (ANOVA :two factor with replication);
2
Planul blocurilor complete randomizate (ANOVA :two factor without replication);
Calculul coeficientului de corelaţie liniară (Correlation);
Calculul covarianţei (Covariance);
Statistică descriptivă (Descriptive statistics);
Regresie exponenţială (Exponential Smoothing);
Testul F pentru varianţe în două sondaje (F-Test : two sample for variance);
Analiză Fourier (Fourier analysis);
Histograme (Histogram);
Medii mobile (Moving average);
Generarea de numere aleatoare (Random number generation);
Rang şi percentile (Rank and percentile);
Calculul coeficientului de regresie liniară şi al termenului liber al regresiei (Regression);
Eşantionare (Sampling);
Testul t pentru medii în observaţii-perechi (t –test: paired two sample for means);
Testul t pentru medii în două sondaje cu varianţe egale în populaţii (t – test : two sample
assuming equal variances);
Testul t pentru medii în două sondaje cu varianţe neegale în populaţii (t – test :
two sample assuming unequal variances);
Testul z pentru medii în două sondaje din populaţii normale (z – test : two sample
for means)
O foaie de calcul statistic conţine celule cu :
text,
litere cu notaţia mărimilor,
valori numerice observate,
valori numerice calculate prin formule proprii şi/sau cu funcţii EXCEL.
Celulele care conţin valori numerice calculate vor date în liste care urmează după foaia de
calcul cu formulele aferente.
2. Funcții EXCEL
3
2.2. Funcții statistice:
= MAX(A1:An) valoarea cea mai mare dintre numerele din celulele A1,…,An.
= MIN(A1:An) valoarea cea mai mică
= AVERAGE(A1:An) mediei aritmetice
= GEOMEAN(A1:An) valoarea mediei geometrice
= HARMEAN(A1:An) valoarea mediei armonice.
= MEDIAN(A1:An) valoarea medianei
= MODE(A1:An) valoarea modului numerelor din celulele A1,…,An cu condiţia ca cel puţin
două din aceste numere să fie egale între ele.
= QUARTILE(A1:An ; Q) valoarea quartilei Q1 pentru Q=1 ; Q2(mediana) pentru Q = 2 ; Q3
pentru Q = 3 a numerelor din celulele A1,…,An .
= VAR(A1:An) valoarea varianţei numerelor din celulele A1,…,An .
= STDEV(A1:An) valoarea abaterii-standard a numerelor din celulele A1,…,An .
= COVAR((A1:An),(B1:Bn)) covarianţei numerelor din celulele A1,…,An cu numerele din
celulele B1,…,Bn .
= CORREL((A1:An),(B1:Bn)) valoarea coeficientului de corelaţie liniară al numerelor din celulele A1,
…,An cu numerele din celulele B1,…,Bn .
= SLOPE((A1:An),(B1:Bn)) valoarea coeficientului de regresie liniară al numerelor din celulele
A1,…,An cu numerele din celulele B1,…,Bn .
= INTERCEPT((A1:An),(B1:Bn)) valoarea termenul liber al regresiei liniare a numerelor din
celulele A1,…,An cu numerele din celulele B1,…,Bn dacă regresia liniară este cu termen liber
nenul.
= NORMDIST(u) funcţiei de repartiţie normale reduse ( valori care se pot găsi şi în tabela 1)
= CHIINV(P,GL) valoarea 2 pentru care P(2 > 2) = la GL grade de libertate(valori care
se pot găsi şi în tabela 3)
= TINV(P,GL) valoarea t/2 pentru care P(t > t/2 la GL grade de libertate(valori care se
pot găsi şi în tabela2)
= FINV(P,GL1,GL2) valorile F pentru care P(F> F) = la (GL1,GL2) grade de libertate (
valori care se pot găsi şi în tabelele 4,5,6 pentru = 0.05; 0.01; 0.001.
Alte funcţii statistice : TREND, FORECAST, LINEST, LOGEST, RAND.
2.3. Funcții logice: AND, OR, .... .
4
Baze de date în EXCEL
5
mai multe cămpuri ale unei baze de date prin diagrame plane(2-D) sau spaţiale (3-D).
6
Pentru aceasta se selectează cîmpurile pe care le vom reprezenta grafic şi se deschide
butonum CHART din bara de butoane standard cu clic stânga pe mouse sau se alege comanda
CHART din meniul INSERT si se parcurg paşii următori:
Se alege tipul şi subtipul de diagramă;
Se selectează domeniile de date (dacă nu au fost selectate anterior) şi se precizează
orientarea seriilor de date pe linii sau coloane,
Se precizează elementele diagramei: titlu, denumiri axe, legendă, grilaje, etichete, tabel de
date,
Se plasează diagrama pe foaia de calcul existentă sau pe altă foaie de calcul,
Trecerea de la un pas la altul se face cu butonul NEXT,
se încheie cu butonul FINISH.
Tipuri de diagrame
I) Diagrame plane (2-D)
1) Linie (Line),
2) Puncte(Scatter),
3) Arii (Area),
4) Bare orizintale (Bar),
5) Bare verticale (Columns),
6) Sectoare de cerc (Pie),
7) Coroane circulare (Doughnut),
8) Radiale (Radar),
9) Combinate (Combination).
II) Diagrame spaţiale (3-D)
10) Suporafeţe (3-D Area),
11) Benzi spaţiale (3-D Line),
12) Paralelipipede orizontale (3-D Bar),
13) Paralelipipede verticale (3-D Column),
14) Sectoare de cilindru (3-D Pie),
15) Relief (3-D Surface).
7
ROLUL STATISTICII ÎN ANALIZA SI PROGNOZA
PRODUCTIEI AGRICOLE LA NIVEL MICRO SI MACRO
IN ROMANIA
Prelucrand datele din Anuarul Statistic al Romaniei pe anii anteriori care cuprinde informatii
despre resurse mecanice, producții la diferitele culturi, efective de animale si productiile
animaliere, precipitatiile si temperaturile medii lunare, etc. se pot obtine prognoze si evolutii
privind productiile viitoare din agricultura tarii noastre.
Un experiment este aleator dacă rezultatele sale nu pot fi prevăzute cu exactitate, fiind sub
influenţa întâmplării. Totalitatea rezultatelor posibile ale unui experiment aleator se numeşte
spaţiu de evenimente elementare şi se notează cu Ω. Dacă mulţimea Ω este finită sau
numărabilă (şir), orice submulţime A Ω se numeşte eveniment. Evenimentele A, B sunt
incompatibile dacă nu se realizează simultan, în caz contrar A şi B se numesc compatibile.
[VC1]
Populaţia statistică este o mulţime de exemplare care aparţin aceleiaşi familii şi care fac
obiectul cercetării statistice. Cercetarea statistică poate fi completă sau exhaustivă (pentru
toate exemplarele populaţiei) de tip referendum sau recensământ sau poate fi parţială sau
selectivă de tip sondaj (eşantion, probă, sondaj de opinie) (pentru o parte reprezentativă
din exemplarele populaţiei).
Exemple de populaţii statistice în agricultură: plantele unei culturi într-o parcelă, animalele
unei ferme zootehnice, maşinile agricole care deservesc o suprafaţă arabilă, fermele vegetale
sau zootehnice dintr-un judeţ, unităţile de prelucrare a produselor agricole (mori, fabrici de
ulei, zahăr, produse lactate, mezeluri, abatoare, etc.), magazinele care comercializează
produse alimentare, reţeaua de case de agroturism, reţeaua de unităţi de alimentaţie publică,
etc.
Fiecare exemplar al populaţiei statistice are o serie de însuşiri cantitative (măsurabile) sau
calitative (atributive) notate X, Y, Z, … sau X1, X2, …, Xn pe care le vom numi în continuare
şi caractere.
8
Pentru populaţiile statistice din agricultură, însuşirile admit şi alte clasificări:
după natură: însuşiri biologice, tehnologice, economice, ecologice,
după modul de exprimare numerică: însuşiri bivalente (0 sau 1), întregi şi
reale (fracţionare),
după modul de apreciere: însuşiri primare (numai măsurabile) şi însuşiri derivate
(măsurabile sau calculabile),
după gradul de generalitate: însuşiri individuale (proprii fiecărui element
al populaţiei) şi colective (proprii unor grupe de elemente ale populaţiei).
Însuşirile individuale precedente devin colective dacă se însumează pentru plantele unei
culturi de pe o parcelă dată sau pentru animalele dintr-o fermă zootehnică dată.
9
Menţionăm şi următoarele însuşiri colective:
Consumul de resurse (forţă de muncă, forţă mecanică, energie, îngrăşăminte, apă,
furaje, medicamente etc.) pentru o societate agricolă (vegetală, zootehnică, de
prelucrare produse agricole, de comercializare produse alimentare, de
agroturism) într-un ciclu de producţie,
Costul resurselor pe unitate de resursă pentru o societate agricolă într-un ciclu de
producţie,
Cheltuielile cu resurse (consumuri înmulţite cu costurile) însumate pentru o societate
agricolă într-un ciclu de producţie,
Cheltuielile neproductive (TVA, taxe, impozite etc.) ale unei societăţi agricole într-un
ciclu de producţie,
Producţii fizice principale şi secundare ale unei societăţi agricole într-un ciclu de
producţie,
Preţurile de vânzare ale producţiilor fizice principale şi secundare pe unitate, pentru o
societate agricolă într-un ciclu de producţie,
Veniturile (producţii fizice înmulţite cu preţurile de vânzare) însumate pentru o
societate agricolă într-un ciclu de producţie,
Profitul (venitul din care se scad cheltuielile totale cu resursele cât şi cele
neproductive) realizat de societatea agricolă într-un ciclu de producţie,
Rata profitului (profitul împărţit la cheltuielile totale) realizată de societatea
agricolă într-un ciclu de producţie.
1
Variabilitatea accidentală este presupusă a fi o variabilă normală cu media 0 şi abaterea –
standard σ.
Exemple de surse de variabilitate:
variabilitatea genotipică a plantelor şi animalelor,
condiţiile pedoclimatice,
atacul buruienilor, bolilor şi dăunătorilor,
conjunctura economică (raport ofertă/cerere) pe piaţa produselor agroalimentare.
Fie o populaţie statistică de volum N pe care dorim să o studiem din punct de vedere al
însuşirii (caracterului) X pe care o posedă exemplarele populaţiei.
Din cauza volumului mare N al populaţiei, nu vom face măsurători complete în toată
populaţia ci vom extrage o parte reprezentativă din exemplarele populaţiei, numită sondaj
(eşantion, probă) pe care vom face măsurători relativ la însuşirea (caracterul) X.
n
Volumul sondajului se notează cu n iar raportul (%) se numeşte cotă de reprezentare
N
sau factor de sondaj.
X MX
xi
n
Media de sondaj este centrul de greutate al datelor de sondaj x1, …, xn fiind cea
mai apropiată de ansamblul valorilor: SPA(x) = (x1 – x)2 +…+ (xn – x)2 este minimă pentru
x= x.
Aici SPA este prescurtarea pentru suma patratelor abaterilor.
a)
Este o valoare mărginită: X [x min; x max];
1
b)
Nivelează diferenţele între valori: suma abaterilor valorilor de sondaj faţă de
X2 ... X2 12
-pătratică:
media
X2 1 n
n
Avem X a ≤ X g ≤ X .
II. Mediana Me este acea valoare faţă de care jumătate din numărul valorilor de
sondaj sunt mai mici ca ea şi cealaltă jumătate din numărul valorilor de sondaj sunt mai mari
ca ea.
Aranjăm datele de sondaj în ordine crescătoare: x1 < x2 < … < xn.
1
Dacă n = număr par avem Me
x k1 iar dacă n = număr impar avem
2
2 2
Me X k 1
.
2
Mediana Me este mai stabilă faţă de media X la valori de sondaj foarte mici faţă de
restul valorilor de sondaj, deoarece ia în calcul numărul de valori de sondaj nu şi mărimea
valorilor de sondaj.
În plus, SMA(X) X1 X ... Xn X este minimă pentru X = Me.
=
Aici SMA este prescurtarea pentru suma modulelor abaterilor. Mediana primei
jumătăţi a datelor de sondaj crescătoare, se numeşte cuartila întâia Q1 . Me = Q2. Analog Q3
pentru a doua jumătate a datelor .
Media şi mediana au fost indicatori de poziţie pentru datele de sondaj.
Urmează indicatori de variabilitate pentru datele de sondaj.
1
xi = n . X şi de aceea avem GL = n – 1 .
IV. Abaterea - standard
Sp
a max 0;1.
S
a max a min
3)
Abaterea standard este sensibilă la înmulţirea sau împărţirea datelor de
sondaj conform teoremei 6.2.
4)
Abaterea standard singură nu poate aprecia intensitatea variabilităţii datelor de
sondaj.
V. Coeficientul de variabilitate
S
c 100
X este principalul indicator procentual al variabilităţii datelor de sondaj în
1
1) Coeficientul de variabilitate c este o valoare mărginită (cuprins a min
între 100
Xmax
amax
şi 100 ).
Xmin
2) Coeficientul de variabilitate c nu are unităţi de măsuri, deci permite comparaţii
între caractere.
3) Coeficientul de variabilitate c poate aprecia cu ajutorul unor praguri intensitatea
variabilităţii datelor de sondaj în jurul mediei lor.
În raport de valorile coeficientului de variabilitate c avem cazurile:
a) Coeficientul de variabilitate c are o valoare mică. În acest caz
variabilitatea datelor de sondaj este mică, omogenitatea este mare şi media X este
foarte bună;
b) Coeficientul de variabilitate c are o valoare mijlocie. În acest caz variabilitatea
datelor de sondaj este mijlocie, omogenitatea lor este mijlocie şi media X este bună;
c) Coeficientul de variabilitate c are o valoare mare. În acest caz
1
Efectuăm un sondaj de n = 10 plante reprezentative deci cota de reprezentare este
n
1 : 7500 plante.
N
Xi Xi- (Xi- X Xi X
Datele de sondaj se aranjează în ordine X )2 S
crescătoare în tabelul alăturat.
40 -10 100 -1.43
Avem indicatorii de sondaj:
42 -8 64 -1.14
500
I) X 50 g/plantă 45 -5 25 -0.71
10 45 -5 25 -0.71
II) Me ϵ [48; 51] deci
48 -2 4 -0.29
51 1 1 0.14
Me = 49.5 g/plantă 54 4 16 0.57
448 57 7 49 1.00
III) S
2
49.8g 2 58 8 64 1.14
10 1 60 10 100 1.43
IV) S 49.8 7g / plantă 500 0 448 -
7
V) C 14%
50
Cazul sondajului de volum mare (n > 30)
În acest caz se face gruparea datelor de sondaj în clase de valori astfel: se fixează
numărul k de clase de valori care nu trebuie să fie nici prea mic, deoarece se şterg trăsături
esenţiale ale datelor de sondaj, nici prea mare, deoarece se pun în evidenţă trăsături
neesenţiale ale datelor de sondaj.
Acest număr k de clase de valori se poate calcula cu una din formulele k < 5 log n, k =
1 + 3.322 log n sau se folosesc recomandabil orientative de mai jos.
1
176 – 200 12
201 – 400 13
401 – 600 14
601 – 800 15
801 – 1000 16
1001 – 2000 17
2001 – 3000 18
3001 – 4000 19
4001 – 5000 20
X max X min
Lungimea unei clase de valori este .
nr. clase de valori k
Centrul clasei de valori Ci , notat cu xi, este mijlocul clasei adică media aritmetică a
valorilor extremităţilor clasei Ci.
Centrul clasei xi aproximează toate valorile de sondaj în clasa Ci, fiind reprezentantul
acestor valori.
Frecvenţa absolută ni a valorilor de sondaj într-o clasă de valori Ci este numărul
datelor de sondaj care cad în clasa respectivă, valori aproximate prin centrul clasei xi.
Frecvenţa relativă (procentuală)fi a valorilor de sondaj într-o clasă de valori Ci este
ni
f
i . Alături de frecvenţele precedente se pot folosi frecvenţele cumulate calculate
n
astfel: Frecvenţele absolute cumulate:
n*i = n1 + n2 + … + ni (1 < i < n)
Frecvenţele relative cumulate:
f*i = f1 + f2 + … + fi (1 < i < n)
Datele grupete se pot prezenta grafic prin histograme în raport cu sistemul de axe (Ci,
ni), poligonul frecvenţelor în raport cu sistemul de axe (xi, ni) şi respectiv cumulata în
*
raport cu sistemul de axe x
i ; n i .
2
Toate aceste operaţii de grupare, tabelare şi reprezentare grafică se pot face cu
programul C1GRUP sau cu EXCEL.
Pentru datele de sondaj grupate, indicatorii de sondaj de la punctele 5.2 I) – V) capătă
forma:
1
I) Media de sondaj:
1
1 k k
X
n nixi fixi
i1 i1
2
dat de funcţia EXCEL scrisă în celula B10: = MODE (A1:An ).
1 k n k
niiX X f X X
2 2
S
n1 n 1 ii
i 1 i1
2
Se numeşte structură de date cu k componente ansamblul de numere
f1,…,fk care îndeplinesc condiţiile :
0≤ fi ≤ 1 (1≤ i ≤ k ) şi f1 +…+ fk = 1 (f1,
…,fk) se numeşte vectorul structurii .
Exemple
1) Frecvenţele relative f1,…,fk ale datelor de sondaj de volum mare,grupate în clasele de
valori C1,…,Ck cu centrele de clase x1,…,xk definesc structura sondajului pe clase de
valori .
2) Fie k ramuri ale unei unităţi economice şi fie C1,…,Ck cheltuielile totale
(productive şi neproductive) anuale ale ramurilor.Cheltuielile totale anuale
ale întregii unităţi sunt C = C1+…+Ck
Numerele f1=C1/ C ,…,fk = C1/ C definesc structura de cheltuieli a unităţii pe ramuri .
In mod analog, fie V1,…,Vk veniturile totale anuale ale ramurilor şi fie
V = V1+…+Vk total anual al unităţii .
Numerele f1 = V1/ V ,…, fk = Vk/ V definesc structura de venituri a
unităţii pe ramuri .
Concentrarea unei structuri de date este tendinţa de creştere a ponderii
fi a unei componente în detrimentul celorlalte,inclusiv micşorarea numărului k de
componente .
Concentrarea structurii este maximă dacă fi = 1 şi fj = 0 pentru j≠ i.
Diversificarea structurii de date este tendinţa de egalizare valorică a
2
ponderilor f1,…,fk ale celor k componente ale structurii, inclusiv prin mărirea numărului k
de componente .
Diversificarea structurii este maximă dacă f1=…= fk = 1/k .
Media valorilor f1,…,fk este f‾ = 1/k iar abaterea-standard a valorilor
f1,…,fk este :
S f 1
2
i deoarece
k1
f i 1
S k .S
1 i 2
kf
[0;1]
k1
Valorile lui - f.log2f se pot lua din tabela 16 din secțiunea Tabele statistice .
Avem H=0 pentru concentrarea maximă şi H= log2 k pentru diversificarea maximă .
Entropia ajustată :
k
1
H f .og f
og k i12
i
2 i
k fi gi 1 [1;1]
R
i 2 1)
(kf1)(kg i
2
2
k fi gi 1
B1
k fi 1
2
B
f gB. B 1 f f g2
1 i i
k f i 1
0 1 2
k
Dacă | R | =1 avem legătura funcţională liniară între
cele două structuri ,dată de relaţia: g = B0 + B1.f
Avem R=1 dacă B1>0 şi R=-1 dacă B1<0 .
Dacă R = 0 ,cele două structuri nu sunt corelate liniar .
Exemplu
Dacă (f1,…,fk) este structura de venituri sau cheltuieli a unei unităţi
economice în anul de bază şi (g1,…,gk ) este structura de venituri sau cheltuieli a aceleiaşi
unităţi în anul curent, R măsoară gradul de stabilitate a structurii în timp .
Dacă caracterul X are numai valori întregi, datele de sondaj de volum mare (n > 30)
se pot grupa pe valori distincte Xi cu frecvenţele absolute ni sau se poate alege un număr de
clase k astfel ca lungimea l a claselor să fie număr întreg deci şi limitele claselor să fie
numere întregi.
Exemplu
Soluţie
k 6
f 12%
n
50
Exemple de însuşiri calitative (atributive) în agricultură
- ecloziune ouă, culoare ouă, rezistenţa la manipulare ouă;
- viabilitate purcei sugari, pui de o zi;
- stare de gestaţie la animale;
- stare de profitabilitate a unei societăţi agricole.
2
3.3 Indicatori de sondaj de evoluţie
2
În secțiunea 3.2 a fost studiată o populație statistică pe care am studiat-o din punct
de vedere al repartiției în spațiu prim măsurători simultane în locuri diferite a valorilor
îsușirii cantitative sau calittative X.Din acest motiv valorile lui X au fost abordate în orice
ordine dorim.
Fie o populaţie statistică pe care o studiem din punct de vedere al evoluției
în timp prim măsurători consecutive în același loc a valorilor însuşirii cantitative Y.
Momentele de timp în care se măsoară valorile lui Y sunt date de variabila poxitivă
crescătoareX. Din acest motiv valorile lui Y sunt abordate în ordinea în care au culese în
timp.
Dacă însuşirea Y ia valori întregi, datele unui sondaj extras din populaţie la
momentele de timp t1, t2, …, tn sunt valori instantanee y1, …, yn măsurate în acele momente
de timp.
Dacă însuşirea Y ia valori reale, datele unui sondaj extras din populaţie în intervalele
de timp [t1, t2), [t2, t3), …, [tn-1, tn] sunt valori medii y1, …, yn măsurate în acele intervale de
timp cu lungimile t2-t1, t3-t2, …, t n – t n – 1 .
Exemplu
Y = efectivul anual de vaci al unei ferme zootehnice se măsoară prin valori
instantanee (la 31 decembrie al anului calendaristic).
Y = producţia anuală de lapte al vacilor dintr-o fermă zootehnică se măsoară prin
valori medii pe perioada 1 ianuarie – 31 decembrie a anului calendaristic sau pe perioada
medie de lactaţie normală de 308 zile.
Măsurătorile sunt echidistante dacă t2–t1 = t3–t2 = … = tn-tn-1 şi neechidistante în caz
contrar.
Exemplu de măsurători echidistante :
Producţia de lapte a vacilor se controlează echidistant din 28 în 28 zile astfel că într-o
lactaţie normală de 308 zile se efectuează 11 controale ale producţiei de lapte.
Prezentarea grafică a datelor de sondaj de evoluţie instantanee se face prin poligonul
valorilor în raport cu axele (ti, yi) iar a datelor de sondaj de evoluţie se face prin cronograma
în raport cu axele ([ti, ti+1), yi).
Indicatori statistici de sondaj de evoluţie
I) Media cronologică
2
Dacă Y se măsoară prin valori instantanee y1, …, yn la momentele de timp t1, …, tn
avem:
y1 t2 t1 y2 t3 t2 ... yn1 tn
(1) Y C
tn1 tn t1
Dacă Y se măsoară prin valori medii y1, …,yxn în intervalele de timp [t1, t2), [t2, t3),
…, [tn-1, tn] avem:
y2 y3 yn1 yn
y1 y2 t t ... t t
t t
2
(2) Y 2 1
3 2 n n1
m 2 2
tn t1
y1 y2 ...
(3) Y C respectiv:
yn1 n 1
y1 yn
y ...
2
n1 2
(4) Y m 2
yn
1
(6) Y Y
D nn 11
2
Aceste valori aşteptate Y1 + (i-1.D se apropie de cele observate Yj atunci când
caracterul Y evoluează numai crescător sau numai descrescător în timp şi abaterile
valorice ale datelor de sondaj consecutive D1 ,…,D n – 1 sunt toate pozitive sau toate
negative şi apropiate între ele ca valoare (caracterul Y evoluează liniar în timp).
In caz contrar se ajustează aceste abateri valorice D1,…,D n – 1 cu o funcţie de
regresie neliniară în raport cu timpul .
Pe durata a m perioade de timp, variaţia valorică a caracterului Y va fi
P
P = y1 + (m – 1)D –yy1 = (m – 1) D deci Y variază valoric cu cantitatea P. în m 1
D
perioade de timp.
Dacă notăm y1 + … + ym = Q avem:
I1 y2 y3
, I , ..., I y
2
y n- yn
y1 2
1
n1
(8) log I logy2 log y1 t2 t1 ... logyn log yn1 tn tn1
2
deci logaritmul lui I este ritmul mediu valoric de evoluţie al valorilor de sondaj
logaritmate.
3
Dacă măsurătorile sunt echidistante avem:
t2 - t1 = t3 – t2 = … = t n – t n – 1 = d iar tn – t1 = (n – 1).d deci avem :
log yn log y1
log I n1 adică :
1
(9) y n1
I n
y
1
Valorile aşteptate ale datelor de sondaj de evoluţie formează o progresie geometrică
cu raţia I: y1,y1.I, …, y1 .I n – 1
Aceste valori aşteptatey1.Ij se apropie de cele observate yj atunci când caracterul Y
evoluează numai crescător sau numai descrescător în timp şi abaterile procentuale ale
datelor de sondaj consecutive, notate cu I1,…,I n – 1 sunt toate supraunitare sau toate
subunitare şi apropiate între ele ca valoare (caracterul Y are o evoluţie exponenţială în
timp ).
In caz contrar se ajustează aceste abateri procentuale I1,…,I n – 1 cu o funcţie de
regresie neliniară in raport cu timpul .
Pe durata a m perioade de timp variaţia procentuală a lui Y va fi
y 1Im1
P I m1 deci Y variază procentual cu valoarea P în m log P 1 perioade de timp.
y1
log I
Im1
Dacă notăm Y1 + … + Ym = Q avem: y1 de unde
I1
Q
Q
log I 1 1
y
m 1
adică numărul de perioade de timp în care se acumulează
log I
cantitatea finală Q a valorilor caracterului Y respectiv în care se consumă cantitatea iniţială Q
a valorilor caracterului X.
Fie diviziunile de timp echidistante t1,…,tn (cu t2 – t1 = t3 – t2 = … = tn – tn - 1 ).
În cazul măsurătorilor echidistante, indicatorii D şi I nu depind de y2,…, yn -1, defect
care poate fi corectat prin metoda uniformizării înclinării dinţilor de ferăstrău ai seriei
cronologice y1,…, yn , după cum urmează :
a) Corecţia lui D
Avem diferenţele de ordin I: Di = xi+1 – xi .
3
Dacă diviziunile de timp echidistante au lungimea 1 adică: t2 – t1 = t3 – t2 = … = tn – tn - 1
=1 atunci Di este înclinarea(panta) segmentului care uneşte punctele ( ti, yi ) şi (ti+1, yi+1) cu
ti+1 – ti = 1.
Dacă Di < 0, avem xi > xi+1 deci pe tronsonul [ ti; ti+1] caracterul Y are variaţie
descrescătoare.
Dacă Di = 0, avem yi = yi+1 deci pe tronsonul [ ti; ti+1] caracterul Y este staţionar.
Dacă Di > 0, avem xi < xi+1 deci pe tronsonul [ ti; ti+1] caracterul Y are variaţie
crescătoare.
Vom înlocui pe D cu ritmurile medii valorice (absolute) RV1 şi RV2 care urmează :
RV1 < 0 este media aritmetică a diferenţelor Di < 0 iar RV2 > 0 este media aritmetică
a diferenţelor Di > 0 .
Valorile lui y1,…, yn vor fi ajustate cu ajutorul lui RV1 şi RV2 astfel :
YV1 x1
yi RV1 dacă yi yi1
YV y dacă y y (1 i n-1)
i i i i1
y RV dacă y y
i 2 i i1
SPAT ( x Y )2
iar variaţia pătratică reziduală valorică a lui Y este :
i
SPAV = (yi – YVi )2
.
Dacă SPAV < SPAT, raportul de corelaţie valorică are forma :
b) Corecţia lui I
Avem rapoartele de ordin I: Ri = yi+1 / yi .
Dacă diviziunile de timp echidistante au lungimea 1 adică: t2 – t1 = t3 – t2 = … = tn – tn - 1
=1 atunci Ri este înclinarea(panta) segmentului care uneşte punctele ( ti, logyi ) şi
(ti+1, logyi+1) cu ti+1 – ti = 1.
Dacă Ri < 1, avem yi > yi+1 deci pe tronsonul [ ti; ti+1] caracterul logy are variaţie
3
descrescătoare.
3
Dacă Ri = 1, avem yi = yi+1 deci pe tronsonul [ ti; ti+1] caracterul logy este staţionar.
Dacă Ri > 1, avem yi < yi+1 deci pe tronsonul [ ti; ti+1] caracterul logy are variaţie
crescătoare.
Vom înlocui pe R cu ritmurile medii procentuale (relative) RP1 şi RP2 care urmează :
RP1 < 1 este media geometrică a rapoartelor Ri < 1 iar RP2 > 1 este media geometrică
a rapoartelor Ri > 1 .
Valorile lui y1,…, yn vor fi ajustate cu ajutorul lui RP1 şi RP2 astfel :
yP1 y1
yi RP1 dacă yi yi1
yP y dacă y y (1 i n-1)
i i i i1
y RP dacă y y
i 2 i i1
SPAT ( y Y
iar variaţia pătratică reziduală procentuală a lui Y este :
)2 i
Cercetare statistică prin sondaj. În cadrul acestuitip de cercetare, datele sunt înregistrate
doar de la o parte a populaţiei statistice, numită eşantion. Eşantionul este determinat pe baza
criteriilor de reprezentativitate, prin utilizarea unor metode probabiliste, ale căror rezultate
sunt extinse laîntreaga populaţie statistică.
3
Bibliografie