Documente Academic
Documente Profesional
Documente Cultură
NOTE DE CURS
CAPITOLUL 1
STATISTICA - INSTRUMENT DE CUNOATERE A
FENOMENELOR DE MAS
-1-
-2-
Informatica, prin aparatul sau, se implica tot mai mult in toate fazele de
-3-
momentul luarii deciziei. Toate aceste operatii folosesc metodele si procedeele statisticii
incepand cu culegerea (observarea) datelor si incheind cu deducerea concluziilor necesare
luarii deciziilor. Aceasta a permis conturarea unei discipline denumita teoria deciziei,
avand drept scop fundamentarea stiintifica a procesului decizional. Deoarece teoria
deciziei face apel si la modele deterministe, aceasta se integreaza intr-un domeniu mai
larg privind matematica aplicata si anume in cercetarea operationala. Cercetarea
operationala este considerata un instrument de conducere nationala a proceselor si
fenomenelor cu un inalt grad de complexitate. Aceasta disciplina integreaza in cuprinsul
sau metode si procedee statistice cat si o multime de tehnici de natura stiintifica, tehnica
si de culegere si prelucrare a informatiei.
Decizii in situatii de risc constituie un alt domeniu in care statistica se aplica.
Diversele variante de dezvoltare a unui fenomen sau proces, fie social sau economic,
presupune descompunerea acestuia intr-o multime de evenimente care formeaza un camp
complet de evenimente. Anticiparea celei mai plauzibile variante de dezvoltare a
fenomenului presupune cunoasterea distributiei de probabilitate asociata acestuia. Acest
lucru nu este posibil fara o observare metodica a evolutiei fenomenului in timp si ca
urmare o determinare a legii de probabilitate pe care o urmeaza.
Aflarea distributiei de probabilitate, utilizand modele si procedee statistice,
permite a aprecia gradul de risc la care este supusa o actiune sau alta.
In marketing statistica se regaseste in S.S.D.M. (sistemul suport al deciziilor de
marketing), ca acesta fiind compus din ,,Banca statistica" si ,,Banca de modele". SSDM
este un ansamblu coordonat de date, sisteme, instrumente si tehnici, inzestrat cu
tehnologia necesara ce ajuta o organizatie sa culeaga si sa interpreteze informatiile
relevante referitoare la activitatea sa si la mediul in care opereaza facand din acesta
temelia actiunilor de marketing. [Kotler.Pk, 1997}.
Pe baza celor prezentate se poate sublinia inca o data rolul si importanta
cunoasterii metodelor si procedeelor puse la dispozitie de statistica in procesul
cunoasterii. Nu este lipsit de importanta aportul statisticii nici in domenii ca: medicina,
biologie, fizica, chimie, stiinte juridice etc. Frecvente sunt cazurile in care studii
intreprinse in aceste domenii trag concluzii care au la baza o multime de date rezultate in
urma unor observari statistice, implicand nemijlocit modele ale inferentei statistice.
-4-
-5-
-6-
-7-
Statistica, prin curentele sale, castiga teren tot mai mult, iar descrierile statistice
devin preocupari de baza in institutiile publice. Aritmetica politica, sub aspect conceptual,
capata o noua dimensiune odata cu inventarea calculului probabilitatilor. Aceasta noua
ramura a matematicii, avea sa indeplineasca misiunea fundamentarii stiinfifice a
preocuparilor statistice de pana atunci. Bernoulli si Laplace aveau sa fie primii care au
utilizat modelele teoriei probabilitatilor in studiul statistic al fenomenelor economice si
sociale. Bernoulli formuleaza ,,legea numerelor mari", deschizand drumul aplicarii
calculului probabilitatilor in economie. Laplace s-a preocupat de studierea fenomenelor
dependente de diversi factori complecsi de actiune, prefigurand utilitatea acestui calcul si
in abordarea de ansamblu a fenomenelor sociale.
Un alt reprezentant de seama al calculului probabilitatilor a fost Gauss, care a
definit legea de repartitie normala. In aceeasi perioada, Fourier a publicat un numar de
studii"despre aplicarea matematicii in investigatii demografice, iar Poisson descopera
legea de repartitie a evenimentelor rare.
Gandirea probabilistica avea sa se consolideze in statistica in secolul al 19-lea,
asigurandu-i progresul si renumele de care se bucura astazi in intreaga lume. Un
reprezentant de seama din aceasta perioada si care a dominat gandirea statistica a acestui
secol a fost matematicianul, astronomul si statisticianul belgian Adolphe Quatelet.
Conform teoriei acestui mare ganditor, diversele caractere fizice, intelectuale si
morale ale oamenilor, observati in masa, s-ar echilibra intr-o fiinta fictiva, ideala, dorita
de natura, dar neizbutita. Fiintele umane, conform teoriei ,,omului mediu", s-ar distribui
de-o parte si de alia a acestei fiinte ideale. Pentru a desprinde ce este general fiintei
umane, A. Quetelet presupune debarasarea omului de caracterele individuale ale sale care
nu sunt decat accidentale. Ideea de ,,om mediu" a constituit izvorul de inspiratie privind o
serie de notiuni si concepte noi din statistica, cum ar fi: repartitie, medie, dispersie,
observare de masa, regularitate etc. In conformitate cu teoria iui A. Quetelet, regularitatile
deduse ca urmare a unei observari de masa deriva din legi care sunt urmate de om atat in
ordinea fizica cat si in cea morala. Lui A. Quetelet i se atribuie, pentru prima oara, o
teorie sintetica a statisticii bazata pe principii, tehnici si procedee statistice.
Acesta
-8-
umane etc. Conform teoriilor lui A. Quetelet, statistica defineste metode unice necesare
studierii fenomenelor bazate pe calculul probabilitatilor, endinta de ansamblu, dedusa pe
baza unui volum mare de observatii statistice. Legea statistica se poate pune in evidenta
numai daca se considera un numar suficient de mare de unitati statistice elementare ale
populatiei de studiat supuse observarii.
Legea numerelor mari, care constituie o expresie a legaturii dintre neccsitate si
intamplare, se verifica in colectivitati relativ mari si cuprinzatoare. In conformitate cu
aceasta lege, actiunea conjugata a unui numar mare de factori aleatori, in conditii bine
determinate, conduce la rezultate aproape independent de intamplare, dand astfel
posibilitatea ca necesitatea sa se realizeze. Referindu-ne la prima lege statistica
descoperita stim ca la nastere numarul baietilor intrece pe eel al fetelor, raportul initial
admis era de baieti 107; fete 100. Particularizand aceasta lege statistica la distributia pe
sexe a nascutilor in sanul fiecarei familii in parte, ar fi imposibil sa indicam ce fel de
raport exista, date fiind variabilele sale destul de numeroase si in acelasi limp importante
pentru diferite familii. O cercetare statistica care sa prezinte rezultate semnificative in
acest sens, trebuie intreprinsa pe mase indeajuns de mari de nasteri : insusi J. Bernoulli
care a dat acestei legi o forma matematica, a tinut sa mentioneze la vremea sa, ca sporirea
numarului observatiilor in scopul maririi gradului de siguranta a deciziei nu constituie
ceva nou si neobisnuit, deoarece omul indiferent de pregatirea sa stie ca sursa de reusita
referitor la o actiune a sa este cu atat mat mare, cu cat mai multe observatii sunt luate in
considerare.
Despre un inceput de organizare statistica in tarile romanesti nu poate fi vorba
decat din secolul al. XVIII-lea incoace. Prima scriere sau recensamant al locuitorilor pare
sa fi fost facuta de Constantin Mavrocordat, cu ocazia reformelor sale in Muntenia si
Moldova. Regulamentul organic (1831) introduce catagrafia sau recensamantul sistematic
si periodic. Din 7 in 7 ani trebuia sa se faca categrafia populatiei, dupa norme bine
stabilite, pentru a servi la ,,asezarea birului si la hotararea veniturilor tarii".
La 28 aprilie 1859, domnitorul Al. I. Cuza aproba infiintarea unui birou de
statistica in Tara Romaneasca, numind sef pe Dionisie Pop Marxian, iar la I iulie 1859
aproba infiintarea Directiei de Statistica din Moldova, sub conducerea lui Ion lonescu de
la Brad.
-9-
- 10 -
Variabila atributiva exprima un atribut sau insusire esentiala (alta, decat timpul sau
- 12 -
Variabila de timp ne arata timpul in care au luat fiinta unitatile populatiei sau
Variabila de sptiu ne arata spatiul in care exista sau au luat nastere unitatile populatiei.
Variabila cantitativa este variabila ale carei stari se exprima prin valori mimerice. Se
Variabila calitativa este variabila ale carei stari se exprima prin cuvinte sau coduri. Se
mai numeste variabila nominala (starile se exprima prin cuvinte) sau variabila ordinala
(starile se exprima prin coduri).
c) dupa modul de variatie variabila cantitativa poate fi:
Variabila discreta este acea variabila care, in intervalul sau de definite inregistreaza
- 13 -
- 14 -
Seria statistica este o constructie care reda fie distributia unei populatii in raport
cu una sau mai multe variabile, fie variatia unei marimi in timp, in spatiu sau de la o
categorie la alta.
Seriile statistice se clasifica in raport cu mai multe criterii, astfel:
1. In raport cu numarul variabilelor
Serii statistice multidimensionale, care au la baza doua sau mai multe variabile.
Serii cronologice (de timp sau istorice), care au la baza variabile de timp;
Serii cantitative, care au la baza variabile cantitative si care dupa modul de variatie a
variabilei pot fi: discrete (cand variabila este discrete) si continue (cand variabila este
continua).
4. In raport cu natura indicatomlui din care este alcatuita seria, avem:
Serii de variatie.
Seria statistica redand distributia populatiei in raport cu una sau mai multe
- 15 -
i
2
R
1
X:
N1 N 2 N i N R
X:
666
1108
1090
290
91
0 - neclasificate;
1090 - ne arata numarul unitatilor de cazare turistice avand categoria de ,,2 stele";
De asemenea, relativ la seria statistica unidimensionala avand la baza variabila X,
- 16 -
x1 x2 xi xR
X:
f f f f
i
R
1 2
fi ne arata ponderea unitatilor din populatie care au inregistrat pentru variabila X starea
xi:
fi =
Ni
N
fi =
Ni
N *100
sau
i=
1, R
i 1
=1
(100%)
Exemplu:
0.341
0.3355
0.089
0.028
0.0015
20.5%
34.1%
33.55%
8 .9 %
2 .8 %
0.15%
X:
0.205
Sau:
X:
33,55 % reprezinta ponderea unitatilor de cazare turistica avand categoria de ,,2 stele".
- 17 -
Pornind de la seria (1.1) se poate deduce seria formata cu frecvente absolute cumulate,
respectiv:
1
X :
N ( x1 )
x2
xi
xR
N ( x2 )
N ( xi )
N (xR )
(1.3.)
unde: N(xi) reprezinta numarul de unitati din populatia studiata pentru care variabila
inregistreaza valori ce nu depasesc valoarea xi.
N(x1) = N1
N(x2) = N1+N2
..
Exemplu.
X:
666
1774
2864
3154
3245
3250
- 18 -
2864 - ne arata numarul unitatilor de cazare turistica avand cel mult doua stele.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria formata cu frecvente relative
cumulate, respectiv:
1
X:
F
(
N x1 )
x2
FN ( x 2 )
xi
FN ( xi )
xR
FN ( x R )
(1.4.)
unde: FN(XI) - exprima ponderea unitatii populatiei studiate pentru care variabila a
inregistrat valori ce nu depasesc valoarea xi.
FN(XI) = f1 + f2 + + fi
FN(XI) =
N ( x1 )
* 100
N
i = 1, R
Exemplu:
X:
20.5%
54.6%
88.15%
97.05%
99.85% 100%
88,15 % - reprezinta ponderea unitatilor de cazare turistice avand cel mult ,,2 stele".
- 19 -
Asa cum se poate constata din definitia celor doua marimi de frecvente cumulate,
acestea se pot calcula si are sens elaborarea unor serii statistice doar in cazul in care la
baza seriei se gaseste o variabila cantitativa.
Relativ la aceeasi populatie statistica studiata A multimea unitanlor de cazare turistica
din Romania in anul 1999, din A.S. al Romaniei /2000, se pot extrage alte serii statistice
de repartipe, ca de exemplu:
- distributia unitatilor de cazare in raport cu forma de proprietate (cf. A.S. al
Romaniei/2000, pg.518).
1290
1960
- 20 -
litoral ba ln ear mon tan D. Dunarii orase resed int a de ju det alte localit.
69
418
908
729 435 691
Este o serie statistica de repartitie unidimensionala avand la baza o variabila
atributiva calitativa si formata cu frecvente absolute. Se poate elabora seria formata cu
frecvente relative.
De asemenea, se pot elabora serii de repartitie unidimensionale in raport cu
numarul de turisti cazati, cu gradul de utilizare a capacitatii in functiune, capacitatea
existenta etc.
Seria statistica de repartitie bidimensionala este o constructie ce reda distributia
unei populatii in raport cu doua variabile.
Astfel, fie populatia statistica A studiata in raport cu variabilele X si Y, rezultatele
observarii se pot grupa intr-un tabel de forma urmatoare:
X x1
x2
xj
xJ
Total
Y
y1
N11
N12
y2
N21
N22
yi
Ni1
Ni2
yl
N1l
Nl2
Total
N1
N2
N1j
N2j
Nij
N1J
N1
N2J
N2
NiJ
Ni
.
.
(1.5.)
Nlj
Nj
Nl
NlJ
- 21
NJ-
unde:
1
X : N
1
1
X :
N
1
x2
xj
xJ
N2
Nj
NJ
y2
yi
yl
N2
Ni
Nl
x1
X/Y = yj :
N i1
x2 x j
N i 2 N ij
xJ
N iJ
y1
Y/ X = xj :
N1 j
y2
yi
yl
N2 j
Ni j
Nl j
- 22 -
j 1, J
x1
xj
xJ
Total
f1J
f1
Y
Y1
-
Yi
fi1
Yl
Total
... fij
flj
fl1
f1
...
fj
fiJ
(1.6.)
fi
flJ
fl
fJ 1
fij =
N ij
N
j 1, J
fj =
Nj
N
fi =
Ni
N
i = 1, I
Exemple:
Relativ la populatia statistica A studiata, din A. S. al Romaniei/2000, se poate
extrage o serie de repartitie bidimensionala, avand la baza variabilele:
X - categoria de confort (numar de stele)
Y - tipul unitatii de cazare turistica de forma urmatoare:
- 23 -
Total
neclasificate
Hoteluri
57
259 388 91
Moteluri
12
50 53
14
811
120
Hanuri turistice
22
22
Cabane turistice
Campinguri
83
56
2 57
Tabere scolare
17 6
Pensiuni turistice
Sate de vacanta
Pensiuni agroturistice
59 19
165
69 15
142
1145
176
322
341
77 191 44
-
110 210 21
2
- 24 -
Tabelul de mai sus este o repartitie statistica bidimensionala avand la baza o variabila X
atributiva cantitativa discreta si o variabila Y atributiva calitativa, formata cu frecvente
absolute.
Se poate deduce seria de repartitie bidimensionala formata cu frecvente relative,
respectiv:
X
Total
Y
Hoteluri
0,018
0,08
0.119
0,028
0,004
0,0006
0,25
Moteluri
0,004 0,015
0,016
0,002
Hanuri turistice
0,007
Cabane turistice
0,026 0,018
0,006
0,001
0,051
Campinguri
0,017 0,021
0,005 0,0006
0.044
Vie turistice si
0,079 0,148
0,065
0.037
0.007
0,038
0,021
0,0009
0,352
bungalouri
Tabere scolare
0,054
0,054
Pensiuni
0,0009 0,024
0,059
0,014
0,002
0.099
turistice
Sate de vacanta
Pensiuni agroturistice
Spatii de cazare pe nave
Total
0,0003
0,034
0,065
0,0003
0,006
0.105
0,205 0,341
0,335
- 25 -
0,089
0,028
0,002
0,0015
X:
0
666
1108
1090
290
91
y9
1
1
2
3
4
5
6
7
8
Y:
811
120
22
165
142
1145
176
322
y1
Y/X = 3 :
91
y2
5
y3
y4
4
y5
2
y6
122
77
191
44
y7
y8
44
y9
y10
21
y11
1
y10
341
y11
5
marimi, iar din cadrul marimilor relative fac parte: indicatorul relativ de intensitate,
indicele statistic si diferenta relative a unei marimi.
Indicatorul de nivel (Y) este o marime ce reflecta nivelul unui fenomen analizat.
De exemplu: productia diferitelor produse, veniturile populatiei, suprafata cultivata cu
principalele culturi, transportul, exportul, importul etc.
Diferenta absoluta a unei marimi (y) exprima diferenta dintre nivelul cercetat si
nivelul baza de comparatie al marimii analizate. Se exprima in aceeasi unitate de masura
in care este cuantificat fenomenul analizat si ne arata cu cat s-a modificat acesta de la un
nivel la altul.
Indicele statistic al unei marimi (/y ) exprima raportul dintre nivelul cercetat si
nivelul baza de comparatie al marimii analizate. Ne arata de cate ori se modifica acea
marime, de la un nivel la altul.
Diferenta relativa a unei marimi (Ry) exprima raportul dintre diferenta absoluta a
marimii respective si nivelul baza de comparatie al acesteia. Ne arata cu cat la suta se
modifica marimea de la un nivel la altul.
Indicatorul relativ de intensitate (d) se defineste ca raport intre doi indicatori de
nivel de natura diferita si arata gradul de raspandire a fenomenului cuantificat de
indicatorul de la numarator in raport cu fenomeoul cuantificat de indicatorul de la
numitor. De exemplu: productia diferitelor culturi / ha, densitatea populatiei, productia
principalelor produse / locuitor, rata somajului etc.
Greutatea specifica (g) reflecta structura fenomenului analizat in raport cu starile
variabile X, de la baza seriei.
Seriile cronologice
Seria cronologica reflecta evolutia in timp a unei marimi.
Valorile variabilei ca functie de timp pot fi fixate la un anumit moment de timp sau sa se
refere la un interval de timp.
Seria cronologica de momente este o serie de observatii ordonate in timp,
exprimand stocuri [Trebici V.. 1985]. De exemplu, volumul populatiei, numar de
universitati, banci, institutii, fonduri fixe, numarul salariatilor, intreprinderile mici si
- 27 -
mijlocii din diferite domenii de activitate, unitatile de cazare turistica etc.Intr-o astfel de
serie insumarea marimii analizate nu are sens din punct de vedere al continutului, aceasta
fiind permisa din considerente de calcul, ajustat etc.
Seria cronologica de intervale este o serie de observatii ordonate in timp
exprimand fluxuri. De exemplu: nascutii vii, divorturile, decesele, productia diferitelor
culturi sau produse, venituri, cheltuieli, productia industriala, agricola, exportul, importul
etc.Intr-o astfel de serie are sens insumarea marimii analizate.
Fie o serie cronologica de momente sau de intervale ce reflecta evolutia in timp a
nivelului unei marimi Y,
0 1 2 . . t ... T
Y:
y y y . . y ... y
0 1 2 t T
t / t0
y
0 1 2 ... t ... T
: 1/ 0 2 / 0
t/0
T /0
0
... y ...
y
y y
t/0
y
= y(t) y(0)
- 28 -
(1.8)
t / t 1
y
0 1 2 ... t ... T
: 1/ 0 2 /1
t / t 1
T / T 1
y y ... y ...
y
(1.9)
Intre cele doua tipuri de diferente absolute cu baza fixa si cu baza in lant, exista relatii de
legatura ce ne permit exprimarea unora in functie celelalte. In acest context, insumand
diferentele absolute cu baza in lant se obtin diferentele absolute cu baza fixa.
t/0
y
1/ 0
y
2 /1
y
t / t 1
y
t/0
y
t 1 / 0
y
t / t 1
y
- 29 -
t / t0
t/0
0 1 2 ... t ... T
: 1/ 0 2 / 0
t/0
T /0
1
... I y ... I
y
Iy Iy
(1.10)
y (t )
*100
y (0)
I
I
t / t 1
y
0 1 2 ... t ... T
: 1/ 0 2 /1
t / t 1
T / T 1
I y I y ... I y ... I
y
t / T 1
y
y (t )
* 100
y (T 1)
- 30 -
(1.11)
t / t0
y
0 1 2 ... t ... T
: 1/ 0 2 / 0
t/0
T /0
0
... R y ... R
y
Ry Ry
t /0
t/0
y
y ( 0)
y (t )
1
y (0)
t/0
y
(1.12)
sau
t /0
t / t 1
y
t/0
I y * 100 100
diferente relative cu baza in lant
0 1 2 ... t ... T
: 1/ 0 2 /1
t / t 1
T / T 1
R y R y ... R y ... R
y
- 31 -
(1.13)
t / t 1
t / t 1
y
* 100 100
gy
0 1 2 .. t .. T
g 0 g1 g 2 . . g t . . g T
(1.14)
y (t )
g(t) =
y (t )
t 1
- 32 -
s0 s1 s2 ... si ... sR
Z:
Z (1) Z (2) Z (3) ... Z (i) ... Z (R)
unde:
(1.15)
__
i=1,R,
s / s0
z
s0 s1 s2 ... si ... sR
: s1 / s0 s2 / s0
si / s 0
0 z z ... z ... sR / s0
z
si / s 0
z
= z(i) z(0)
(1.16)
s / s0
z
s0 s1 s2 . . si . . sR
: s1 / s0 s2 / s0 si / s0 sR / s
0 I z I z . . I z . . I 0
z
si / s 0
z
s / s0
z
(1.17)
Z (i )
* 100
Z ( 0)
s0 s1 s2 ... si ... sR
: s1 / s0 s2 / s0
si / s 0
0 Rz Rz ... Rz ... RsR / s0
z
si / s0
z
Si / s0
Z ( 0)
* 100
- 34 -
(1.17)
Se deduc seriile formate cu marimi absolute si relative calculate doar cu baza fixa (se
poate alege orice stare a variabile ce exprima spatiu).
PROBLEME PROPUSE
PI. Dati 5 exemple de populatii statistice a caror cercetare ar prezenta interes si pentru
fiecare populatie selectata precizati:
1. denumirea populatiei, a unitatii statistice si volumul acesteia;
2. scopul cercetarii statistice;
3. variabilele statistice in raport cu care s-ar face observarea statistica a populatiei.
P2. Sa se extraga din Anuarul Statistic sau alte surse informationale o serie statistica
bidimensionala ce reda distributia unei populatii in raport cu doua variabile atributive,
relativ la care se cere:
1. denumirea populatiei ce a fost supusa observarii si volumul acesteia;
2. unitatea statistica;
3. caracterizarea variabilelor statistice in raport cu care a fost studiata populatia;
4. caracterizarea seriei statistice in raport cu toate criteriile cunoscute;
5. elaborarea seriei bidimensionale formata cu frecvente relative, interpretare;
6. extragerea
repartitiilor
unidimensionale
marginale
si a celor conditionate;
- 35 -
formate cu diferente absolute, indici statistici, diferente relative, cu baza fixa si cu baza
in lant (interpretari).
P5. Dati 5 exemple de serii cronologice avand la baza indicatorul relativ de
intensitate.
P6. Din Anuarul Statistic sau alte surse informationale extrageti o serie de spatiu formata
cu indicatorul de nivel sau indicator relativ de intensitate si deduceti seriile formate cu
diferente absolute, indici si diferente relative, calculate cu baza fixa. Interpretare.
P7. Extrageti 5 exemple de serii de spatiu ce contin informatii importante pentru
domeniul economic.
P8.Se da urmatoarea serie de variatie, cronologica, de momente, avand la baza un
indicator de nivel :
-farmaciile din Romania la sfirsitul anului 1989
Z:
1980
1857
1985
1986
1987
1988
1989
1922
1924
1930
1925
1935
Z:
1980
3810
1985
1988
1989
1990
1991
3063
2478
2159
1475
1302
- 36 -
- Luna 2-225
- Luna 3-240
-Luna 4-250
- Luna 5-240
- Luna 6-245
- Luna 7-260
- Luna 8-280
- Luna 9-270
- Luna 10-275
- Luna 11-290
- Luna 11-290
(mil.lei)
Se cere :
1.Alcatuiti o serie cronologica cu datele din problema si comentati tipul de
indicator folosit.
2.Analizati cu cat s-a modificat C.A. atat in raport cu prima luna cat si in raport cu
luna precedenta.
3.Aratati de cate ori se modifica C.A. in raport cu prima luna, cat si de la o luna la
alta.
4.Aratati cu cat la suta s-a modificat
C.A. in raport cu prima luna, cat si de la o luna la alta.
5.Graficul seriei.(cronograma).
CAPITOLUL II
OBSERVAREA, SISTEMATIZAREA I
PREZENTAREA DATELOR STATISTICE
Observarea statistica
- 37 -
programul observarii;
- 38 -
fiecare dintre ele conduce la o pregatire cat mai completa a observarii, de rezultatele
careia depinde corectitudinea celorlalte etape a cercetarii statistice.
Delimitarea populatiei supuse observarii fata de alte populatii statistice cu care
aceasta se afla in legatura se realizeaza prin evidentierea insusirilor si trasaturilor comune
ce caracterizeaza populatia supusa studiului. In conditiile in care se impune cercetarea
doar a unei parti din populatie, atunci trebuie precizat care anume vor fi unitatile ce vor fi
supuse observarii, dupa ce criterii se selecteaza acestea din populatia initiaia, astfel incat
rezultatele cercetari sa poata fi extinse la nivelul intregii populatii.
Definirea unitatilor statistice de observat presupune claritate si precizie pentru a
nu da loc confuziilor. In momentul observarii trebuie cunoscut exact care sunt unitatile
statistice ce trebuie inregistrate in raport cu variabilele de studiat.
Stabilirea timpului si a locului unde va avea loc observarea are importanta din
punct de vedere a comparabilitalii datelor rezultate din observare. Notiunea de timp a
observarii are in statistica doua acceptiuni:
-
durata observarii.
Momentul sau perioada la care se refera datele inregistrate trebuie sa fie in
- 39 -
- 40 -
micsorarea eficientei observarii. Forma cea mai frecventa de observare totala o constituie
recensamantul populatiei. Avand in vedere anvergura unei asemenea observari totale,
recensamantul presupune o pregatire prealabila din punct de vedere uman, material si
financiar de reusita careia depinde in mare masura eficacitatea lui. Cu prilejul fiecarui
recensamant se elaboreaza o metodologie corespunzatoare cerintelor perioadei
considerate, constituind baza de referinta a tuturor celor implicati in aceasta actiune.
Observarea totala se practica si in domeniul controlului tehnic de calitate, in cazul
produselor de inalta tehnicitate , asa cum ar fi: televizoare, masini de spalat, frigidere,
automobile etc. Este necesara o observare totala in acest caz, deoarece constatarea
defectiunilor de catre cumparatori ar implica cheltuieli mult mai mari cu remedierea
acestora in comparatie cu organizarea unei observari totale a loturilor de produse ce
urmeaza a fi scoase pe piata.
In cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt
nesemnificative, este suficienta realizarea unor observari partiale prin care sa se asigure
ca rebuturile nu depasesc un anumit procent admis. O astfel de observare, care include
doar o parte din unitatile populatiei supuse studiului corespunde observarii partiale.
Observarea partiala constituie o alternativa la observarea totala in cazul
populatiitor infinite sau chiar daca sunt finite prin observare are loc distrugerea acestora.
Avand la baza procedeul observarii partiale se pot evalua rezervele de titei,
carbune sau alte minerale, se poate evalua masa de material lemnos din fondul silvic a
unei zone sau la nivelul intregii tari. In general, observarea partiala se recomanda in toate
cazurile in care se considera mai avantajoasa decat observarea totala. Avantajele acestui
tip de observare se materializeaza de cele mai multe ori intr-un program de observare mai
complex si mai complet, cu cheltuieli de timp si materiale mai reduse si nu de putine ori
cu un grad de exactitate mai ridicat.
Esantionul, ca rezultat al observarii partiale, presupune respectarea cu strictete a
principiului reprezentativitatii, in conformitate cu care fiecare unitate statistica din
populatia generala sa aiba aceeasi sansa de a face parte din esantion. Asigurarea
respectarii principiului reprezentativitatii in formarea esantionului de observat permite
acestora o structura foarte apropiata cu cea a populatiilor din care sunt formate. Aceasta
ne asigura, cu o anumita probabilitate dinainte fixata, ca rezultatele obtinute la nivelul
- 41 -
- 42 -
piata, pentru ca nu exista o formula unica de elaborare care sa conduca la stabilirea unui
chestionar foarte bun. De fapt un chestionar este bun, atunci cand furnizeaza raspunsuri
precise, adevarate si utilizabile. Conceperea unui chestionar se bazeaza foarte mult pe
experienta.
Problemele care intervin in elaborarea unui chestionar sunt numeroase si
complexe. Acestea nu vor fi prezentate detaliat in acest studiu, ci vor fi abordate doar in
linii mari.
Elaborarea chestionarului depinde de ohiectivul anchetei. Intrebarile si
eventualele probleme ce intervin in elaborarea lor sunt legate de obiectivele urmarite.
Astfel daca informatiile privesc anumite fapte, evenimente petrecute, atunci
intrebarile sunt relativ usor de formulat. Ceea ce ar putea impiedica obtinerea de
informatii ar fi refuzul celor intrebati de a da un raspuns exact la unele din intrebari,
datorat unor motive personale sau imposibilitatii furnizarii unui raspuns total sau partial
aferent unor evenimente mai indepartate. Este evident ca lungimea perioadei analizate
depinde de natura faptelor. Daca evenimentele se produc curent atunci perioada este mai
scurta, iar daca evenimentele sunt rare, perioada analizata este mai lunga.
Ia schimb in cazul anchetelor asupra opiniilor, motivatiilor, intentiilor, elaborarea
chestionarului este mai dificila, intrebarile vor fi formulate si studiate cu o foarte mare
atentie. Ca de exemplu in cazul anchetelor asupra opiniilor, intrebarile privind exprimarea
acestora sunt usor de formulat, in cea mai mare parte se primesc raspunsuri (fiecare isi
exprima opinia). Ceea ce este dificil in culegerea informatiilor privind opiniile il
reprezinta masurarea intensitatii de manifestare a acestora [Fournis, 1985].
In situatii ca cele formulate mai sus trebuie sa se evite intrebarile care ar conduce
la aparitia de erori in raspunsuri. Aceste erori pot sa fie provocate voluntar, de catre
repondent, datorita mascarii unei atitudini, opinii etc., sau pot fi involuntare datorate
neintelegerii clare a problemei in cauza.
Pentru evitarea acestor inconveniente intrebarile puse trebuie sa raspunda la o
serie de caracteristici bine definite [Heifer, 1985].
Astfel ele trebuie sa fie:
usor de inteles, adica sa nu contina cuvinte ce nu pot fi intelese de orice repondent;
stimulatoare, adica intrebarile puse trebuie sa incite la raspuns;
- 43 -
- 44 -
- cu raspunsuri multiple, unde repondentul poate sa aleaga mai multe variante de raspuns.
Daca acest numar nu este limitat atunci codificarea si prelucrarea datelor necesita
o perioada mai lunga, motiv pentru care se recomanda limitarea numarului de raspunsuri.
- cu clasameme, unde repondentul claseaza raspunsurile posibile intr-o anumita ordine in
functie de preferintete sale. Aceste tipuri de intrebari cer un efort mai mare din partea
repondentului, ca urmare ele devin obositoare. Astfel se impune limitarea variantelor de
raspuns. De asemenea aceste intrebari necesita o perioada mai mare de pregatire a lor
pentru prelucrare, iar exploatarea nu este imediata,
- intrebari cu scale ale atitudinilor, permit nuantarea raspunsurilor binare pe o gradate de
tip excelent - foarte rau. Aceasta se poate realiza explicitand fiecare varianta prin cuvinte
de tipul excelent, bun, mediu, rau, foarte rau, sau un sistem de note de exemplu, acordand
note de la 1 la 5, stiind ca 1 este pentru foarte rau iar 5 pentru excelent. Aceste intrebari
permit masurarea atitudinilor folosind instrumente puse la punct de psihologi, iar atasarea
de note fiecarei trepte a scalei simplifica prelucrarea si da posibilitatea efectuarii unor
calcule. In schimb daca scala are prea multe trepte alegerea unei sau alteia dintre ele
devine diflcila, de aceea utilizarea unui numar de 5 trepte este cel mai convenabil. Daca
treptele nu sunt bine diferentiate si scala nu se schimba de la o intrebare la alta atunci
repondentul poate avea tendinta de a ramane mereu in aceeasi zona a scalei.
Claude Jeveau in ,L 'enquette par questionnaire" caracterizeaza intrebarile inchise astfel:
sunt cele care se preteaza cel mai bine la prelucrarea si analiza statistica, raspunsurile
primite pot fi prelucrate imediat fara a necesita analize intermediare complicate;
sunt usor de inteles si se poate raspunde repede;
garanteaza un anumit anonimat;
ele pot fi folosite ca intrebari filtru, servind la gruparea repondentilor;
ele prezinta pericolul de a ,,dicta" raspunsul celui anchetat in masura in care raspunsul
la care s-a gandit nu figureaza printre cele posibile, el alegand unul care se apropie cel
mai mult de ceea ce s-a gandit;
ele nu pot fi folosite pentru obtinerea de informalii nuantate, corespunzatoare
atitudinilor, motivatiilor profunde, aplicarea lor se limiteaza doar la culegerea de
informatii obiective.
- 45 -
Intrebarile deschise
O intrebare deschisa este aceea care lasa pe cel interesat sa raspunda cum vrea el,
neexistand nici o constrangere. Intrebarile deschise pot fi prezentate astfel:
complet nestructurate, sunt intrebarile la care repondentii pot sa raspunda cum doresc,
de tipul: ce parere aveti... ?
asociere de cuvinte, cand se dau pe rand diferite cuvinte iar repondentilor li se cere sa
noteze primul cuvant care le vine in gand;
completarea frazei, cand repondentilor li se prezinta o fraza incompleta, pe care trebuie
sa o completeze;
completarea unei povestiri, cand repondentilor le este prezentata o
povestire incompleta, pe care trebuie sa o continue, etc. In chestionar trebuie rezervat
spatiu suficient pentru completarea intregului raspuns.
Intrebarile deschise pot fi caracterizate astfel:
daca sunt bine formulate atunci se pot obtine informatii asupra oricarui subiect;
ele sunt indispensabile in culegerea informatiilor privind problemele delicate, cum sunt
cele legate de masurarea atitudinilor, nevoilor, motivatiilor;
utilizarea lor este impusa in cazurile in care nu pot fi prevazute toate raspunsurile
posibile;
formularea lor este foarte delicata, de aceea ele trebuie sa fie cuprinzatoare, sa nu
comporte ambiguitati si contrasensuri;
prelucrarea lor este foane costisitoare si anevoioasa.
Intrebirile semi-deschise (mixte) sunt intrebari in care principalele raspunsuri
posibile sunt propose ca in cazul intrebarilor inchise, dar se lasa si posibilitatea adaugarii
de raspunsuri libere in afara celor propuse, cum sunt intrebarile deschise[Javeou, 1992].
Aceasta forma mixta tinde sa rezolve problemele de exhaustivitate a fntrebarilor
inchise si sa reduca costul de codificare al intrebarilor deschise. Intrebarile mixte sunt
avantajoase atunci cand sunt precodificate raspunsurile stabilite, care acopera cea mai
mare parte din aria raspunsurilor, ramanand ca un numar destul de mic de raspunsuri,
obtinute pe parcursul anchetei, sa fie codificat ulterior.
Aceste intrebari au urmatoarele caracteristici:
- 46 -
- 47 -
- 48 -
- 49 -
- 50 -
- 51 -
- 52 -
erori de observare;
persoana, iar altele la un grup, mai ales in cazul anchetelor organizate in gospodarii;
-
neintelegerea intrebarilor foane lungi, foarle complexe si care contin mai multe ideii
in acelasi timp;
- 53 -
folosirea unor intrebari vagi, abstracte, a caror implicatii nu sunt bine intelese;
- dificultatea alegerii unuia sau a mai multor raspunsuri dintr-o lista. Este important sa
se stie daca raspunsurile se exclud sau nu, daca poti alege doar unul sau mai multe. In
general se prefera o lista cu raspunsuri cat mai completa, dar sa nu fie prea lunga.
c) Erori datorate solicitarii memoriei, si anume:
- erori cauzate de uitarea unor evenimente sau retinerea lor partiala;
- erori cauzate de lungimea perioadei de referinta, mai ales atunci cand ea este mare.
d) Erori datorate lipsei sinceritatii in furnizarea informatiilor. Astfel de erori sunt mai
frecvente in cazul tarilor unde persoanele nu sunt obisnuite cu sondajele. In cadrul acestei
categorii s-ar include:
- erori datorate fricii de a declara o situate asa cum este ea, de exempiu in cazul
venitului, persoanele declara in general salariul, pensia sau ajutorul primit, veniturile
suplimentare nu sunt declarate mai ales de frica impozitelor fiscale;
- erori cauzate de dorinta impresionarii anchetatorului, de exemptu subestimand
consumul de alcool, supraestimand activitatile culturale etc.
e) Erori cauzate de anchetatori, si anume:
- prin interpretarea unor intrebari sau ,,suflarea" unor raspunsuri, la cei intervievati;
- in cazul organizarii de sondaje probabiliste, atunci cand o uniitate este inlocuita cu
aita, care nu este trecuta pe lista esantionului, situatie intalnita mai ales atunci cand nu se
obtin informatii de la unitatile ce trebuie supuse observarii.
Pentru reducerea acestor erori este necesara o selectie riguroasa a anchetatorilor, o
buna pregatire a acestora, si o testare prealabila a chestionarelor. De asemenea se
recomanda efectuarea de controale a anchetatorilor. Depistarea erorilor se poate realiza si
in faza de prelucrare a datelor, iar in functie de natura lor se pot lua diferite masuri pentru
eliminarea efectului acestora.
In concluzie, asa cum spunea J. Desabie , atunci cand o ancheta esueaza, eel mai frecvent
se datoreaza erorilor de observare decat erorii de esantionare. De aceea este irational sa
consacri mari eforturi pentru reducerea erorii de esantionare atunci cand erorile de
observare sunt consistente. Dar in general erorile de observare sunt mult mai mici in
cazul anchetelor prin sondaje decat in cazul recensamintelor, datorate faptului ca
anchetatorii au o pregatire mult mai buna decat agentilor recenzori.
- 54 -
Erorile datorate non-raspunsurilor provin din absenta totala sau partiala a datelor
privind unitatile supuse observarii.
Sistematizarea si prezentarea datelor statistice
Sistematizarea constitute o etapa in cadrul prelucrarii datelor statistice in vederea
prezentarii acestora sub forma de serie statistica.
Datele obtinute ca urmare a procesului de observare statistica, in forma lor bruta,
permit o caracterizare amanuntita a fiecarei unitati din populatia considerata. Deoarece,
datele rezultate din observare se prezinta sub forma dezorganizata nu permit o
caracterizare a populatiei in ansamblu.
In vederea atingerii scopului cercetarii statistice intreprinse si anume acela de a da
o caracterizare de ansamblu a populatiei considerate este necesar ca datele rezultate din
observare sa fie supuse unor operatii de sistematizare si prezentare in vederea deducerii a
ceea ce este esential, tipic si general in legatura cu populatia.
Deoarece in prelucrarea statistica primul pas il constituie prezentarea datelor
observate sub forma de serie, pentru construirea seriilor statistice se aleg variabilele care
trebuie sa fie in stransa dependent cu scopul cercetarii si cu natura fenomenului cercetat.
In raport cu una sau mai multe variabile din programul observarii, se poate
construi o serie statistica, permitand astfel diverse ordonari (grupari) a datelor
inregistrate. Orice cercetare statistica se face cu un anumit scop bine precizat. In urma
efectuarii observarii statistice, indiferent de numarul variabilelor prevazut in programul
cercetarii, prelucrarea datelor rezultate se face in raport cu acelea care sunt strans legate
de scopul final.
Odata precizate variabilele de la baza seriei, se stie care va fi continutul primului
sir de date si ca urmare esle elucidat criteriul in raport cu care informatiile rezultale din
observare vor fi ordonate, necunoscandu-se insa cum se face propriu-zis ordonarea si
cum se completeaza primul sir al seriei.
Completarea primului sir de date al unei serii statistice nu presupune doar o
simpia aranjare in ordine crescatoare sau descrescatoare a variabilelor numerice sau in
- 55 -
ordine alfabetica a starilor variabilelor calitalive. Definirea unei serii, referitor la primul
sir de date se realizeaza in raport cu toate starile variabilei stabilite.
In cazul unei variabile calitative sau cantitative discrete (si care inregistreaza un numar
redus de stari) ce sta la baza construirii unei serii, procedeul cel mai simplu de completare
a primului sir il constituie ordonarea sau aranjarea starilor variabilei respective intr-o
anumita ordine. Daca variabila care sta la baza seriei este de variatie continua sau desi
discreta inregistreaza un numar prea mare de valori in cadrul populatiei de studiat,
ordonarea valorilor acestei variabile va conduce la o faramitare prea mare a populatiei,
ceea ce nu permite evidentierea principalelor aspecte ale acesteia. Pentru asemenea
cazuri, completarea primului sir presupune in primul rand reunirea in clase distincte a
acelor unitati din populate pentru care variabila nu prezinta variatii esentiale. Ca urmare,
in vederea definitivarii primului sir de date al unei serii, se grupeaza datele in mod
corespunzator, fiind necesar in primul rand stabilirea claselor.
Operatia de stabilire a claselor presupune imparprea unitatilor unei populatii in
clase distincte in raport cu una sau mai multe variabile si aranjarea claselor rezultate intro anumita ordine. In urma unei asemenea operatii, fiecare unitate trebuie sa se gaseasca in
una si numai una din clasele rezultate. Aceasta operatie nu trebuie sa conduca la pierderi
de unitati, regasindu-se insa intr-o alta ordine decat cea dupa care s-a realizat observarea.
De modul cum se face operatia de grupare a unitatilor populatiei depinde in mare
masura sesizarea principalelor aspecte calitative care se pot contura in cadrul unei
populatii cat si calitatea informatiilor rezultate in urma prelucrarii datelor respective.
Omogenitatea constituie o proprietate de baza pe care trebuie sa o aiba clasele.
Se spune ca o clasa este omogena daca, pentru unitatile care fac parte din ea, variabila de
grupare inregistreaza variatii nesemnificative.
In cazul seriilor care au la baza o variabila de grupare calitativa sau cantitativa
discreta, problema omogenitatii nu se ridica deoarece, toate unitatile pentru care variabila
a inregistrat aceeasi stare constituie o clasa.
In cele ce urmeaza se va prezenta operatia de stabilire a claselor in cazul unei serii
unidimensionale.
Daca la baza seriei avem o variabila calitativa, atunci clasele se stabilesc in raport
cu starile acesteia. Pentru fiecare stare a variabilei se va construi o clasa. Ca urmare, in
- 56 -
acest caz, intr-o clasa vor intra toate unitatile care au inregistrat aceeasi stare in timpul
observarii in raport cu variabila considerate.
Pentru o variabila cantitativa, care sta la baza construirii unei serii, stabilirea
claselor se realizeaza in mod diferit pentru o variabila discreta si pentru o variabila
continua.
In cazul unei serii care are la baza o variabita cantitativa discreta (numarul
starilor nu este prea mare), clasele se stabilesc in mod asemanator ca si la variabilele
calitative, respectiv:
x1 x 2
X:
N1 N 2
xi
Ni
xR
NR
In conditiile in care cercetarea populatiei presupune elaborarea unei serii care are la baza
o variabila cantitativa continua sau o variabila cantitativa discreta, dar care in populatia
considerate inregistreaza un numar prea mare de stari, clasele nu se mai pot stabili cu
ajutorul starilor variabilei. Pentru asemenea cazuri, gruparea unitatilor populatiei in clase
se face cu ajutorul intervalelor de grupare (variatie), fiecare interval cuprinzand un numar
oarecare de valori ale variabilei. Ca urmare, pentru o serie continua, clasele se definesc
cu ajutorul intervalelor de grupare.
Doua probleme se pun in cazul elaborarii unei serii care are la baza o variabila cantitativa
continua:
determinarea lungimii intervalelor de variatie;
stabilirea formei de scriere a intervalelor de variable.
Determinarea lungimii intervalelor de variatie conduce la doua situatii:
serii construite cu intervale de lungime egala;
serii construite cu intervale de lungime diferita. Alegerea unuia din cazurile de mai sus
(intervalele de lungime egala sau diferita) trebuie precedaia de o analiza atenta a modului
de variatie a variabilei in cadrul populatiei. Stabitirea numarului de intervale de variable
trebuie sa asigure satisfacerea umiatoarelor conditii:
-
informatia care se pierde in urma operatiei de grupare sa nu fie prea mare, iar
- 57 -
media aritmetica a fiecarei grupe (in raport cu valorile inregistrate) sa fie cat mai
fenomenului de studiat din cadrul populatiei. Trebuie remarcat ca acest lucru nu este
posibil nici in cazul unui numar mic de intervale deoarece se pierd prea multe date, nici
in cazul unui numar prea mare de intervale, populatia farmitandu-se prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul in care populatia in raport cu
variabila X este normala, urmatoarea expresie:
l x=
x max x min
1 3,322 lg N
N ..
Nk
. . NR
1
__
- 58 -
20
22.2
22.2
1-3 ani
28
31.1
53.3
4-6 ani
11
12.2
65.6
- 59 -
peste 6 ani 31
34.4
Total
100.0
90
100.0
Frecventa relativa
absoluta
Frecventa relativa
cumulata
non-raspuns
56
62.2
62.2
card
12
13.3
75.6
card,cont
1.1
76.7
cont
10
11.1
87.8
credite
3.3
91.1
credite in valuta
1.1
92.2
depozit
5.6
97.8
depozit,cont
1.1
98.9
plata
1.1
100.0
90
100.0
utilit.,prod.econ.
Total
Veniturile familiei
- 60 -
Frecventa
absoluta
pana la 2,5 mil. lei
25
27.8
27.8
2,6-5 mil.lei
26
28.9
56.7
28
31.1
87.8
8.9
96.7
peste 25 mil.lei
3.3
100.0
Total
90
100.0
Categoria socio-profesionala
Frecventa absoluta
Frecvema
Frecventa relativa
relativa
cumulata
manager
7.8
7.8
patron
5.6
13.3
liber profesionist
10.0
23.3
salariat
29
32.2
55.6
profesor
3.3
58.9
medic
4.4
63.3
pensionar
10
11.1
74.4
- 61 -
fermier
5.6
80.0
elev/student
13
14.4
94.4
casnica
2.2
96.7
somer
3.3
100.0
Total
90
100.0
1.1
1.1
10.0
11.1
55
61.1
72.2
25
27.8
100.0
Total 90
100.0
Promptitudinea personalului
Frecventa absoluta Frecventa relativa Frecventa relativa cumulata
3
1.1
1.1
23
25.6
26.7
66
73.3
100.0
- 62 -
Total 90
100.0
Nivelul dobanzilor
4.4
4.4
20
22.2
26.7
41
45.6
72.2
21
23.3
95.6
4.4
100.0
Total 90
100.0
2,6-5 6-
mil.lei 10 25 25
mil. mil. mil.lei
Lei lei
1
- 63 -
20
11
15
41
10
26
28 8
5
Total
25
21
1
4
3
90
Reprezentari grafice
Reprezentarea grafica a unei serii ne da o imagine geometrica (in plan sau spatiu)
cu privire la forma statica sau evolutia dinamica a fenomenului cuantificat de seria
respectiva.
Graficul asociat unei serii constituie o imagine spatiala a fenomenului de cercetat,
permitand evidentierea rapida a structurii, dinamicii si tendintei de dezvoltare a acestuia.
Reprezentarile grafice sunt folosite atat in scopul cunoasterii populatiei in cauza, cat si
pentru popularizarea unor rezultate din diverse domenii de activitate.
Elaborarea completa si corecta in acelasi timp a unui grafic presupune elucidarea
urmatoarelor elemente: titlul graficului, scara de reprezentare, reteaua graficului, semnele
conventional si notele.
Titlul graficului trebuie sa fie scurt, clar si semnificativ pentru continutul
fenomenului reliefat prin seria considerata.
In cele mai frecvente cazuri un grafic se traseaza intr-un sistera de axe
rectangulare xOy. Pe fiecare din cele doua axe se reprezinta valorile variabilelor X,
respectiv Y, un astfel de punct marcat se mai numeste punct cotat. Scara de reprezentare
reuneste multimea tuturor punctelor cotate. In cazul in care variabila inregistreaza valori
mici, gradarea scarii incepe in principiu de la zero, daca variabila inregistreaza valori
mari se considera o alta origine stabilita cu aproximatie. Pentru a nu incarca prea mult
- 64 -
- 65 -
(2.2)
Li = k
Ni
li
i = 1, R
unde: li = xi xi-1 adica diferenta dintre limita superioara si cea inferioara a intervalului de
variatie.
Multimea tuturor dreptunghiurilor astfel determinate, formeaza histograma atasata seriei.
Poligonul frecventelor
Este o reprezentare grafica a seriilor statistice avand la baza o variabila atributiva
cantitativa continua si formata cu frecvente absolute sau relative, simple sau cumulate.
Trasarea acesteia presupune realizarea in prealabil a histogramei. Poligonul frecventelor
se obtine unind prin segmente de dreapta mijloacele laturilor superioare ale
dreptunghiurilor, din care este alcatuita histograma.
- 66 -
- 67 -
Exemplu
Din Anuarul Statistic al Romaniei din anul 2000 am extras seria care urmeaza, redand
distributia voturilor electoratului pentru Senat (dupa redistributie) la alegerile din 3
noiembrie 1996:
Formaitunea Politica CDR PDSR USD UDMR PRM PUNR
Voturi obtinute (%) 37,0 28,7
16,1 7,7
5,6
4,9
- 68 -
Din Anuarul Statistic al Romaniei din anul 2000 am extras seria care urmeaza, redand
nivelul PNB/loc in S calculat pe baza puterii de cumparare in Romania si alte tari esteuropene
Tara
12197 7543
6153
9624
9832
Cartograma si cartodiagrama
Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafica a seriilor
statistice de spatiu.
Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spatiului (sub
forma de harta) in interiorul caruia se manifesta fenomenul care este cuantificat de seria
de reprezentat. in interiorul hartii astfel realizata, prin diverse culori sau nuante ale
aceleiasi culori, prin hasururi sau prin diferite diagrame, este evidentiata intensitatea
dezvoltarii fenomenulut cercetat precum si marimea indicatorilor seriei.
Cartograma in culori sau nuante ale aceleiasi culori se utilizeaza pentru redarea
intensitatii manifestarii unui fenomen. Acest tip de grafic este recomandat in special
atunci cand intensitatea fenomenului surprins de seria de spatiu nu prezinta o variabila
prea mare pentru a nu apela la prea multe culori sau nuante ale acestora, care sa
ingreuneze citirea graficului.
Cand realizarea unei cartograme in culori este prea costisitoare sau culori le si
nuantele sunt greu de reprodus este utilizata cartograma prin hasuri. Si in acest caz
densitatea hasurilor trebuie sa redea diferente de intensitate a fenomenului in spatiu
surprins de seria de reprezentat. Dupa ce harta a fost desenata si impartita in
conformitate cu starile variabilei de spatii, ce sta la baza seriei, in interiorul fiecarei
subdiviziuni se utilizeaza hasuri a caror intensitate sa fie proportionala cu intensitatea
fenomenului cuantificat de indicatorul cu care s-a construit seria.
Cartodiagrama constitute o modalitate de reprezentare grafica a seriilor de spatiu,
realizandu-se ca o imbinare intre cartograma si diferite alte tipuri de diagrame, ca de
- 69 -
exemplu diagrame prin benzi, cerc , patrat, dreptunghi etc. De exemplu, pentru a
reprezenta o serie de spatiu ce exprima volumul investitiilor straine pe judete, la noi in
tara, se procedeaza astfel: in primul rand se deseneaza harta Romaniei, delimitandu-se
judetele; in cadrul fiecarui judej se deseneaza o figura geometrica oarecare convenabil
aleasa, a carei arie sau marime sa fie direct proportionala cu volumul investitiilor straine
din judetul respectiv.
Si acest tip de reprezentare grafica isi are o larga aplicabilitate in special in
urmarirea acelor fenomene de natura economica sau sociala care sunt urmarite in spatiu.
CAPITOLUL 3
SERII STATISTICE ATRIBUTIVE DE REPARTIIE
UNIDIMENSIONALE
Organizarea datelor rezultate din observarea statistica sub forma de serie de
frecvente, constituie o prima etapa a prelucrarii acestora. O serie statistica reda sub forma
rezumativa (sintetica) o prima imagine asupra populatiei de studiat in raport cu variabila
de la baza seriei.
Pornind de la repartitia statistica, ca forma sintetica de prezentare a rezultatelor
observarii, se pot deduce o serie de caracteristici specifice populatiei considerate, cum ar
fi:
- nivelul mediu al variabilei;
- structura populatiei in raport cu variabila considerata;
- variatia variabilei in raport cu nivelul mediu al acesteia;
- forma dupa care se dispun unitatile populatiei in jurul valorii medii. Caracterizarea
numerica a acestor aspecte poate fi realizata prin urmatorii parametri (caracteristici):
- parametrii tendintei centrale;
- parametrii de structura;
- parametrii variatiei;
- parametrii concentrarii;
- parametrii formei.
- 70 -
, X , ..., X )
(3.0)
- 71 -
definita ca un raport a doua marimi din care se deduce aceeasi expresie pentru X ca si
din (3.0).
Exista, asadar, doua modalitati echivalente de definire a valorii medii, criteriul
relatiei determinante a lui Boiarski-Kisini si criteriul raportului, ultima fiind mai
accesibila. Criteriul raportului presupune raportarea volumului fenomenului cercetat la
volumul populatiei. Acesta presupune cuantificarea volumului fenomenului in functie de
natura lui.
Pentru a exemplifica cele prezentate mai sus, se considers populatia familiilor
dintr-o localitate, cercetata in raport cu numarul de copii. Datele rezultate din observare
se prezinta ca o serie de repartitie de forma:
xi
X:
N
i i 1,R
In acest caz, functia determinanta are urmatoarea forma:
R
x N
G(x1,x2,...,xR) =
i 1
semnificand numarul total de copii din localitatea respectiva. Pentru a gasi numarul
mediu de copii pe familie se particularizeaza relatia (3.0) dupa cum urmeaza:
R
x N = XN
i 1
i 1
De unde rezulta
- 72 -
x N
i 1
N
i 1
- 74 -
Acesta este indicatorul eel mai utilizat in calculul parametrului valoarea medie a
unei serii statistice, asa cum rezulta din practica statistica.
Se considera acum doua serii statistice de repartitie, una formata din frecvente absolute,
iar cealalta din frecvente relative:
xi
X:
N
i i 1,R
(3.4.)
xi
X:
f
i i 1,R
(3.5.)
Avand in vedere respectarea relatiei (3.0) se gasesc urmatoarele expresii de calcul pentru
media aritmetica:
-
xi N i =
i 1
XN
i 1
De unde rezulta
x N
i 1
(3.6)
N
i 1
- 75 -
xi f i =
i 1
X f
i 1
x f
i 1
i i
f
i 1
x
i 1
fi
(3.7.)
x C
i 1
xi
i 1
CR
x
i 1
(3.8.)
i 1
- 76 -
xi 1 xi
X:
f
i i 1,R
Daca s-ar cunoaste densitatea f(x) a variabilei X, atunci, prin definite, media aritmetica
teoretica (speranta matematica) a acesteia, notata cu E(X), ar fi:
E(X) = xf ( x )dx
(3.9)
f2
fR
,
x 2 x1 x R x R 1
Aplicand relapa de calcul (3.9') se deduce expresia de calcul a mediei aritmetice, dupa
cum urmeaza:
R
E(X) = M(X) = X =
i 1
Folosind notatiile:
X
xi xi 1
fi
2
xi xi 1
'
i
x f
i 1
'
(3.10)
- 77 -
X:
0 1
N1 N 2
x N
i 1
N
i 1
0 N i 1N 2 N 2
f 2 (3.11.)
N1 N 2
N
Ca urmare, media aritmetica a unei serii care are la baza o variabila alternativa
coincide cu frecventa relativa a starii notata cu 1.
In vederea intelegerii mai profunde a celor prezentate mai sus, se considera, in
cele ce urmeaza, doua exemple concludente in acest sens.
Exemplu
Angajatii unei societati comerciale se distribuie dupa salariul lunar cuvenit conform
urmatoarei serii de repartitie continua:
- 78 -
1,6 2,0 2,0 2,4 2,4 2,8 2,8 3,2 3,2 3,6 3,6 4,0
X:
7
13
18
6
4
2
x N
i 1
N
i 1
==
2,544
50
5
X:
0 1
850 150
- 79 -
Unde starea 1 pentru variabila X corespunde acelor agenti care au inregistrat pierderi in
anul considerat. Media (ponderea) agentilor cu capital de stat care au inregistrat pierderi
se determina astfel:
R
x N
i
i 1
N
i 1
0 * 850 1 *150
0,15 (15%)
1000
baza unei serii se afla o variabila-care a inregistrat o singura stare X = C, atunci aplicand
relatia de calcul a valorii medii se obtine:
M(X) = M(C ) = C
2. Media produsului dintre o variabila X si o constanta k este egala cu produsul dintre
media variabilei X si constanta respectiva:
R
i 1
i 1
M(k*X) = kxi f i k xi f i k X kM ( X )
- 80 -
X si Y
si se intentioneaza
(3.16)
Pornind de la cele patru proprietati ale mediei aritmetice se pot deduce o serie de
consecinte ale acestora, frecvent intalnite in calcule statistice privind media. Prezentam in
acest sens urmatoarele consecinte:
a) Facand media sumei dintre o variabila X si o constanta C se obtine suma
dintre media variabilei si constanta respectiva :
M(X + C) = M(X) + C
(3.19)
- 81 -
(3.20)
Aceasta ultima relatie, 3.20, conduce la concluzia conform careia, daca starile
unei variabile cantitative cresc sau descresc cu o constanta C, atunci si media noii
variabile obtinute creste sau descreste cu acea constanta.
b) Daca valorile unei variabile X sunt simplificate cu o constanta, atunci media
variabilei X descreste de acel numar de ori.
Daca in proprietatea 2, constanta este de forma 1/k, atunci, relatia (3.13)devine:
M(X/k ) = 1/k * M(X)
(3.21)
De unde rezulta
M(X) = k*M(X/k)
c) Primele doua consecinte conduc la relatia de calcul simplificata a indicatorului
media aritmetica. In acest sens, se face urmatoarea transformare asupra variabilei X:
Z=
X C
k
(3.22)
+C
(3.23)
Aceasta ultima relatie (3.23), constituie formula de calcul simplificat a mediei aritmetice.
Avantajul maxim privind aplicarea acestei relatii se obtine alegand pentru constanta C
starea de mijloc a seriei care are la baza variabila X, iar pentru k valoarea care reprezinta
cel mai mare divizor comun al tuturor diferentelor X-C.
Formula (3.23) se particularizeaza dupa cum seria, care are la baza variabila X,
este o serie construila cu frecvente absolute sau cu frecvente relative:
- in cazul unei serii construita cu frecvenfe absolute, de forma:
- 82 -
xi
X:
N
i i 1,R
Se obtine:
xi C
i1 k * N i
i 1
*k +C
(3.24)
xi
X:
f
i
i 1,R
Se obtine:
R xi C
X * f i *k +C
i1 k
(3.25)
- 83 -
N
x i Ni
xi i
d
i 1
i 1
X
= R
=
R
Ni
Ni
i 1 d
i 1
R
x N
i 1
N
i 1
X min
x
i 1
min
Ni
N
i 1
x N
i 1
R
N
i 1
- 84 -
i 1
Ni
max
Xmax
N
i 1
7 Suma abaterilor liniare ale valorilor unei variabile de la media aritmetica este
nula.
M(X - X ) = 0
8 Proprietatea de minim a mediei aritmetice, se formuleaza astfel:
2
M(X - X )2 M ( X x0 )
xi
X:
N
i
(3.27)
i 1,R
In cazul unei serii discrete de forma (3.27), media armonica notata cu X-1 se
defineste prin:
R
X 1
i 1
Ni
1
Ni
xi
i 1
(3.28)
- 85 -
X 1
N*
i 1
i 1
1
xi
(3.29)
i 1 x i
xi 1 xi
X:
N
i i 1,R
procedand ca la media aritmetica, pentru media armonica rezulta:
R
X 1
i 1
Ni
(3.30)
1
Ni '
xi
i 1
X 1
R
R
x
i 1
(3.31)
'
i
- 86 -
1 Media armonica este cuprinsa intre cea mai mica si cea mai mare valoare a variabilei
X, inregistrata in populatia cercetata
xmin x 1 xmax
2.Daca valoarea medie a unei serii avand la baza variabila X, a fost calculata cu
indicatorul media armonica, atunci, trebuie sa fie verificata urmatoarea relatie:
i 1
R
1
1
Ni
Ni
xi
i 1 X 1
xi
X:
N
i
i 1,R
xi
X:
m
i
i 1,R
i= 1, R
(3,32)
- 87 -
X 1
m
i 1
1
mi
i 1 x i
x N k
i 1
1
N i xi k
xi
i 1
x N
i 1
R
N
i 1
Ca urmare, daca intre cele doua sisteme de ponderi mi si Ni, exista o relatie de forma
(3.32), media armonica este identica cu media aritmetica.
Exemplu
Se considera o intreprindere industriala formata din 5 sectii unde se cunosc
productivitatile medii in fiecare sectie la nivel de muncitor cat si a realizarilor totale la
nivelul fiecarei sectii. Datele din tabelul de mai jos redau acest lucru:
300
300.000
400
450.000
350
400.000
380
420.000
- 88 -
420
500.000
400
350
380
420
300
X :
300.000 450.000 400.000 420.000 500.000
X 1
m
i 1
x
i 1
mi
1
1
1
1
1
300.000
450.000
400.000
420.000
500.000
300
400
350
380
420
2.070.000
372.168lei / muncitor
5562
X g sau X 0
- 89 -
X g x1N1 x 2N 2 x RN R
(3.33)
Xg x
N1
1
N2
2
NR
R
x
i 1
Ni
i
1
N
x
i 1
Ni
N
i
xif i
(3.34)
i 1
xi xi 1
'
i
i = 1, R
(3.40)
In relatia de mai sus, are loc egalitatea in cazul cand variabila X este constanta sau
intre ponderi exista anumite relatii.
Deoarece nu prezinta interes studiul variabilelor care inregistreaza o singura
valoare, prezinta inponanta intelegerea erorii ce poate fi comisa cand, in cazul unei serii
date cu un sistem de ponderi determinat, un indicator de calcul pentru medie se substituie
cu altul.
- 90 -
N(Me) = N/2
(3.41)
Calculul valorii mediane se face diferentiat, dupa cum seria are la baza o variabila
discreta sau continua.
Pentru o repartitie discreta, calculul medianei nu implica probleme deosebite si nici un
volum mare de calcule.
Se considera o repartitie cu frecvente absolute:
x1 x 2
X:
N1 N 2
xi
Ni
xR
NR
(3.42)
In calculul valorii mediane a unei serii discrete, pot aparea doua situatii:
a) volumul N al populatiei este un numar impar;
b) volumul N al populatiei este un numar par.
In ambele cazuri, calculul medianei presupune, in prima faza, determinarea
rangului medianei, notat cu rM , conform urmatoarei relatii:
rM e
1 R
N i N (M e )
2 i 1
- 91 -
(3.40)
a) Daca volumul populatiei N este un numar impar, rangul medianei este un numar
zecimal a carui parte intreaga[N/2] indica numarul de unitati din populatie pentru care
variabila X a inregistrat valori mai mici ca mediana.Ca urmare Me trebuie sa fie valoarea
imediat urmatoare celei de rang [N/2], adica :
Me =
x N
1
2
(3.44)
b) Daca volumul populatiei este un numar par, rangul medianei este un numar intreg si ca
urmare la mijlocul seriei nu se mai afla o valoare a variabilei X cu care sa coincida
mediana ci se gasesc doua valori, mediana calculandu-se in acest caz ca media aritmetica
a acestora. Relatia de calcul a medianei, in acest caz, este:
x N x N
Me =
1
2
(3.45)
2
Pentru o repartitie continua, calculul valorii mediane presupune
verificarea egalitatii (3.41) si ca urmare, trebuie cunoscuta densitatea de
repartitie f(x). Determinarea functiei implica un volum mare de calcule si
deci, din acest motiv, in activitatea practica f(x) este aproximat.
Acest lucru va conduce la o expresie aproximativa de calcul a valorii mediane,
care necesita un volum redus de calcule.
- 92 -
x0 x1 x1 x 2 xi1 xi x R 1 x R
N2 Ni
NR
N1
X :
(3.46)
unde intervalele Xi-1- Xi, i = l,R pot fi de lungime egala sau neegala. Calcularea rangului
medianei va permite stabilirea intervalului in care se afla valoarea mediana, interval
numit si interval median. Se cumuleaza frecventele absolute din aproape in aproape pana
ce este indeplinita inegalitatea:
N1 N 2 N i
1
N
2
Ultima frecventa Ni, cumulata, ne permite sa indicam intervalul median [Xi-1 - Xi).
Ca urmare, Me xi 1 xi , si deci se poate scrie:
Me = xi 1 x
(3.47)
unde x este distanta de la limita inferioara a intervalului median (Xi-1) pana la mediana.
Pentru determinarea medianei mai trebuie cunoscuta aceasta distanta x.
Determinarea distantei x , de la limita inferioara a intervalului median pana la
mediana se poate face in ipoteza ca in intervalul median frecventa absoluta se distribute
proportional cu lungimea intervalului, de unde rezulta:
N ( M e ) N ( xi 1 )
Ni
x
xi xi 1
(3.48)
unde:
N(Me)- reprezinta frecventa absoluta cumulata pana la mediana (rangul medianei);
N(Xi-1) - reprezinta frecventa absoluta cumulate pana la limita inferioara a intervalului
median care se mai numeste si suma frecventelor intervalelor premergatoare intervalului
median.
- 93 -
x =
N ( M e ) N ( xi 1 )
xi xi 1
Ni
Me= xi-1+
N ( M e ) N ( xi 1 )
xi xi 1
Ni
(3.49)
rMe FN ( M e )
1 R
1
fi
2 i 1
2
- 94 -
M e x Me
FN ( M e ) FN ( x Me )
l Me
FMe
Aceasta proprietate este evidenta insasi din definitia data parametrului, dar ea poate
rezulta aplicand o serie de majorari si minorari in relatia de calcul (3.50).
2 Valoarea mediana a unei serii nu se modifica daca frecventele absolute se
simplifica cu aceeasi valoare (de obicei, cel mai mare divizor comun).
Demonstratia acestei proprietati rezulta din formula de calcul a valorii mediane
(3.50). Urmatorul raport:
N ( M e ) N ( x Me )
N Me
- 95 -
mediana este mai putin afectata de valorile extreme ale variabilei, care uneori, pot fi
anormal de mari sau de mici, situatie in care mediana este mat reprezentativa.
Cu toate aceste avantaje, totusi mediana nu poate compensa avantajele valorii
medii. Mediana nu se bucura de anumite proprietati ale valorii medii, cum ar fi: media
unei sume de variabile, proprietatea de aditiune.
- 96 -
x1 x2 xi xR
X:
f f f f
i
R
1 2
(3.51)
valoarea modala se citeste direct din serie, nefiind nevoie de nici o tehnica sau formula de
calcul. In cazul acestui tip de serie, valoarea modala va fi acea valoare a variabilei X
pentru care frecventa este cea mai mare.
b) Pentru serii de repartitie continue, respectiv:
x0 x1 x1 x 2 xi1 xi x R 1 x R
f2
fi
fR
f1
X :
(3.52)
- 97 -
ax
bx c dx f i 1
bx c dx f i
bx c dx f i 1
xi 2
xi
ax
xi 1
x i 1
ax
(3.53)
xi
(3.54)
- 98 -
(3.55)
(3.56)
f i f i 1
xi xi 1 x
(3.57)
1
1 1
1
lMo
1 1
(3.58)
unde :
-
intervalului precedent;
-
intervalului urmator;
-
- 99 -
Frecvente sunt cazurile cand este necesara studierea structurii populatiei in raport
cu o variabila sau alta.Parametrii statistici, in forma cea mai generala, folositi in
caracterizarea structurii unei populatii, poarta denumirea de valori quantile.
Valorile quantile ale unei serii de repartitie unidimensionale sunt acele marimi
inregistrate de variabila X, care impart seria in n parti egale ( mai precis imparte
populatia in n parti egale).In acest caz se vor calcula p quantile; p=n-1.
Pentru o serie continua a carei densitate de probabilitate f(x) este cunoscuta,
urmatoarea egalitate este satisfacuta de cele p quantile :
q1
q2
xR
X1
q1
qn 1
f ( x)dx f ( x)dx
f ( x)dx
1
n
(3.2.1.)
1
n
sau
N(qp)= p
N
n
p 1, n 1
i
2
R
1
X:
N
N
N
N
1
2
i
R
rq p N (q p ) p
N
n
- 100 -
qp
x r qp x r qp 1
2
In cazul seriilor care au la baza o variabila continua , cf. definitiei, cele n-1 quantile
trebuie sa satisfaca relatia 3.2.1.
Fie o serie de variatie continua, ale carei intervale de variatie nu trebuie sa fie neaparat de
lungime egala, cum ar fi :
x0 x1 x1 x 2 xi1 xi x R 1 x R
N2 Ni
NR
N1
X :
rq p N (q p ) p
1 R
Ni
n I 1
- 101 -
N (q p ) N ( xi 1 )
Ni
xi xi 1
q p xq p
N (q p ) N ( x q p )
l qp
(3.2.2.)
xmin M e M e xmax
X:
50% 50%
- 102 -
1 R
1 R
rq 2 2 N i N i
4 i 1
2 i 1
1 R
3 R
rq 3 3 N i N i
4 i 1
4 i 1
Expresiile rangurilor pentru cele 3 quartile sunt diferite, dupa cum valorile rangurilor
corespunzatoare lor sunt intregi sau nu.
In cazul in care rangurile sunt valori intregi, quartilele se calculeaza ca medie
aritmetica simpla a valorilor lui X corespunzatoare rangului si rangului majorat cu o
unitate.
R
sunt :
Q1
x r Q1 x r Q11
2
- 103 -
Q2
Q3
x r Q 2 x r Q 21
2
x r Q 3 x r Q 31
2
R
iar daca p N i , p 1,3 , se divide cu 4, atunci relatiile pentru calculul quartilelor sunt :
i 1
Q1 x r Q1 1
Q2 x r Q 2 1
Q3 x r Q 3 1
1 R
N i reprezinta intervalul quartilei mici.
4 i 1
Q1 xQ1
N (Q1 ) N ( xQ1 )
N Q1
l Q1
- 104 -
1 R
3 R
rQ1 3 N i N i
4 i 1
4 i 1
Primul interval care satisface inegalitatea :
N 1 N 2 ... N i
3 R
N i reprezinta intervalul quartilei mari.
4 i 1
Q3 x
Q3
N (Q3 ) N ( xQ 3 )
N Q3
lQ 3
Valorile decile reprezinta acel caz particular al valorilor quantile pentru care
n=10. Valorile decile reprezinta acei parametri de structura care impart populatia in 10
parti egale.
Parametrii variatiei
In functie de elementul de referinta folosit in masurarea variatiei, deosebim :
-parametrii variatiei in raport cu valoarea medie
-parametrii variatiei in raport cu valoarea mediana.
1.3.1. Parametrii variatiei in raport cu valoarea medie
Din aceasta grupa fac parte:
-amplitudinea sau variatia maxima
-variatia maxima si variatia minima fata de valoarea medie
-abaterea medie liniara
- abaterea medie patratica.
- 105 -
Wx
X
x max x min
X
sau
Wx
X
100
x max x min
X
100
dx
dx M X X
dx
x
i 1
X Ni
R
N
i 1
- 106 -
d x xi X f i
i 1
VX
dx
X
100
Coeficientul simplu de variatie arata cu cat se abate in medie orice valoare a variabilei X
de la valoarea medie echivalenta cu 1 sau 100%.
Abaterea medie patratica
Acest indicator este utilizat atat pentru caracterizarea gradului de
reprezentativitate a valorii medii cat si in scopul estimarii unor parametrii necunoscuti.
Abaterea medie patratica , notata cu x , se defineste ca fiind media patratica a
abaterilor valorilor variabilei X, de la valoarea medie, adica:
x M (X X )2
- 107 -
x
R
x2
i 1
X )2 Ni
pentru o serie cu frecvente absolute,
N
i 1
sau :
R
Pentru o serie data, varianta calculata nu are interpretare, dar daca se extrage
radacina patrata din aceasta se obtine un numar care se exprima in aceleasi unitati de
masura ca si variabila de la baza seriei. Acest numar reprezinta abaterea medie patratica,
simbolizind cu cat se abate in medie in plus sau minus orice valoare xi a variabilei X, de
la valoarea medie.
Parametrul abatere medie patratica se poate exprima si sub forma relativa, caz in
care se numeste coeficient de variatie a lui Pearson si se noteaza cu Vx.
Expresia de calcul este :
Vx
x
100
X
- 108 -
Y ))
- 109 -
1
X1 X 2 . . X n 1
2 (V ( X 1 ) V ( X 2 ) . . V ( X n )) V ( X )
V
n
n n
11.Varianta unor variabile normate este unu, iar media este zero.
Pentru o variabila X oarecare, variabila normata atasata este :
Z=
X X
x
De medie M(Z)=0.
Si varianta Z2 1.
12.Regula de adunare a variantelor.
Varianta in intreaga populatie, care masoara variatia totala in raport cu X, este egala cu
suma a doua variante, din care una masoara variatia in cadrul grupelor, iar cealalta
variatia dintre grupe.
x2 x2 x2
i
abaterea interquartila
abaterea interdecila
abaterea interquantila
Abaterea interquartila
Abaterea interquartila , prin definitie este media aritmetica simpla a segmentelor
Me-Q1 si Q3-Me, respectiv:
- 110 -
M e Q1 Q3 M e Q3 Q1
2
2
si arata cu cat se abat in medie in plus sau in minus, de la mediana cele 50% din valorile
variabilei cuprinse intre Q1 si Q3.
Forma relativa a acestui indicator , notat cu Qr este :
Qr
Q Q1
Q
100 3
100
Me
2M e
D=
D9 M e M e D1 D9 D1
2
2
Dr
D9 D1
100
2M e
- 111 -
q n 1 M e M e q1 q n 1 q1
2
2
q q1
q
100 n 1
100
Me
2M e
Cu cat abaterea interquantilica este mai mica, cu atat valoarea mediana este mai
reprezentativa.
3.4.Parametrii concentrarii
Daca la baza unei serii se afla o variabila numerica, atunci caracterizarea sintetica
a concentrarii valorilor sale in jurul valorii medii se realizeaza in principal cu ajutorul
parametrilor adecvati ai variatiei.
In cazul in care seria are insa la baza o variabila nenumerica, caracterizarea
sintetica a concentrarii starilor variabilei se poate realiza prin:
-
energia informationala
entropia informationala
- 112 -
, se
exprima astfel:
f
f
i 1
2
i
Seria prezinta o concentrare maxima daca toate unitatile populatiei sunt repartizate intr-o
singura clasa a carei frecventa relativa va fi 1, iar pentru celelalte clase frecventele
relative vor fi 0.
Energia informationala
Acest parametru a fost introdus de academicianul Octav Onicescu.Prin definitie :
R
2
E= f i , unde s-a notat cu E, energia informationala.
i 1
1
E
R
Er
1
1
R
f
i 1
2
i
1
1
R
1
R
, de unde 0 E r 1 .
Entropia informationala
- 113 -
H= f i ln
i 1
1
fi
1 1
H R ln ln R
R 1/ R
In cazul unei concentrari maxime, entropia informationala inregistreaza o valoare
minima, deoarece :
H=1 ln1+ (R-1)*0*ln 1/0 0
Hr
H 0
H
ln R 0 ln R
f
i 1
ln
1
fi
ln R
3.5.Parametrii formei
Parametrii formei unei serii de repartitie, dupa continut, se clasifica in doua grupe ;
-parametrii asimetriei
- 114 -
-parametrii boltirii
Parametrii asimetriei
Asimetria unei serii se defineste in raport cu dispunerea unitatilor intr-o parte sau alta a
valorii medii.
In acest sens o serie de repartitie este simetrica in raport cu media sa daca
frecventele valorilor variabilei X, egal departate de valoarea medie, sunt egale intre ele,
adica :
f (X ) f (X
si
),
O serie de repartitie este asimetrica in raport cu valoarea sa medie daca exista cel putin o
pereche de valori ale variabilei X, egal departate de valoarea medie, pentru care
frecventele corespunzatoare sa nu fie egale intre ele, adica :
f (X ) f (X
si
X Mo
x
sensul acesteia.
In acest sens avem :
=0, atunci
2.daca >0, atunci
1.daca
X M0,
- 115 -
M ( X X )3
x3
Calculand valoarea acestui parametru, in functie de semnul ei, avem urmatoarele cazuri :
1. 3 0 , ceea ce inseamna ca M ( X X ) 3 0 , adica suma tuturor abaterilor cu
semnul minus, este egala cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a
treia.In acest caz, seria este simetrica.
2. 3 >0, ceea ce inseamna ca M ( X X ) 3 >0.Aceasta este echivalent cu faptul
ca pe total suma abaterilor cu semnul plus de la valoarea medie este mai mare decat suma
abaterilor cu semnul minus si ca urmare seria prezinta o asimetrie pozitiva.
3. 3 <0, deci M ( X X ) 3 <0. Aceasta este echivalent cu faptul ca pe total suma
abaterilor cu semnul minus de la valoarea medie este mai mare decat suma abaterilor cu
semnul plus si ca urmare seria prezinta o asimetrie negativa..
Parametrii boltirii
Aprecierea boltirii unei serii este utila in caracterizarea gradului de
reprezentativitate a valorii medii cat si pentru compararea reprezentativitatii a doua sau
mai multe valori medii ce reprezinta serii diferite.
Parametrul M ( X X ) 4 da o caracterizare numerica sub forma absoluta a
gradului de boltire a unei serii.
Sub forma relativa gradul de boltire a unei serii se masoara cu parametrul :
B4
M (X X )4
sau
x4
B4'
M ( X X )4
3
x4
- 116 -
daca B4' 0 ( adica B4=3) atunci seria in cauza prezinta aceeasi boltire cu a curbei
normale(excesul este nul)
B4' >0, atunci boltirea corespunzatoare curbei respective este mai inalta si mai
B4' <0, atunci boltirea corespunzatoare curbei respective este mai plata ( mai
X:
10 16
16 22
22 28
28 34
34 40
15
10
Se cere :
a) pretul mediu
b) pretul inregistrat de cele mai multe actiuni din esantion
c) acel pret care divide esantionul in doua parti egale
d) reprezentativitatea pretului mediu
e) sa se calculeze cu cat se abate in medie pretul unei actiuni din esantion de la
pretul mediu
f) folosind valorile quartile sa se studieze structura actiunilor in raport cu pretul.
P2.Intr-o firma s-au realizat 40 de produse in cadrul unui trimestru.Acestea au fost
propuse prelucrarii in mod secvential in doua sectii de productie.
Repartitia produselor realizate in raport cu costurile ( in mii lei) din cele doua sectii a
fost :
C2
100-108
108-116
116-124
124-132
- 117 -
C1
62-66
58-62
54-58
50-58
3
1
1
2
5
10
3
1
3
5
1
1
1
3
Folosind proprietatea conform careia media sumei a doua variabile este egala cu
suma mediilor acestora, calculati costul mediu pe produs.
P.3.Distributia a 100 de angajati din trei ramuri de activitate diferite, in raport cu salariul
primit este :
R
S
8,0-8,5
7,5-8,0
7,0-7,5
6,5-7,0
6,0-6,5
Total
R1
6
6
7
11
10
40
R2
8
7
10
5
30
R3
Total
7
8
5
10
30
100
X:
0 200
10
200 400
400 600
600 800
800 1000
40
50
25
- 118 -
12
16
X:
0 100
152
100 160
160 220
220 280
280 320
15
83
49
20
BIBLIOGRAFIE
1. Biji, E.M., Gogu, E., - Teoria i Tehnica Sondajului Statistic, Editura Oscar Print,
2009.
2. Boboc, C., Analiza statistic multidimensional. Aplicaii n cadrul produselor i
serviciilor, Editura Meteor Press, 2007.
3. Buiga Anua, Statistic inferenial, Editura Universitii ,,Babe-Bolyai, Cluj
Napoca, 2009
3. Cmpeanu, A.S., - Statistic pentru afaceri (Statistic II), Bucureti, 2006.
- 119 -
- 120 -