Sunteți pe pagina 1din 43

Capitolul V

ANALIZA STATISTIC A VARIABILITII FA


DE TENDINA CENTRAL
5.1. NECESITATEA MSURRII VARIABILITII
(MPRTIERII) VALORILOR INDIVIDUALE.
CLASIFICAREA INDICATORILOR DE
MPRTIERE
Formele individuale de manifestare ale fenomenelor de mas analizate
ntr-o colectivitate prezint o variabilitate (mprtiere) mai mare sau mai
mic n funcie de numrul, natura, direcia i sensul aciunii factorilor
eseniali i ntmpltori. La nivelul colectivitii, sau al ansamblului, legea
tendinei comportamentului acestor fenomene este reflectat sintetic de
indicatorii tendinei centrale: media, mediana, etc. Cu ct fenomenele au un
grad mai mare de complexitate (determinat de multitudinea de factori
de influen) cu att variaia (mprtierea) valorilor individuale este mai
mare. Deci, utilizarea corect a indicatorilor tendinei centrale n
fundamentarea deciziilor necesit verificarea stabilitii i
reprezentativitii valorilor nregistrate de acetia. Astfel, valoarea
determinat a mediei este reprezentativ numai n msura n care ea este
calculat din date omogene, apropiate ntre ele ca mrime sau din punctul de
vedere al altor criterii. Aceasta nseamn c determinarea valorii mediei
trebuie s fie nsoit de verificarea omogenitii valorilor individuale din
care ea s-a calculat. Verificarea omogenitii valorilor individuale necesit
msurarea i analiza mprtierii i concentrrii fa de valorile tipice
calculate.
n statistic prin noiunea general de mprtiere (variaie sau
dispersare) se au n vedere abaterile msurabile ale valorilor individuale fa
de o valoare central (tipic). De exemplu, n dou populaii, aceeai
variabil nregistreaz valorile:
{x
i
}
=
{2;2;2;10;18;18;18}

{x
i
}={9;9;9;9;10;11;11;11;11}.
Cele dou serii au aceeai medie i median dar mprtierea
(dispersarea) este diferit. Acest fapt este evideniat de abaterile nregistrate
fa de media (10) sau mediana (10). Seria a doua este mai omogen
(nregistreaz o mai mic mprtiere sau dispersare a valorilor individuale),
128 Statistic general
iar valorile sale tipice sunt mai reprezentative. Prin urmare, noiunea de
dispersare, mprtiere, completeaz informaiile despre seriile
statistice investigate.
Calculul i analiza indicatorilor variaiei sau mprtierii valorilor
individuale fa de tendina central ofer posibilitatea rezolvrii unor probleme
de cunoatere statistic. Dintre acestea se disting:
1) analiza gradului de omogenitate a datelor din care s-au calculat
indicatorii tendinei centrale i verificarea reprezentativitii acestora;
2) compararea n timp i (sau) spaiu a mai multor serii de repartiie
dup caracteristici independente sau (i) interdependente;
3) selectarea obiectiv a factorilor semnificativi de influen dup
care se structureaz unitile unei colectiviti statistice;
4) separarea aciunilor factorilor eseniali de aciunea factorilor
ntmpltori, identificarea felului n care factorii eseniali i modific
aciunea de la o grup (clas) la alta;
5) concentrarea valorilor individuale ale caracteristicilor i
deplasarea acestora fa de valorile tipice;
6) aplicarea diferitelor teste ale statisticii matematice.
Indicatorii mprtierii (variaiei) utilizai n analizele statistice sunt
clasificai dup mai multe criterii:
dup numrul variantelor luate n calcul (sau dup gradul lor de
sintez) exist indicatori simpli i indicatori sintetici;
dup modul de sistematizare a datelor primare exist indicatori
ai variaiei calculai pentru serii de distribuie unidimensionale
i indicatori ai variaiei calculai pentru serii multidimensionale;
dup modul de calcul i exprimare exist indicatori ai variaiei
calculai ca mrimi absolute i ca mrimi relative.
Indiferent de natura lor, indicatorii de mprtiere calculai ofer
informaii necesare nu numai pentru cunoaterea variabilitii din seriile
statistice analizate, dar i pentru aprecierea "calitii" (sub aspectul
reprezentativitii i al ncrcturii informaionale) valorilor tipice utilizate
n procesul decizional.
5.2. INDICATORII SIMPLI AI MPRTIERII
Aceti indicatori prezint urmtoarele caracteristici generale:
se determin dintr-un numr redus de valori individuale;
se determin, de regul, prin compararea sub form de diferen i,
n consecin, se exprim n unitatea de msur a variabilei
observate;
Capitolul V 129
informaiile despre variabilitate oferite n urma determinrii i
analizrii rezultatelor sunt extrem de reduse i nu vizeaz
omogenitatea ansamblului de date nregistrate etc.
a) Amplitudinea mprtierii sau variaiei (A) se definete prin diferena
dintre cea mai mare i cea mai mic valoare individual nregistrat.
A=x
max
-x
min
(5.1.)
unde:
x
max
= max{x1, x2,..., xn};
x
min
={x1, x2,..., xn};
{x
i
}= valori individuale nregistrate ) n , 1 i ( =
Observaii asupra coninutului i metodologiei de calcul:
1) Amplitudinea se exprim n unitatea de msur a caracteristicii
urmrite, dac se calculeaz dup relaia (5.1), sau n procente dac se
calculeaz sub form relativ dup relaia urmtoare:

A% =
X
max
X
min

X
% 100
(5.2)
2) Ca msur a mprtierii valorilor individuale amplitudinea
prezint dezavantajul c nu ine seama de toate observaiile i este sensibil
la prezena valorilor aberante. De exemplu, urmtoarele trei serii
vizualizate au aceeai amplitudine dar prezint variaii (dispersri) diferite:


x
min
x
min
x
min
x
min
x
max
x
max
x
max
x
max

Amplitudinea este un indicator de mprtiere "destul de rezonabil"
numai dac valorile individuale ale seriei sunt repartizate n mod uniform,
omogen (fr s existe valori aberante).
130 Statistic general
3) n cazul seriilor de distribuie de frecven pe intervale calculul
ampliutudinii este lipsit de sens;
4) Amplitudinea se utilizeaz frecvent n prelucrarea statistic la
alegerea numrului de intervale de grupare a datelor i la stabilirea mrimii
intervalelor.
b) Abaterea intercuantilic se calculeaz, ca diferen ntre cuantila
superioar i cuantila inferioar ambele avnd acelai ordin. Astfel, pentru
cuantilele definite n capitolul anterior observm:
- pentru r = 4 Q
3
- Q
1
, conine 50% din numrul observaiilor;
- pentru r = 10 D
9
-D
1
, conine 80% din numrul observaiilor.

ntr-o distibuie normal abaterea intercuartilic se exemplific n
figura 5.1.



Figura 5.1. Abaterea Q
3
-Q
1
n distribuia normal


Observaii:
1) Acest indicator se exprim n unitatea de msur a caracteristicii;
2) Calculul abaterii intercuartilice, spre deosebire de cel al
amplitudinii, prezint avantajul c evit valorile individuale extreme sau
aberante. Prin calculul acestui indicator se pierd, ns, informaii dar are
ctig de cauz omogenitatea valorilor individuale.
3) Acest indicator ofer informaii despre concentrarea valorilor
individuale n cadrul seriei, pentru analiza asimetriei distribuiilor;

4) Ca i amplitudinea mprtierii, abaterea intercuartilic nu poate fi
utilizat n calcule algebrice etc.
c) Abaterile individuale ca msuri ale mprtierii ntr-o serie
exprim cu cte uniti de msur sau de cte ori (sau ct la sut) valoarea
Abaterea intercuantilic
Q
1
3
Q ( ) -
Q
3
25% 25% 25% 25%
Q
2
Q
1
Capitolul V 131
caracteristicii urmrit, la fiecare unitate a colectivitii, se abate de la
mrimea calculat a unui indicator al tendinei centrale.
Prin urmare, tendina central se exprim prin media aritmetic,
abaterile individuale n mrimi absolute sau relative i se calculeaz astfel:

d
i
= X
i


X sau d
i
%=
X
i


X

X
%100
(pentru orice
i = 1, n
) (5.3)
Observaii: d
i
% =

X
X X
i
d
i
=

X X
i

1) n relaia (5.3) valorile individuale se compar cu valoarea lor
medie, dar la fel de bine poate fi utilizat pentru comparare oricare alt
indicator al tendinei centrale (de exemplu: mediana).
2) Media abaterilor individuale {

d
i
} (cu i = 1,n) calculate n raport
cu media variantelor caracteristicii este nul, deoarece abaterile ntr-un sens
sau altul, n sintez, se compenseaz reciproc.
3) n cursul seriilor de distribuie de frecvene pe intervale, pentru
calculul abateriilor individuale se iau n considerare centrele de interval.
4) n analizele statistice se urmrete n mod deosebit abaterile
maxime pozitive (d
max+
) i negative (d
max-
) calculate n cifre absolute i
relative astfel:
d
max+
=x
max
-
x
sau d
max+
%=
dmax +

X
% 100
(5.4)
x x d =
max max
sau 10 %
max
max
=

x
d
d 0 (5.5)
5) n cazul unui distribuii simetrice
d
max +
= d
max
, iar n
interiorul seriei la abateri egale, (dar de semne contrare), le corespund
frecvene egale de apariie. Aceasta conduce la compensarea pe total (la
nivelul ntregului ansamblu) a abaterilor individuale.
6) n funcie de scopul analizei statistice ntreprinse se pot studia i
seriile {d
j
}, {d
j
,n
j
}, {d
j
,f
j
}. Se determin n acest sens toi indicatorii
prezentai n capitolul anterior, dar abaterile individuale se iau n modul (n
valoare absolut).
Analiza coninutului i metodologiei de calcul a indicatorilor simpli
ai mprtierii, sub aspect informaional, prezint dezavantajul c unii nu in
seama dect de un numr redus de valori individuale, iar alii - cu toate c au
n vedere relaia dintre fiecare valoare individual i media lor
corespunztoare - permit numai o caracterizare aproximativ a mprtierii
n cadrul seriei.

132 Statistic general
5.3. INDICATORII SINTETICI AI MPRTIERII
Indicatorii sintetici ai mprtierii (variaiei), spre deosebire de
indicatorii simpli, sintetizeaz ntr-o singur expresie numeric variaia
valorilor individuale fa de tentina central a caracteristicilor urmrite,
ntr-o populaie statistic. Principalii indicatori sintetici cu care se
caractrerizeaz mprtierea (variaia) termenilor seriei fa de tendina lor
central sunt: abaterea medie adsolut; dispersia; abaterea medie
ptratic (sau abaterea standard) i coeficientul de variaie. La baza
determinrii indicatorilor sintetici stau abaterile individuale, dar pentru a se
evita compensarea, ele vor fi luate n modul (valoare absolut) sau se va
opera cu ptratele acestora.
5.3.1. Abaterea medie absolut
Abaterea medie absolut (
d)
reprezint media aritmetic simpl
sau ponderat a abaterilor "absolute" ale termenilor seriei de la tendina lor
central, caracterizat cu ajutorul mediei sau al medianei.
n cazul n care abaterea valorilor individuale sunt calculate i analizate
fa de medie atunci abaterea medie absolut
(d
x
)
se determin astfel:
- cazul seriei simple:

n
x x
d
i
n
1 i
x

(5.6.)
- cazul seriei de distribuie de frecvene:

j
k
k j
j j
k
1 j
x
n
n x x
d
=

sau
j
k
1 j
j
x
f x x d

=
= (5.7.)
unde:
k = numrul de variante distincte sau intervale de grupare;
nj (cu j=
1, k
) = frecvene absolute;
fj (cu j=
1, k
) = frecvene relative, exprimate sub form de coeficieni
1
.
Este posibil ca n unele analize statistice s prezinte interes abaterea
medie absolut a abaterilor valorilor individuale de median
d
Me
.
n
asemenea situaii aceasta se determin dup urmtoarele relaii:

1
n cazul n care frecvenele relative sunt n % atunci numitorii relaiilor (5.7) i
(5.9), unde intervin acestea, vor fi egali cu 100.
Capitolul V 133
- cazul seriei simple:

n
Me x
d
i
n
1 i
Me

=
=

(5.8)
- cazul seriei de distribuie de frecvene:

j
k
1 j
j j
k
1 j
Me
n
n Me x
d
=
=


= sau
j
k
1 j
j
x f Me x d

=
= (5.9)
Coninutul i metodologia de calcul a abaterii medii absolute conduc
la unele observaii cum ar fi:
1) ea se exprim n unitatea de msur a caracteristicii urmrite;
2) n cazul seriilor de distribuie pe intervale de grupare pentru
calculul ei se iau n considerare centrele acestora;
3) abaterea absolut medie calculat n funcie de media valorilor
individuale este mai mic sau egal cu aceea calculat n funcie de media
aritmetic:

x
d Me d (5.10)
4) ea se calculeaz i se analizeaz nu numai pentru seriile de
distribuie, dar i pentru seriile cronologice sau teritoriale;
5) calculul i analiza acestui indicator sintetic al mprtierii este
justificat numai n msura n care prezint interes, pentru caracterizarea
variabilitii, mrimea abaterilor i nu i semnul lor (pozitiv sau negativ).
Aplicaia 5.1. Se consider seria simpl {1, 2, 4, 5, 7, 8, 9, 10, 11, 13}pentru
care s-a calculat media
x = 7
i Me=7,5. Se construiete tabelul urmtor care
conine abaterile absolute fa de medie i median
( x
i
Xsi x
i
Me)
precum
i sumele corespunztoare:

Tabelul 5.1.

x
i
1 2 4 5 7 8 9 10 11 13 Total
7
i
x
6 5 3 2 0 1 2 3 4 6 32
5 , 7
i
x
6,5 5,5 3,5 2,5 0,5 0,5 1,5 2,5 3,5 5,5 32

Potrivit relaiilor (5.6) i (5.8) se constat c
d
x
= d
Me
= 3, 2
.
Rezultatul obinut evideniaz faptul c n cadrul seriei analizate n
medie valorile individuale se abat de la media (7) sau de la media (7,5) lor
134 Statistic general
n mod identic cu (3,2). Aceast egalitate este neltoare, deoarece ea
exist pentru cazuri foarte rare. n general cei doi indicatori au valori
distincte. Calculul abaterii medii absolute pentru cazul seriilor de distribuie
pe intervale de grupare este exemplificat n cadrul Aplicaiei 5.2.
Abaterea medie abolut, ca indicator sintetic al mprtierii valorilor
individuale fa de tendina lor central, satisface destul de bine condiiile
lui Yulle, dar prezint dezavantajul c nu poate fi utilizat n calcule
algebrice. Din aceast cauz n analizele statistice n locul ei se prefer
abaterea ptratic (abaterea standard sau abaterea tip).
5.3.2. Dispersia
Valoarea absolut ale diferenelor xi -
x
calculate n (5.6), (5.7) (sau
5.8) i (5.9) elimin sensul (semnul) abaterilor fa de tendina central.
Acelai obiectiv poate fi atins dac diferenele respective se ridic la ptrat.
Lundu-se n considerare ptratele abaterilor valorilor individuale de la
tendina lor central se obine o valoare tipic a mprtierii, numit
dispersie

("
x
2
).

Prin urmare, dispersia ca msur sintetic a mprtierii (variaiei)
reprezint media aritmetic (simpl sau ponderat) a ptratelor abaterilor
valorilor individuale de la tendina lor central. Aceasta nseamn c n
calculul dispersiei poate fi luat n considerare media sau alt indicator al
tendinei centrale (de exemplu, mediana). Deci, relaiile de calcul ale
dispersiei fa de media aritmetic, sunt urmtoarele:
- cazul seriei simple:

n
) x x (
2
i
n
1 i 2
x

=

=


(5.10)

- cazul seriei de distribuie de frecvene

k
1 j
j
2
j
k
1 j
2
x
n ) x x (
=


sau
j
2
j
k
1 j
2
x
f ) x x (

=
=

(5.11)

Calculul dispersiei, pentru cazul seriei simple i pentru cazul de
distribuie de frecvene pe intervale de grupare, este exemplificat n aplicaia
5.2.
Aplicaia 5.2.
cazul seriei simple. Lund n considerare datele prezentate la
Aplicaia 5.1 obinem seria ptratelor abaterilor valorilor
individuale de la media lor (7):
136 Statistic general

=
=

2
j
k
1 j
j
2
j
k
1 j
2
x
x
n
n x

sau
2
j
2
j
k
1 j
2
x
x f x

=
=


(5.13)
Dispersia unei caracteristici invariante (staionare) sau a unei
constante este nul.
Prin centrarea tuturor valorilor individuale ale unei variabile
numerice ntr-o constant a dispersia valorilor centrate nu
difer de dispersia valorilor iniiale. Deoarece a x a x
i i
= ,
atunci avem:
2
x
i
2
i
i
2
i i
2
a x
n
] a x a x [
n
)] a x ( ) a x [(
i
=
+
=

=

c.c.t.d.
Dac fiecare valoare individual a unei variabile numerice X se
multiplic de acelai numr de ori h atunci dispersia valorilor
transformate va fi mai mare dect dispersia valorilor iniiale de
h
2
ori. Deoarece
i i
x h hx = , atunci avem:
2
x
2 i
2
i i
2
hx
h
n
] x h hx [
i
=

=

c.c.t.d.
Combinnd ultimele dou proprieti rezult c dispersia valorilor
individuale
n , 1 i
i
} a hx {
=
comparativ cu dispersia valorilor iniiale
n , 1 i
i
} x {
=
este:
2
x
2 2
a hx
h
i
=

.
Proprietile constatate anterior sugereaz exprimarea dispersie
printr-o relaie care simplific operaiile de calcul implicate n
obinerea rezultatului final, fr s afecteze rezultatul obinut prin
celelalte relaii (5.10) (5.14).
Relaiile de calcul simplificat ale dispersiei sunt, deci, urmtoarele:
cazul seriei simple:

"
x
2
=
n
i=1

x
i
a
h
2
n
% h
2

(
x a
)
2
(5.14)
cazul seriei de distribuie de frecvene pe intervale de grupare:

"
x
2
=
n
i=1

xja
h
2
n
j
k
j=1

n
j
% h
2

(
x a
)
2

sau
"
x
2
=
k
j=1

x
j
a
h
2
f
j
/h
2

(
x a
)
2
(5.15)
Capitolul V 137
n relaiile (5.14) i (5.15), numite i relaii de calcul simplificat ale
dispersiei, valorile lui "a" i "h" sunt valori convenabil stabilite. De exemplu,
n cazul distribuiei pe intervale egale de grupare se iau, deseori, astfel:
a = centrul de interval care are cea mai mare frecven;
h = mrimea intervalului de grupare sau cel mai mare divizor comun
al valorilor [x
i
-a]
.

Aplicaia 5.3.
Exemplificm determinarea dispersiei dup relaia (4.15) utiliznd
datele din tabelul 5.3.

Tabelul 5.3.
Determinarea dispersiei prin relaia de calcul simplificat

Centre de interval
(sute mii lei)
x
j

Numr de
intrri
n
j

x
j - 5,5

x
j
5,5
1
x
j
5,5
1
n
j
x
j
5,5
1
n
j
3,5
4,5
5,5
6,5
7,5
26
33
64
7
10
-2
-1
0
1
2
-2
-1
0
1
2
-52
-33
0
7
20
104
33
0
7
40
TOTAL 140 - - -58 184

Obinem:
x =
58
140
% 1 + 5, 5 = 5, 086
sute mii lei i

"
x
2
=
184
140
% 1
(
5, 086 15, 5
)
2
= 1, 14
egal cu valoarea dispersiei
calculat pe baza datelor iniiale (netransformate) din aplicaia 5.2.
Dispersia se calculeaz nu numai pentru caracteristici numerice.
n cazul unei caracteristici alternative (distribuia
corespunztoare este prezentat n capitolul anterior) dispersia se
determin, n mod convenional, astfel:
"
p
2
=
(1p)
2
N+(0p)
2
M
(N+M)
= q
2
N
N+M
+p
2
M
N+M
= q
2
p+p
2
q = qp
(
p+q
)
=


=pq=p
(
1p
)
(5.16)
unde: p+q=1;

q =
N
N+M
= 1 q
- reprezint greutatea specific a unitilor care
posed caracteristici n form direct (de tip DA);

p =
N
N+M
= 1 q
- reprezint greutatea specific a unitilor care
nu posed caracteristica n form direct (de tip NU).
Gruparea variabilelor continue presupune divizarea domeniului
de variaie ntr-un anumit numr de intervale i alegerea unei
valori reprezentative din cadrul fiecrui interval; de obicei, se
138 Statistic general
aleg drept valori reprezentative mijloacele intervalelor n ipoteza
c n fiecare interval frecvenele (absolute sau relative) sunt
normal repartizate. Aceast alegere datorit faptului c ipoteza
considerat nu se verific, de regul, n practic implic un
anumit grad de arbitrariu i este susceptibil de introducerea unor
erori sistematice. Mrimea acestor erori este apreciabil mai ales
atunci cnd lungimea intervalelor este mare.
Efectul generat de presupusa concentrare (artificial) a
valorilor individuale n centrele intervalelor, atunci cnd analiza
se realizeaz prin intermediul gruprii valorilor variabilelor
continue, poate fi corectat cu ajutorul formulelor lui W. F.
Sheppard. Utilizarea acestor formule este limitat, ns, la
cazurile n care:
a. distribuia de frecvene este continu,
unimodal i relativ simetric;
b. frecvenele (absolute sau relative) tind ctre
zero la ambele extremiti ale domeniului de
variaie.
Relaiile lui W. F. Sheppard pentru momentele centrate de
ordinele 2, 3 i 4 sunt urmtoarele:
240
h 7
2
h
12
h
12
h
4
2
2
4
c
4
3
c
3
2
2
calculat x
2
2
2
corectat x
c
2
+
=
= =
(5.17)
unde: h = lungimea intervalelor de grupare
n cazul unui sondaj statistic efectuat ntr-o populaie
normal distribuit, corecia lui Sheppard se recomand atunci
cnd volumul eantionului (n) satisafce inegalitatea
4
0
h
3 n |
.
|

\
|
< (5.18)
O alt proprietate interesant a dispersiei este urmtoarea: dac o
colectivitate statistic cu efectiv "n" este structurat n dou
subcolective "a" i "b", cu efectivele "n
a
" i "n
b
", atunci dispersia
general (a colectivitii) este determinat n funcie de media
dispersiilor corespunztoare subcolectivitilor (
"
x
a
2
si "
x
b
2
)
i de
dispersia mediilor
(x
a
si x
b
)
pariale de la media general
x.

(acest caz particular va fi generalizat ulterior).
Capitolul V 139
Prin urmare:
se calculeaz mediile pariale
x
a
si x
b
,
ale subcolectivitilor i
media general:
x =
x
a
*n
a
+x
b
*n
b
n
a
+n
b
;

se calculeaz dispersiile pariale
"
x
a
2
si "
x
b
2
;

dispersia general a colectivitii investigate n funcie de
dispersiile pariale:

"
x
2
=
n
a
"
xa
2
+n
b
"
x
b
2
n
a
+n
b
+
n
a
(x
a
x)
2
+n
b
(x
b
x)
2
n
a
+n
b (5.18)
unde:

"
x
2
- sintetizeaz mprtierea tuturor valorilor individuale din
colectivitatea general cauzat att de influena factorilor aleatori, ct i de
influena factorului sistematic n funcie de care s-a structurat colectivitatea
general.

n
a
"
x
a
2
+n
a
"
x
b
2
n
a
+n
b - reprezint media dispersiilor pariale
(
"
x
2
)
.

2
- sintetizeaz variaia (mprtierea) din interiorul
subcolectivitilor. Aceasta se datoreaz factorilor specific, aleatori.

n
a
x
a
x
b
2
+n
b
x
b
x
b
2
n
a
+n
b - este dispersia mediilor pariale de la
media general. Ea sintetizeaz influena factorului sistematic, de structurare
a colectivitii, asupra mprtierii generale a valorilor individuale;
sintetizeaz variaia dintre subcolectivitile n care s-a structurat
colectivitatea general.
Relaia (5.18) permite nu numai determinarea dispersiei ntr-o
colectivitate structurat n mai multe pri dar pune n eviden i
urmtoarele aspecte:
ct la sut din dispersia general (variaia general) este explicat
de factorul n funcie de care s-a structurat colectivitatea
general:

R
2
=

x
2
"
x
2
$ 100
(5.19)
R
2
- se numete grad de determinare. Gradul de determinare
exprim msura n care variaia caracteristicii urmrite depinde de factorul
(cauza) sistematic dup care s-a structurat colectivitatea.
ct la sut din dispersia general este explicat (determinat) de
factorii aleatori, care acioneaz n fiecare subcolectivitate a
colectivitii generale:
140 Statistic general

K
2
=
"
x
2
"
x
2
$ 100 = 1 R
2
(5.20)
K
2
- se numete grad de nedeterminare. Gradul de nedeterminare
exprim, deci, msura n care variaia caracteristicii urmrite este
dependent de variaia factorilor (cauzelor) care acioneaz n interiorul
subcolectivilor.
Utilizarea n analiza statistic a relaiei (5.18), numit i regula de
adunare a dispersiilor, este exemplificat n urmtoarea aplicaie.
Aplicaia 5.4.
S presupunem c societatea comercial "ANDMIR" S.A. i
desfoar activitatea n cadrul a dou filiale "AND" S.A. i "NIR" S.A.
Datele referitoare la numrul de persoane i salarii brute, pe categorii de
personal i pe filiale, se prezint n tabelul urmtor. Cum se explic
dispersia general a salariilor la "ANDMIR" S.A.?

Tabelul 5.4

Filiala "AND" S.A. Filiala " MIR" S.A.
Societatea
"ANDMIR" S.A.
Nr. de
persoane
n
a

Salarii
medii nete
sptmnal
e
(mii lei)
a
x
Nr. de
persoane
n
b

Salarii medii
nete
sptmnale
(mii lei)
b
x
Nr. de
persoane
n
a+nb

Salarii medii
nete
sptmnale
(mii lei)
b a
x
+

Muncitori 30 210 100 180 130 186,6
Personal
operativ cu
studii
superioare
20 378 10 310 30 355,3
Cadre de
conducere
10 600 5 510 15 570
TOTAL 60=n
a
331=
a
x 115=n
b
205,7=
b
x 175 248,6=
b a
x
+


Dispersia general
"
X
a+b
2
a salariilor din societatea comercial
"ANDMIR" S.A. este:
"
X
a+b
2
=
1
175
|30$ 210
2
+20$ 378
2
+10$ 600
2
+100$ 180
2
+10$ 310
2
+5$ 510
2
|


248,6
2
=14096,211

Dispersia dintre grup:

X
a+b
2
=
n
a
(X
a
X)
2
+n
b
(X
b
X)
2
n
a
+n
b
+
n
a
X
a
2
+n
b
X
b
2
n
a
+n
b
X
a+b
2

Capitolul V 141

X
a+b
2
=
1
175
[
60$ 331
2
+ 115$ 205, 7
2
]
248, 6
2
= 3567, 162

Media dispersiilor pariale se calculeaz ca o medie aritmetic
ponderat a acestora
"
X
a+b
2
:

"
X
a,b
2
=
na"
Xa
2
+n
b
"
X
b
2
n
a
+n
b
=
1
175
|60$ 20117+ 115$ 5526, 64| = 10529, 049


"
X
a
2
=
1
60
|30$ 210
2
+ 20$ 378
2
+ 10$ 600
2
| 331
2
= 20117

Prin urmare:

"
X
a+b
2
= "
X
a,,b
2
+
X
a,,b
2
e 14096, 211 = 10529, 049+ 3567, 162

Rezultatele obinute demonstreaz c dispersia (variaia) salariilor n
societatea comercial "ANDMIR" S.A. se explic 74,7% printr-o
mprtiere a salariilor ca urmare a aciunii factoriilor specifici care
acioneaz n cadrul fiecrei fialiale "AND" S.A. i "MIR" A.S., iar n mic
parte (25,3%) se explic prin mprtierea salariilor medii ale filialelor fa
de salariu din societatea "ANDMIR" S.A.
O alt observaie care se impune este urmtoare: dispersia ca i
media valorilor individuale este sensibil la prezena valorilor
extreme, aberante. Aceast se constat, n mod evident, i din
exemplul urmtor:

Tabelul 5.5.

Serii statistice
X

"
X
2

{1, 1, 2, 2, 2, 4, 4, 4} 2,5 1,5
{1, 1, 2, 2, 2, 4, 4, 4, 70} 10 451,3

Pentru msurarea variabilitii termenilor seriei fa de tendina
central, dispersia poate fi calculat nu numai n funcie de
valoarea medie ci i n funcie de o alt valoare tipic, de
exemplu mediana;
Dispersia, ca indicator sintetic al mprtierii valorilor
individuale n jurul tendinei lor centrale nu are unitate de msur
cu coninut economic.
n cazul n care se utilizeaz eantioane de volum redus dispersia
se determin prin relaia urmtoare:

"
x
2
=
n
i=1

(
X
i
X
)
2
n1 (5.21)
Rezultatul obinut prin aceast relaie (5.21) este puin diferit de cel
obinut prin relaia (5.10) atunci cnd colectivitatea investigat este suficient
142 Statistic general
de mare. Relaia (5.21) este justificat atunci cnd dispersia se calculeaz
dintr-un numr redus de valori individuale. Relaia (5.21) difer de relaia
(5.10) prin faptul c numrul de uniti este diminuat cu un grad de libertate.
Pentru eliminarea neajunsurilor rezultate din calculul i analiza
dispersiei se utilizeaz, n analiza seriilor de repartiie empiric (real) sau
teoretic, abaterea medie ptratic.
5.3.3. Abaterea medie ptratic
Abaterea medie ptratic (numit i abaterea standard sau
abaterea tip) se definete ca medie ptratic, simpl sau ponderat, a
abaterilor valorilor individuale de la tendina central sau ca rdcin
ptratic a dispersiei. Potrivit acestei definiii relaia de calcul a abaterii
medii ptratice
(
"
x
)
este urmtoarea:
"
x
= "
x
2
(5.22)
Aplicaia 5.5
S presupunem c cinci experi acord succesiv note (<6) asupra
calitii a dou produse de acelai tip. Datele i rezultatele sunt urmtoarele:

Tabelul 5.6.

Nota medie
Abaterea
medie absolut
Dispersia
Abaterea
medie ptratic
Seria notelor
acordate
y X y d
2
x

x

Produsul A:
{3, 5, 4, 4, 5, 3, 4, 5}
4 0,4 0,25 0,5
{2,5; 5,5; 3,5; 4,5; 4} 4 0,8 1,2499 1,118

Din tabelul 5.6 se constat: media acordat pentru calitatea celor
dou produse este identic; abaterea medie ptratic specific
produsului B este mai mare i semnific faptul c la acest produs
notele sunt mai mult dispersate (mprtiate) n jurul mediei (4)
dect la produsul A; variabilitatea notelor acordate la produsul B
este mai mare dect cea specific produsului A.
Comparnd abaterea medie absolut cu abaterea medie ptratic,
calculate pentru aceeai serie, se constat c:

d
x
[ "
x
sau d
x
l
4
5
* "
x
(5.23)
Cu toate c ntre valorile celor doi indicatori ai mprtierii
diferenele sunt destul de mici n analizele statistice se prefer abaterea
medie ptratic deoarece ea este un parametru al legii normale (majoritatea
Capitolul V 143
metodelor de prelucrare statistic au la baz ipoteza normalitii
repartiiilor) i se preteaz mai bine la calcule algebrice.
Abaterea medie ptratic prezint interes nu numai pentru
apreciere omogenitii valorilor individuale ale unei serii (sau
pentru a verifica reprezentativitatea mediei lor) dar i pentru
construirea unor intervale centrate n
x
care conin un anumit
procent din masa total a observaiilor. Astfel, dac distribuia
unitilor din colectivitatea investigat, dup caracteristica
urmrit, este sub form de "clopot" sau este uor asimetric,
atunci: intervalul
x "
x
; x + "
x
conine 68,26% din observaii;
intervalul
x 2"
x
; x + 2"
x
conine 95,44% iar 99,74% din
observaii sunt situate n intervalul
x 3"
x
; x + 3"
x
.

n analizele financiar-bursiere abaterea medie ptratic (tip sau
standard) poate fi utilizat i ca o msur a "riscului". De
exemplu, riscul unui portofoliu de iniiative de deplasare a
capitalului este cu att mai mic cu ct abaterea medie ptratic
corespunztoare portofoliului respectiv este mai mic i invers.
De asemenea, acest indicator poate fi calculat i analizat n:
studii de marketing i ale calitii produselor; pentru elaborarea
variantelor de prognoz etc.
Coninutul abaterii medii ptratice ca i metodologia sa de calcul
poate fi generalizat, pentru a msura sintetic distanele medii
dintre valorile individuale luate succesiv dou cte dou.
Fie,
X =
(
x
i
)

si Y =
(
y
i
)

, cu i = 1, n,
vectorii observaiilor
dintr-o colectivitate efectuate asupra a dou caracteristici prevzute n
program. Familia distanelor dintre cei doi vectori se definete prin relaia
lui Minkovski (5.24).

p
1
n
1 j
p
j j
Y X ) Y , X ( d
(

=

=
, cu p > 1 (5.24)
Observm c:
- dac p=1 se obine o distan absolut, numit "norm";
- dac p=2 se obine distana euclidian;
- n cazul n care exist frecvene absolute sau relative, ataate
cuplurilor (x
i,yi),
atunci se calculeaz dispersia ponderat. Astfel, dac
exist frecvene relative atunci (5.24) devine:

p
1
p
j j
n
1 j
i
Y X f ) Y , X ( d
(

=

=
, cu p > 1

(5.25)

144 Statistic general
Abaterea medie ptratic nu poate fi utilizat pentru compararea
variabilitii mai multor caracteristici de natur diferit urmrite
n aceeai colectivitate statistic. Acest neajuns poate fi eliminat
prin utilizarea coeficientului de variaie sau de omogenitate.
Deseori n analiza statistic se apeleaz la valorile individuale
standardizate. Valorile (datele) numerice standardizate sunt
valori iniiale (nregistrate) transformate cu ajutorul medie i
abaterii lor medii ptratice. Deci, prin operaia de stndardizare
fiecare valoare x
i
( n , 1 i = ) se substituie prin
s
i
x ( n , 1 i = ); unde:

=
x x
x
i s
i
; ( n , 1 i = ) (5.26)
Avantajele principale ale utilizrii valorilor standardizate
se rezum la urmtoarele:
o Elimin unitatea de msur a variabilei studiate;
o Media lor aritmetic este egal cu zero ( 0 x
s
i
= );
o Dispersia lor este constant i egal cu unu
( 1
2
x
s
i
= ).
5.3.4. Coeficientul de omogenitate
Coeficientul de omogenitate (de variaie) este o msur a dispersiei
relative care descrie abaterea medie ptratic ca procent din media
aritmetic. Acest coeficient de variaie permite compararea mprtierii
valorilor care nu sunt exprimate n aceeai unitate (de exemplu, compararea
variabilitii salariilor din dou ri i n diferite monede, compararea
variabilitii compartimentului unor produse pe diferite piee etc.).
Coeficientul de variaie (CV) se definete ca raport ntre abaterea
medie ptratic i media aritmetic a ansamblului de observaii. Astfel,

CV
x
=
"
x
X
$ 100
(5.27)
Aplicaia 5.6
Studiind distribuia salariilor brute ale filialelor "AND" S.A. i
"MIR" S.A. din Aplicaia 5.4 constam c:
| la filiala "AND" S.A.:
X
a
= 331
mii lei/persoan

"
xa
= 114, 83
mii lei/persoan

CV
xa
= 34, 69%

| la filiala "MIR" S.A.:
X
b
= 205, 7
mii lei/persoan

"
x
b
= 74, 34
mii lei/persoan

CV
x
b
= 36, 14%

Capitolul V 145
Se observ c abaterea medie ptratic reprezint 34,69% din salariu
mediu, de 331 mii lei/pers., la filiala "AND" S.A. i 36,14% la filiala "MIR"
S.A. Distribuia angajailor dup salariile obinute este mai puin omogen
la "MIR" S.A. dect la "AND" S.A., iar salariul mediu de 331 mii lei/pers.
este mai reprezentativ dect acela de 205,7 mii lei/pers.
Observaii:

1) Coeficientul de variaie este cel mai sintetic indicator al
mprtierii, nu numai pentru c permite comparaia variabilitii, dar i
pentru faptul c valorile sale sunt localizate n intervalul {0,100}. Cu ct
valorile sale sunt mai apropiate de zero, cu att seria este mai omogen
(media este mai reprezentativ); cu ct valorile sale sunt mai apropiate de
100 cu att ansamblul valorilor individuale observate este mai eterogen
(mprtierea este mai mare, iar media calculat este mai puin
reprezentativ). Practica utilizrii coeficientului de variaie a stabilit pragul
de trecere de la starea de omogenitate la cea de eterogenitate: dac
CV [ 30% 35%
colectivitatea este omogen; dac CV>35%
colectivitatea este eterogen.
2) Pentru determinarea coeficientului de variaie de multe ori se
utilizeaz abaterea medie absolut:

CV
x

=
d
x
X
$ 100
(5.28)
Diferena dintre CV (5.27) i CV' (5.28) poart amprenta diferenei
dintre abaterea medie ptratic i abaterea medie absolut.
3) Coeficientul de variaie, indiferent dup ce relaie se calculeaz, n
analizele financiar-bursiere este o msur a riscului i permite o interpretare
mai nuanat a dispersiei.
Calculul i analiza indicatorilor simpli i sintetici ai mprtierii
valorilor individuale ale caracteristicilor n jurul tendinei lor centrale ofer,
dup cum s-a constatat, informaii utile pentru cunoaterea manifestrii
fenomenelor de mas i pentru fundamentarea deciziilor. Pentru
profunzimea analizei ntreprinse aceste informaii trebuie completate cu
altele referitoare la concentrarea valorilor individuale, la deplasarea acestora
fa de anumite valori tipice. Prin urmare, analiza mprtierii (variaia)
valorilor individuale trebuie s fie urmat de analiza formelor n care se
distribuie acestea.
5.3.5. Diferena medie C. Gini
Un alt indicator sintetic utilizat n analiza variaiei valorilor
individuale nregistrat de o variabil numeric n funcie de scopul
cercetrii este diferena medie C. Gini.
146 Statistic general
Diferena medie C. Gini (DG) reprezint o medie a diferenelor
absolute a valorilor individuale luate prin asociere combinat dou cte
dou.
Pentru exemplificarea determinrii DG lum n considerare seria
simpl {210, 222, 226, 235, 244, 245, 250}. Comparnd prin diferen
fiecare cu fiecare datele din seria prezentat obinem rezultatele
prezentate n tabelul urmtor.

Tabelul 5.7

Valori
individuale
210 222 226 235 244 245 250
Suma
diferenelor
pe linii
210 0 12 16 25 34 35 40 162
222 -12 0 4 13 22 23 28 90
226 -16 -4 0 9 18 19 24 70
235 -25 -13 -9 0 9 10 15 34
244 -34 -22 -18 -9 0 1 6 7
245 -35 -23 -19 -10 -1 0 5 5
250 -40 -28 -24 -15 -6 -5 0 0
368

Pe baza sumei sumei diferenelor absolute considerate pe liniile
tabelului (deasupra diagonalei principale) determinm indicatorul
DG=368/21 = 17,523.
Din tabelul prezentat constatm urmtoarele:
Numrul total al diferenelor pozitive este 1 + 2 + ... + (n-1) =
2
) 1 n ( n
.
n cazul nostru 21.
Dac s-ar lua n considerare toate diferenele din tabel, n ambele
sensuri, atunci valoarea aceluiai indicator ar fi fost
02 , 15
7
368 2
DG
2
=

= .
Generaliznd raionamentul exemplificat anterior s-ar putea deduce cu
uurin urmtoarea relaie a diferenei medii Gini:
2
n
1 i
] Me [ ] x [ i
n
n n Me x
4 DG
i

=

= (5.29)
Capitolul V 147
unde: x
i
= valori individuale nregistrate pentru variabila numeric
observat X;
Me = mediana valorilor nregistrate;

] x [
i
n = rangul fiecrui termen x
i
;

] Me [
n = rangul valorii mediane;
n = numrul de valori nregistrate.
Dac, ns, dispunem de o serie de distribuie de frecvene pe
intervale, raionamentul prezentat conduce la urmtoarea relaie
general de calcul a diferenei medii Gini:
o dac frecvenele sunt absolute:


=
= =
|
.
|

\
|

=
r
1 i
i
r
1 i
r
1 i
i ai ai
n
n F F
r 2 DG (5.30)
o dac frecvenele sunt relative:
( )
100
100 F F
r 2 DG
r
1 i
f f
i i

=

= (5.31)
unde: F
ai
(
i
f
F ) sunt frecvenele absolute
(relative) cumulate cresctor.
Caracteristica esenial a indicatorului DG o reprezint faptul c
rezultatul este dependent de fiecare valoare individual i nu de o
anumit valoare prestabilit cum ar fi cea care indic numeric
tendina central. Din aceast cauz, indicatorul DG sintetizeaz
variaia fiecrei valori individuale fa de fiecare alt valoare
individual luat n considerare.
5.4. CARACTERIZAREA STATISTIC A FORMELOR
DE REPARTIZARE A FRECVENELOR
Bateria valorilor tipice ale tendinei centrale i mprtierii fa de
aceasta trebuie completat cu informaii referitoare la forma n care se
repartizeaz unitile colectivitii dup caracteristica urmrit. Analiza
statistic a formelor de repartizare a frecvenelor presupune caracterizarea
asimetric (deplasarea valorilor individuale fa de anumite valori tipice ale
tendinei centrale) i a aplatizrii curbei frecvenelor.
148 Statistic general
5.4.1. Asimetria distribuiilor statistice
O distribuie este simetric dac observaiile nregistrate sunt egal
dispersate de o parte i alta a valorii lor centrale. ntr-o distribuie simetric
cele trei valori cu care se exprim tendina central, valoarea modal (M
o
),
median (M
e
) i medie
(
X
)
,
se confund, ca n fig. 5.2.
n
x
j
j
M = M = x
e o

Figura 5.2. Repartiia simetric a frecvenelor

O repartiie asimetric (sau oblic) se caracterizeaz prin faptul c
frecvenele valorilor caracteristicii urmrite sunt deplasate mai mult sau mai
puin, ntr-o parte i alta fa de tendina central (exprimat prin: M
e
, M
o

sau
x).
n fig. 5.3 i 5.4 se prezint distribuii unimodale oblice la dreapta
sau la stnga valorilor tendinei centrale:
M
o
M
e
x
_
< <
Mo
M
e x
_
(sau etalarea frecven\elor spre st@nga) (sau etalarea frecven\elor spre dreapta)
x
j
x
_
M
o
M
e
>
>
n
j
j
x x
_
M
e Mo
n
j
Fig.5.3 Repartiia oblic Fig.5.4 Repartiie oblic
spre stnga spre dreapta

Amploarea asimetriei statistice unimodale se caracterizeaz sintetic
cu ajutorul unor coeficieni adimensionali.
Capitolul V 149
1) Coeficientul lui Yule i Kendall (C
asyk
)
Yule i Kendall comparnd modul de etalare a frecvenelor la
dreapta i la stnga medianei i innd cont de poziia cuantilelor n raport
cu mediana au recomandat pentru msurarea asimetriei urmtorul coeficient:

C
asy k
=
(Q
3
M
e
)(M
e
Q
1
)
(Q
3
M
e
)+(M
e
Q
1
)
(5.33)
Observm urmtoarele:
valoarea coeficientului lui Yule i Kendall sunt n intervalul -1 i
+1;
dac C
asyk
= 0
g
simetrie (sau cuartilele sunt echidistante);
dac C
asyk
> 0
g
asimetrie la stnga (sau etalarea frecvenelor
spre dreapta);
dac C
asyk
< 0
g
asimetrie la dreapta (sau etalarea frecvenelor
spre stnga)
dac acest coeficient are valoarea sub 0,1 seria este considerat
moderat asimetric; iar peste 0,3 seria este pronunat
asimetric;
coeficientul lui Yule i Kendall nu poate fi utilizat n compararea
asimetriei mai multor repartiii de frecvene.
2) Coeficienii lui Karl Pearson
Pentru msurarea asimetriei K. Pearson analizeaz poziia a dou
valori centrale (valoarea modal i medie) relativizat prin dispersia seriei i
propune un coeficient, care ia valori cuprinse ntre zero i unu;

C
as
=
XM
o
"
x (5.34)
Cu ct valorile acestui coeficient sunt mai apropiate de zero, cu att
seria este mai simetric (simetria exist cnd valoarea sa este zero); cu ct
valorile sale sunt mai apropiate de unu cu att seria este mai asimetric.
ntr-o repartiie de frecvene moderat asimetric (cum ar fi de
exemplu distribuia gama) ntre valorile centrale (M
o
, M
e
,
X
) se verific, n
mod aproximativ, relaia:
M
o
X l 3
(
M
e
X
)
.
Substituind aceast
expresie n relaia (5.34) se obine urmtoarea formul alternativ:

C
as
=
3(XM
e
)
"
x (5.34)
Pentru a completa analiza simetriei n seriile de distibuie
unidimensionale se poate apela i la momentele centrate de diverse ordine.
Astfel, dac se iau n considerare momentele centrate de ordinele 2 i 3 (n
relaia momentului centrat de ordin K (5.12) valorile lui K sunt 2 i 3) se
obine:
150 Statistic general
3) Coeficientul de asimetrie
1
introdus iniial de Karl Pearson
care are urmtoarea relaie:

( )
( )
3
2
2
3
1

= (5.35)
4) Coeficientul
1
o transformare ulterioar a coeficientului
1

realizat de R.A. Fisher calculat dup relaia:

( )
2
3
2
3
1 1

= =
Interpretarea coeficientului lui Fisher pornete de la observaia c
momentele centrate de ordin impar ale seriilor de distribuie perfect
simetrice sunt egale cu zero. Deci, n particular
3
= 0. Pentru seriile n care
predomin termenii cu abateri negative fa de medie (x
i
x <0) vom avea

3
< 0, iar n timp ce pentru cazurile n care predomin termenii cu abateri
pozitive fa de medie (x
i
x <0) vom avea
3
> 0. Deci,
2
fiind
ntotdeauna pozitiv, coeficientul
1
va fi <0 sau >0 dup semnul lui
3
.
Asimetria distribuiilor unitilor ntr-o colectivitate dup
caracteristica urmrit poate fi vizibil pe reprezentrile grafice (histograma,
poligonul frecvenelor efective) empirice comparate cu alura clopotului lui
Gauss.
5.4.2. Aplatizarea/boltirea repartiiilor de frecvene
Graficele seriilor de distribuie de frecven sunt mai mult sau mai
puin aplatizate n comparaie cu graficul legii normale (Gauss-Laplace). Prin
urmare, o distribuie este aplatizat dac o mare variaie a caracteristicii
urmrite antreneaz o uoar variaie a frecvenelor i invers. Acest
raionament este vizualizat n fig.5.5.
Capitolul V 151

Figura 5.5. Distribuii cunimodale cu grade diferite de aplatizare

Rdcinile etimologice ale ale denumirilor utilizate sunt greceti:
kurtos=cocoat, platys = larg (lat) i leptos = ngust (subire). Prezentm n
continuare urmtorii indicatori (numii de exces sau kurtois):
1) Coeficientul
2
al lui Pearson, dat de relaia:
2
2
4
2

= (5.36)
2) Coeficientul
2
al lui Fisher, dat de relaia:
3 3
2
2
4
2 2

= = (5.37)
Analiznd cei doi coeficieni constatm c etalonul pentru aprecierea
gradului de aplatizare al unei serii empirice l reprezint distribuia normal.
n cazul su
2
= 3 (deci,
2
= 0). Astfel, dac:
-
2
> 3 (sau
2
> 0) distribuia se numete leptokurtic, avnd un
vrf mai ascuit i cozi mai lungi dect la cea normal;
-
2
< 3 (sau
2
< 0) distribuia se numete platikurtic, avnd un
vrf mai aplatizat (turtit) i cozi mai scurte dect la cea normal;
-
2
3 (sau
2
0) - distribuia se numete mezokurtic i este
echivalent cu cea normal n privina gradului de aplatizare;
Calculul i interpretarea coeficienilor de aplatizare prezentai
trebuie completat cu analiza graficului distribuiei empirice comparativ cu
cel al distribuiei normale.
f
i

x
i

Leptokurtic

Mezokurtic

Platikurtic
152 Statistic general
Analiza asimetriei i aplatizrii are sens numai n cazul distribuiilor
empirice unidimensionale care prezint o singur valoare modal.

5.5. Analiza statistic a concentrrii/diversificrii

Probelematica concentrrii-diversificrii formulat pentru prima dat
de Corado Gini (1912) o dat cu analiza distribuiei veniturilor unei
populaii este deosebit de important i prezint interes n diverse
domenii. n acest sens este suficient s precizm urmtoarele: caracterizarea
structurii pieelor; analiza inegalitilor dintre repartiiile de structur;
analiza repartiiilor regionale etc.
Prin concentrare se nelege, n general, aglomerarea unitilor unei
populaii statistice sau a valorilor globale ale unei distribuii n jurul unei
valori tipice a variabilei analizate X. n mod complementar se definete
noiunea de diversificare.
Din definiia prezentat se constat, n mod evident, urmtoarele:
Noiunea de concentrare se refer att la aglomerarea unitilor
unei populaii statistice pe variante (sau n intervale de variaie),
ct i la aglomerarea valorilor globale(de tipul
i i
n x cu , 1 = i )
sau a valorilor unui indicator de nivel pe aceleai varianate(sau
intervale de variaie). Studiul concentrrii, presupune deci,
analiza comparat a structurii efectivului unei populaii i a
structurii valorilor globale pe aceleai variante (sau intervale de
variaie) ale variabilei observate. n acest mod se pot evidenia
att inegalitile dintre distribuiile de structur comparate ct i
compararea valorilor globale pe un numr limitat de uniti ale
populaiei; cu ct sunt mai mari diferenele dintre cele dou
distribuii de structur cu att mai mari sunt i disparitile dintre
grupele de uniti, ceea ce nseamn c exist o concentrare care
tinde s creasc, i invers, cu ct diferenele dintre distribuiilede
structur sunt mai mici, cu att concentrarea este mai slab
(diversificarea este mai mare), tinznd spre o echipartiie
(distribuie egalitar).
Studiul concentrrii solicit respectarea a dou cerine eseniale:
s fie posibil i s aib sens aditivitatea valorilor individuale ale
variabilei observate; s fie posibil i s aib sens divizarea
valorilor globale ntre unitile populaiei. Aceasta nseamn c
analiza concentrrii se poate efectua asupra variabilelor continue
cu valori pozitive i doar n anumite cazuri variabilelor calitative
Capitolul V 153
(n mod deosebit, pentru stabilirea gradului de concentrare pe
tipologii calitative).
Caracterizarea statistic a concentrrii/diversificrii se poate
realiza prin mijloace grafice i prin procedee numerice (de calcul).

5.5.1 Curba de concentrare

Curba de concentrare (elaborat de italianul C. Gini i americanul
Lorentz)/numit i curba Lotentz-Gini - permite aprecierea i, totodat, st
la baza determinrii unei msuri a concentrrii (gradului de concentrare)
numit indicele de concentrare Gini.
Curba de concentrare se traseaz pe baza punctelor de coordonate
(
i i
q , p ). Coordonatele acestor puncte sunt:
,
n
F
p
i
i
ai
i

= cu r , 1 i = ;
i 1 ai ai
n F F + =

(5.38)

=
i
i i
i
i
n x
L
q (5.39)
unde: r , 1 i = ;
i 1 ai ai
n F F + =

- frecvena absolut cumulat pn la nivelul
i;
i i 1 i i
n x L L + =

- valorile globale (
i i
n x ) cumulate pn la nivelul i al
variabilei de grupare.
i
p = reprezint frecvenele (efectivele) relative cumulate pn la
nivelul i;
i
q = sunt valorile globale relative cumulate pn la acelai nivel i.
Exprimate n procente fiecare din coordonatele
i
p i
i
q prezint
valori n intervalul 0 i 100%, iar curba de concentrare rezult din unirea
punctelor (
i i
q , p ) i se ncadreaz ntr-un ptrat de latur 100% ca n figura
5.6.









154 Statistic general












Figura 5.6 Curba de concentrare cu grade diferite de
concentrare/diversificare

Analiza curbelor de concentrare vizualizate n fig. 5.6 evideniaz
urmtoarele:
Curba de concentrare se plaseaz sub prima bisectoare
(diagonala ptratului Gini) deoarece
i i
q p sau se suprapune cu
diagonala cnd
i i
q p = (n cazul echipartiiei). Suprafaa
cuprins ntre diagonal i curba ce unete punctele (
i i
q p , ) se
numete suprafa de concentrare.
Gradul de concentrare se interpreteaz n funcie de mrimea
suprafeei de concentrare. Astfel, cu ct curba de concentrare se
abate mai mult de la diagonala ptratului cu att mai mare este
suprafaa de concentrare, respectiv diferenierile dintre grupe
sunt mai mari i concentrarea este mai puternic (diversificarea
este mai slab) i invers. Concentrarea este maxim
(diversificarea este minim) atunci cnd o singur unitate din
populaie deine ntreaga valoare global a variabilei analizate
n acest caz curba de concentrare coincide cu dou laturi ale
ptratului.
Curba de de concentrare poate fi utilizat pentru analiza
concentrrii dar i ca metod de aproximare a valorilor centrale
ale distribuiei (mediana i mediala), a indicelui de concentrare
Gini; ca mijloc de comparare calitativ a gradului de concentrare
etc.



p
i
50% 100%
q
i
50%

100%

(a) Concentrare
slab
(b) Lipsa concentrrii
(echirepartiie)
p
i
50% 100%
q
i
50%
100%
(c) Concentrare
puternic
p
i
50% 100%
q
i
50%

100%

Capitolul V 155
5.5.2 Indicatori numerici a
concentrrii/diversificrii

1. Diferena absolut dintre valoarea medial (
l
M ) i valoarea
median (
e
M )
Aceast diferen (notat) calculat dup relaia :
e l
M M M = (5.40)
presupune efectuarea unor operaii premergtoare de determinare a medianei
(
e
M ) i a medialei (
l
M ) mediana valorilor globale
i i
n x - dup
metodologia prezentat n capitolul patru. De regul, pentru aceeai
distribuie mediala este mai mare dect mediana. Egalitatea acestor dou
valori centrale exist n cazul distribuiilor egalitare.
Prin urmare, diferena dintre medial-median n studiul concentrrii
poate fi interpretat astfel:
cu ct M este mai mare cu att concentrarea este mai
puternic, iar diversificarea este mai mic;
dac M =0 (
l
M =
e
M ) nu exist concentrare, distribuia fiind
egalitar.
cu ct M este mai mare, diversificarea este mai mare i
concentrarea este mai mic.
Indicatorul prezentat are dezavantajul pentru interpretare i anume
valorile sale
nu se ncadreaz ntr-un interval. Din aceast cauz se determin deseori
coeficientul de concentrare M %.
Acest coeficient de concentrare se determin comparnd prin
rapoarte diferena absolut medial-median cu amplitudinea absolut a
variaiei variabilei analizate. Deci,
100 *
x x
M M
% M
min max
e l

= (5.41)
Observaii:
coeficientul de concentrare prezint valori n intervalul
[0;100%]. Cu c\t valorile sale sunt mai apropiate de 0 cu att
concentrarea este mai slab i invers; cu ct valorile sunt mai
apropiate de 100% cu att sunt mai mari disparitile ntre
valorile globale pe intervale (pe clase) de variaie.
M % spre deosebire de diferena absolut medial-median
prezint i un alt avantaj i anume ofer posibilitatea comparrii
gradului de concentrare al diferitelor distribuii statistice
156 Statistic general
indiferent de unitatea de msur utilizat pentru exprimarea
variabilelor observate;
prin relaiile lor de calcul M i M % pot fi uor determinate
dar au dezavantajul c nu se calculeaz n funcie de toi termenii
ci doar n funcie de cei care ocup o poziie central n serie.

2. Coeficientul abaterii medii Gini (CDG)

Coeficientul abaterii medii Gini (CDG) este un alt indicator cu
ajutorul cruia se apreciaz numeric concentrarea/diversificarea. El se
determin ca raport ntre diferena medie Gini (vezi relaia 5.30) i dublul
mediei aritmetice a variabilei observate. Deci,

x 2
DG
CDG = (5.42)
Acest coeficient prezint valori n intervalul [0;1]; cu ct valorile
sunt mai apropiate de zero, cu att concentrarea este mai slab i, invers, cu
ct valorile sunt mai aproape de 1 cu att concentrarea este mai puternic.
Se observ c acest coeficient ca interpretare se apropie de cea a
indicatorului relativ al dispersiei (coeficientul de variaie).

3. Indicele de concentrare Gini (IG)

Ca indicator sintetic al concentrrii unei distribuii, prezentul
indicele de concentrare a fost formulat de Corrado Gini (1912) cu ocazia
analizei distribuiei slariilor i veniturilor populaiei.
Indicele de concentrare Gini (IG) se definete n funcie de suprafaa
de concentrare (dintre curba de concentrare i diagonala ptratului vezi i
fig. 5.6) i de aria ptratului (care este egal cu 1):

e concentrar de Suprafata 2
2
patratului Aria
e concentrar de Suprafata
IG = = (5.43)
Observaii:
valorile indicelui de concentrare Gini sunt cuprinse n intervalul
[0;1] sau[0;100%] dac se exprim procentual.
IG este adimensional i respect condiia de tranzitivitate n timp
i spaiu ceea ce permite utilizarea sa n efectuarea comparaiilor.
Acestea sunt elemente care determin ca IG s fie cel mai
Capitolul V 157
frecvent n analiza concentrrii, n paralel cu preocuprile
multiple de determinare a unor noi relaii de calcul.
n aria preocuprilor de determinare a IG un loc aparte l ocup
metoda grafic.
Aproximarea valorii IG pe cale grafic are ca punct de pornire curba
de concentrare trasat pe baza datelor nregistrate (vezi i fig. 5.6). Pe baza
acestei curbe suprafaa de concentrare se poate aproxima diminund aria
triunghiului ABC cu suma ariilor trapezelor de tipul celor evideniate n fig.
5.7.













Figura 5.7 Determinarea suprafeei de concentrare

Prin urmare, suprafaa de concentrare este:
(

+ = +


i
i i 1 i
i
1 i i i 1 i
f ) q q ( 1
2
1
) p p )( q q (
2
1
2
1

iar indicele de concentrare Gini (IG) se va determina dup relaia
urmtoare:

+ =

i
i i 1 i
f ) q q ( 1 IG (5.44)

5.5.3. Indicatori ai concentrrii n seriile calitative
atributive
Punctul de pornire n analiza concentrrii n cazul seriilor calitattive
atibutive l reprezinta calculul ponderilor (greutilor specifice), notate prin
g
i
.
1. Raportul de concentrare (RC), un indicator de concentrare
utilizat frecvent n cercetrile de marketing, exprim ponderea deinut de
q
i
B

h

q
i
q
i-1

0

A

p
i-1
p
i
1 p
i

C

D

1

158 Statistic general
primele n cele mai mari uniti dintr-o populaie statistic observat dup o
variabil (un criteriu) care definete mrimea (talia) lor. Numrul n este
ales n mod arbitrar, din numrul total (N) al unitilor populaiei.
Acest indicator (RC) se determin dup relaia urmtoare:

=
=
n
1 i
i
g RC ; (5.45)
unde:

=
=
N
1 i
i
i
i
q
q
g
Raportul de concentrare calculat dup (5.45) prezint urmtoarele
caracteristici:
se determin simplu i rapid
nu ine seama n calculul su dect de datele referitoare la
primele n (n>N) cele mai mari uniti; restul unitilor (N-n) nu sunt
luate n considerare.
2. Energia informaional Onicescu (EO)
Spre deosebire de indicatorul anterior, Energia informaional
Onicescu prezint avantajul c n determinarea sa se ia n considerare
ntreaga populaie statistic (N) privit ca sistem, dar i prile componente
(n_i) privite ca stri ale sistemului. Energia informaional Onicescu (EO)
se calculeaz ca sum a ptratelor ponderilor tuturor componentelor unei
populaii ststistice, dup relaia urmtoare:


= =
= =
N
1 i
N
1 i
i
2
i
1 g cu , g EO , (5.46)
Se observa urmatoarele:
- valorile energiei informaionale Onicescu sunt cuprinse n
intervalul
(

1 ,
1
N
. Valoarea maxim este atins atunci cnd concentrarea
este maxim (diversificarea este minim) monopol i valoarea minim este
atins atunci cnd exist echirepartiie (diversificare maxim)
- prezint inconvenientul variabilitii valorii minime
|
.
|

\
|
N
1
, n
funcie de numrul categoriilor (grupelor sau claselor). Pentru ca acest
indicator sa prezinte valori ntr-un interval invariant este transformat
conform relaiei urmtoare(fr s fie afectat coninutul i interpretarea):
Capitolul V 159
| | 1 ; 0
N
1
1
N
1
EO
EO
|

= (5.46.1)
3. Entropia C. Shannon (H) este un alt indicator cu care se
apreciaz concentrarea/diversificarea sau organizarea/dezorganizarea i se
determin dup urmtoarea relaie:

=
=
N
1 i
i
i
g
1
ln g H (5.47)
Mulimea valorilor acestui indicator este intervalul [0; ln N], iar
interpretarea sa este similar cu cea a energiei informaionale Onicescu.
4. Diferena Hirschman (DH)
n literatura de specialitate energia informaional Onicescu mai
este cunoscut i sub alte denumiri indicele Hirschman Herfindahl sau
ptratul lungimii vectorului frecvenelor.
Diferena Hirschman (DH) se determin ca diferen ntre EO (sau
indicele Hirschman) i valoarea aceluiai indicator pentru unitile de talie
egal (EOE). n aceast situaie
EOE
1
reprezint numrul unitilor din
populaia statistic, de volum N, care au talia egal.
DH = EO EOE (5.48)
Diferena Hirschman ntr-o situaie real se datoreaz inegalitilor
de talie a unitilor populaiei.
5. Coeficientul de concentrare Corrado Gini (CG)
Aceta se determin dup relaia urmtoare:

=
=
K
1 i
2
i
g CG (5.49)
Unde: K=numrul de categorii ale variabilei analizate
(

1 ,
K
1
CG ceea ce nseamn c prezint ca i EO dezavantajul
variabilitii limitei minime.
Pentru a elimina neajunsul precizat n analiz (n comparaii) se
utilizeaz forma corectat a coeficientului de concentrare Corrado Gini
cunoscut i sub denumirea de coeficientul de concentrare Strck (CS).
Relaia de calcul a acestuia este:
160 Statistic general

1 K
1 g K
CS
K
1 i
2
i

=

=
(5.50)
n aceast form CS corespunde cu EO
|
i prezint valori n
intervalul [0;1]. Valoarea minim este independent de numrul categoriilor
considerate.

Capitolul V 161
ntrebri de autoevaluare
Care sunt principalele caracteristici ale indicatorului abatere medie
absolut ?
Care este principalul dezavantaj al indicatorului amplitudinea
valorilor ?
Ce probleme de cunoatere rezolv sistemul indicatorilor mprtieri
valorilor ?
Care sunt avantajele comparative ale diferitelor modaliti de calcul
a dispersiei?
Acre sunt proprietile dispersiei i utilizarea lor practic ?
n analizele financiar bursiere abaterea medie ptratic se
utilizeaz ca msur a riscului ?
Abaterea medie ptratic se poate utiliza pentru compararea
variabilitii mai multor caracteristici de natur diferit ?
1. Da
2. Nu
Care sunt principalii indicatori ai simetriei i relaiile lor de calcul ?
Coeficientul de variaie arat:
a) de cte ori este mai mare abaterea standard (tip) fa de media
aritmetic;
b) cu cte procente este depit limita de omogenitate admis;
c) cu ct este mai mare abaterea standard fa de media aritmetic;
d) de cte ori se cuprinde abaterea standard n medie;
e) cte procente din abaterea standard reprezint media aritmetic.
Dispersia este invers proporional cu:
a) volumul eantionului;
b) volumul caracteristicilor studiate;
c) abaterea standard;
d) coeficientul de asimetrie;
e) este o mrime asimetrie.
Ptratul abaterii tip msoar:
a) amplitudinea dispersiei unui set de date n jurul mediei lor;
b) omogenitatea unui set de date;
c) asimetria unei distribuii;
d) tendina central a unui set de date;
e) gradul de concentrare a frecvenelor.
Coeficientul de asimetrie propus de Paarson se afl n relaie de
invers proporionalitate cu:
162 Statistic general
a) abaterea standard;
b) abaterea standard i valoarea modal;
c) dispersia i valoarea modal;
d) media aritmetic;
e) valoarea modal.
Dispersia, calculat prin metoda momentelor, este:
a) momentul iniial de ordin doi;
b) momentul iniial de ordin patru mprit la momentul iniial de
ordin doi la ptrat;
c) momentul centrat de ordin doi la ptrat;
d) momentul iniial de ordin doi minus momentul iniial de ordinul
nti la ptrat;
e) momentul centrat de ordin doi minus momentul iniial de ordin
unu la ptrat.
Salariaii unei ntreprinderi au salariul mediu de 7.00 mil. lei, cu o
abatere medie ptratic a salariilor de 1.50 mil. lei. Patronul firmei
hotrte s mreasc fiecare salariu individual de 1,3 ori. Dispersia
noilor salarii fa de salariul mediu va fi:
a) 150;
b) 22.500;
c) 29.250;
d) 253,5;
e) 38.025.
Care dintre urmtoarele afirmaii referitoare la coeficientul de
variaie nu este adevrat:
a) este un indicator sintetic al mprtierii;
b) este expresia relativ a abaterii medii ptratice;
c) valori mici ale coeficientului de variaie semnific un grad mare
de reprezentativitate a mediei caracteristicii studiate;
d) valori mici ale coeficientului de variaie reflect o tendin
accentuat de simetrie a distribuiei;
e) valori mici ale coeficientului de variaie reflect omogenitatea
colectivitii din punctul de vedere al caracteristicii studiate.
ntr-o populaie statistic s-au cules date despre dou variabile
numerice distincte. Seriile formate n urma sistematizrii sunt:
{x
i
}
i
= 1.7

= {2;2;2;10;18;18;18} i {y
i
}
i=1.7
= {9;9;9;10;11;11;11}.
Observnd variantele celor dou serii se constat c:
a) seria format dup Y este mai omogen dect cea format dup X;
b) seria format dup X este mai omogen dect cea format dup Y;
Capitolul V 163
c) cele dou serii prezint aceeai omogenitate, deoarece au aceeai
medie i mediane egale cu 10;
d) nu are sens comparabilitatea omogenitii din cele dou serii,
deoarece sunt formate dup variabile distincte;
e) seria format dup X este mai omogen deoarece abaterile
individuale fa de valoarea median sunt mai mari.
Fie colectivitatea statistic sistematizat n r grupe dup valorile
caracteristicii de grupare X i n m grupe dup valorile variabilei
analizate Y i pentru care s-au calculat dispersiile:
=
2
dispersia total, =
2
i
dispersiile de grup
=

2
media dispersiilor de grup.
Contribuia factorului de grup X la variaia general a variabilei Y
s msoar cu indicatorul:
a) R
2
;
2
2

=


b) R
2
;
2
2

=
c) R
2
; 1
2
2

=
d) R
2
;
n
n ) y y (
:
n
n
1
j
m
1 j
j
2
j
m
1 j
i
r
1 i
i
2
i
r
1 i
=

=
=
=


=
e) R
2
;
n
n ) y y (
:
n
n ) y y (
1
j
m
1 j
j
2
j
m
1 j
j i
m
1 j
r
1 i
j i
2
i j
m
1 j
r
1 i
=

=
= =

= =




=
Pentru 200 de salariai ai unei societi comerciale fondul de
salarizare a fost, ntr-o sptmn, de 150 milioane lei. tiind c cei
mai muli dintre salariai au avut un salariu de 820 mii lei, iar
coeficientul de asimetrie al repartiiei dup salariu a fost de -0,35,
coeficientul de variaie a fost:
a) 24,5%;
b) 200%;
c) -25,52%;
d) 37,5%;
164 Statistic general
e) 26,67%.
Se cunosc urmtoarele date (convenionale) asupra repartiiei unei
caracteristici:
Grupe Frecvene
11,0-13,0 12
13,0-15,0 18
15,0-17,0 8
17,0-19,0 2
Total n=40
Date fiind valoarea modal Mo (x
mo
) = 13,75; valoarea medie = 14,0
coeficientul de asimetrie (Pearson) are valoarea:
a) 0,377;
b) 0,677;
c) 1,377;
d) 0,963;
e) 0,09.
Pentru seria de date reprezentnd distribuia familiilor dup nivelul de venit:
Venit
Foarte
sczut
Sczut Mediu Ridicat
Foarte
ridicat
Nr. familii 10 20 40 20 10
Coeficientul de asimetrie propus de Pearson este:
a) zero;
b) unitar;
c) egal cu -1;
d) nu se poate calcula;
e) egal cu coeficientul de variaie.
Dac pentru o serie de distribuie de frecvene coeficientul de
variaie indic un nivel ridicat de eterogenitate, atunci se recomand
mprirea colectivitii n grupe dup un factor de grupare
semnificativ, ceea ce duce la:
a) creterea gradului de omogenitate n interiorul grupelor;
b) creterea gradului de eterogenitate n interiorul grupelor;
c) scderea gradului de omogenitate n interiorul grupelor;
d) creterea nivelului coeficientului de variaie n interiorul
grupelor;
e) nivelul de omogenitate n interiorul grupei va fi ntotdeauna egal
cu cel calculat pentru distribuia marginal.
S se precizeze care dintre seriile de repartiie, caracterizate prin
urmtoarele seturi de valori, prezint o asimetrie pozitiv:
a)

x = 40 u.m.; Me = 40 u.m.; Mo = 40 u.m.;


Capitolul V 165
b)

x = 2.500 u.m.; Me = 3.000 u.m.; Mo = 3.300;


c)

x = 151,25 u.m.; Me = 138,75 u.m.; Mo = 112, 58 u.m.;


d)

x = 180 u.m.; Me = 180 u.m.; Mo = 140 u.m. i 220 u.m.


e)

x = Me = Mo = 0.
Dac ntre cuartilele calculate pentru o serie de repartiie exist relaie
Q
2
= (Q
1
+Q
3
)/2 atunci repartiie este:
a) asimetric spre valorile mari;
b) asimetric spre valorile mici;
c) normal;
d) hiperbolic;
e) bidimensional.
O grup de 25 de studeni susine la dou discipline cte un test pentru
verificarea cunotinelor. Testele au punctaje diferite, iar pe baza lor
se cunoate:
- la testul A: 450 9000
25
1
2
25
1
= =
= =
A i
i
A i
i
x x
- la testul B: 100 425
25
1
2
25
1
= =
= =
B i
i
B i
i
x x
Grupa de studeni este mai omogen din punctul de vedere al
cunotinelor acumulare:
a) la disciplina A;
b) la disciplina B;
c) la ambele discipline exist acelai grad de omogenitate;
d) nu sunt suficiente date pentru a studia omogenitatea;
e) nu se pot compara omogenitile cunotinelor la cele dou
discipline, deoarece punctajele testelor au fost diferite.
Se cunosc date convenionale referitoare la valorile unei caracteristici:
Grupe Frecvene
9,0-9,5 3
9,5-10,0 1
10,0-10,5 42
10,5-11,0 23
11,0-11,5 9
11,5-12,0 1
12,0-12,5 1
Total n=80
Cunoscnd c media aritmetic a caracteristicii

x este = 10,51
uniti, coeficientul de omogenitate (variaie) este de:
166 Statistic general
a) 4,62%;
b) 13,32%;
c) 22,19%;
d) 23,32%;
e) 14,62%.
ntr-o colectivitate statistic, fenomenul de concentrare nseamn:
a) o variaie sczut a valorilor caracteristicii n jurul mediei;
b) o distribuie n form de J;
c) o asimetrie sczut a distribuiei;
d) o distribuie n form de U;
e) cumularea valorilor caracteristicii n cadrul unei grupe /clase a
colectivitii.
Dac ntre cuartilele pentru o serie de repartiie exist relaia Q
2
=
2
3 1
Q Q +
atunci repartiia este:
a) asimetric la dreapta;
b) asimetric la stnga;
c) normal;
d) hiperbolic;
e) bidimensional;
f) bimodal.
Fie seria statistic {x
1
,x
2
..........x
n
} obinut prin observarea unei
variabile numerice X i pentru care s-au calculat media

x i dispersia
2
x
. Controlndu-se calitatea datelor culese, se constat c fiecare
dintre acestea a fost majorat la nregistrare cu 100 de uniti. Seria
corect ar fi fost:

)
`

100
,......
100
,
100
2 1 n
x x x
. Calculndu-se din nou dispersia pentru valorile
corecte, se constat c aceasta este:
a) egal cu dispersia iniial;
b) mai mic dect
2
x
de 10.000 ori;
c) mai mic dect
2
x
cu
100
1
;
d) mai mare dect
2
x
cu
100
1
;
Capitolul V 167
e) mai mare dect
2
x
de 100 de ori.
Amplitudinea relativ a variaiei se calculeaz ca:
a) ;
100
x x
min max


b)
; 100
x
x x
min
min max


c)
; 100
x
x x
max
min max


d)
; 100
x
x x
min max


e)
; 100
x
x x
max


O variabil aleatoare X, distribuit normal i cu oblicitate moderat
are 50% din valori situate n centrul distribuiei, cuprinse ntre 35,2 i
48,6; coeficientul de variaie este 2,5%, iar valoarea modal, 38,2%.
Asimetria este:
a) moderat pozitiv;
b) moderat negativ;
c) egal cu zero;
d) nu se pot preciza felul i mrimea asimetriei;
e) egal cu amplitudinea semiinterquartilic.
Abaterea medie interquartilic se calculeaz ca:
a) Q
3
-Q
1
;
b) ;
2
Q Q
1 3


c) ;
2
Q Q
1 2


d) ;
2
) Me Q ( ) Me Q (
1 3
+

e) 2(Q
2
-Q
1
).
Pentru dou serii de distribuie de frecvene, indicatorul amplitudinea
mprtierii este comparabil dac:
a) cele dou serii se refer la aceeai caracteristic;
b) cele dou serii se refer la aceeai colectivitate;
c) cele dou serii se refer la caracteristici diferite, dar cu aceeai
unitate de msur;
168 Statistic general
d) cele dou serii au acelai grad de asimetrie;
e) cele dou serii se refer la colectiviti de acelai volum.
120 de elevi din dou orae particip la un concurs de cultur
general. Cei 50 de elevi din primul ora obin un punctaj mediu de
16 puncte, cu un coeficient de variaie de 10%, iar cei din al doilea
ora obin un punctaj mediu de 18 puncte cu o abatere medie ptratic
de 1,9 puncte. Factorul de grupare (oraul) contribuie la variaia
punctajelor obinute de elevi n proporie de:
a) 23,46%;
b) 10,28%;
c) 76,54%;
d) 48,44%;
e) 24,48%;
Dispersia unei repartiii binomiale cu p probabilitatea succesului, q
probabilitatea insuccesului i n numrul de observaii, este:
a) np;
b) nq;
c) ; npq
d) npq(q-p);
e) npq.
Distribuia unei variabile aleatoare X este perfect simetric, de medie

x = 20. Dac se adaug dou uniti statistice cu valorile variabilei


studiate x
1
=18 i x
2
=180, atunci noua distribuie:
a) are simetrie pozitiv;
b) este perfect simetric;
c) are simetrie negativ;
d) are fie simetrie pozitiv, fie simetrie negativ;
e) nu prezint simetrie.
Dispersia unei caracteristici de tip alternativ binar, este maxim cnd:
a) numrul de rspunsuri alternative este egal cu numrul de
rspunsuri negative;
b) toate unitile colectivitii nregistreaz rspunsuri afirmative;
c) toate unitile colectivitii nregistreaz rspunsuri negative;
d) toate unitile colectivitii nregistreaz fie rspunsuri negative,
fie rspunsuri pozitive;
e) nu se poate preciza n ce caz dispersia unei caracteristici
alternative este maxim.
Dispersia valorilor unei variabile aleatoare X, fa de o constant a,
este minim cnd:
Capitolul V 169
a) a = 0;
b) a =

x ;
c) pentru orice a;
d) a = ;
i
x
e) a = x
max
;
Calculul amplitudinii variaiei valorilor individuale are sens pentru:
a) serii statistice numerice formate pe variante;
b) serii statistice formate dup o variabil alternativ;
c) serii statistice formate pe intervale egale de variaie;
d) serii statistice formate pe intervale neegale de variaie;
e) pe orice tip de serie.

S-ar putea să vă placă și