Documente Academic
Documente Profesional
Documente Cultură
=
=
n
1 i
i
x n x
(4.1)
n
x
x
n
1 i
i
=
= (4.2)
Aplicaia 4.1. Opt experi au cotat o iniiativ cu urmtorul punctaj
(din 20): {3,5,7,9,10,11,12,18}. Punctajul mediu obinut de respectiva
iniiativ este:
90 Statistic general
375 , 9
8
18 12 11 10 9 7 5 3
x =
+ + + + + + +
= /expert - puncte acordate
n medie de un expert.
Observaii i proprieti utile n analiz:
1) Definiia dat mediei aritmetice (4.2) este adevrat numai dac
valorile individuale nregistrate sunt numerice. Pentru o serie cu valori
nenumerice sau cu valori msurabile pe o scal nominal sau ordinal nu se
poate calcula media aritmetic.
2) Mrimea calculat a mediei aritmetice este unic; o serie nu
posed mai multe medii aritmetice distincte.
3) Mrimea mediei aritmetice poate s coincid sau nu cu vreo
valoare individual nregistrat, dar precis ea ncadreaz ntre valoarea
minim i maxim.
Demonstraie
Dac simbolizm prin } x ,..., x , x min{ x
n 2 1 min
= i prin
} x ,..., x , x max{ x
n 2 1 max
= atunci
max min
x x x .
min
ori n de
min min min n 2 1
nx x ... x x x ... x x = + + + + + +
4 4 4 4 3 4 4 4 4 2 1
i
max
ori n de
max max max n 2 1
nx x ... x x x ... x x = + + + + + +
4 4 4 4 3 4 4 4 4 2 1
Deci,
max min n 2 1 min
x x x n x ... x x nx + + +
Aceast proprietate nu trebuie privit i interpretat mecanic,
deoarece ea n substan demonstreaz c nivelul mediu este mai aproape de
x
min
sau de x
max
n funcie de ordinul de mrime al valorilor individuale i
de frecvena (absolut sau relativ) acestora.
4) Prin definiie, media aritmetic este legat de toate valorile
numerice nregistrate i, n consecin, este sensibil la prezena valorilor
aberante. Astfel, seria {1, 1, 2, 2, 2, 4, 4, 70} posed o singur valoare
aberant (ultima), foarte diferit de celelalte. Media calculat din primele 8
valori individuale (dup eliminarea valorii aberante) este egal cu 2,5 ceea
ce reprezint o valoare central "rezonabil". Dimpotriv, adugnd i
ultima valoare se obine o medie egal cu 10, nereprezentativ, pentru
seria luat n considerare.
5) Suma diferenelor dintre toate valorile individuale nregistrate i
media lor aritmetic este nul. Aceast proprietate fiind valabil pentru
aditivitatea valorilor individuale demonstreaz c n condiiile aciunii
Capitolul IV 91
exclusive a factorilor ntmpltori abaterile pozitive i negative fa de
tendin, la nivelul ansamblului, se compenseaz reciproc. Aceast
proprietate i d mediei, n principiu, caracterul de centru de greutate al
ansamblului de date nregistrate.
Deci,
i=1
n
(x
i
x) =
i=1
n
x
i
nx = nx nx = 0
(4.3)
6) ntr-o colectivitate statistic, suficient de mare, unde, de obicei,
multe uniti prezint pentru o aceeai caracteristic (exist deci, o
distribuie de frecvene) media aritmetic se calculeaz ca o medie
aritmetic ponderat. Raionamentul care st la baza calculului acesteia este
similar cu cel al mediei aritmetice simple (4.2).
Astfel,
= =
= + + = + + =
k
1 j
j k 1 k k 1 1 j
k
1 j
j
n x n x ... n x n x ... n x n x
(4.4)
=
=
=
k
1 j
j
k
1 j
j j
n
n x
x (4.5)
unde:
k = numrul variantelor (intervalelor distincte)
n
j
= frecvena variantei distinctive (clasei, grupei sau intervalele de
variaie) j ( k , 1 j = )
=
k
1 j
j
n = reprezint efectul total al colectivitii sau numrul total de
valori individuale nregistrate de X (volumul universului observat statistic).
Dac inem seama de frecvenele relative,
=
=
k
1 j
j
j
j
n
n
f , de apariie a
valorilor individuale relaia precedent devine:
=
=
k
1 j
j j
f x x sau
100
f x
x
k
1 j
j j
=
= (4.6)
7) n cazul n care frecvenele relative sau absolute sunt egale ntre
ele atunci relaiile de determinare a medie aritmetice simple sau ponderate
echivalente. Afirmaia este evident.
92 Statistic general
Aplicaia 4.2. S considerm c n contul bancar al unei societi
comerciale n 10 zile s-au nregistrat urmtoarele intrri:
- seria de date observate: {1, 0, 1, 2, 1, 1, 3, 0, 1, 0}
- seria de date ordonate: {0, 0, 0, 1, 1, 1, 1, 1, 2, 3}
- distribuia valorilor observate va fi:
{(0, 3), (1, 5), (2, 1), (3, 1)}
Calculul numrului mediu de intrri ca medie aritmetic ponderat
necesit, uneori, construirea urmtorului tabel:
Tabelul 4.1.
Numr de intrri n cont x
j
Numr de zile n
j
x
jnj
x
1=0
x
2=1
x
3=2
x
4=3
n
1=3
n
2=5
n
3=1
n
4=1
x
1
n
1=0
x
2
n
2=5
x
3
n
3=2
x
4
n
4=3
TOTAL 10 3x
j
n
j
sau
Tabelul 4.2.
f
j
x
j
f
j
f
1=0
f
2=1
f
3=2
f
4=3
x
1
f
1=0
x
2
f
2=0,5
x
3
f
3=0,2
x
4
f
4=0,3
3f
j
=1,0 3x
j
f
j
=1,0
Aplicnd relaia de calcul a mediei aritmetice ponderate se va observa
c aceasta va fi aceeai i egal cu 1; adic n medie o intrare pe zi, din perioada
de timp urmrit.
8) n cazul n care se dispune de o distribuie pe grupe, (fr s existe
datele iniiale), nu este posibil determinarea mediei aritmetice ca n seria
brut, deoarece nu se cunosc dect limitele extreme ale intervalelor de
grupare. Pentru a calcula o valoare apropiat de o valoare real a mediei
aritmetice se face o convenie i n locul valorilor x
j
se iau n considerare
centrele intervalelor de grupare, calculate dup relaia:
x
j
=
limita inf erioara+limita superi oara
2
; unde
(4.7)
Capitolul IV 93
x
j
= centrul intervalului de grupare j
(j = 1, k)
.
Aceast convenie este indus de urmtoarea ipotez: n interiorul
tuturor intervalelor de grupare, frecvenele sunt uniform distribuite. n
practic, aceast ipotez se verific foarte rar, motiv pentru care ntre media
calculat pe baza centrelor de interval i cea calculat pe baza datelor
iniiale exist diferene. Mai mult, se spune c media determinat pe baza
centrelor intervalelor (grupelor) estimeaz cu anumit eroare adevrata
valoare medie.
Aplicaia 4.3. Distribuia a 175 societi comerciale dup ncasrile
lunare realizate din desfacerea aceluiai sortiment de mrfuri se prezint
astfel:
Tabelul 4.3.
Distribuia societilor comerciale dup volumul ncasrilor lunare
Grupe de societi
comerciale dup
volumul ncasrile
lunare (mil. lei)
Numr
societi
comerciale
n
j
Centrul de
interval
(mil. lei)
x
j
ncasrile totale
estimate pe intervale
de grupare (mil. lei)
x
j
n
j
1 2 3 4
149,5 - 156,5
156,5 - 163,5
163,5 - 170,5
170,5 - 177,5
177,5 - 184,5
184,5 - 191,5
191,5 - 198,5
12
12
29
47
42
22
11
153
160
167
174
181
188
195
1836
1920
4843
8178
7602
4136
2145
TOTAL 175 -
=
=
7
1 i
j j
30660 n x
Pe baza datelor din tabelul de mai sus ncasarea medie lunar a unei
societi din cele 175 este:
2 , 175
175
30660
x = = mil. lei/societate comercial
9) Exemplul prezentat evideniaz faptul c n cazul n care se
dispune de un volum mare de date (de un numr apreciabil de grupe)
calculul manual al mediei aritmetice este destul de greoi. Acest inconvenient
poate fi nlturat dac se iau n considerare valorile centrale fa de o
constant oarecare a i reduse de un anumit numr de ori (h):
94 Statistic general
h
a x
u
j
j
= (4.8)
Deoarece media aritmetic a distribuiei {(Uj, nj), j = 1,2,..,k} este
h
a x
n
n U
U
j
k
1 j
j
k
1 j
j j
= =
=
=
(4.9),
atunci media aritmetic a datelor de valori individuale ) k , 1 ( x
j
din serie
este dat de relaia urmtoare:
a h u x + = (4.10)
n mod curent, valoarea lui "a" se ia egal cu aceea a centrului de
interval cu frecvena cea mai mare, iar valoarea lui "h" se ia egal cu
mrimea intervalului de grupare (n cazul distribuiei pe intervale egale) sau
cu cea a celui mai mare divizor comun al valorilor
{x
j
a}( cu j = 1, K).
Aplicaia 4.4. Pe baza datelor din aplicaia 4.3 media aritmetic se
calculeaz pe baza relaiei (4.10) efectund urmtoarea desfurare:
Tabelul 4.4.
x
j
n
j
U
j
=
x
j
a
h
a=174; h=7
u
jnj
153
160
167
174
181
188
195
12
12
29
47
42
22
11
-3
-2
-1
0
1
2
3
-36
-24
-29
0
42
44
33
TOTAL 175 -
=
=
7
1 i
j j
30 n x
Se observ c, 1714 , 0
175
30
n
n U
U
k
1 j
j
k
1 j
j j
= = =
=
=
, iar valoarea mediei
aritmetice dup (4.10) este 2 , 175 174 7 1714 , 0 x = + = mil. lei/societate
comercial; valoarea identic cu cea obinut la aplicaia 4.14.
Capitolul IV 95
9) n cazul n care colectivitatea general este structurat, valoarea
medie a caracteristicii studiate se calculeaz ca medie aritmetic ponderat
(uneori simpl) a mediilor pariale. Astfel, s presupunem c o serie
statistic cu "n" uniti se structureaz n dou clase omogene de mrime n
a
i n
b.
Pentru fiecare clas s-au calculat mediile aritmetice pariale a x i
b x , ale aceleiai caracteristici (X). Valoarea medie a caracteristicii (X) pe
ansamblul colectivitii se va calcula dup relaia:
x = x =
n
a
x
a
+n
b
x
b
n
a
+n
b (4.11)
Generaliznd, s-ar putea determina media variabilei numerice
observate X, ntr-o populaie (eantion) structurat dup un criteriu
(caracteristic) prestabilit, n funcie de mediile pariale dup relaia
urmtoare:
=
=
= =
p
1 l
l
p
1 l
l l
n
n x
x x (4.11.1)
unde: l x = media clasei (partiiei) l;
l
n = numrul de uniti din partiia l;
k = numrul de partiii ale populaiei studiate
n relaiile prezentate pentru calculul mediei (inclusiv n 4.11 i
4.11.1) se pot utiliza nunumai frecvene absolute ci i relative (exprimate n
coeficieni sau n procente).
Compararea mai multor medii aritmetice ponderate, cnd frecvenele
sunt diferite ntre ele, poate s introduc erori n fundamentarea deciziilor
deoarece n analiza comparat a fenomenului i pune amprenta att
modificarea structurii ct i variaia valorilor individuale.
Acest efect "shift and share" prezint n analiz imprtan prin:
- interes economic: relativizeaz fenomenele; explic o realitate
mascat; descompune o variabil n mai multe componente;
- interes statistic: necesit o reinterpretare a mediei sau o analiz
critic a rezultatelor medii, fr s se dea impresia c valorile medii
calculate pot s falsifice realitatea.
Principiul "shift and share" are largi utilizri n analizele economice
mai ales atunci cnd se iau n considerare structuri diferite cum sunt cele
din economia teritorial, demografie, analiza utilizrii forei de munc
pe sexe i calificri etc.
96 Statistic general
11) n cazul n care caracteristica urmrit este alternativ, calculul
nivelului su mediu, n mod convenional, se face astfel:
- unitile colectivitii se mpart n dou grupe: una format din
unitile la care se nregistreaz forma direct de manifestare a caracteristicii i o
alta format din acele uniti la care s-a nregistrat opusul formei directe de
manifestare;
- n mod convenional, aceast caracteristic alternativ se exprim numeric
dup cum urmeaz: se acord valoarea 1 pentru variantele cu rspuns afirmativ
(forma direct) i valoarea zero variantelor cu rspuns negativ (forma opus);
- se elaboreaz distribuia din tabelul 4.5. i se calculeaz valoarea
medie dup relaia (4.5.)
Tabelul 4.5.
Distribuia general a frecvenelor dup o caracteristic numeric
Varianta
caracteristicii (x
i)
Rspunsul
nregistrat
Frecvene
absolute
Frecvene relative
x=1 DA
N - uniti care
posed
caracteristica
p =
N
N+M
x=0 Nu
M - uniti care
nu posed
caracteristica
q =
M
N+M
= 1 p
TOTAL - N+M
p + q = 1
Media aritmetic a caracteristicii alternative este o mrime relativ
de structur, deoarece:
1%N+0%M
N+M
=
N
N+M
= p
; (4.12)
unde p = procentul unitilor care posed forma direct a caracteristicii.
12) n cazul a dou variabile numerice independente X i Y observate
avem proprietile:
Y X XY
Y X Y X
=
=
(4.13)
Dac, ns, variabilele X i Y sunt dependente, atunci Y X XY iar
diferena Y X XY ) y , x ( Cov = se numete covariana valorilor
nregistrate pentru cele dou variabile.
13) Din motive practice (de simplificare), deseori, analiza statistic se
realizeaz prelucrnd valorile centrate n media aritmetic. Adic,
Capitolul IV 97
x x x
i
c
i
= (4.14)
Unde:
c
i
x = valoarea centrat a valorii individuale x
i
.
Deci, n situaia observaiilor realizate pentru m variabile numerice,
matricea acestora este:
|
|
|
.
|
\
|
=
mn
n 1
2 m 1 m
12 11
x
...
x
... x x
... ...
... x x
X
iar matricea valorilor centrate va fi
|
|
|
|
.
|
\
|
= =
n
mn
n
n 1
2
2 m
1
1 m
2
12
1
11
c
x x
...
x x
... x x x x
... ...
... x x x x
X X X
, cu
|
|
|
|
.
|
\
|
=
n
n
2 1
2 1
x
...
x
... x x
... ...
... x x
X
n cazul n care se opereaz cu asemenea valori centrate, media acestora
este egal cu zero:
0 x x
n
) x x (
n
x
x
n
1 i
i
n
1 i
c
i
c
i = =
= =
= =
(4.15)
14) ntr-o serie cronologic continu pentru care s-au calculat
modificrile absolute cu baz mobil (tranzitiv) i care prezint valori
apropiate, atunci modificarea medie absolut pentru ntregul orizont al seriei se
determin prin relaia:
1 T
x x
1 T
0 T
T
1 t
x
1 t / t
x
=
=
4.2.2. Media armonic ) x ( h
Media armonic, ca msur a tendinei centrale ntr-un ansamblu de
observaii cantitative, se definete ca valoare invers a mediei aritmetice a
inverselor valorilor individuale nregistrate. Aplicarea mediei armonice
pentru exprimarea numeric a tendinei centrale are sens numai dac este
obiectiv nsumarea inverselor valorilor individuale. Deci, relaia de calcul a
mediei armonice simple este urmtoarea:
x
h
=
1
(
1
x
i
)
=
n
n
i=1
1
x
i
(4.16)
Aplicaia 4.5. S presupunem c se efectueaz trei investiii care
produc acelai venit. Ratele lor de randament sunt urmtoarele: 5%, 10%, i
98 Statistic general
15%. Rata medie cu care trebuie plasat capitalul pentru a produce venitul
total al celor trei investiii va fi calculat ca medie aritmetic a
randamentelor individuale:
x
h
=
3
1
5
+
1
10
+
1
15
=
3
11
30
= 8, 18%
Acest rezultat, dup cum se observ, este diferit de valoarea
calculat a mediei aritmetice, care este de 10%.
Aplicaia 4.6. O persoan cheltuiete 40.000 lei pentru aprovizionarea
cu trei tipuri de cafea, de caliti diferite. Preurile unitare sunt 8.000 lei i
16.000 lei. Preul mediu au unui kilogram de cafea se obine raportnd costul
total la cantitatea total cumprat:
pre mediu =
cost ul total
cantitatea tot ala
=
3%40000
5+4+2, 5
=
120000
11,5 = 10434,8 lei/kg
Acelai rezultat s-ar fi obinut dac s-ar fi calculat media armonic a
preurilor unitare corespunztoare celor 3 caliti:
pre mediu =
3
1
800
+
1
10000
+
1
16000
= 10434, 8lei/ kg
Aplicaia 4.7. S presupunem c pentru efectuarea unei operaii un
lucrtor cheltuiete 15 minute, iar altul 30 minute. Care este timpul mediu
consumat?
Dac s-ar calcula rapid media aritmetic, s-ar constata c timpul
mediu consumat ar fi 22,5 minute. Pentru a verifica veridicitatea rezultatului
efectum urmtorul raionament. ntr-o or primul lucrtor a executat 60 :
15 = 4 operaii, iar al doilea 60 : 30 = 2 operaii. Aceasta nseamn c
amndoi lucrtorii au efectuat 6 operaii. Timpul mediu calculat prin
raportarea timpului total lucrat la numrul total al operaiilor executate este:
60+60
60
15
+
60
30
=
1+1
1
15
+
1
30
= 20
minute/operaie
Acest rezultat este inferior celui anterior, de 22,5 minute. Care este,
ns, rezultatul corect?
n ipoteza unui consum de timp egal cu timpul mediu de 20 minute,
ntr-o or lucrtorii ar fi efectuat
60
20
+
60
20
= 6
operaii, un numr egal cu cel
efectiv realizat. Dac timpul mediu ar fii de 22,5 minute, numrul total de
operaii efectuate de cei doi lucrtori ar fi fost
60
22, 5
+
60
22, 5
= 5
operaii,
diferit de cel real. Prin urmare, n aceast aplicaie timpul mediu consumat
este raional dac el se calculeaz ca media armonic.
Pentru o serie de distribuii de frecvene media armonic ponderat
se calculeaz dup relaia:
Capitolul IV 99
x
h
=
k
j=1
n
j
k
j=1
1
x
j
n
j
(4.17)
dac se utilizeaz frecvenele absolute i dup relaia:
x
h
=
100
k
j=1
1
x
j
f
j
(4.18)
dac se utilizeaz frecvenele relative.
Se impun cteva observaii:
1) Pentru aceleai valori pozitive, media armonic este mai mic
dect media aritmetic;
2) n cazul n care ntre dou variabile exist o relaie de invers
proporionalitate
(y =
1
x
)
aceasta se pstreaz i ntre mediile calculate
pentru fiecare variabil.
Spre exemplificare, considerm valorile individuale ale
productivitii muncii (W
i
) i valorile consumului specific de timp de
munc (t
i
). ntre aceste valori exist relaia
. i
i
t
1
W = . Atunci,
= =
i
i
i
i i
i
i
i
i
T
T W
T
q
W . n acelai timp,
= =
i
i
i
i
i
i
i
i
i
T
t
1
T
Q
T
t care este o
medie armonic.
Deci relaia de invers proporionalitate exist ntre valorile lor
medii (
t
1
W = ) deoarece nivelul mediu de timp de munc se calculeaz ca
media armonic i nu ca medie aritmetic.
3) Media armonic este egal cu media aritmetic dac sunt calculate
din aceleai valori individuale sau dac se folosesc ponderi diferite i
compuse: dac pentru calculul mediei aritmetice se utilizeaz frecvene reale
(n
i
sau f
i
), iar pentru media armonic se utilizeaz frecvene compuse (x
i
n
i
sau x
i
f
i
), atunci h x x = .
4) Dac suma valorilor centrate n medie este nul n cazul mediei
aritmetice, bazndu-se pe obiectivitatea nsumrii valorilor individuale,
avem 0 ) x x (
i
i
=
\
|
(4.19).
5) Prin definiie i mod de calcul rezultatul determinrii mediei
armonice este influenat de prezena valorilor individuale mici i de
frecvena acestora.
6) Media armonic se utilizeaz pentru exprimarea tendinei centrale
n funcie de scopul cercetrii i mai ales n funcie de natura obiectiv
dintre valorile variabilei numerice observate. De cele mai multe ori, media
armonic se utilizeaz pentru calculul indicelui (sintetic) al preurilor
mrfurilor i tarifelor serviciilor (care sintetizeaz indicii individuali ai
acestor preuri i tarife). Relaia de calcul a acestui indice este:
=
=
1 j
j
1
j
1
p
0 / 1
j
j
1
j
1
p
0 / 1
p q
i
1
p q
I
j
sau
=
=
1 j
p q
1
p
0 / 1
p
0 / 1
j j
j
g
i
1
100
I (4.20)
Unde:
j
1
j
1
p q = valoarea sortimentului de marf j n perioada curent;
j
p
0 / 1
i = valoarea indicelui preurilor mrfurilor de sortiment j
(determinat la rndul su dup relaia 4.18);
j j
p q
1
g = ponderea sortimentului de mrfuri j n totalul cheltuielilor
efectuate (de gospodrii din eantion) n perioada curent.
4.2.3. Media ptratic (sau momentul iniial de ordinul
doi)
Media ptratic ( p x ) exprim tendina central a valorilor numerice
nregistrate pentru variabila observat dac are sens obiectiv nsumarea
ptratelor valorilor individuale. Ea reprezint acea valoare a caracteristicii
care dac ar nlocui fiecare valoare individual din serie suma ptratelor
termenilor seriei nu s-ar modifica.
Deci,
n
i=1
x
i
2
= x
i
2
+ ... + x
n
2
= x
p
2
+ ...x
p
2
= nx
p
2
(4.21)
Prin urmare, media ptratic se calculeaz dup relaia urmtoare:
x
p
=
n
i=1
x
i
2
n
1/ 2
(4.22)
Pentru o serie de distribuie de frecvene media ptratic ponderat
se determin dup relaia (4.21) sau (4.22).
Capitolul IV 101
x
p
=
k
i=1
x
j
2
n
j
2
k
j=1
n
j
1
2
sau, (4.23)
x
p
=
k
j=1
x
j
2
f
j
1/ 2
(4.24)
Definiia i relaiile de calcul ale mediei ptratice conduc la cteva
observaii importante:
1) Cu toate c media ptratic se poate calcula att din valori
individuale pozitive, nule sau negative, ea nu are sens din punct de vedere
economic dect dac se calculeaz din valori pozitive.
2) Valoarea mediei ptratice este mai mare dect cea a mediei
aritmetice atunci cnd ele se calculeaz din aceleai date.
3) n mod frecvent media ptratic se utilizeaz pentru a caracteriza
tendina central din ansamblul abaterilor valorilor individuale de la valoarea
lor medie. De asemenea, media ptratic se recomand pentru calculul
nivelului mediu n seriile n care predomin valorile ridicate sau cnd se
dorete s se acorde o importan mai mare n nivelul mediu a acelor uniti
pentru care caracteristica urmrit prezint cele mai mari valori absolute.
4) Fiind obiectiv nsumarea ptratelor valorilor individuale, atunci:
=
= |
.
|
\
|
n
1 i
2
p
2
i
0 x x sau
=
= |
.
|
\
|
n
1 i
j
2
p
2
i
0 n x x (4.25)
4.2.4. Media geometric
Spre deosebire de tipurile de medii prezentate anterior, care au la
baz o relaie de aditivitate ntre termenii unei serii statistice, media
geometric se calculeaz pe baza unei relaii obiective multiplicative ntre
termenii aceleiai serii.
Prin urmare, media geometric ) x ( g reprezint acea valoare a
caracteristicii observate care dac ar nlocui fiecare valoare individual din
serie produsul acestora nu s-ar modifica.
Deci,
n
g
ori n de
g g
n 2 1
n
1 i
i
x x ... x x ... x x x = = =
=
43 42 1
(4.26)
de unde
x
g
=
n
i=1
x
i
1/ n
- pentru o serie simpl (4.27)
sau
102 Statistic general
x
g
=
k
j1
x
j
nj
1
k
j=1
n
j
- pentru o serie de distribuie de frecvene
Media geometric, uneori, se mai numete i medie logaritmic
deoarece se poate determina prin logaritmii valorilor individuale. Astfel:
l n(x
g
) =
n
i=1
ln x
i
n
, de unde
x
g
= exp .
1
n
n
i=1
l n
(
x
i
)
(4.28)
Observaii i proprieti:
1) Dac relaia obiectiv dintre date este multiplicativ, atunci
compensarea abaterilor individuale fa de tendina central se exprim prin
relaia:
=
=
n
1 i g
i
1
x
x
(4.29)
2) Calculul nivelului mediu ca medie geometric are sens economic
numai atunci cnd relaia de multiplicare a termenilor seriei este real.
Calculul nivelului mediu ntr-o serie de distribuie media geometric se
utilizeaz mai rar, ndeosebi cnd termenii prezint o evident concentrare
ctre valorile cele mai mici sau cnd se urmrete s se acorde o importan
deosebit valorilor individuale reduse.
3) Dac cel puin o valoare individual este nul sau negativ,
calculul mediei geometrice este lipsit de sens.
4) n mod frecvent, media geometric se utilizeaz pentru calculul
indicelui mediu al dinamicii, pentru caracterizarea tendinei centrale din
seria indicilor de dinamic cu baz mobil.
5) Media geometric a produsului (raportului) dintre dou variabile
este produsul (raportul) mediilor geometrice ale valorilor variabilelor
observate.
Astfel, dac indicii de dinamic cu baz mobil (tranzitiv) sunt
omogeni (prezint valori apropiate), atunci indicele mediu de dinamic se
determin dup relaia urmtoare:
1 I
0
T
1 I
T
1 t
*
1 t / t
x
x
x
I I
=
= =
(cu T 1 = numrul indicilor cu baz
mobil) (4.30)
Sub cerina compatibilitii datelor, seria cronologic de lungime se
periodizeaz (de exemplu n k subperioade omogene). n aceast situaie se
determin pentru fiecare subperioad
x
j
1 t / t I (cu k , 1 j = ), iar apoi se
determin simplu sau ponderat indicele mediu de dinamic, global,
pentru ntreaga perioad studiat. n acest sens poate fi utilizat relaia de
urmtoarea form:
Capitolul IV 103
|
.
|
\
|
= =
=
=
k
1 j
j
j x T k
1 j
T
j
j
*
I I I (4.31)
cu: T
j
= lungimea subperioadei j;
j
I = indicele mediu de dinamic asociat subperioadei j.
Dac indicele mediu de dinamic arat de cte ori sau de ct la sut
s-au modificat, n medie, valorile variabilei X pe ntregul orizont de timp
T , 1 , pentru a determina cu ct la sut s-au modificat aceleai valori pe
acelai orizont de timp se calculeaz ritmul mediu (rata medie) dup relaia:
100 100 I R
* *
= (4.32)
6) Media geometric a raportului sau produsului dintre dou
caracteristici independente este egal cu raportul sau produsul mediilor
geometrice ale celor dou caracteristici.
Aplicaia 4.8. n 1992, 1993 i 1994 un businessman a realizat un profit
de 10 mil. lei, 20 mil. lei i 160 mil. lei. Pe baza acestor informaii se urmrete
determinarea indicelui mediu al profitului. n 1993 fa de 1992 profitul s-a
dublat, iar n 1994 fa de 1993 profitul s-a multiplicat de 8 ori. Dac se
calculeaz rapid media aritmetic se constat c n perioada 1992-1994 profitul
s-a multiplicat de
2+8
2
= 5
ori pe an. Acest rezultat n mod evident este incorect
deoarece dac profitul din 1992 a fost de 10 mil. lei s-ar fi multiplicat de 5 ori
pe an ar fi trebuit ca n 1993 i 1994 profiturile realizate s fi fost de 50 mil. lei
i de 250 mil. lei, valori nereale mult superioare valorilor reale.
Dimpotriv, dac indicele mediu de dinamic se determin ca media
geometric a dinamicilor individuale se obine urmtoarea valoare:
x
g
= 2 % 8 = 4
. Acesta este un rezultat mult mai corect dect cel anterior
deoarece pornind de la 10 mil. lei n 1992 profitul s-ar multiplica de 4 ori n
1994 i ar fi fost de 160 mil. lei.
4.2.5. Media de ordin p (momentul iniial de ordin
p)
Analiznd tipurile de medii prezentate constatm c esenial pentru
exprimarea numeric real a tendinei centrale o analiz detaliat trebuie s
precead alegerea tipului de medie. Sunt, n practic, fenomene ale cror
forme individuale de distribuie solicit pentru exprimarea tendinei centrale
utilizarea unui anumit tip de medie, care nu a fost prezentat anterior.
Aceast afirmaie conduce la ideea determinrii mediei de ordin p
sau a momentului iniial de ordin p, precum i la ordinea mediilor de
diverse ordine. n acest sens considerm o funcie y = p(x), strict monoton,
104 Statistic general
definit pe intervalul de variaie al datelor [x
min
, x
max
]. Deci,
+
R ] x , x [ : p
max min
. Numim media de ordin p a unei variabile, discrete,
de valori x
i
i frecvene asociate f
i
valoarea p( x ) pentru care exist
egalitatea urmtoare:
=
=
r
1 i
i i
) x ( p f ) x ( p (4.32)
n ansamblul punctelor M
i
(x
i
, y
i
), cu r , 1 i = , generate prin funcia
stabilit centrul su de greutate este G(x
G
, y
G
) unde:
=
= =
r
1 i
i i G
x f x x i
= =
= = = =
r
1 i
r
1 i
i i i i G
y ) x ( p f ) x ( p f y y
Graficul funciei y = p(x) cu punctele sale semnificative se prezint
mai jos:
x
G
M
p
M
r
M
1
x
1
x
2
x
x
i
x
r
p x
) x ( p y
1 1
=
) x ( p y
2 2
=
) x ( p y =
) x ( p y
i i
=
) x ( p y
r r
=
) x ( p y =
Figura 4.1. Graficul funciei y = p(x)
Analiznd graficul funciei y = p(x) observm urmtoarele:
Capitolul IV 105
Convexitatea (sau concavitatea) funciei, ct i poziia fa de grafic
a punctului G conduc la ideea unei relaii ntre media de ordin p i
media aritmetic ( x ). Aceste relaii sunt urmtoarele:
< <
= =
> >
0
) x ( d
p d
x d
p d
x x
0
) x ( d
p d
x d
p d
x x
0
) x ( d
p d
x d
p d
x x
2
2
p
2
2
p
2
2
p
(4.34)
Aceast relaie sugereaz c alegerea tipului de medie s fie
precedat de o analiz calitativ a datelor, de identificare a funcie dup
care se manifest fenomenul studiat.
Dac se ia n considerare funcia p(x) = x
k
(cu Z k ) atunci pentru
valorile individuale din
+
R ] x , x [
max min
se definete media de
ordin k (sau momentul iniial de ordin k), notat prin m
k
.
Din
3 k 2 2
2
2
x ) 1 k ( k
) x ( d
p d
x d
p d
= (4.35) se
constat c:
. 1 k x m
; 1 k x m
; 1 k x m
k
k
k
< <
= =
> >
Dac n raionamentul anterior lum k = {-1, 0, 1, 2} atunci avem:
. x m 2 k
; x m 1 k
; x m ) 1 , 0 ( k
; x m 1 k
p
2
1
g
k
h
1
= =
= =
=
= =
n virtutea strictei monotonii a funciei analizate (pentru orice
2 1
k k 2 1
m m k k < < sau pentru orice
2 1
k k 2 1
m m k k > > )
rezult existena, ntre mediile prezentate, a urmtoarei relaii de
ordine (inegalitatea mediilor): p g h x x x x (4.36)
106 Statistic general
4.2.6. Media termenilor unei serii cronologice
n seriile de distribuie (de frecvene) analizate cnd s-a estimat
tendina central s-au considerat constante timpul i spaiul.
n seriile cronologice timpul este variabil iar spaiul (inclusiv
densitatea frecvenelor, structura organizatoric etc.) este constant. Aceast
particularitate este esenial pentru exprimarea numeric a tendinei
centrale.
Astfel,
ntr-o serie cronologic de intervale (sau de flux), n virtutea
continuitii timpului, termenii fiind aditivi, nivelul mediu se
determin (pentru ntregul orizont de timp studiat) ca medie
aritmetic simpl dup urmtoarea relaie:
T
x
x
T
1 t
t
=
= (4.37)
unde: x
t
= nivelul variabilei X nregistrate n intervalul T , 1 t =
T = numrul de termeni ai seriei cronologice analizate.
ntr-o serie cronologic de momente aditivitatea termenilor nu mai
are sens. n aceast situaie pot exista urmtoarele cazuri:
o Cazul n care momentele de timp de nregistrare a
datelor sunt egal deprtate ntre ele. ntr-o astfel de
serie de stoc nivelul de nregistrare la un anumit
moment se poate determina adugnd la nivelul
nregistrat n momentul precedent intrrile dintre
cele dou momente succesive i eliminnd ieirile
dintre aceleai momente. La acest considerent mai
adugm ipoteza conform creia ntre dou momente
de timp succesive fenomenul urmeaz o evoluie
liniar (aproximativ). n baza acestei ipoteze, nivelul
mediu nregistrat ntre dou momente succesive de
timp s-ar putea determina ca medie aritmetic a
valorilor nregistrate la momentele respective.
Capitolul IV 107
x
1
x
2
x
3
... x
t-1
x
t
... x
T-1
x
T
... ...
1
2 ... t-1 ... T-1
t
) 38 . 4 (
1 T
2
x
x ... x x ... x x
2
x
2
x ... x ... x x
x
2
x x
x ...
2
x x
x ...
2
x x
x
2
x x
x
T
1 T t 1 t 3 2
1
1 T 1 t 2 1
CR
T 1 T
T
t 1 t
1 t
3 2
2
2 1
1
+ + + + + + + +
=
=
+ + + + +
=
+
=
+
=
+
=
+
=
4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 2 1
Deci, nivelul mediu ntr-o serie cronologic de
momente egal distanate se determin dup relaia
(4.37) care este relaia mediei simple cronologice.
o Cazul n care momentele de nregistrare a datelor
nu sunt egal deprtate. n acest caz, principiul
determinrii unei serii cronologice (discontinue) de
momente distanate inegal este asemntor celui
specific mediei aritmetice: se raporteaz valoarea
agregat pe ntreul orizont de timp a variabilei
observate la numrul termenilor seriei sau la
lungimea orizontului de timp. inem seama, ns, c
seria este format din stocuri (din termeni neaditivi),
pe orizontul T , 1 , fapt care ne conduce la dou
situaii.
1. Cazul cnd se cunoate funcia
matematic, continu, care aproximeaz
evoluia n timp, n orizotnul T , 1 . n
aceast situaie, n mod evident (trivial)
108 Statistic general
nivelul mediu s-ar putea determina dup
urmtoarea relaie:
=
T
1
T
1
dt
dt ) t , x ( f
x (4.39)
2. Cazul cnd nu se cunoate funcia
continu f(x,t) din orizontul T , 1 . n
aceast situaie, evoluia fenomenului
analizat poate fi vizualizat ca n figura
urmtoare:
0 1 2 3 4 ... t-1 t ... T-1 T
t
x
x
T
x
T-1
x
t
x
t-1
x
4
x
3
x
2
x
1
Figura 4.2. Evoluia unui fenomen X la diverse momente din orizontul de
timp T , 1
n situaia vizualizat mai sus aproximm evoluia fenomenului ntre
dou momente succesive cu o dreapt. Cu ct distanele dintre momentele
de timp sunt mai mici cu att aproximrile amintite sunt mai realiste.
Pe baza graficului de mai sus se observ c valoarea agregat a
variabilei observate X n fiecare interval dintre dou momente succesive de
timp [t-(t-1)] coincide cu aria trapezului corespunztor intervalului. Aria
Capitolul IV 109
unui asemenea trapez este
2
) 1 t ( t
) x x (
t 1 t
+
, cu t = T , 1 i, n consecin,
valoarea agregat a variabilei n orizontul T , 1 este
=
+
T
1 t
t 1 t
2
) 1 t ( t
) x x ( .
Prin urmare, nivelul mediu pe orizontul T , 1 se determin printr-o medie
numit medie cronologic ponderat n esen medie aritmetic,
exprimat prin urmtoarea relaie:
) 40 . 4 (
p ... p p
2
p
x
2
p p
x ...
2
p p
x
2
p p
x
2
p
x
2
) 1 t ( t
2
) 1 t ( t
) x x (
x
T 2 1
T
T
1 T 2 T
1 T
3 2
3
2 1
2
1
1
T
1 t
T
1 t
t 1 t
CR
+ + +
+
+
+ +
+
+
+
+
=
=
+
=
=
=
Unde: ) 1 t ( t p
1 t
=
1
- diferena dintre frecvena intervalului modal i frecvena
intervalului precedent;
2
- diferena dintre frecvena intervalului modal i cea a
intervalului urmtor.
Raionamentul prin care se ajunge la relaia (4.41) este sugerat de
figura urmtoare:
112 Statistic general
n
x
1
Mo 1 j
x
Mo 1 j
x
+
jMo
x
Mo
Figura 4.4. Determinarea grafic a valorii modale
n graficul de mai sus, utiliznd teorema asemnrii triunghiurilor
(din geometrie) constatm c:
. d . t . c . c h x Mo
Mo x
x Mo
2 1
1
jMo jMo
2
1
1 j
j
+
+ =
=
+
+
Aplicaia 4.10. Distribuia a 50 uniti de alimentaie dup volumul
ncasrilor zilnice se prezint astfel:
Tabelul 4.7.
Grupa de uniti dup
ncasrile zilnice (mii lei)
Numr
de uniti
ni
Centrul
de interval
xi
Numr de
uniti cumulate
cresctor
Observaii
500-550
550-600
600-650
650-700
700-750
750-800
3
12
17
8
6
4
525
575
625
675
725
775
3
15
32
40
46
50
*Interval
modal
TOTAL 50
Capitolul IV 113
Valoarea modal a ncasrilor zilnice sau ncasarea zilnic ce mai
frecvent (cea mai probabil este aproximativ:
M
0
= 600 + 50
1715
(1712)+(178)
= 617, 86
mii lei
Observaii:
1) n mod asemntor se definete i se poate determin valoarea
antimodal cu cea mai mic frecven, sau cea mai puin probabil;
2) Pe graficul repartiiei statistice (histogram, poligonul
frecvenelor) valoarea modal corespunde punctului, de pe abscis, n care
graficul i atinge maximul;
3) Modul satisface condiiile 1, 3, i 4 ale lui Yule, dar mai puin pe
celelalte. El are avantajul principal fa de medie sau cuantile c se
determin rapid i are o semnificaie simpl.
4) Exist n practic i serii de distribuie multimodale. n astfel de
situaii se determin mai multe valori modale, dar ele nu pot fi sintetizate
pentru a se obine o singur valoare modal pentru ntreaga colectivitate.
5) Pentru lansarea n producie de serie a unui tip de confecie de o
anumit mrime, decizia se ia n funcie de valoarea modal calculat.
6) Metodologia de calcul a modului pentru seriile de distribuie de
frecvene relative este similar cu cea prezentat mai sus.
7) n practic exist serii de distribie care prezint dou sau mai
multe valori modale. Acestea nu sunt aditive i, n consecin, nu pot fi
agregate pentru determinarea unei valori modale globale (generale). n acest
sens, figura de mai jos este deosebit de sugestiv:
n
i
x
i
M
01
M
02
Figura 4.5 Repartiie bimodal
8) Determinarea valorii modale are, deci, sens s se determine pentru
repartiiile (unimodale) valorilor individuale ale unei variabile numerice
observate. Dac repartiia nu are maxim ci un minim se determin valoarea
114 Statistic general
antimodal. Valoarea modal are sens s se determine, deci, pentru
repartiiile multimodale sau repartiiile n form de .
4.3.2. Cuantilele
Cuantilele sunt indicatorii care descriu anumite poziii localizate n
mod particular n cadrul seriilor de distribuie. Conceptul de "cuantil"
indic o divizare a distribuiei observaiilor ntr-un numr oarecare de pri.
Prin urmare, cuantilele de ordin "r" (C
r
) sunt valori ale caracteristicii
urmrite care mpart distribuia ordonat a observaiilor n "r" pri egale. Fiecare
parte are acelai efectiv, adic 1/r din numrul total al unitilor. Cuantilele se mai
numesc valori echiprobabile, deoarece
k
1
] C x [ p ] C x [ p
k k
= > = < . Frecvent se
utilizeaz urmtoarele cuantile:
- mediana sau cuantila de ordin 2 (r=2);
- cuartilele sau cuantilele de ordinul 4 (r=4);
- decilele sau cuantilele de ordinul 10 (r=10);
- centilele sau cuantilele de ordinul 100 (r=100).
Cuantilele de ordin superior (r>4) se calculeaz n cazul distribuiilor
cu numr mare de grupe sau clase de valori individuale.
- Mediana (Me): Mediana (cuantila de ordinul 2) reprezint acea
valoare a caracteristicii localizat n mijlocul seriei sau repartiiei statistice
cu valori individuale aranjate n ordine cresctoare sau descresctoare.
Cu alte cuvinte, mediana mparte numrul unitilor investigate n dou
pri egale: numrul valorilor individuale superioare medianei este egal cu
numrul valorilor individuale mai mici dect mediana. Din aceast cauz
mediana se mai numete valoarea echiprobabil a caracteristicii:
2
1
) Me x ( P ) Me x ( P
i i
= = (4.42)
Cazul seriei simple: Determinarea medianei, n asemenea situaii,
presupune ordonarea cresctoare sau descresctoare a valorilor individuale ale
caracteristicii. Dup ordonarea termenilor seriei se identific mediana astfel:
- dac seria ordonat are un numr impar de termeni, mediana corespunde
cu valoarea individual de rang
n+1
2 . Deci, n acest caz
M
e
= X n+1
2 (4.43)
De exemplu, n seria:
{
} 61 , 40 , 34 , 20 , 13 , 6 , 5 {
Me
sau
n seria:
{
} 32 , 28 , 21 , 15 , 12 , 6 , 3 {
Me
valorile mediane sunt 20 i respectiv 15.
Capitolul IV 115
- dac seria ordonat cresctor este format dintr-un numr par de
termeni mediana se determin, n mod convenional, ca medie aritmetic ntre
valoarea individual de rang
(
2
n
i acea de rang
(
+
2
1 n
.
Deci,
M
e
=
x
n
2
+x
n+1
2
2
(4.44)
De exemplu, n seria
{ {
} 61 , 58 , 40 , 34 , 28 , 13 { } 63 , 61 , 40 , 34 , 28 , 13 , 58 {
4 3
x x
37
2
x x
Me
4 3
=
+
=
Observm c n cadrul seriei simple impare mediana determinat
respect pe deplin definiia valorii mediane. n cazul seriei cu numr par de
termeni, valoarea median se determin n mod convenional i nu este
conform definiiei date.
Cazul seriei distribuiei de frecvene: La cazul seriei de distribuie
de frecvene pe variante distincte, semnificaia valorii mediane este
afectat de metoda sa de calcul. n asemenea situaie este considerat
valoarea median acea valoare individual a caracteristicii corespunztoare
primei frecvene cumulate ascendent care depete
2
n
k
1 n
1 i
=
+
.
Aplicaia 4.11. S considerm, n mod convenional, c n urma
controlului de calitate a 100 loturi de aparate electronice s-au obinut
urmtoarele date:
Tabelul 4.4
Numr de aparate
electronice cu defecte x
1
Numr de loturi
de aparate n
i
Numr cumulat
cresctor de loturi
0
1
2
3
4
5
10
20
40
15
10
5
10
30
70
85
95
100
TOTAL 100 -
Se observ, din datele de mai sus, c prima frecven cumulat
cresctor care depete (100+1)/2 = 50,5 este 70 i corespunde numrului
median de aparate defecte M
e
= 2. Valoarea median, astfel, determinat nu
116 Statistic general
rspunde definiiei date deoarece observm ca valoarea sa 2 nu mparte
seria n dou pri egale: numai 30% din loturi au un numr de defecte mai
puin 2 i nu 50% cum cere definiia. Din aceast cauz, n asemenea situaii
se recomand s se renune la median cu valoare tipic pentru
caracterizarea tendinei centrale de repartiie i s se recurg la alte valori
tipice.
n cazul distribuiei de frecvene pe intervale (caz n care datele
i pierd individualitatea) valoarea median se determin n mod
aproximativ printr-un procedeu de interpolare liniar bazat pe ipoteza
repartizrii uniforme a frecvenelor n interval median.
Procedeul de determinare a valorii mediane a caracteristicii n cazul
distribuiilor pe intervale se desfoar n urmtoarele etape:
- se determin intervalul median. Acesta este intervalul care
corespunde primei frecvene cumulate cresctor care depete
2
n
k
1 n
1 i
=
+
;
- n cadrul intervalului median; valoarea medianei se determin prin
interpolare cu ajutorul relaiei urmtoare:
jMe
jMe
1 i
Me 1 i
k
1 i
1 i
jMe jMe
n
n n
2
1
h X Me
=
=
+
|
.
|
\
|
+ = (4.45)
unde:
jMe
X - limita inferioar a intervalului median;
jMe
h - mrimea intervalului median
jMe
n - frecvena intervalului median
=
jMe
1 i
Me 1 i
n - suma frecvenelor precedente intervalului median.
Pe baza datelor din aplicaia 4.11 se constat c volumul (median) al
ncasrilor este:
M
e
= 600 + 50
22, 515
17
= 630, 8
mii lei. Aceast valoare semnific
faptul c 50% din numrul unitilor de alimentaie public au ncasri
zilnice mai mici de 630,8 mii lei i 50% au ncasrile zilnice mai mari de
630,8 mii lei.
Observaii:
1) Metodologia de calcul a valorii mediane n seriile de distribuie de
frecvene relative este similar cu cea prezentat mai sus;
Capitolul IV 117
2) Raionamentul de determinare a medianei aplicat repartiiei
valorilor globale (x
j
n
j
) ale caracteristicii analizate conduce la obinerea
indicatorului de poziie numit medial, utilizat frecvent n studiul
concentrrii.
3) Calculul cuantilelor de ordin r>4 reprezint o generalizare a
metodologiei de determinare a medianei.
4) Mediana satisface cel mai bine condiiile lui Yule, cu excepia
celei de-a 6-a. Ea nu se preteaz calculelor algebrice, n cazul n care seria
este structurat n pri relativ omogene.
5) Valoarea medianei nu este afectat de observaiile extreme ale
seriei.
Cuartilele sunt valori care localizate ntr-o serie ordonat mparte
aceast serie n patru pri egale, fiecare diviziune coninnd 25% din
valorile individuale nregistrate pentru aceeai variabil numeric.
Procedeul de determinare a cuartilelor este asemntor cu cel al
determinrii medianei.
Pentru o serie simpl, determinarea cuartilelor Q
1
, Q
2
= Me, Q
3
este
efectuat dup procedeul prezentat la median. n cazul seriei de distribuie
de frecvene pe variante Q
1
este considerat ca fiind valoarea caracteristicii
corespunztoare primei frecvene cumulate ascendent care depete
|
.
|
\
|
+ = +
=
r
1 i
i ak
1 n
4
1
) 1 F (
4
1
; Q
2
= Me; iar Q
3
este acea valoare a caracteristicii
corespunztoare primei frecvene cumulate ascendent care depete
|
.
|
\
|
+ = +
=
r
1 i
i ak
1 n
4
3
) 1 F (
4
3
. Dac seria de distribuie de frecvene este de
intervale, unde valorile individuale i pierd individualitatea, valorile
aproximative ale cuartilelor (Q
1
, Q
2
= Me i Q
3
) se determin prin procedeul
de interpolare liniar astfel:
- se stabilesc intervalele n care se situeaz Q
1
, Q
2
i Q
3
. Acestea sunt
intervalele corespunztoare primelor frecvene cumulate ascendent care
depesc ) 1 F (
4
3
); 1 F (
4
2
); 1 F (
4
1
ak ak ak
+ + + ;
- n etapa anterioar n cadrul intervalelor identificate valorile cuartilelor
(Q
1
, Q
2
,Q
3
) se determin dup urmtorul sistem de relaii:
118 Statistic general
3
1 3
3 3
2
1 2
2 2
1
1 1
1 1
ja
aja ak
ja ja 3
ja
aja ak
ja ja 2
ja
aja ak
ja ja 1
n
F ) 1 F (
4
3
h x Q
Me
n
F ) 1 F (
4
2
h x Q
n
F ) 1 F (
4
1
h x Q
+
+ =
=
+
+ =
+
+ =
(4.47)
x
i
f
i
0
Q
1
Q
2
Q
3
25% 25% 25% 25%
x
i
F
fi
100%
0
75%
50%
25%
Q
1
Q
2
Q
3
Figura 4.6. Determinarea grafic a cuartilelor
Din reprezentrile grafice anterioare se constat c n diagrama
diferenial cuartilele corespund absciselor n care dreptele paralele cu Oy
mpart diagrama n patru arii egale cu 25%.
Capitolul IV 119
Decilele (n numr de 9) sunt acele valori ale caracteristicii care
mpart aria de variabilitate n zece pri (intervale) egale, coninnd fiecare
10% din numrul observaiilor.
n cadrul unei serii simple, conform definiiei, cele 9 decile (D
1
, D
2
,
D
3
, D
4
, D
5
= Me, D
6
, ..., D
9
) se determin dup procedura prezentat n
cazul medianei. n cazul unei serii de distribuie de frecvene, pe variante,
decila m (D
m
, m = 9 , 1 ) va fi considerat acea valoare corespunztoare
primei frecvene cumulate ascendent care depete
|
.
|
\
|
+ = +
=
r
1 i
i an
1 n
10
m
) 1 F (
10
m
cu m = 1, ..., 9.
Dac avem de-a face cu o serie de distribuie de frecvene pe
intervale, determinarea decilelor se va aproxima, dup ce au fost identificate
intervalele n care se gsesc D
m
cu m = 9 , 1 , cu relaiile obinute de
asemenea prin interpolare:
( )
( )
( )
9 jD
1 9 ajD an
9 jD 9 jD 9
5 jD
1 5 ajD an
5 jD 5 jD 5
1 jD
1 1 ajD an
2 jD 1 jD 1
n
F 1 F
10
9
h x D
...
Me
n
F 1 F
10
5
h x D
...
n
F 1 F
10
1
h x D
+
+ =
=
+
+ =
+
+ =
(4.48)
Apelndu-se la reprezentarea grafic, se va putea constata c
diagrama diferenial este mprit n zece arii egale. Calculul decilelor se
justific atunci cnd variaia valorilor individuale este mare sau foarte mare.
Centile. Dac avem la dispoziie o colectivitate statistic cu un
numr mare de uniti i cu o variaie foarte mare, este util pentru analiz
calculul cuantilelor de ordin mai mare ca 10. de exemplu, cuantila de
ordinul 100, numit i centil. Centilele n numr de 99 sunt valorile
caracteristicii care mpart seria n 100 de pri egale (fiecare parte coninnd
100
1
din numrul observaiilor efectuate).
120 Statistic general
Procedeul de determinare a centilelor este asemntor cu cel al
determinrii medianei, cuartilelor i decilelor (cuantilelor de ordin mai mic
ca 10). Centilele de rang 25 i 75 se identific cu Q
1
i Q
3
, centila de rang 50
se identific cu mediana, iar centilele de ranguri 10, 20, 30, 40, ..., fiind
decilele D
1
, D
2
, ..., D
9
.
4.4. RELAIA DINTRE MEDIA ARITMETIC,
VALOAREA MODAL I MEDIAN
Localizarea n cadrul seriei a valorii mediei aritmetice, a valorii
modale i mediane conduce la informaii despre forma de distribuire a
unitilor colectivitii dup caracteristica urmrit. Astfel:
- dac exist egalitatea
x = M
0
= M
e
atunci, aa cum s-ar observa i
din grafic, distribuia frecvenelor este simetric;
- n cazul unei distribuii unimodale uor asimetrice, frecvenele sunt
uor deplasate ntr-o parte sau alta, ntre cei trei indicatori ai tendinei
centrale exist urmtoarea relaie, fr s se verifice cu regularitate:
x M
0
= 3
(
x M
e
)
(4.46)
Sunt cazuri cnd unul din cei trei indicatori ai tendinei centrale are o
semnificaie mai puternic. Exemple:
1) Fie seria
2, 4, 4, 7, 8, 1000
. n aceast serie mediana, ca
valoare central, este mai semnificativ dect media aritmetic,
corespunztoare care este afectat de valoarea extrem: 1000.
2) n seria studenilor din anul I ordonai dup media obinut la
concursul de admitere pentru a identifica studentul care se localizeaz cel
mai bine se caut n mijlocul seriei rangul studentului median; acesta
mparte seria ordonat n dou pri egale.
3) Sindicatele estimeaz c societatea comercial E i remunereaz
mai puin angajaii. Ei calculeaz salariul cel mai frecvent obinut i declar
c este mai mic dect n alte societi comerciale din acelai domeniu.
Patronatul n schimb replic i calculeaz salariul mediu i gsete c acesta
este superior salariilor medii din alte societi comerciale. Cele dou calcule
efectuate sunt corecte, dar comparaia sufer; se compar aici un salariu
modal cu un salariu mediu.
Exemplele de mai sus pun n eviden faptul c dup calculul indicatorilor
tendinei centrale o atenie deosebit trebuie acordat analizei n
concordan cu natura fenomenului analizat cu gradul de mprtiere
(variaie) a valorilor individuale. Aceasta este cu att mai important cu ct
n elaborarea deciziilor se ine seama de valoarea tipic calculat, cea mai
reprezentativ cu cea mai mare ncrctur informaional despre tendina
central.
Capitolul IV 121
ntrebri de control
n ce situaii se aplic pentru caracterizarea tendinei centrale: media
aritmetic, media geometric, mediana ?
Ce se nelege prin cuantile ? Definiia i modalitatea de calcul a
cuantilelor de ordinul 2 i 4.
Care sunt dezavantajele mediei n caracterizarea tendinei centrale ?
Care este semnificaia valorii modale ? Cum i cnd se calculeaz
aceasta ?
Cum se determin media variabilei alternative ?
Care sunt proprietile mediei aritmetice, dar ale mediei armonice ?
Care este trstura definitorie a indicatorilor medii utilizai pentru
caracterizarea tendinei centrale ?
Cnd nu are sens determinarea mediei aritmetice ?
Distribuia angajailor S.C. VIM dup numrul de sptmni de
concediu din 2001 se prezint astfel:
Nr. sptmni de concediu Nr. angajai
1 27
2 110
3 302
4 28
Total 467
Se cere s se calculeze i s interpreteze media, mediana i valoarea
modal.
Se cunosc urmtoarele date:
Intervale de salarii (mil. lei) Nr. angajai
1,25 2,00 87
2,00 2,75 170
2,75 3,50 115
3,50 4,25 32
4,25 5,00 18
5,00 5,75 10
5,75 6,50 3
Total 3,75
Se cere:
a) S se reprezinte grafic seria;
b) S se calculeze i s se interpreteze salariul mediu, median i
modal.
122 Statistic general
Se cunosc urmtoarele date:
Numrul de persoane
dintr-o familie
% numrului de
familii n oraul A
% numrului de
familii n oraul B
1 17 22,3
2 28,8 30,9
3 17,3 17,3
4 15,8 15,9
5 10,4 8,0
6 5,6 3,3
7 i peste 5,1 2,3
Total 100,0 100,0
Se cere:
a) S se calculeze i s se compare valorile mediane ale celor dou
distribuii;
b) S se calculeze i s se compare valorile modale pentru cele
dou repartiii;
c) Se pot calcula mediile celor dou repartiii ? Argumentai.
Distribuia a 200 de familii dup numrul de copii se prezint astfel
(date convenionale):
Nr. copii 0 1 2 3 4 5 Total
Nr. familii 20 65 70 30 10 5 200
Valoarea median n seria prezentat este:
a) 1 copil;
b) 2 copii;
c) 70 familii;
d) 3 copii;
e) 5 copii.
Dac ntr-o distribuie unidimensional format dup o variabil
numeric X valorile individuale sunt evident deplasate ctre valorile
mari, atunci:
a) ; Mo Me x < <
b) ; Mo Me x > >
c) ; Mo Me x = =
d) ; Me Mo x < <
e) . x Mo Me x =
Capitolul IV 123
O ntreprindere de transport auto-cltori aloc 10 autobuze pentru
traseul M-N a crui distan este D. Datele referitoare la vitezele
medii nregistrate de autovehicule ntr-o zi sunt urmtoarele:
Viteza medie (km/h) 40 60 70
Nr. de autovehicule 3 5 2
n medie, un autovehicul a parcurs n ziua considerat traseul M-N
de distan D cu o vitez de:
a) 56 km/h;
b) 53,5 km/h;
c) 60 km/h;
d) 70 km/h;
e) 56,7 km/h.
Se dau datele referitoare la repartiia salariailor unei societi
comerciale dup vechimea n munc:
Grupe (ani) Nr. salariai
(0-5] 3
(5-10] 5
(10-15] 9
(15-20] 15
(20-25] 9
(25-30] 5
peste 30 3
Total n = 49
Vechimea medie a unui salariat n cadrul societii comerciale este:
a) 12,5 ani;
b) 21,5 ani;
c) 9,75 ani;
d) 17,5 ani;
e) 24,5 ani.
Pentru calculul mediei aritmetice ntr-o serie numeric de distribuie
de frecvene pe intervale se iau n considerare:
a) limitele inferioare;
b) mijloacele intervalelor, indiferent de repartiiile din intervale;
c) limitele superioare;
d) limitele superioare dac frecvenele sunt relative;
e) mijloacele intervalelor n ipoteza aprioric a normalitii
repartiiilor din intervale.
Pentru urmtoarele valori ale unei variabile aleatoare X: {7, 11, 14,
14, 12, 20}. Care dintre urmtoarele afirmaii este adevrat:
a) Me = 14;
b) Mo = 14 i Me = 13;
c) x = 13 i Me = 13;
124 Statistic general
d) x = 14 i Mo = 14;
e) x = Mo = Me = 14.
Considernd urmtoarele valori ale unei variabile aleatoare X: {5, 7,
4, 5, 20, 6, 4}, indicatorul cel mai potrivit pentru a caracteriza
tendina central este:
a) media armonic;
b) media;
c) modul;
d) media ptratic;
e) mediana.
Expresia sintetizrii valorilor individuale ale unei variabile statistice
ntr-un singur nivel reprezentativ a tot ceea ce este esenial, obiectiv
i stabil n apariia i manifestarea fenomenelor de mas este dat de:
a) valoarea lor median;
b) valoarea lor medial;
c) valoarea lor medie;
d) coeficientul lor de variaie;
e) calculul unei mrimi relative de intensitate.
Care dintre urmtoarele afirmaii nu este adevrat pentru o serie
statistic:
a) ntre quartila 1 i quartila 3 se gsesc 50% din observaii, situate
n centrul distribuiei;
b) valoarea quartilei 2 este egal cu mediana, doar pentru o serie
simetric;
c) valoarea medianei este ntotdeauna egal cu valoarea quartilei 2;
d) pentru o serie simetric, abaterea interquartilic este nul;
e) pentru o serie simetric, abaterea interquartilic cuprinde 25%
din observaii.
Dou grupe de studeni, cu efective de 25 i respectiv 32 de
persoane, au susinut un test de cultur general. Prima grup a
obinut media 7,8 iar a doua, 8,4. Nota medie pe ansamblul celor
dou grupe este:
a) 8,14;
b) 8,10;
c) 8,12;
d) 8,00;
e) 8,09.
Media armonic se definete ca:
a) media aritmetic calculat din inversele valorilor individuale
nregistrate;
Capitolul IV 125
b) valoarea invers a mediei aritmetice a termenilor seriei;
c) valoarea invers a mediei aritmetice, calculat din inversele
ptratelor valorilor individuale nregistrate;
d) valoarea invers a mediei aritmetice, calculat din inversele
valorilor individuale;
e) valoarea care, dac ar nlocui termenii seriei, nu ar modifica
suma lor.
O medie calculat dintr-un ir de valori individuale este
reprezentativ dac:
a) s-au utilizat frecvenele absolute de apariie a valorilor
individuale;
b) irul de valori individuale este omogen;
c) unul dintre coeficienii de asimetrie ia valori n intervalul [-1;1];
d) irul de valori este structurat pe intervale de grupare egale;
e) s-a utilizat media aritmetic.
ntr-o serie de distribuie normal dup o anumit variabil
numeric, ntre valoarea median, modal i medie este adevrat
relaia:
a) Me Mo x < < ;
b) Mo x Me < < ;
c) Me Mo x = = ;
d) Mo Me x < < ;
e) x Me Mo < < .
unde x = media aritmetic; Me = mediana; Me = valoarea modal.
Despre stocul de mrfuri existent la o societate comercial se cunosc
urmtoarele date obinute n urma inventarierii:
Data inventarierii
1.01.
1997
1.02.
1997
15.03.
1997
10.05.
1997
1.07.
1997
Stocul existent (mil. lei) 50 58 68 70 75
Stocul mediu de mrfuri al societii comerciale din perioada
1.01.2000 1.07.2000 a fost de:
a) 66 mil. lei;
b) 60 mil. lei;
c) 64,2 mil. lei;
d) 50 mil. lei;
e) 75 mil. lei.
126 Statistic general
La o banc se analizeaz distribuia debitorilor dup situaia zilelor
de ntrziere a rambursrii creditelor, astfel:
Intervale de variaie a numrului de
zile de ntrziere a plii
Nr. debitori mai mult dect
limita inferioar
10-20 120
20-30 85
30-40 37
40-50 16
50-60 7
60-70 2
Valoarea median calculat utiliznd frecvene relative este:
a) 25 zile;
b) 35 zile;
c) 27 zile;
d) 23 zile;
e) nu se poate calcula mediana utiliznd frecvene relative.
ntre decila a treia i a aptea se afl:
a) 40% din termenii seriei;
b) 60% din termenii seriei;
c) 50% din termenii seriei;
d) 30% din termenii seriei;
e) 70% din termenii seriei.