Sunteți pe pagina 1din 26

DESCRIEREA STATISTICĂ A SERIILOR

UNIVARIABILE

Pentru descrirea unui set de date statistice, numerice, se folosesc trei proprietăţi majore:
- tendinţa centrală;
- variabilitatea;
- forma distribuţiilor.
În orice analiză şi interpretare statistică poate fi folosită o varietate de indicatori pentru a caracteriza aceste
trăsaturi esenţiale ale setului de date. Dacă indicatorii statistici sunt calculaţi pentru o colectivitate totală, ei
se numesc parametri

O serie (distribuţie) statistică univariabilă sau univariantă, prezintă corespondenţa dintre două şiruri de date
statisitice, sistematizate într-o succesiune logică :
- primul şir reprezintă valori ale caracteristicii de grupare, iar
- al doilea şir reprezintă frecvenţa de apariţie corespunzătoare.
Pentru o colectivitate C cu N elemente ordonate după variabila statistică X, cu valorile xi, i = 1, M , unde:
x 1 < x 2 < L < x M , la fiecare valoare xi , corespunde un efectiv ni . Ansamblul valorilor xi cu numărul
elementelor nj , asociate fiecărei variabile xi , respectivfiecărei clase Ji , (x i −1 , x i ) formează o serie statistică
univariabilă.
O serie statistică, definită de ansamblul valorilor (x i , n i ) se notează :

X : (x 1 , x 2 , K x i , K , x m ) sau X : (x i ) cu i = 1, M , cînd n 1 = n 2 = L = n , respectiv:

 x1 x 2 K x j K x M  x 
X:  , sau X :  j  , j = 1, M
 n1 n 2 K n j K n M  n j 
   

nj M
Dacă se utilizează frecvenţele relative, f j =
M
; ∑ f j = 1 serie statistică se poate scrie sub forma:
j−1
∑n j
j=1

 x1 x 2 K x j K x M 
X: 
 f1 f 2 K f j K f M 
 

care poate fi considerată ca o variabilă aleatoare.


Pentru astfel de serii statistice, sunt adevărate toate proprietăţile variabilelor aleatoare discrete.

2_INDICATORII TENDINTEI CENTRALE_11.doc 1


VARIABILE ALEATOARE FINITE

 x1 x 2 K x n 
Definiţia . Fie X o variabilă aleatoare discretă, avînd tabelul de distribuţie : X :   , atunci funcţia de
 p1 p 2 K p n 
 
repartiţie corespunzătoare va fi dată de relaţia :


0 , x≤x 1
p , x 1 <x≤x 2
 1
 p1 + p 2 , x 2 <x≤x 3

F(x ) = ........................
 k −1
 p ,
 ∑ i x k −1 < x ≤ x k
 i =1
 ........................

1 , x >x n

Observaţie:
Valorile funcţiei de repartiţie a variabilei aleatoare discrete X se obţin în următorul mod :
Dacă x < x1 ,atunci : F(x ) = P(X < x ) = P(X < x <1 ) = 0
Dacă x1< x ≤ x2 , are loc : P(X < x ) = P[(X ≤ x 1 ) ∪ (x 1 < X < x 2 )] = P(X = x 1 ) = p1
Dacă x1< x ≤ x2 , are loc :
P(X < x ) = P[(X ≤ x 1 ) ∪ (x 1 < X ≤ x 2 ) ∪ (x 2 < X < x 3 )] =
= P(X ≤ x 1 ) + P(x 1 < X ≤ x 2 ) + P(x 2 < X < x 3 ) = P(X = x 1 ) + P(X = x 2 ) = p1 + p 2
k −1
Dacă xk-1< x ≤ xk , are loc : P(X < x ) = P{(X ≤ x ) ∪ (x 1 < X ≤ x 2 ) ∪ K ∪ (x k −1 < X < x k )} = ∑p
i =1
i .

n
Pentru x > xn , P (X < x ) = ∑p i = 1.
i =1
Exemplul
1 2 3 
Fie variabila aleatoare discretă X :  
0.2 0.3 0.5 

Funcţia de repartiţie este o funcţie în scară:

x≤1 F(x)=P(X<x)=P(Φ)=0
1< x ≤2 F(x)=P(X<x)=P(X=1)=0.2
2< x ≤3 F(x)=P(X<x)=P({X=1}U{X=2})=P(X=1)+P(X=2)=
=0.2+0.3=0.5
x>3 F(x)=P(X<x)=P(Ω)=1.

Deci F(x) va fi de forma :

0 , x ≤ 1,
 0.2 , 1 < x ≤ 2,

F ( x) = 
 0.5 , 2 < x ≤ 3,
 1 , x > 3.

2_INDICATORII TENDINTEI CENTRALE_11.doc 2


Graficul funcţiei F(x) :

(0,1)

(0,1/2)

(0,1/5)

0 1 2 3

Valori medii

Definiţie :
 n 
Dacă variabila aleatoare simplă X ia valorile x1,x2,….,xn cu probabilităţile p1,p2,…,pn,  ∑ pi = 1 , atunci numărul:
 i =1 
M(X) = p1x1+p2x2+ ⋅⋅⋅ +pnxn se numeşte valoarea medie (sau speranţa matematică) a variabilei aleatoare X.

Definiţie
Dacă X este o variabilă aleatoare de tip continuu avînd densitatea de repartiţie f, atunci numărul :

M(X) =
−∞
∫ x ⋅ f (x)dx se numeşte valoarea medie a variabilei aleatoare X, dacă integrala este convergentă.

Observaţie:
Dacă variabila aleatoare X ia valori în intervalul ( a , b ) , -∞ < a < b < ∞, atunci f(x)=0 pentru x ∉ ( a , b ), deci:
b


M(X) = x ⋅ f ( x )dx .
a

Proprietăţi

Dacă X şi Y sunt variabile aleatoare simple, numărabile sau de tip continuu, şi există M(X) şi M(Y), atunci:
M1. Există M(X+Y) şi M(X+Y) = M(X) + M(Y)
M2. Există M(c X) şi M(c X) = c M(X) , c constantă.
Are loc şi următoarea proprietate:
M.1.2.Fie X1, X2, … ,Xn variabile aleatoare şi c1,c2, … ,cn constante.
 n 
Dacă există M(Xi), i = 1,2, … ,n atunci există şi M


∑c
i =1
i ⋅ X i  şi are loc relaţia :


 n  n
M


∑c
i =1
i ⋅ Xi  =
 ∑
 i =1
c i ⋅ M(X i ) .

M3. X ≤ Y ⇒ M(X) ≤ M(Y)


M4. Dacă X şi Y sunt variabile aleatoare independente şi există M(X) şi M(Y), atunci există şi M(X ⋅Y) şi are loc relaţia:
M(X ⋅Y) = M(X) ⋅ M(Y)
M5. Dacă f este densitatea de repartiţie a variabilei aleatoare X, iar g:R→R este o funcţie continuă,

atunci : există M(g(X)) şi are loc relaţia : M (g (X )) =
∫ g(x) ⋅ f (x)dx .
−∞
Exemplu :
 2
x ∈ (− 1,1)
Fie variabila aleatoare X cu densitatea de repartiţie f,

(
f (x) =  π ⋅ 1 + x 2
,
)
 0, x ∉ (− 1,1)

2_INDICATORII TENDINTEI CENTRALE_11.doc 3
Valoarea medie a variabilei aleatoare X este :
∞ ∞ 1
2x 2 x
M(X ) = ∫ x ⋅ f (x )dx = ∫ π ⋅ (1 + x ) ⋅ dx = ⋅ ∫⋅ dx = 0.
2 π 1+ x2
−∞ −∞ −1
2
Valoarea medie a variabilei aleatoare X este :

[ ]
∞ ∞ 1
( ) ∫x
M X2 = 2
⋅ f (x )dx =
2x 2
∫ π ⋅ (1 + x ) 2
⋅ dx =
2 

⋅ 1 −
1 
π  1+ x2 
2
π
+1 4
 ⋅ dx = ⋅ (x − arctgx ) −1 = − 1.
π
−∞ −∞ −1

Dispersia

Definiţie
Se numeşte dispersia sau varianţa variabilei aleatoare X, care are valoarea medie m, numărul :
µ2 (X) = D2 (X) = M [ (X-m)2 ] = σ2 , (dacă variabila aleatoare X are medie!).
Dacă X este o variabilă aleatoare de tip continuu, care are media m, cu densitatea de repartiţie f, atunci dispersia se scrie
sub forma :

σ 2 = D 2 (X) =
−∞
∫ (X − m) ⋅ f (x)dx .
Proprietăţi:
D0. D2(X) = M(X2) - [ M(X) ]2
D1. D2(X) ≥ 0 , pentru orice variabilă aleatoare X.
D2. Egalitatea D2(X) = 0 are loc dacă şi numai dacă X este o variabilă aleatoare constantă cu probabilitatea egală
cu 1, sau
D2(X) = 0 ⇔ X ≡ m ( sau mai exact : P (X = m) = 1 ).
D3. D2( c⋅X ) = c2⋅ D2(X) , unde c este o constantă.
D4. Dacă variabilele aleatoare X1,X2, … ,Xn sunt independente două cîte două, atunci :
D2(X1+X2+ ⋅⋅⋅ +Xn) = D2(X1)+ D2(X2)+ ⋅⋅⋅ + D2(Xn).
D.3.4. Dacă variabilele aleatoare X1,X2, … ,Xn sunt n variabile aleatoare independente două cîte două, şi c1,c2, … ,cn
sunt n constante atunci are loc relaţia :

∑ [c ]
 n  n
D2 

 i =1

ci ⋅ Xi  =

 i =1
2
i ⋅ D 2 (X i )

Demonstraţie:
Se aplică proprietatea D.0. şi se obţine :
2
 n   n     n
2


D 2
 ∑ 

c i ⋅ X i = M  c i ⋅ X i   −  M
   i =1

    i =1

ci ⋅ Xi  =
 ∑
 i =1    
  2
 n n    n 
= M
 i =1
2
∑ 2
ci ⋅X i + 2 ⋅ ∑
ci ⋅ c j ⋅ X i ⋅ X j  − M 
   i =1

ci ⋅ X i  =
 ∑
 i , j =1   
 i≠ j 

( ) ) ∑ c i2 [M(X i2 )]− 2 ⋅ ∑ c i c j M(X i ) ⋅ M(X j )


n n n n
= ∑ c i2 M X i2 + 2 ⋅ ∑ (
ci c jM X i X j −
i =1 i , j=1 i =1 i , j=1
i≠ j i≠ j
Dar variabilele aleatoare Xi sunt independente,două cîte două,deci conform cu M4 se deduce :

∑ c M(X )− ∑ c [M(X )] = ∑ c [M(X )− [M(X )] ] = ∑ c


 n  n n n n
D
 ∑
 i =1
ci Xi  =

 i =1
2
i
2
i
i =1
2
i
2
i
i =1
i
2
i i
2

i =1
2
iD (X )

Definiţie
Numărul D(X ) = D 2 (X ) se numeşte abaterea mediei pătratice şi măsoară gradul de “împrăştiere” a variabilei aleatoare în
jurul valorii sale medii.

Inegalitatea lui CEBÎŞEV

Propoziţie :
Dacă variabila aleatoare X are valoarea medie m şi dispersia σ2, atunci pentru orice ε,
σ2
(
ε > 0 are loc: P X − m ≥ ε ≤ )
ε2

2_INDICATORII TENDINTEI CENTRALE_11.doc 4


(
(sau sub forma echivalentă : P X − m ≥ k ⋅ σ ≤ ) 1
, ∀k ∈ R , k > 0 )
k2
Demonstraţie:
Dacă variabila aleatoare X are funcţia de densitate de repartiţie f, atunci:
∞ m−ε m+ε ∞
D(X) = ∫ (x − m) f (x)dx = ∫ (x − m) f (x)dx + ∫ (x − m) f (x)dx + ∫ (x − m) f (x)dx ≥
2 2 2 2

−∞ −∞ m−ε m+ε

m −ε ∞

∫ (x − m) f (x)dx + ∫ (x − m) f (x)dx.
2 2

−∞ m+ε

Pentru x ∉ ( m-ε , m+ε), adică | x-m | ≥ ε, are loc :


m −ε ∞  m −ε ∞ 
D(X ) ≥ ∫ ε 2 ⋅ f ( x )dx + ∫ ∫
ε 2 ⋅ f ( x )dx =ε 2  f ( x )dx + f ( x )dx  = ∫
 −∞ 
−∞ m+ε  m+ε 
ε 2 [P(X ≤ m − ε) + P(X ≥ m + ε)] = ε 2 ⋅ P( X − m ≥ ε ).
σ2 σ2
(
S-a demonstrat astfel că : P X − m ≥ ε ≤ ) (
, sau forma echivalentă: P X − m < ε ≥1 − ) .
ε2 ε2

Inegalitatea lui Cebîşev poate fi scrisă şi sub alte forme :

σ2
P( X − m ≥ a ) ≤ ,∀a ∈ R ,a > 0
a2

σ2
P( X − m ≤ a ) > 1 − , ∀a ∈ R ,a > 0
a2

Inegalitatea lui Cebîşev precizează marginea superioară pentru probabilitatea ca variabila aleatoare X, care are valoarea medie m
şi abaterea medie pătratică σ2 , să ia valori în intervalul ( m-a , m+a ).

Momente de ordin superior

Definiţie
N
Se numeşte moment de ordinul r al variabilei aleatoare finită X, numărul m r = M r (X ) = ∑ p i ⋅ x ir
, unde variabila
i =1
aleatoare X ia valorile xi respectiv cu probabilităţile pi, cu condiţia ca seria din membrul drept să fie absolut convergentă.
Dacă variabila aleatoare X este continuă şi are densitatea de repartiţie f, atunci se numeşte moment de ordinul , numărul:

M r (X ) = ∫x
r
⋅ f ( x )dx , dacă integrala din membrul drept este convergentă.
−∞

Definiţie.
Se numeşte moment centrat de ordinul r al variabilei aleatoare X, care are media m = M(X), numărul µr = Mr (X - m).
Definiţie
Se numeşte moment absolut de ordinul r al variabilei aleatoare discrete X,numărul :
mar = Mr ( | X | ),
iar numărul:
mr = Mr (X − m )
se numeşte moment centrat absolut de ordinul r al variabilei aleatoare X.

Comentarii :
1.Media (speranţa matematică) a unei variabile aleatoare X este momentul de ordinul întîi al variabilei aleatoare, iar dispersia -
momentul centrat de ordinul doi.
2.Valoarea medie este una dintre cele mai importante caracteristici numerice ataşate variabilei aleatoare, care va permite în
anumite situaţii, să tragem unele concluzii asupra variabilei aleatoare, fără a apela la legile lor de probabilitate.
3.Valoarea medie este un fel de valoare centrată a variabilei aleatoare, valoare în jurul căreia se situează celelalte valori posibile,
astfel ca media abaterilor de la această valoare să fie nulă.

2_INDICATORII TENDINTEI CENTRALE_11.doc 5


4.Alte caracteristici de poziţie sunt : modulul şi mediana.
4.1.Modulul - este valoarea cea mai probabilă în cazul unei variabile aleatoare discrete sau punctul de maxim al funcţiei f în cazul
variabilei aleatoare de tip continuu care au densitatea de repartiţie f.
4.2.Mediana - variabilei aleatoare X este valoarrea Me pentru care:
P( X < Me ) = P( X > Me ) .
Me
1
Dacă X are densitatea de repartiţie f, atunci Me este valoarea pentru care :
∫ f (x)dx = 2 .
−∞
Geometric, Me , este un număr real cu proprietatea că dreapta x = Me împarte aria cuprinsă între graficul funcţiei y = f(x) şi axa Ox
în două părţi egale.
5.Dacă o variabilă aleatoare are densitate de repartiţiem, F(x) şi valoare medie (finită) , atunci :
lim x ⋅ (1 − F(x )) = 0 şi lim x ⋅ F(x ) = 0 .
x →∞ x →−∞
6. Dacă o variabilă aleatoare are densitate de repartiţiem, F(x) şi valoare medie (finită), m , atunci :
∞ 0
m= ∫ (1 − F(t )) ⋅ dt − ∫ F(t ) ⋅ dt.
0 −∞

Proprietăţi

P.1. . Inegalitatea lui SCHWARTZ.


Dacă X şi Y sunt două variabile aleatoare pentru care există M(X2) şi M(Y2), atunci :
M(XY ) ≤ M X 2 M Y 2 ( ) ( )
Demonstraţie:
Fie variabila aleatoare Z=(X-λY)2 , unde λ este un parametru real.
Valoarea medie a variabilei aleatoare Z va fi :
M(Z) = M(X2) - 2λM(XY) + λ2 M(Y2)
Cum Z ≥ 0, avem M(Z) ≥ 0, ∀λ∈R, deci :
M(X2) - 2λM(XY) + λ2 M(Y2) ≥ 0.
Dacă considerăm funcţia de gradul doi, în variabila λ, cum M(Y2) ≥ 0,
discriminantul ecuaţie va fi negativ, deci :
[ M(XY) ] 2-M(X2)M(Y2) ≤ 0 ,
de unde rezultă inegalitatea lui Schawartz.

P.2. Inegalitatea lui HÖLDER.


Fie X o variabilă aleatoare pentru care există M(|X|r ) şi Y o variabilă aleatoare pentru care există M(|Y|s ), unde r>1 şi

[ ( )] ⋅ [M(Y )]
1 1
M( X ⋅ Y ) ≤ M X
1 1 r s s
+ = 1. Atunci : r
r s
Demonstraţie:

[ ( )] [ ( )]
r s 1 1
a b r −r s −s
Se foloseşte inegalitatea: ab ≤ + în care se alege : a = X ⋅ M X şi b = Y ⋅ M Y
r s
r s
XY X Y
Se obţine :
[M(X )] ⋅ [M(Y )]
1
r r
1
s s

r⋅M X ( ) + s ⋅ M(Y )
r s

Aplicînd operatorul de mediere, în ambii membri ai inegalităţii, obţinem :


M( X ⋅ Y ) ( ) + M(Y ) = 1 + 1 = 1 ,
MX
r s

[M(X )] ⋅ [M(Y )] r ⋅ M(X ) s ⋅ M(Y ) r s


1
≤ 1 r s
r r s s

de unde rezultă imediat inegalitatea lui Hölder.


Inegalitatea lui Hölder este o generalizare a inegalităţii lui Schwartz. Inegalitatea lui Schwartz se deduce din inegalitatea P.3.2. în
se consideră r=s=2.

P.3. Dacă k > h > 0 şi dacă X este o variabilă aleatoare pentru care există M(|X|k ) şi M(|X|h) , atunci are loc :

[M(X )] ≤ [M(X )]
1 1
h h k k

Demonstraţie:

[ ( )] , dacă r > 1.În această inegalitate se


1
Dacă în inegalitatea lui Hölder se pune Y = 1, se obţine relaţia : M X ≤ M X ( ) r r

k k
substituie |X| cu X şi r cu > 1.
h
2_INDICATORII TENDINTEI CENTRALE_11.doc 6
( ) ≤ [M(X )] , de unde se deduce P.3.
h
h k k
Rezultă relaţia : M X

P.4. Inegalitatea lui MARKOV.


Fie X o variabilă aleatoare pozitivă , casre admite voloarea medie M(X) = m, atunci pentru orice λ > 0 , are loc inegalitatea :
1
P(X ≥ λ ⋅ m ) ≤ .
λ
Demonstraţie:
Pentru 0 < λ ≤ 1,1/λ > 1 şi inegalitatea P.3.4. este evidentă.
Dacă λ > 1, X este o variabilă aleatoare continuă strict pozitivă cu funcţia de densitate de repartiţie f, atunci :
∞ λ⋅m ∞ ∞ ∞
m = ∫ x ⋅ f ( x )dx . Deci m = ∫ x ⋅ f ( x ) dx + ∫ x ⋅ f ( x ) dx ≥ ∫ x ⋅ f ( x ) dx ≥ λ ⋅ m ⋅ ∫ f (x )dx =
0 0 λ⋅m λ⋅m λ⋅m

 ∞ 
= λm ⋅ F( x )  = λ ⋅ m ⋅ [1 − F(λ ⋅ m )] = λ ⋅ m ⋅ P(X ≥ λm ) , de unde rezultă inegalitatea P.4.
 λ ⋅ m 

P.5. Inegalitatea lui KOLMOGOROV.


Fie X1,X2, …,Xn, n variabile aleatoare independente,cu mediile nule, M(Xk) = 0, şi dispersiile finite, D2(Xk) < ∞, k = 1,2, … ,n.
 n  1 n
Atunci pentru ∀ε>0 are loc inegalitatea: P max
 1≤ k ≤ n ∑ Xi ≥ ε ≤ 2 ⋅
 ε ∑
D 2 (X k ) .
 i =1  k =1
Inegalitatea lui Kolmogorov este o generalizare a inegalităţii lui Cebîşev.

Exemple :
0, x ∉ (− 1,1]

1.Variabila aleatoare X are densitatea de repartiţie f ( x ) =  1 ,
 2 , x ∈ [− 1,1)
Să se calculeze valoarea medie şi dispersia variabilei aleatoare Z=2X2+1.

Soluţie:

M(g(X )) = ∫ g(x ) f (x ) dx, g ( x ) = 2x 2 + 1, x ∈ R.
−∞
∞ 1
M(Z) = ∫ g(x ) f (x ) dx = ∫ (2x ) 12 ⋅ dx = 53.
2
+1 ⋅
−∞ −1
Dispersia se calculează astfel :
 5 
2  5 
2  2 
2
D 2 (Y ) = M  Z −   = M  2 x 2 + 1 −   = M  2x 2 −  
 3    3    3  
2
 2
Pentru calculul dispersiei vom considera funcţia g (x ) =  2 x −  şi se va obţine :
 3
1 2
 2 1 16
D 2 (Z ) =  2 x 2 −  ⋅ ⋅ dx = .

 3 2 45
−1

2.Dacă evenimentele A1,A2, …,An sunt independente cu propritetăţile de realizare cunoscute, pi = P( Ai ) , i = 1,2,…,n , să se
determine valoarea medie şi dispersia variabilei aleatoare definite de sistemul de mai sus.

Soluţie:
Fie X numărul de evenimente care se realizează.
n
P( X = k ), coeficientul lui xk din polinomul: (1) Q(x ) = ∏ (p
i =1
i ⋅ x − q i ), unde : q i = 1 − p i . Dacă :

0 1 2 K n 
(2) Q(x ) = P0 + P1 ⋅ x + P2 ⋅ x + L + Pn ⋅ x , atunci distribuţia li X este : X
2 n
 care are valoare medie :
 P0 P1 P2 K Pn 

( )
n
M(X ) = ∑i ⋅ P
i =1
i şi dispersia D 2 (X ) = M X 2 − [M (X )] .
2

2_INDICATORII TENDINTEI CENTRALE_11.doc 7


n
În urma derivării relaţiei (2) se obţine : Q ′(x ) = P1 + 2 xP2 + L + nx
n −1
Pn , de unde : Q ′(1) = ∑i ⋅ P
i =1
i = M (X ) .

Dacă se deriveză relaţia (1) se obţine:


n    n
(3) Q ′(x ) = ∑ p k ⋅  ∏ (p i x + q i )  , deoarece p i + q i = 1 ⇒ Q′(1) = ∑p k , deci :
k =1   i ≠ k   k =1
M(X) = p1+ p2+ ⋅⋅⋅ + pn .
Pentru a calcula dispersia D2(X) se va determina prima dată M(X2),

( ) ∑k
n
M X2 = 2
⋅ Pk
k =1
Se va deriva polinomul x ⋅ Q′(x ).

(x ⋅ Q′(x ))′ = (P1x + 2P2 x 2 + L + nPn x n )


(x ⋅ Q′(x ))′ = Q′(x ) + xQ′′(x ) = P1 + 2 2 P2 x + L + n 2 Pn x n −1


( )
n
Pentru x =1 relaţia de mai sus devine: Q ′(1) + Q ′′(1) = ∑k
k =1
2
⋅ Pk = M X 2 .

Derivînd relaţia (3) (se calculează a doua derivată a polinomului (1)) , pentru x=1 rezultă :
n
Q ′′(x ) = p1 ⋅ ∑ i ≠1
pi + p2 ⋅ ∑
i≠2
pi + L + p n ⋅ ∑
i≠n
pi = ∑p
k =1
k ⋅ [M(X ) − p k ] =

 n  n n
= M(x )
 ∑ pk  −
 k =1 
 ∑
k =1
p 2k = [M(X )]2 − ∑p
k =1
2
k , de unde rezultă

( )
n
M X 2 = M(X ) + [M (X )]2 − ∑p
k =1
2
k .

Dispersia va avea forma :

( )
n n n
D 2 (X ) = M X 2 − [M(X )]2 = [M(X )]2 + M(X ) − ∑ k =1
p 2k − [M (X )]2 = ∑
k =1
pk − ∑p
k =1
2
k =

( ) ∑p
n n
= p1 + p 2 + L + p n − p12 + p 22 + L + p 2n = k (1 − p k ) = ∑ p k q k = p1q 1 + p 2 q 2 + L + p n q n .
k =1 k =1

2_INDICATORII TENDINTEI CENTRALE_11.doc 8


INDICATORII TENDINTEI CENTRALE

MEDII
Deoarece statistica operează cu un număr mare de variante, este necesar să se găsească o singură expresie
numerică pentru a sintetiza toate aceste valori individuale.
Mărimile medii constituie instrumente principale de cunoaştere a fenomenelor de masă şi au un grad mare
de aplicabilitate în activitatea practică. Ele redau ceea ce este tipic, comun şi general în variaţia sau în
evoluţia fenomenelor.
Pentru a asigura un conţinut cât mai real mediilor calculate, se impune ca valorile individuale din care se
obţin să fie cât mai apropiate între ele. Totodată, trebuie să se ţină seama de gradul de omogenitate al
colectivităţii supuse cercetării. În cazul eterogenităţii se vor calcula medii parţiale, iar media pe ansamblu va
apărea ca o sinteză a acestora.
Pentru aplicarea corectă a metodei mediilor este necesar să se respecte următoarele condiţii:
calculul mediilor să se bazeze pe folosirea unui număr mare de cazuri individuale sub care s-a înregistrat
caracteristica, a căror variaţie este întâmplătoare în raport cu fenomenul în totalitatea lui
- valorile din care se va calcula media să fie omogene ;
- alegerea acelei forme de medie care corespunde cel mai bine formei de
variaţie a caracteristicii cercetate şi informaţiilor de care se dispune.
Prin definiţie, media valorilor individuale ale unei variabile este expresia sintetizării într-un singur nivel
reprezentativ, a tot ceea ce este esenţial, tipic şi obiectiv în evoluţia acesteia.
În condiţiile în care media este o valoare reprezentativă pentru toate nivelele pe care le sintetizează,
înseamnă că le poate substitui. Substituirea poate fi privită sub două aspecte:
- cantitativ, care constă în faptul că nivelul total al caracteristicii calculat prin
totalizarea nivelurilor individuale nu trebuie să se schimbe atunci când aceste niveluri
sunt substituite cu media lor;
- calitativ, legat de semnificaţia şi conţinutul mediei calculate, conţinut care
este asigurat atunci când unităţile au un grad înalt de omogenitate.
Rezultă că media măsoară influenţa cauzelor esenţiale, făcând abstracţie de cauzele întâmplătoare.
În statistică, media poate fi interpretată ca nivelul la care ar fi ajuns caracteristica înregistrată, dacă în
toate cazurile factorii esenţiali şi neesenţiali ar fi acţionat constant, deci s-ar fi obţinut o valoare identică.
Diversitatea largă a fenomenelor social-economice, precum şi complexitatea variabilităţii acestor fenomene,
condiţionează alegerea tipului de medie adecvat. Mediile cele mai frecvent întâlnite sunt: aritmetică,
armonică, pătratică, geometrică şi cronologică, calculate ca medii simple sau ponderate.

Indicii ca indicatori derivaţi


În mod frecvent apare necesitatea de a compara sub formă de raport două sau mai multe valori înregistrate
pentru acelaşi fenomen în funcţie de timp, de spaţiu sau de diferite structuri economico-sociale.
Astfel de mărimi relative au fost denumite indici. Metoda indicilor este larg utilizată în teoria şi practica
economică.

Indicatorii statici calculaţi ca mărimi medii


Fenomenele de masã social-economice supuse acţiunii legitãţilor statistice prezintã forme de manifestare
dintre cele mai diferite.Aceastã variabilitate a formelor individuale de manifestare este generatã de multiple
cauze asociate între ele, ale cãror influenţe se modificã în funcţie de condiţii obiective şi specifice, de la una
la alta. În aceste condiţii, când complexul dinamic de influenţe ale unui fenomen de masã determinã pentru
fiecare unitate a colectivitãţii nivele diferite ale caracteristicilor studiate, se pune problema determinãrii unei
valori care sã substituie toate formele de manifestare individuale. Asemenea valori care substituie valorile
individuale diferite, obţinute printr-o metodã statisticã şi cunoscute ca valori tipice sau centrale ale
colectivitãţii respective sunt mãrimile medii.
2_INDICATORII TENDINTEI CENTRALE_11.doc 9
Media valorilor individuale ale unei caracteristici reprezintã expresia sintetizãrii într-un singur nivel
reprezentativ a tot ceea ce este tipic, esenţial şi obiectiv în apariţia, manifestarea şi dezvolatrea fenomenelor
de masã.
În funcţie de repartiţia frecvenţelor, mediile menţionate se calculeazã ca :
- medii simple sau
- medii ponderate.

Mediile simple se calculeazã atunci când se utilizeazã toate variantele înregistrate sau când, în urma
operaţiilor de sistematizare, toate valorile individuale prezintã frecvenţe egale.
În cazul în care, în urma sistematizãrii (grupãrii), valorile individuale ale caracteristicii prezintã frecvenţe
diferite, nivelul mediu se calculeazã ca medie ponderatã.

Media aritmeticã

În sens statistic, media aritmeticã a valorilor individuale x 1, x2, ..., xN ale caracteristicii “X”, urmãritã într-o
colectivitate, reprezintã acea valoare ( x ) care s-ar fi înregistrat dacã toţi factorii de influenţã ar fi acţionat în
mod constant la nivelul fiecãrei unitãţi de înregistrare.
Deci, putem spune cã, dacã fiecare valoare individualã “xi” (cu i = 1, ..., n) ar fi înlocuitã cu x , valoarea
totalizatã a caracteristicii nu se modificã.

Aceasta înseamnã cã:


n
∑ x i = x1 + x 2 + ... + x i + ... + x n = x + x + ... + x + ... + x = nx
i =1
n
∑ xi
i =1
x= ⇒ media _ aritmetica _ simpla
n

Media aritmeticã simplã se utilizeazã atunci când, pentru aflarea nivelului mediu, se apeleazã la variantele
înregistrate într-o colectivitate, iar mãrimea colectivitãţii nu este foarte mare.
Într-o colectivitate statisticã mare, unde multe unitãţi prezintã aceeaşi valoare individualã şi seria statisticã
obţinutã în urma prelucrãrii prezintã frecvenţe diferite, media aritmeticã se calculeazã ca o medie aritmeticã
ponderatã, dupã formula:

n k
∑ x i n i = x1n1 + x 2 n 2 + ... + x i n i + ... + x k n k = xn1 + xn 2 + ... + xn i + ... + xn k = x ∑ n i
i =1 i =1

ceea ce conduce la:


n

∑x n
i =1
i i
x= k

∑i =1
ni

unde: - xi = toate cele “k” (i = 1, ..., k) vaolri individuale înregistrate în colectivitate


- xi ni = valoarea centralizatã a caracteristicii la toate unitãţile (ni) care
prezintã acelaşi nivel (xi)
- xni = valoarea centralizatã a caracteristicii care s-ar fi înregistrat dacã la
fiecare din cele “ni “ unitãţi toţi factorii de influenţã ar fi acţionat constant;
- n = Σni , i = 1, ..., k = volumul colectivitãţii studiate

2_INDICATORII TENDINTEI CENTRALE_11.doc 10


În legãturã cu cele douã modalitãţi de calcul ale mediei aritmetice se impun unele observaţii. Astfel:
• media aritmeticã este precis definitã şi se bazeazã pe toate observaţiile efectuate;
• nivelul mediei aritmetice depinde nu numai de nivelul variantelor, ci şi de mãrimea frecvenţelor
corespunzãtoare;
• în cazul în care calculul mediei aritmetice este precedat de operaţia de grupare a valorilor
individuale pe intervale, atunci valorile “xi “ (i = 1, ..., k) vor fi centrele intervalelor de grupare;
• în cazul în care pentru valorile individuale dispunem de frecvenţe relative “fi “ (i = 1, ..., k) şi nu
de frecvenţele absolute “ni “, media aritmeticã se va calcula dupã relaţia:
în care

Media aritmeticã a unei caracteristici numerice prezintã o serie de proprietãţi utile pentru calculul şi
k
ni
∑x i fi fi = k
• 100
∑n
i =1
x=
100 i =1
i

interpretarea valorii sale. Dintre aceste proprietãţi ale mediei aritmetice, cele mai utilizate în analiza statisticã
a fenomenelor sociale şi economice sunt urmãtoarele:
a) într-un şir de valori egale, media acestora este egalã cu fiecare dintre ele
b) mãrimea mediei aritmetice este întotdeauna cuprinsã şi intervalul de variaţie al caracteristicii
studiate
xmin < x < xmax
c) într-o serie statisticã suma tuturor abaterilor individuale ale termenilor seriei de la media lor
aritmeticã (luate cu semnul corespunzãtor) este zero.
- pentru o serie simplã:
n

∑ (x
i =1
i − x) = 0

- pentru o serie de frecvenţe:


n

∑ (x
i =1
i − x )ni = 0

sau
n

∑ (x
i =1
i − x) fi = 0

d) într-o serie statisticã, dacã toţi termenii se mãresc (micşoreazã) cu aceeaşi mãrime constantã “a”,
atunci media noilor termeni este mai mare (micã) decât media seriei iniţiale cu constanta “a”;
e) într-o serie statisticã, dacã toţi termenii se mãresc (micşoreazã) cde acelaşi numãr de ori “h”,
atunci şi media seriei iniţiale se mãreşte (micşoreazã) de acelaşi numãr de ori “h”.
Prin combinarea acestor douã proprietãţi se poate ajunge la o relaţie de calcul simplificat al mediei
aritmetice.
f) dacã într-o serie de distribuţie se reduc proporţional toate frecvenţele, atunci media calculatã pe
baza noilor frecvenţe va fi egalã cu media seriei iniţiale;
g) pentru o serie de distribuţie de frecvenţe cu toate frecvenţele egale între ele, media aritmeticã
ponderatã se transformã în medie aritmeticã simplã;
h) într-o colectivitate structuratã pe grupe, media acesteia (x) este dependentã de media grupelor (xj
cu j = 1, ..., p) şi de frecvenţele grupelor respective (nj sau fj). În acest caz media generalã nu este
o sumã a mediilor parţiale, ci o sintezã a acestora, deoarece pe întreaga colectivitate are loc un
proces de compensare a abaterilor mediilor parţiale de la media generalã.
i) Media aritmeticã a sumei (diferenţei) dintre douã variabile aleatoare independente este egalã cu
suma (diferenţa ) mediilor celor douã variabile luate în considerare
x+y=x+y
j) media produsului a douã variabile aleatoare independente x şi y este egalã cu produsul mediilor
celor douã variabile:
2_INDICATORII TENDINTEI CENTRALE_11.doc 11
xy = x • y

Media armonicã
Media armonicã se defineşte ca valoare inversã a mediei aritmetice, calculatã din inversele valorilor
individuale înregistrate.
Relaţia pentru media armonicã simplã:
pentru o serie de distribuţie de frecvenţe
n
xh = n k
1

i =1 x i
∑n i =1
i
xh = k
⇒ absolute
1

i =1 x i
ni

100
xh = n
⇒ relative
1

i =1 x i
fi

Compararea mediei armonice cu media aritmetică permite stabilirea anumitor relaţii utile analizelor nivelelor
sintetice.
Astfel:
1) Pentru aceleaşi valori pozitive ale unei caracteristici, media lor armonică este mai mică decât cea
aritmetică.

( x h p x)

Dacă valorile individuale sunt egale între ele şi egale cu o constantă “c”, atunci

xh = x = c

2) În cazul în care între două variabile interdependente există o relaţie de inversă proporţionalitate
(y = 1/x), aceasta se păstrează şi între mediile calculate pentru fiecare variabilă. Deci, dacă
pentru una din variabile, nivelul mediu se calculează ca medie aritmetică, în mod obligatoriu
nivelul mediu al celei de a doua variabile se calculează ca medie armonică.

Asemenea cazuri în care media armonicã apare ca o formã transformatã a mediei aritmetice, se
întâlnescatunci când se calculeazã media unor indicatori derivaţi exprimaţi ca mãrimi relative parţiale sau ca
mãrimi medii parţiale. Media armonicã se foloseşte , de exemplu, la aclculul preţului mediu şi al indicelui
mediu al preţurilor, când lipsesc informaţiile despre volumul fizic al circulaţiei mãrfurilor. De asemenea, se
foloseşte media armonicã la calculul salariului mediu pe întreprindere când se cunosc salariile medii şi
fondurile de salarii de la nivelul secţiilor; tot mdia armonicã se foloseşte la calculul recoltei medii de grâu pe
ţarã, când se cunosc recoltele medii şi recoltele totale la nivelul judeţelor.

3. Media pãtraticã
Media pãtraticã reprezintã acea valoare (xp) care, dacã ar înlocui fiecare termen al seriei (xi), i = 1, ..., n,
suma pãtratelor termenilor nu s-ar modifica. Relaţia de calcul a mediei pãtratice pentru o serie simplã este:

2_INDICATORII TENDINTEI CENTRALE_11.doc 12


n

∑x i =1
2
i ∑x 2
i ni
xp = xp = i =1
n
∑n
i =1
i

Pentru o serie de frecvenţe, dacã frecvenţele sunt absolute, atunci relaţia de calcul a mediei pãtratice va fi:
sau dacã frecvenţele sunt relative

∑x 2
i fi
xp =
100
Media pãtraticã se poate calcula pentru orice valori pozitive, nule sau negative, dar din punct de vedere
economic nu au sens decât dacã toate valorile individuale xi sunt pozitive.
Indiferent de semnul valorilor individuale xi, media pãtraticã este mai mare decât media lor aritmeticã.
Media pãtraticã este recomandatã pentru calculul nivelului mediu atunci când seria analizatã predominã
valorile ridicate sau când se doreşte sã se acorde o importanţã mai mare acelor unitãţi pentru care
caracteristica prezintã cele mai mari valori absolute.
Media pãtraticã se foloseşte, de asemenea, în cazul calculãrii mediei abaterilor valorilor individuale de la
nivelul lor mediu, mãrimea sa oferind informaţii utile pentru aprecierea omogenitãţii seriei analizate.

4. Media geometricã
Media geometricã reprezintã acea valoare (xg) a caracteristicii cu care, dacã s-ar înlocui toate valorile
individuale, produsul lor nu s-ar modifica.

f ( x1 , x 2 ,..., x n ) = f ( x g , x g ,..., x g ) ⇒ de _ n _ ori

Dacã xi = termenii unei serii statistice şi xg = media geometricã a acestor termeni, atunci potrivit definiţiei:

deci rezultã relaţia pentru media geometricã simplã:

∏ x i = x1n ⋅ x 2 ⋅ ... ⋅ x n = x g ⋅ x g ⋅ ... ⋅ x g ⇒ de _ n _ ori


x g = n ∏ xi k

∑ ni n ni
x g = i =1 ∏ x i
i =1

i =1

Pentru o serie de frecvenţe relaţia de calcul a mediei geometrice ponderate este:

Câteva observaţii utile:


- calculul nivelului mediu al unei caracteristici ca medie geometricã are sens economic numai atunci
când relaţia de multiplicare a termenilor seriei este posibilã. Se foloseşte frecvent în cazul seriilor dinamice
la calculul mediilor (a indicelui mediu), din mãrimi relative de dinamicã între care existã relaţia de produs.
- dacã cel puţin un termen al seriei este nul sau negativ, atunci media geometricã calculatã pentru
seria analizatã nu are sens.
Media geometricã are o serie de proprietãţi dintre care amintim:
1) În cazul mediei geometrice, abaterile termenilor seriei faţã de medie nu se calculeazã sub formã
de diferenţe, ci sub formã de rapoarte (xi/xg) cu i = 1, ..., n. Produsul acestora este egal cu 1.

2) Media geometricã a unui ansamblu format din douã sau mai multe subansambluri poate fi

x1 x 2 x n ∏
xi
n
xi x gn
∏ ( )=
i =1 x g x x
...
x
= i =1

x n
= n =1
xg
g g
2_INDICATORII TENDINTEI CENTRALE_11.doc g g
13
calculatã în funcţie de media geometricã a subansamblurilor.
3) Media geometricã a raportului dintre douã caracteristici independente este egalã cu raportul
mediilor geometrice ale celor douã caracteristici.
4) Media geometricã a unui produs de caracteristici independente este egalã cu produsul mediilor
geometrice ale caracteristicilor respective.
În concluzie, atunci când folosim mãrimile medii, o problemã deosebitã de care trebuie sã ţinem seama în
evaluarea esenţei formei de manifestare a unui fenomen o reprezintã identificarea celei mai potrivite metode
de calcul a nivelului mediu.
Relaţia de ordine între mediile prezentate este urmãtoarea:

xh ≤ x g ≤ x ≤ x p

2_INDICATORII TENDINTEI CENTRALE_11.doc 14


Indicatori de poziţie

Analiza tendinţei centrale în seriile de repartiţie sau de distribuţie presupune luarea în considerare nu numai a
valorilor individuale ale caracteristicii, ci şi a formei în care se repartizeazã frecvenţele valorilor individuale.
Caracterizarea tendinţei centrale presupune un sistem de indicatori care sã cuprindã pe lângã mãrimile medii
şi indicatori de poziţie. Aceasta înseamnã cã în analiza unor serii de repartiţie poate fi valoare tipicã nu
numai media, ci şi indicatori de poziţie, ca mediana şi modulul (dominanta).
Indicatorii de poziţie, prin locul pe care îl ocupã în cadrul variantelor caracteristicii, evidenţiazã tendinţa de
aglomerare, de concentrare a frecvenţelor în zona centralã a distribuţiilor statistice.

Mediana – Me

Mediana reprezintã acea valoare a caracteristicii situatã la mijlocul seriei sau repartiţiei statistice cu valorile
individuale aranjate în ordine crescãtoare sau descrescãtoare. Mediana împarte numãrul unitãţilor în douã
pãrţi egale; numãrul celor cu valori individuale inferioare medianei este egal cu numãrul celor care au valori
individuale superioare medianei.
Pentru o serie simplã, ordonatã, cu un numãr impar de termeni, mediana este valoarea corespunzãtoare
termenului de rang (n+1)/2; ex: avem seria 5, 6, 13, 20, 34, 40, 61. Mediana este (7+1)/2 = 8/2 = 4, valoarea
corespunzãtoare termenului al patrulea din serie fiind 20.
Pentru o serie: 5, 8, 6, 7, 4, 1, 1, se face întâi ordonarea crescãtoare sau descrescãtoare: 8, 7, 6, 5, 4, 1, 1, deci
Me = 5.
În cazul seriei ordonate cu un numãr par de termeni, mediana este valoarea situatã între termenii de rang
[n/2] şi [(n+2)/2]. În acest caz, mediana se determinã în mod convenţional ca medie aritmeticã a termenilor
de rang [n/2] şi [(n+2)/2].
Ex.: 5, 8, 13, 28, 34, 40, 61, 63
x1, x2, x3, x4, x5, x6, x7, x8

[n/2] [(n+2)/2]

Me = (x4 + x5)/2 = 31 ((28+34)/2 = 62/2 = 31)

n cazul unei serii de distribuţie de frecvenţe, pentru determinarea medianei se aplicã urmãtorul principiu:
valoarea medianã este acea valoare a caracteristicii corespunzãtoare primei frecvenţe cumulate ascendent
care depãşeşte

Modulul sau valoarea dominantã – Mo


Reprezintã acea valoare a caracteristicii care are cea mai mare frecvenţã de apariţie. Pe graficul repartiţiei
statistice, Mo corespunde punctului de abscisã corespunzãtor maximului curbei de frecvenţe.
Pentru o repartiţie discretã, valoarea modalã se identificã prin examinarea şirului de frecvenţe (absolute sau
relative).
În cazul în care seria este de distribuţie de frecvenţe pe intervale, determinarea cu aproximaţie a valorii
modale implicã desfãşurarea urmãtoarelor etape:
- identificarea intervalului modal. Intervalul modal (cel cãrui îi aparţine modului) este
intervalul cu frecvenţa (absolutã sau relativã) maximã;
- estimarea valorii modale. Dacã în cadrul intervalului modal frecvenţele sunt simetric
distribuite, atunci Mo coincide cu mijlocul intervalului modal; dacã repartiţia în cadrul
intervalului modal este de alt tip, atunci valoarea modalã (dominantã) se determinã în
raport cu abaterea frecvenţelor în intervalul premodal şi al celui postmodal, de la
frecvenţa intervalului modal. Relaţia de aproximare a valorii modale în aces caz se
stabileşte prin interpolare.
Mo − x j − 1 ∆1
=
x j + Mo ∆2

2_INDICATORII TENDINTEI CENTRALE_11.doc 15


Un alt procedeu de aproximare se bazeazã pe ipoteza cã, dacã distribuţia este moderat asimetricã, atunci între
valoarea modalã (Mo), medianã (Me) şi media aritmeticã (x) se poate stabili urmãtoarea relaţie:

Mo = x − 3( x − Me)

Observaţii:
- în orice repartiţie simetricã unimodalã
-în orice repartiţie unimodalã uşor asimetricã mediana se plaseazã între medie şi valoarea modalã;
Mo = Me = x
distanţa medianei faţã de modul este aproximativ dublul distanţei sale de la media aritmeticã.
În contextul analizei şi determinãrii valorii modale, în practica statisticii se întâlnesc repartiţii unimodale (cu
o singurã valoare modalã sau interval modal) şi repartiţii plurimodale (multimodale) cu mai multe valori
(intervale) modale.
Prezenţa mai multor valori modale (una principalã şi altele secundare) evidenţiazã, în general, caracterul
eterogen al repartiţiei.

Indicatori statistici ai variaţiei (împrãştierii)

Caracteristicile statistice care definesc o colectivitate prezintã grade şi forme de variaţie diferite, în funcţie de
natura, direcţia şi intensitatea acţiunii factorilor esenţiali şi întâmplãtori la nivelul unitãţilor simple sau
complexe ale colectivitãţii.
Influenţa acestor factori este sintetic reflectatã de indicatorii tendinţei centrale. Astfel, media unei
caracteristici ar putea fi semnificativã în cazul în care acţiunea factroilor esenţiali ar putea fi predominantã.
Media este o valoare reprezentativã numai în mãsura în care ea este calculatã din date omogene. Aceasta
înseamnã cã determinarea nivelului mediu trebuie sã fie însoţitã de verificarea omogenitãţii valorilor
individuale prin calculul indicatorilor de variaţie, de concentrare, de asimetrie şi de exces.
Determinarea acestor indicatori oferã, deci, posibilitatea rezolvãrii unor probleme de cunoaştere statisticã
deosebit de utile, cum ar fi:
- verificarea reprezentativitãţii mediei ca valoare tipicã a unei serii statistice pentru care a
fost calculatã;
- analiza gradului de omogenitate a valorilor individuale ale seriei;
- compararea în timp şi în spaţiu a mai multor serii de repartiţie dupã caracteristici
independente sau interdependente;
- selectarea factorilor semnificativi de influenţã dupã care se structureazã unitãţile unei
colectivitãţi;
- separarea modului de acţiune a factorilor esenţiali de acţiunea factorilor întâmplãtori şi,
în mod implicit, identificarea felului în care acţioneazã factorii esenţiali de la o grupã la
alta.;
- caracterizarea statisticã a formei de variaţie a unei caracteristici.
Aceşti indicatori sunt clasificaţi dupã mai multe criterii, astfel:
1) dupã numãrul variantelor cuprinse în metodologia lor de generalitate, deosebim:
- indicatori simpli
- indicatori sintetici
2) dupã metodologia de calcul şi forma de exprimare, deosebim:
- indicatori ai variaţiei, calculaţi ca mãrimi absolute (exprimaţi în unitatea de mãsurã a
caracteristicii studiate)
- indicatori ai variaţiei, calculaţi ca mãrimi relative

3) dupã modul de sistematizare a datelor complexe, deosebim:


- indicatori ai variaţiei, calculaţi pentru serii de distribuţie unidimensionale
- indicatori ai variaţiei, calculaţi pentru serii de distribuţie multidimensionale

2_INDICATORII TENDINTEI CENTRALE_11.doc 16


Indicatorii variaţiei calculaţi pentru distribuţii multidimensionale

Pentru mãsurarea variabilitãţii valorilor individuale dintr-o distribuţie multidimensionalã, se calculeazã


indicatori ai variaţiei simpli şi sintetici exprimaţi în mãrimi absolute şi relative.
Din categoria indicatorilor simpli ai variaţiei deosebim:
- amplitudinea variaţiei
- abaterile individuale

1) Amplitudinea variaţiei, ca expresie cantitativã a domeniului de variaţie a unui fenomen, se


calculeazã ca mãrime absolutã sau relativã şi se noteazã cu A.

Amplitudinea absolutã a variaţiei (A) se determinã pentru o serie de variante, ca diferenţã între varianta
maximã şi varianta minimã, ale aceleiaşi caracteristici:
A = xmax - xmin
În cazul unei distribuţii de frecvenţe pe intervale, amplitudinea absolutã a variaţiei se aproximeazã
prin diferenţa dintre limita superioarã a ultimului interval şi limita inferioarã a primului interval. Se observã
cã amplitudinea variaţiei se exprimã în unitatea de mãsurã a caracteristicii analizate. Amplitudinea poate fi
consideratã o mãsurã a variaţiei numai dacã seriile pentru care se calculeazã se referã la aceeaşi caracteristicã
înregistratã şi aceeaşi unitate de timp, dar în unitãţi de spaţiu diferite, sau în aceeaşi unitate de spaţiu, dar
pentru perioade de timp diferite.

Amplitudinea relativã a variaţiei (A%) se exprimã sub formã de coeficient sau în procente şi se calculeazã ca
raport între amplitudinea absolutã a variaţiei şi nivelul unui indicator al tendinţei centrale. Ca regulã
generalã, se ia ca bazã de comparare pentru calculul amplitudinii relative nivelul mediu al caracteristicii.

A
A% = ⋅ 100
x
Amplitudinea variaţiei se utilizeazã în prelucrarea statisticã la alegerea numãrului de grupe şi la
stabilirea mãrimii intervalului de grupare.

2) Abaterile individuale ca indicatori ai variaţiei exprimã cu câte unitãţi de mãsurã sau de câte ori
(sau cu cât la sutã) valoarea individualã a caracteristicii este mai mare sau mai micã decât mãrimile unui
indicator al tendinţei centrale sau decât mãrimea unui indicator de poziţie. Deci abaterile individuale sunt
exprimate în mãrimi absolute sau relative şi se calculeazã în funcţie de fiecare valoare individualã şi nivel
mediu.
Abaterile individuale absolute (di) se calculeazã ca diferenţã între fiecare variantã înregistratã şi nivelul
mediu al acestora.

d i = xi − x
pentru i = 1, ..., m.
Abaterile individuale relative (di%) se calculeazã ca raport între abaterile individuale absolute şi nivelul
mediu al caracteristicii şi se exprimã sub formã de coeficienţi sau în procente.

pentru orice i = 1, ..., m


di x −x
di % = ⋅ 100 = i ⋅ 100
x x
În analiza variaţiei într-o distribuţie unidimensionalã, intereseazã în mod deosebit abaterile maxime pozitive
şi negative. În acest sens se calculeazã:
- abateri maxime absolute pozitive (dmax+) şi negative (dmax-)

d max + = x max − x
d max − = x min − x

2_INDICATORII TENDINTEI CENTRALE_11.doc 17


- abateri maxime relative pozitive (dmax+%) şi negative (dmax-%)

d
d max + % = max + ⋅100
x

d
d max − % = max − ⋅100
x

În cazul în care distribuţia este simetricã, (dmax+) = (dmax-), iar în inetriorul seriei la abaterile egale luate în
modul le corespund frecvenţe egale de apariţie, se asigurã o compensare a abaterilor nu numai pe total, ci şi
la nivelul centralizat al unitãţii.
Indicatorii simpli ai variaţiei, calculaţi pe baza relaţiilor dintre doi termeni ai seriei sau dintre fiecare termen
şi media lor, permit numai o caracterizare aproximativã a variaţiei unitãţilor colectivitãţii. Din aceastã cauzã
este necesarã completarea informaţiilor oferite de aceşti indicatori cu indicatorii sintetici ai variaţiei.

Indicatorii sintetici ai variaţiei


Indicatorii sintetici ai variaţiei cuprind într-o singurã expresie numericã întreaga variaţie a unei
caracteristici urmãritã în colectivitatea analizatã.
1) Abaterea medie (d) absolutã se calculeazã ca o medie aritmeticã simplã sau ponderatã a abaterilor
“absolute” ale termenilor seriei de la media lor.
Relaţiile de calcul ale abaterii medii absolute sunt:
- pentru o serie simplã de distribuţie

Σ xi − x
dx =
n
- pentru o serie de distribuţie de frecvenţe
Σ x i − x ni
dx =
Σn i

- pentru o serie de frecvenţe relative

Σ xi − x f i
d=
100

Din relaţiile de calcul rezultã cã:


- abaterea medie absolutã se exprimã în unitatea de mãsurã a caracteristicii
- în cazul seriilor de distribuţie de frecvenţe pe intervale, în locul variantelor (xi) se vor
lua în considerare centrele intervalelor
- în calculul abaterii medii se utilizeazã media deoarece în mod curent tendinţa centralã
se exprimã prin media aritmeticã
- deoarece într-o serie de distribuţie suma algebricã a abaterilor pozitive este egalã cu
suma abaterilor negative absolute, pentru calcul ne putem mãrgini numai la valorile
individuale ale caracteristicii superioare mediei, sumele de la numitor înmulţindu-se cu
2
- pentru aceeaşi serie statisticã abaterea medie calculatã în raport cu media aritmeticã (dx)
este mai mare, de regulã, decât abaterea medie calculatã în raport cu mediana (dMe)
- abaterea medie se calculeazã nu numai pentru seriile de distribuţie, ci şi pentru seriile
dinamice sau teritoriale

2_INDICATORII TENDINTEI CENTRALE_11.doc 18


2) Dispersia este un indicator sintetic al variaţiei şi se calculeazã ca o medie aritmeticã simplã sau
ponderatã a pãtratelor abaterilor valorilor individuale de la media lor aritmeticã.
pentru o serie simplã, formula de calcul este:

σ 2x =
∑ (x i − x) 2
n
pentru o serie cu frecvenţe absolute

σ 2x =
∑ (x i − x) 2 n i σ 2x =
∑ (x i − x) 2 f i
∑ ni 100
pentru o serie cu frecvenţe relative

Relaţiile de calcul permit o serie de constatãri, şi anume:


- ca mãsurã a variaţiei, cu cât mãrimea dispersiei este mai mare, cu atât este mai mare
variaţia valorilor individuale (şi deci omogenitatea va fi mai micã), şi invers, valorile
dispersiei vor fi cu atât mai mici cu cât omogenitatea colectvitãţii dupã caracteristica
urmãritã este mai mare
- dispersia, spre deosebire de ceilalţi indicatori ai variaţiei, nu are unitãţi de mãsurã cu
conţinut economic real
- abaterea medie pãtraticã se calculeazã pe baza dispersiei
- în cazul folosirii unei serii de distribuţie pe intervale, mãrimea dispersiei este
aproximativã, întrucât s-a luat în considerare centrul de interval, în baza ipotezei cã
frecvenţele urmeazã o repartiţie normalã în cadrul fiecãrui interval

Proprietãţile dispersiei:
a) Pentru un şir de valori egale între ele, dispersia este nulã (deoarece media lor aritmeticã este
egalã cu fiecare din variantele înregistrate).

Daca _ x1 = x 2 = ... = x 0 = x ⇒ σ x2 = 0

b) Dacã fiecare valoare individualã a caracteristicii se va modifica într-un sens sau altul cu aceeaşi
constantã “a”, dispersia noii serii este egalã cu dispersia iniţialã
c) Într-o serie de distribuţie, dacã fiecare valoare individualã se simplificã de “h” ori, atunci
dispersia noii serii se simplificã faţã de dispersia iniţialã de h2 ori.
d) Dacã fiecare frecvenţã de apariţie a valorilor individuale se simplificã sau se multiplicã de un
anumit numãr de ori, mãrimea dispersiei calculatã pentru seria transformatã esteegalã cu mãrimea dispersiei
iniţiale.
Prin combinarea proprietãţilor (b, c, şi d) se obţine relaţia de calcul simplificat al dispersiei într-o
serie de distribuţie.
- pentru o serie cu frecvenţe absolute:
unde: a = se ia de regulã centrul de interval cu frecvenţa cea mai mare
xi − a 2
∑( h
) ni
σ x2 = h 2 − ( x − a) 2
∑ i n
h = se ia divizorul comun al şirului.
Din punct de vedere practic, aplicarea relaţiei de calcul simplificat se recomandã atunci când seria
prezintã valori individuale mari, când calculul se efectueazã manual, şi când media aritmeticã s-a calculat
dupã relaţia de calcul simplificat.

3) Abaterea medie pãtraticã (σx) se calculeazã ca medie pãtraticã a abaterilor individuale de la


media lor aritmeticã.
2_INDICATORII TENDINTEI CENTRALE_11.doc 19
Relaţia de calcul:

σ x = σ x2
Deci se extrage rãdãcina pãtratã din dispersie.
Abaterea medie pãtraticã se exprimã în unitatea de mãsurã concertã a caracteristicii urmãrite.
Valoarea sa este cu atât mai mare cu cât este mai intensã variaţia valorilor individuale ale caracteristicii.
Pentru aceeaşi serie statisticã, abaterea medie liniarã calculatã (dx) este mai micã sau cel mult egalã cu
abaterea medie pãtraticã (σx). Se apreciazã cã, pentru o serie statisticã cu tendinţã de normalitate, abaterea
medie liniarã reprezintã 4/5 din valoarea abaterii medii pãtratice:
4
dx =σ x ⋅
5
Chiar dacã conţinutul concret al abaterii medii pãtratice nu este la fel de clar în comparaţie cu
abaterile individuale şi abaterea medie liniarã, totuşi ea este prefertaã în analizele statistice. Preferinţa se
explicã prin faptul cã ea este parametrul legii normale de repartiţie.
Majoritatea modelelor utilizate în analiza statisticã (în analiza dispersionalã, în analiza regresiei şi
corelaţiei) se fundamenteazã pe ipoteza de normalitate a repartiţiei caracteristicii distribuţiilor implicate. Din
aceastã cauzã, abaterea medie pãtraticã se utilizeazã pe scarã largã şi în alte domenii cum ar fi în conducerea
unor procese economice, în prognozã, marketing, studiul calitãţii producţiei, etc.
Deoarece abaterea medie pãtraticã este exprimatã în aceeaşi unitate de mãsurã ca şi caracteristica
concretã, aceasta se poate utiliza la compararea gradului de variaţie numai pentru serii care se referã la
aceeaşi caracteristicã.

4) Coeficientul de variaţie (omogenitate) (V) se calculeazã ca raport între abaterea medie pãtraticã
şi media aritmeticã şi se exprimã sub formã de coeficienţi sau în procente.
Sunt necesare urmãtoarele observaţii:
- coeficientul de variaţie este expresia relativã a abaterii (σ x)
- coeficientul de variaţie (V) reprezintã o mãsurã sinteticã a omogenitãţii distribuţilor
statistice dupã o anumitã caracteristicã şi ia valori în intervalul (0; 100).
σx
Vx = ⋅ 100
x
Se observã cã valorile mici ale coeficientului de variaţie semnificã faptul cã media aritmeticã calculatã are un
grad ridicat de reprezentativitate, iar colectivitatea este omogenã. Colectivitatea este eterogenã şi media este
mai puţin reprezentativã atunci când valoarea lui V este apropiatã de limita maximã (100) sau (1) a mulţimii
sale de valori.
Calculul indicatorilor statistici ai variaţiei oferã informaţii utile referitoare la amploarea variaţiei valorilor
individuale în jurul unei valori centrale semnificative, atunci când unitãţile colectivitãţii sunt urmãrite dupã o
singurã variabilã, indiferent de natura ei.
Aceste informaţii trebuie completate cu altele referitoare la concentrarea (diversificarea) unitãţilor, la
asimetria distribuţiei. În cazul în care unitãţile colectivitãţii sunt însã structurate pe grupe, în funcţie de douã
sau mai multe variabile, calculul indicatorilor variaţiei trebuie adaptat în mod corespunzãtor.

2_INDICATORII TENDINTEI CENTRALE_11.doc 20


Media şi dispersia caracteristicilor alternative (Da/Nu)

Distribuţia frecvenţelor absolute şi relative pe variantele caracteristicii alternative notate cu 1-dacă există sau
se manifestă caracteristica la unitatea statistică supusă cercetării statistice, sau 0- dacă nu există caracteristica
avută în vedere, se prezintă astfel:

Variantele caracteristicii Frecvevţele absolute Frecvenţele relative


x1=1 M M
p=
N
x2=0 M=N M
q =1−
N
Total ∑ ni = N ∑ ni = p + q = 1
a) Media caracteristicii alternative este:
x=
∑ x i n i = M ⋅ 1 + (M − N ) ⋅ 0 = M = p
∑ ni N N

b) Dispersia caracteristicii alternative este:


∑ (x i − x )2 n i (1 − p )2 p + (0 − p )2 q
σ 2p = =
∑ ni p+q

Dacă se ştie că p+q=1 deci 1-p=q atunci:


q 2 p + p 2 q pq (p + q )
σ 2p = = = pq = p(1 − p)
p+q p+q

c)Abaterea medie pătratică a caracteristicii alternative este:


σ p = σ 2p = pq = p(1 − p)

În încercările statistice practice realizate în domeniul social-economic, dacă nu se cunosc


valorile lui p şi q se consideră p=q ceea ce înseamnă că dispersia caracteristicii alternative va fi maximă,
σ02=0,25.

2_INDICATORII TENDINTEI CENTRALE_11.doc 21


APLICATII

1. Repartiţia muncitorilor dupã vechime

Grupe de Centrul Nr. muncitori fi xi - x (xi – x)fi (xi – x)2fi [(xi – a)/h]fi
muncitori intervalului xi
dupã
vechime
0–5 2,5 10 -15,7 -157 2464,9 90
5 – 10 7,5 40 -10,7 -428 4579,6 160
10 – 15 12,5 60 -5,7 -342 1949,4 60
15 – 20 17,5 80 -0,7 -56 39,2 0
20 – 25 22,5 50 4,3 215 924,5 50
25 – 30 27,5 30 9,3 279 2594,7 120
30 – 35 32,5 20 14,3 286 4089,8 180
35 – 40 37,5 10 19,3 193 3724,9 160
Σfi; i = 1, ..., k - Σ(xi – x)fi Σ(xi – x)2fi Σ[(xi – a)/h]2fi
300 -10 20367,0 820

x=
∑ x i fi =
5450
= 18,2 _ ani; a = 17,5; h = 5
∑ fi 300

Calculul indicatorilor variaţiei


Amplitudinea:
A = xmax – xmin = 40 – 0 = 40 ani
A 40
A% = ⋅ 100 = ⋅ 100 = 219,8%
x 18,2
Abaterea fiecãrei variaţii:
- absolutã di = xi – x = 2,5 – 18,2 = -15,7
- relativã d% = (di/x)100 = (-15,7/18,2)100

Indicatori sintetici
1) Abaterea medie liniarã dx

dx =
∑ xi − x fi =
1956
= 6,5 _ ani
∑ fi 300

2) Dispersia (σx2)

σ 2x =
∑ (x i − x) 2 f i =
20367
= 67,89
∑ fi 300

xi − a 2
∑( h
) fi
820 2
σ 2x = ⋅ h 2 − (x − a) 2 = ⋅ 5 − (18,2 − 17,5) 2 = 67,84
∑ fi 300

2_INDICATORII TENDINTEI CENTRALE_11.doc 22


3) Abaterea medie pãtraticã

σ x = σ x2 = 67,86 = 8,2 _ ani


4) Coeficientul de variaţie

σx 8,2
V= ⋅ 100 = ⋅ 100 = 45%
x 18,2

d 6,5
V' = x ⋅ 100 = ⋅ 100 = 35,7%
x 18,2

mai mari decât 35%.


seria neomogenã, media nereprezentativã

2_INDICATORII TENDINTEI CENTRALE_11.doc 23


Indicatorii variaţiei din cadrul colectivităţilor împărţite în grupe

2. S-a efectuat o analiză statistică pe un număr de 95 studenţi. În urma distribuţiei pe grupe şi subgrupe
în funcţie de vârstă şi sex s-a obţinut următoarea situaţie:

18-20 20-22 22-24 24-26 26-28 28-30 Total


Vârstă

Sex

Masculin 1 8 24 10 5 2 50

Feminin 2 9 21 8 4 1 45

Total 3 17 45 18 9 3 95

Pentru a studia mai uşor variaţiile caracteristicilor ce definesc fenomenele supuse studiului
statistic s-au realizat grupări prealabile ale unităţilor colectivităţii. Astfel s-au calculat medii pe fiecare
grupare a colectivităţii statistice precum şi o medie pentru întreaga colectivitate.
Pentru a se determina separat, atât la nivelul grupei cât şi la nivelul colectivităţii generale
influenţa caracteristicii de grupare xi cât şi a variabilelor caracteristicii yi este necesar a se calcula:

1. Dispersia totală generală: σ02;

∑ yi ⋅ n j 2229
y0 = = = 23,46
∑nj 95

∑ (y j − y 0 )2 ⋅ n j
m

j=1 419
σ 02 = = =
m 95
∑nj
j=1
Interval n ij yi n ij ⋅ y i (y j − y 0 ) ( y i − y 0 )2 ( y i − y 0 ) 2 * n ij

18-20 3 19 57 -4,46 19,92 59,76


20-22 17 21 357 -2,46 6,07 103,14
22-24 45 23 1035 -0,46 0,21 9,65
24-26 18 25 450 1,54 2,36 42,51
26-28 9 27 243 3,54 12,51 112,58
28-30 3 29 87 4,417 5,54 30,66 91,97

Total 95 144 2229 419,62

j0 = 23,46
Dispersia totală= 4,417

2_INDICATORII TENDINTEI CENTRALE_11.doc 24


2. a. Dispersia de grupă: σI2=4,3908

Grupa I masculin
Grupe de studenţi Nr.de studenţi Centrul Nij*ji yj-yo (yj-y0)2 (yj-y0)2*nij
după Nij interva-lului
vârstă yi
18-20 1 19 19 -4,64 21,53 21,53
20-22 8 21 168 -2,64 6,97 55,76
22-24 24 23 552 -0,64 0,41 9,83
24-26 10 25 250 1,36 1,85 18,50
26-28 5 27 135 3,36 11,29 56,45
28-30 2 29 58 5,36 28,73 57,46
Total 50 1182 219,52

yI= 23,64 yi-y0 = 0,18


Dispersia totală = 4,3904

2. a. σII2=4,3733
Grupa a II-a feminin
Grupe de studenţi Nr.de Centrul Nij*ji yj-yo (yj-y0)2 (yj-y0)2*nij
după studenţi interva-lului
vârstă Nij yi

18-20 2 19 38 -4,267 18,204 36,409

20-22 9 21 189 -2,267 5,138 46,240

22-24 21 23 483 -0,267 0,071 1,493

24-26 8 25 200 1,733 3,004 24,036

26-28 4 27 108 3,733 13,938 55,751

28-30 1 29 29 5,733 32,871 32,871

Total 45 1047 196,80

y0= 23,26 yi-y0 = -0,193


Dispersia totală = 4,373

3. Media totală:
k
∑ yi n i
23,64 ⋅ 50 + 23,26 ⋅ 45 2229
y 0 = i =1 = = = 23,46
k 95 95
∑ ni
i =1
4. Media dispersiilor de grupă:
σ2 ⋅ n
σi = ∑ i i =
4,39 ⋅ 50 + 4,37 ⋅ 45
= 4,38
∑ i
n 95
5. Dispersia dintre grupe:

σ 2y / x = ∑ (yi − y 0 )2 ⋅ n i =
(23,64 − 23,46)2 ⋅ 50 + (23,26 − 23,46)2 ⋅ 45 = 3,31 = 0,034
∑ ni 95 95
6. Regula de adunare a dispersiilor:
2_INDICATORII TENDINTEI CENTRALE_11.doc 25
σ02 = σi2 + σ 2y / x = 4,38 + 0,034 = 4,415

7. Coeficientul de determinaţie:

σ 2y / x 0,034
R2 = 100 = 100 = 0,78%
σ02 4,415

8. Coeficientul de nedeterminaţie:

σ2 4,38
1 − R 2 = i2 100 = 100 = 99,22% ⇒ 0,78%+99,22%=100%
σ0 4,415
Se poate concluziona că R2>1-R2 şi, deci, “sexul” nu reprezintă un factor determinant pentru
vârstă, aceasta fiind influenţată de alţi factori.

2_INDICATORII TENDINTEI CENTRALE_11.doc 26

S-ar putea să vă placă și