Documente Academic
Documente Profesional
Documente Cultură
UNIVARIABILE
Pentru descrirea unui set de date statistice, numerice, se folosesc trei proprietăţi majore:
- tendinţa centrală;
- variabilitatea;
- forma distribuţiilor.
În orice analiză şi interpretare statistică poate fi folosită o varietate de indicatori pentru a caracteriza aceste
trăsaturi esenţiale ale setului de date. Dacă indicatorii statistici sunt calculaţi pentru o colectivitate totală, ei
se numesc parametri
O serie (distribuţie) statistică univariabilă sau univariantă, prezintă corespondenţa dintre două şiruri de date
statisitice, sistematizate într-o succesiune logică :
- primul şir reprezintă valori ale caracteristicii de grupare, iar
- al doilea şir reprezintă frecvenţa de apariţie corespunzătoare.
Pentru o colectivitate C cu N elemente ordonate după variabila statistică X, cu valorile xi, i = 1, M , unde:
x 1 < x 2 < L < x M , la fiecare valoare xi , corespunde un efectiv ni . Ansamblul valorilor xi cu numărul
elementelor nj , asociate fiecărei variabile xi , respectivfiecărei clase Ji , (x i −1 , x i ) formează o serie statistică
univariabilă.
O serie statistică, definită de ansamblul valorilor (x i , n i ) se notează :
x1 x 2 K x j K x M x
X: , sau X : j , j = 1, M
n1 n 2 K n j K n M n j
nj M
Dacă se utilizează frecvenţele relative, f j =
M
; ∑ f j = 1 serie statistică se poate scrie sub forma:
j−1
∑n j
j=1
x1 x 2 K x j K x M
X:
f1 f 2 K f j K f M
x1 x 2 K x n
Definiţia . Fie X o variabilă aleatoare discretă, avînd tabelul de distribuţie : X : , atunci funcţia de
p1 p 2 K p n
repartiţie corespunzătoare va fi dată de relaţia :
0 , x≤x 1
p , x 1 <x≤x 2
1
p1 + p 2 , x 2 <x≤x 3
F(x ) = ........................
k −1
p ,
∑ i x k −1 < x ≤ x k
i =1
........................
1 , x >x n
Observaţie:
Valorile funcţiei de repartiţie a variabilei aleatoare discrete X se obţin în următorul mod :
Dacă x < x1 ,atunci : F(x ) = P(X < x ) = P(X < x <1 ) = 0
Dacă x1< x ≤ x2 , are loc : P(X < x ) = P[(X ≤ x 1 ) ∪ (x 1 < X < x 2 )] = P(X = x 1 ) = p1
Dacă x1< x ≤ x2 , are loc :
P(X < x ) = P[(X ≤ x 1 ) ∪ (x 1 < X ≤ x 2 ) ∪ (x 2 < X < x 3 )] =
= P(X ≤ x 1 ) + P(x 1 < X ≤ x 2 ) + P(x 2 < X < x 3 ) = P(X = x 1 ) + P(X = x 2 ) = p1 + p 2
k −1
Dacă xk-1< x ≤ xk , are loc : P(X < x ) = P{(X ≤ x ) ∪ (x 1 < X ≤ x 2 ) ∪ K ∪ (x k −1 < X < x k )} = ∑p
i =1
i .
n
Pentru x > xn , P (X < x ) = ∑p i = 1.
i =1
Exemplul
1 2 3
Fie variabila aleatoare discretă X :
0.2 0.3 0.5
x≤1 F(x)=P(X<x)=P(Φ)=0
1< x ≤2 F(x)=P(X<x)=P(X=1)=0.2
2< x ≤3 F(x)=P(X<x)=P({X=1}U{X=2})=P(X=1)+P(X=2)=
=0.2+0.3=0.5
x>3 F(x)=P(X<x)=P(Ω)=1.
0 , x ≤ 1,
0.2 , 1 < x ≤ 2,
F ( x) =
0.5 , 2 < x ≤ 3,
1 , x > 3.
(0,1)
(0,1/2)
(0,1/5)
0 1 2 3
Valori medii
Definiţie :
n
Dacă variabila aleatoare simplă X ia valorile x1,x2,….,xn cu probabilităţile p1,p2,…,pn, ∑ pi = 1 , atunci numărul:
i =1
M(X) = p1x1+p2x2+ ⋅⋅⋅ +pnxn se numeşte valoarea medie (sau speranţa matematică) a variabilei aleatoare X.
Definiţie
Dacă X este o variabilă aleatoare de tip continuu avînd densitatea de repartiţie f, atunci numărul :
∞
M(X) =
−∞
∫ x ⋅ f (x)dx se numeşte valoarea medie a variabilei aleatoare X, dacă integrala este convergentă.
Observaţie:
Dacă variabila aleatoare X ia valori în intervalul ( a , b ) , -∞ < a < b < ∞, atunci f(x)=0 pentru x ∉ ( a , b ), deci:
b
∫
M(X) = x ⋅ f ( x )dx .
a
Proprietăţi
Dacă X şi Y sunt variabile aleatoare simple, numărabile sau de tip continuu, şi există M(X) şi M(Y), atunci:
M1. Există M(X+Y) şi M(X+Y) = M(X) + M(Y)
M2. Există M(c X) şi M(c X) = c M(X) , c constantă.
Are loc şi următoarea proprietate:
M.1.2.Fie X1, X2, … ,Xn variabile aleatoare şi c1,c2, … ,cn constante.
n
Dacă există M(Xi), i = 1,2, … ,n atunci există şi M
∑c
i =1
i ⋅ X i şi are loc relaţia :
n n
M
∑c
i =1
i ⋅ Xi =
∑
i =1
c i ⋅ M(X i ) .
[ ]
∞ ∞ 1
( ) ∫x
M X2 = 2
⋅ f (x )dx =
2x 2
∫ π ⋅ (1 + x ) 2
⋅ dx =
2
∫
⋅ 1 −
1
π 1+ x2
2
π
+1 4
⋅ dx = ⋅ (x − arctgx ) −1 = − 1.
π
−∞ −∞ −1
Dispersia
Definiţie
Se numeşte dispersia sau varianţa variabilei aleatoare X, care are valoarea medie m, numărul :
µ2 (X) = D2 (X) = M [ (X-m)2 ] = σ2 , (dacă variabila aleatoare X are medie!).
Dacă X este o variabilă aleatoare de tip continuu, care are media m, cu densitatea de repartiţie f, atunci dispersia se scrie
sub forma :
∞
σ 2 = D 2 (X) =
−∞
∫ (X − m) ⋅ f (x)dx .
Proprietăţi:
D0. D2(X) = M(X2) - [ M(X) ]2
D1. D2(X) ≥ 0 , pentru orice variabilă aleatoare X.
D2. Egalitatea D2(X) = 0 are loc dacă şi numai dacă X este o variabilă aleatoare constantă cu probabilitatea egală
cu 1, sau
D2(X) = 0 ⇔ X ≡ m ( sau mai exact : P (X = m) = 1 ).
D3. D2( c⋅X ) = c2⋅ D2(X) , unde c este o constantă.
D4. Dacă variabilele aleatoare X1,X2, … ,Xn sunt independente două cîte două, atunci :
D2(X1+X2+ ⋅⋅⋅ +Xn) = D2(X1)+ D2(X2)+ ⋅⋅⋅ + D2(Xn).
D.3.4. Dacă variabilele aleatoare X1,X2, … ,Xn sunt n variabile aleatoare independente două cîte două, şi c1,c2, … ,cn
sunt n constante atunci are loc relaţia :
∑ [c ]
n n
D2
i =1
∑
ci ⋅ Xi =
i =1
2
i ⋅ D 2 (X i )
Demonstraţie:
Se aplică proprietatea D.0. şi se obţine :
2
n n n
2
D 2
∑
∑
c i ⋅ X i = M c i ⋅ X i − M
i =1
i =1
ci ⋅ Xi =
∑
i =1
2
n n n
= M
i =1
2
∑ 2
ci ⋅X i + 2 ⋅ ∑
ci ⋅ c j ⋅ X i ⋅ X j − M
i =1
ci ⋅ X i =
∑
i , j =1
i≠ j
i =1
2
iD (X )
Definiţie
Numărul D(X ) = D 2 (X ) se numeşte abaterea mediei pătratice şi măsoară gradul de “împrăştiere” a variabilei aleatoare în
jurul valorii sale medii.
Propoziţie :
Dacă variabila aleatoare X are valoarea medie m şi dispersia σ2, atunci pentru orice ε,
σ2
(
ε > 0 are loc: P X − m ≥ ε ≤ )
ε2
−∞ −∞ m−ε m+ε
m −ε ∞
∫ (x − m) f (x)dx + ∫ (x − m) f (x)dx.
2 2
≥
−∞ m+ε
σ2
P( X − m ≥ a ) ≤ ,∀a ∈ R ,a > 0
a2
σ2
P( X − m ≤ a ) > 1 − , ∀a ∈ R ,a > 0
a2
Inegalitatea lui Cebîşev precizează marginea superioară pentru probabilitatea ca variabila aleatoare X, care are valoarea medie m
şi abaterea medie pătratică σ2 , să ia valori în intervalul ( m-a , m+a ).
Definiţie
N
Se numeşte moment de ordinul r al variabilei aleatoare finită X, numărul m r = M r (X ) = ∑ p i ⋅ x ir
, unde variabila
i =1
aleatoare X ia valorile xi respectiv cu probabilităţile pi, cu condiţia ca seria din membrul drept să fie absolut convergentă.
Dacă variabila aleatoare X este continuă şi are densitatea de repartiţie f, atunci se numeşte moment de ordinul , numărul:
∞
M r (X ) = ∫x
r
⋅ f ( x )dx , dacă integrala din membrul drept este convergentă.
−∞
Definiţie.
Se numeşte moment centrat de ordinul r al variabilei aleatoare X, care are media m = M(X), numărul µr = Mr (X - m).
Definiţie
Se numeşte moment absolut de ordinul r al variabilei aleatoare discrete X,numărul :
mar = Mr ( | X | ),
iar numărul:
mr = Mr (X − m )
se numeşte moment centrat absolut de ordinul r al variabilei aleatoare X.
Comentarii :
1.Media (speranţa matematică) a unei variabile aleatoare X este momentul de ordinul întîi al variabilei aleatoare, iar dispersia -
momentul centrat de ordinul doi.
2.Valoarea medie este una dintre cele mai importante caracteristici numerice ataşate variabilei aleatoare, care va permite în
anumite situaţii, să tragem unele concluzii asupra variabilei aleatoare, fără a apela la legile lor de probabilitate.
3.Valoarea medie este un fel de valoare centrată a variabilei aleatoare, valoare în jurul căreia se situează celelalte valori posibile,
astfel ca media abaterilor de la această valoare să fie nulă.
Proprietăţi
[ ( )] ⋅ [M(Y )]
1 1
M( X ⋅ Y ) ≤ M X
1 1 r s s
+ = 1. Atunci : r
r s
Demonstraţie:
[ ( )] [ ( )]
r s 1 1
a b r −r s −s
Se foloseşte inegalitatea: ab ≤ + în care se alege : a = X ⋅ M X şi b = Y ⋅ M Y
r s
r s
XY X Y
Se obţine :
[M(X )] ⋅ [M(Y )]
1
r r
1
s s
≤
r⋅M X ( ) + s ⋅ M(Y )
r s
P.3. Dacă k > h > 0 şi dacă X este o variabilă aleatoare pentru care există M(|X|k ) şi M(|X|h) , atunci are loc :
[M(X )] ≤ [M(X )]
1 1
h h k k
Demonstraţie:
k k
substituie |X| cu X şi r cu > 1.
h
2_INDICATORII TENDINTEI CENTRALE_11.doc 6
( ) ≤ [M(X )] , de unde se deduce P.3.
h
h k k
Rezultă relaţia : M X
∞
= λm ⋅ F( x ) = λ ⋅ m ⋅ [1 − F(λ ⋅ m )] = λ ⋅ m ⋅ P(X ≥ λm ) , de unde rezultă inegalitatea P.4.
λ ⋅ m
Exemple :
0, x ∉ (− 1,1]
1.Variabila aleatoare X are densitatea de repartiţie f ( x ) = 1 ,
2 , x ∈ [− 1,1)
Să se calculeze valoarea medie şi dispersia variabilei aleatoare Z=2X2+1.
Soluţie:
∞
M(g(X )) = ∫ g(x ) f (x ) dx, g ( x ) = 2x 2 + 1, x ∈ R.
−∞
∞ 1
M(Z) = ∫ g(x ) f (x ) dx = ∫ (2x ) 12 ⋅ dx = 53.
2
+1 ⋅
−∞ −1
Dispersia se calculează astfel :
5
2 5
2 2
2
D 2 (Y ) = M Z − = M 2 x 2 + 1 − = M 2x 2 −
3 3 3
2
2
Pentru calculul dispersiei vom considera funcţia g (x ) = 2 x − şi se va obţine :
3
1 2
2 1 16
D 2 (Z ) = 2 x 2 − ⋅ ⋅ dx = .
∫
3 2 45
−1
2.Dacă evenimentele A1,A2, …,An sunt independente cu propritetăţile de realizare cunoscute, pi = P( Ai ) , i = 1,2,…,n , să se
determine valoarea medie şi dispersia variabilei aleatoare definite de sistemul de mai sus.
Soluţie:
Fie X numărul de evenimente care se realizează.
n
P( X = k ), coeficientul lui xk din polinomul: (1) Q(x ) = ∏ (p
i =1
i ⋅ x − q i ), unde : q i = 1 − p i . Dacă :
0 1 2 K n
(2) Q(x ) = P0 + P1 ⋅ x + P2 ⋅ x + L + Pn ⋅ x , atunci distribuţia li X este : X
2 n
care are valoare medie :
P0 P1 P2 K Pn
( )
n
M(X ) = ∑i ⋅ P
i =1
i şi dispersia D 2 (X ) = M X 2 − [M (X )] .
2
( ) ∑k
n
M X2 = 2
⋅ Pk
k =1
Se va deriva polinomul x ⋅ Q′(x ).
Derivînd relaţia (3) (se calculează a doua derivată a polinomului (1)) , pentru x=1 rezultă :
n
Q ′′(x ) = p1 ⋅ ∑ i ≠1
pi + p2 ⋅ ∑
i≠2
pi + L + p n ⋅ ∑
i≠n
pi = ∑p
k =1
k ⋅ [M(X ) − p k ] =
n n n
= M(x )
∑ pk −
k =1
∑
k =1
p 2k = [M(X )]2 − ∑p
k =1
2
k , de unde rezultă
( )
n
M X 2 = M(X ) + [M (X )]2 − ∑p
k =1
2
k .
( )
n n n
D 2 (X ) = M X 2 − [M(X )]2 = [M(X )]2 + M(X ) − ∑ k =1
p 2k − [M (X )]2 = ∑
k =1
pk − ∑p
k =1
2
k =
( ) ∑p
n n
= p1 + p 2 + L + p n − p12 + p 22 + L + p 2n = k (1 − p k ) = ∑ p k q k = p1q 1 + p 2 q 2 + L + p n q n .
k =1 k =1
MEDII
Deoarece statistica operează cu un număr mare de variante, este necesar să se găsească o singură expresie
numerică pentru a sintetiza toate aceste valori individuale.
Mărimile medii constituie instrumente principale de cunoaştere a fenomenelor de masă şi au un grad mare
de aplicabilitate în activitatea practică. Ele redau ceea ce este tipic, comun şi general în variaţia sau în
evoluţia fenomenelor.
Pentru a asigura un conţinut cât mai real mediilor calculate, se impune ca valorile individuale din care se
obţin să fie cât mai apropiate între ele. Totodată, trebuie să se ţină seama de gradul de omogenitate al
colectivităţii supuse cercetării. În cazul eterogenităţii se vor calcula medii parţiale, iar media pe ansamblu va
apărea ca o sinteză a acestora.
Pentru aplicarea corectă a metodei mediilor este necesar să se respecte următoarele condiţii:
calculul mediilor să se bazeze pe folosirea unui număr mare de cazuri individuale sub care s-a înregistrat
caracteristica, a căror variaţie este întâmplătoare în raport cu fenomenul în totalitatea lui
- valorile din care se va calcula media să fie omogene ;
- alegerea acelei forme de medie care corespunde cel mai bine formei de
variaţie a caracteristicii cercetate şi informaţiilor de care se dispune.
Prin definiţie, media valorilor individuale ale unei variabile este expresia sintetizării într-un singur nivel
reprezentativ, a tot ceea ce este esenţial, tipic şi obiectiv în evoluţia acesteia.
În condiţiile în care media este o valoare reprezentativă pentru toate nivelele pe care le sintetizează,
înseamnă că le poate substitui. Substituirea poate fi privită sub două aspecte:
- cantitativ, care constă în faptul că nivelul total al caracteristicii calculat prin
totalizarea nivelurilor individuale nu trebuie să se schimbe atunci când aceste niveluri
sunt substituite cu media lor;
- calitativ, legat de semnificaţia şi conţinutul mediei calculate, conţinut care
este asigurat atunci când unităţile au un grad înalt de omogenitate.
Rezultă că media măsoară influenţa cauzelor esenţiale, făcând abstracţie de cauzele întâmplătoare.
În statistică, media poate fi interpretată ca nivelul la care ar fi ajuns caracteristica înregistrată, dacă în
toate cazurile factorii esenţiali şi neesenţiali ar fi acţionat constant, deci s-ar fi obţinut o valoare identică.
Diversitatea largă a fenomenelor social-economice, precum şi complexitatea variabilităţii acestor fenomene,
condiţionează alegerea tipului de medie adecvat. Mediile cele mai frecvent întâlnite sunt: aritmetică,
armonică, pătratică, geometrică şi cronologică, calculate ca medii simple sau ponderate.
Mediile simple se calculeazã atunci când se utilizeazã toate variantele înregistrate sau când, în urma
operaţiilor de sistematizare, toate valorile individuale prezintã frecvenţe egale.
În cazul în care, în urma sistematizãrii (grupãrii), valorile individuale ale caracteristicii prezintã frecvenţe
diferite, nivelul mediu se calculeazã ca medie ponderatã.
Media aritmeticã
În sens statistic, media aritmeticã a valorilor individuale x 1, x2, ..., xN ale caracteristicii “X”, urmãritã într-o
colectivitate, reprezintã acea valoare ( x ) care s-ar fi înregistrat dacã toţi factorii de influenţã ar fi acţionat în
mod constant la nivelul fiecãrei unitãţi de înregistrare.
Deci, putem spune cã, dacã fiecare valoare individualã “xi” (cu i = 1, ..., n) ar fi înlocuitã cu x , valoarea
totalizatã a caracteristicii nu se modificã.
Media aritmeticã simplã se utilizeazã atunci când, pentru aflarea nivelului mediu, se apeleazã la variantele
înregistrate într-o colectivitate, iar mãrimea colectivitãţii nu este foarte mare.
Într-o colectivitate statisticã mare, unde multe unitãţi prezintã aceeaşi valoare individualã şi seria statisticã
obţinutã în urma prelucrãrii prezintã frecvenţe diferite, media aritmeticã se calculeazã ca o medie aritmeticã
ponderatã, dupã formula:
n k
∑ x i n i = x1n1 + x 2 n 2 + ... + x i n i + ... + x k n k = xn1 + xn 2 + ... + xn i + ... + xn k = x ∑ n i
i =1 i =1
∑x n
i =1
i i
x= k
∑i =1
ni
Media aritmeticã a unei caracteristici numerice prezintã o serie de proprietãţi utile pentru calculul şi
k
ni
∑x i fi fi = k
• 100
∑n
i =1
x=
100 i =1
i
interpretarea valorii sale. Dintre aceste proprietãţi ale mediei aritmetice, cele mai utilizate în analiza statisticã
a fenomenelor sociale şi economice sunt urmãtoarele:
a) într-un şir de valori egale, media acestora este egalã cu fiecare dintre ele
b) mãrimea mediei aritmetice este întotdeauna cuprinsã şi intervalul de variaţie al caracteristicii
studiate
xmin < x < xmax
c) într-o serie statisticã suma tuturor abaterilor individuale ale termenilor seriei de la media lor
aritmeticã (luate cu semnul corespunzãtor) este zero.
- pentru o serie simplã:
n
∑ (x
i =1
i − x) = 0
∑ (x
i =1
i − x )ni = 0
sau
n
∑ (x
i =1
i − x) fi = 0
d) într-o serie statisticã, dacã toţi termenii se mãresc (micşoreazã) cu aceeaşi mãrime constantã “a”,
atunci media noilor termeni este mai mare (micã) decât media seriei iniţiale cu constanta “a”;
e) într-o serie statisticã, dacã toţi termenii se mãresc (micşoreazã) cde acelaşi numãr de ori “h”,
atunci şi media seriei iniţiale se mãreşte (micşoreazã) de acelaşi numãr de ori “h”.
Prin combinarea acestor douã proprietãţi se poate ajunge la o relaţie de calcul simplificat al mediei
aritmetice.
f) dacã într-o serie de distribuţie se reduc proporţional toate frecvenţele, atunci media calculatã pe
baza noilor frecvenţe va fi egalã cu media seriei iniţiale;
g) pentru o serie de distribuţie de frecvenţe cu toate frecvenţele egale între ele, media aritmeticã
ponderatã se transformã în medie aritmeticã simplã;
h) într-o colectivitate structuratã pe grupe, media acesteia (x) este dependentã de media grupelor (xj
cu j = 1, ..., p) şi de frecvenţele grupelor respective (nj sau fj). În acest caz media generalã nu este
o sumã a mediilor parţiale, ci o sintezã a acestora, deoarece pe întreaga colectivitate are loc un
proces de compensare a abaterilor mediilor parţiale de la media generalã.
i) Media aritmeticã a sumei (diferenţei) dintre douã variabile aleatoare independente este egalã cu
suma (diferenţa ) mediilor celor douã variabile luate în considerare
x+y=x+y
j) media produsului a douã variabile aleatoare independente x şi y este egalã cu produsul mediilor
celor douã variabile:
2_INDICATORII TENDINTEI CENTRALE_11.doc 11
xy = x • y
Media armonicã
Media armonicã se defineşte ca valoare inversã a mediei aritmetice, calculatã din inversele valorilor
individuale înregistrate.
Relaţia pentru media armonicã simplã:
pentru o serie de distribuţie de frecvenţe
n
xh = n k
1
∑
i =1 x i
∑n i =1
i
xh = k
⇒ absolute
1
∑
i =1 x i
ni
100
xh = n
⇒ relative
1
∑
i =1 x i
fi
Compararea mediei armonice cu media aritmetică permite stabilirea anumitor relaţii utile analizelor nivelelor
sintetice.
Astfel:
1) Pentru aceleaşi valori pozitive ale unei caracteristici, media lor armonică este mai mică decât cea
aritmetică.
( x h p x)
Dacă valorile individuale sunt egale între ele şi egale cu o constantă “c”, atunci
xh = x = c
2) În cazul în care între două variabile interdependente există o relaţie de inversă proporţionalitate
(y = 1/x), aceasta se păstrează şi între mediile calculate pentru fiecare variabilă. Deci, dacă
pentru una din variabile, nivelul mediu se calculează ca medie aritmetică, în mod obligatoriu
nivelul mediu al celei de a doua variabile se calculează ca medie armonică.
Asemenea cazuri în care media armonicã apare ca o formã transformatã a mediei aritmetice, se
întâlnescatunci când se calculeazã media unor indicatori derivaţi exprimaţi ca mãrimi relative parţiale sau ca
mãrimi medii parţiale. Media armonicã se foloseşte , de exemplu, la aclculul preţului mediu şi al indicelui
mediu al preţurilor, când lipsesc informaţiile despre volumul fizic al circulaţiei mãrfurilor. De asemenea, se
foloseşte media armonicã la calculul salariului mediu pe întreprindere când se cunosc salariile medii şi
fondurile de salarii de la nivelul secţiilor; tot mdia armonicã se foloseşte la calculul recoltei medii de grâu pe
ţarã, când se cunosc recoltele medii şi recoltele totale la nivelul judeţelor.
3. Media pãtraticã
Media pãtraticã reprezintã acea valoare (xp) care, dacã ar înlocui fiecare termen al seriei (xi), i = 1, ..., n,
suma pãtratelor termenilor nu s-ar modifica. Relaţia de calcul a mediei pãtratice pentru o serie simplã este:
∑x i =1
2
i ∑x 2
i ni
xp = xp = i =1
n
∑n
i =1
i
Pentru o serie de frecvenţe, dacã frecvenţele sunt absolute, atunci relaţia de calcul a mediei pãtratice va fi:
sau dacã frecvenţele sunt relative
∑x 2
i fi
xp =
100
Media pãtraticã se poate calcula pentru orice valori pozitive, nule sau negative, dar din punct de vedere
economic nu au sens decât dacã toate valorile individuale xi sunt pozitive.
Indiferent de semnul valorilor individuale xi, media pãtraticã este mai mare decât media lor aritmeticã.
Media pãtraticã este recomandatã pentru calculul nivelului mediu atunci când seria analizatã predominã
valorile ridicate sau când se doreşte sã se acorde o importanţã mai mare acelor unitãţi pentru care
caracteristica prezintã cele mai mari valori absolute.
Media pãtraticã se foloseşte, de asemenea, în cazul calculãrii mediei abaterilor valorilor individuale de la
nivelul lor mediu, mãrimea sa oferind informaţii utile pentru aprecierea omogenitãţii seriei analizate.
4. Media geometricã
Media geometricã reprezintã acea valoare (xg) a caracteristicii cu care, dacã s-ar înlocui toate valorile
individuale, produsul lor nu s-ar modifica.
Dacã xi = termenii unei serii statistice şi xg = media geometricã a acestor termeni, atunci potrivit definiţiei:
∑ ni n ni
x g = i =1 ∏ x i
i =1
i =1
2) Media geometricã a unui ansamblu format din douã sau mai multe subansambluri poate fi
x1 x 2 x n ∏
xi
n
xi x gn
∏ ( )=
i =1 x g x x
...
x
= i =1
x n
= n =1
xg
g g
2_INDICATORII TENDINTEI CENTRALE_11.doc g g
13
calculatã în funcţie de media geometricã a subansamblurilor.
3) Media geometricã a raportului dintre douã caracteristici independente este egalã cu raportul
mediilor geometrice ale celor douã caracteristici.
4) Media geometricã a unui produs de caracteristici independente este egalã cu produsul mediilor
geometrice ale caracteristicilor respective.
În concluzie, atunci când folosim mãrimile medii, o problemã deosebitã de care trebuie sã ţinem seama în
evaluarea esenţei formei de manifestare a unui fenomen o reprezintã identificarea celei mai potrivite metode
de calcul a nivelului mediu.
Relaţia de ordine între mediile prezentate este urmãtoarea:
xh ≤ x g ≤ x ≤ x p
Analiza tendinţei centrale în seriile de repartiţie sau de distribuţie presupune luarea în considerare nu numai a
valorilor individuale ale caracteristicii, ci şi a formei în care se repartizeazã frecvenţele valorilor individuale.
Caracterizarea tendinţei centrale presupune un sistem de indicatori care sã cuprindã pe lângã mãrimile medii
şi indicatori de poziţie. Aceasta înseamnã cã în analiza unor serii de repartiţie poate fi valoare tipicã nu
numai media, ci şi indicatori de poziţie, ca mediana şi modulul (dominanta).
Indicatorii de poziţie, prin locul pe care îl ocupã în cadrul variantelor caracteristicii, evidenţiazã tendinţa de
aglomerare, de concentrare a frecvenţelor în zona centralã a distribuţiilor statistice.
Mediana – Me
Mediana reprezintã acea valoare a caracteristicii situatã la mijlocul seriei sau repartiţiei statistice cu valorile
individuale aranjate în ordine crescãtoare sau descrescãtoare. Mediana împarte numãrul unitãţilor în douã
pãrţi egale; numãrul celor cu valori individuale inferioare medianei este egal cu numãrul celor care au valori
individuale superioare medianei.
Pentru o serie simplã, ordonatã, cu un numãr impar de termeni, mediana este valoarea corespunzãtoare
termenului de rang (n+1)/2; ex: avem seria 5, 6, 13, 20, 34, 40, 61. Mediana este (7+1)/2 = 8/2 = 4, valoarea
corespunzãtoare termenului al patrulea din serie fiind 20.
Pentru o serie: 5, 8, 6, 7, 4, 1, 1, se face întâi ordonarea crescãtoare sau descrescãtoare: 8, 7, 6, 5, 4, 1, 1, deci
Me = 5.
În cazul seriei ordonate cu un numãr par de termeni, mediana este valoarea situatã între termenii de rang
[n/2] şi [(n+2)/2]. În acest caz, mediana se determinã în mod convenţional ca medie aritmeticã a termenilor
de rang [n/2] şi [(n+2)/2].
Ex.: 5, 8, 13, 28, 34, 40, 61, 63
x1, x2, x3, x4, x5, x6, x7, x8
[n/2] [(n+2)/2]
n cazul unei serii de distribuţie de frecvenţe, pentru determinarea medianei se aplicã urmãtorul principiu:
valoarea medianã este acea valoare a caracteristicii corespunzãtoare primei frecvenţe cumulate ascendent
care depãşeşte
Mo = x − 3( x − Me)
Observaţii:
- în orice repartiţie simetricã unimodalã
-în orice repartiţie unimodalã uşor asimetricã mediana se plaseazã între medie şi valoarea modalã;
Mo = Me = x
distanţa medianei faţã de modul este aproximativ dublul distanţei sale de la media aritmeticã.
În contextul analizei şi determinãrii valorii modale, în practica statisticii se întâlnesc repartiţii unimodale (cu
o singurã valoare modalã sau interval modal) şi repartiţii plurimodale (multimodale) cu mai multe valori
(intervale) modale.
Prezenţa mai multor valori modale (una principalã şi altele secundare) evidenţiazã, în general, caracterul
eterogen al repartiţiei.
Caracteristicile statistice care definesc o colectivitate prezintã grade şi forme de variaţie diferite, în funcţie de
natura, direcţia şi intensitatea acţiunii factorilor esenţiali şi întâmplãtori la nivelul unitãţilor simple sau
complexe ale colectivitãţii.
Influenţa acestor factori este sintetic reflectatã de indicatorii tendinţei centrale. Astfel, media unei
caracteristici ar putea fi semnificativã în cazul în care acţiunea factroilor esenţiali ar putea fi predominantã.
Media este o valoare reprezentativã numai în mãsura în care ea este calculatã din date omogene. Aceasta
înseamnã cã determinarea nivelului mediu trebuie sã fie însoţitã de verificarea omogenitãţii valorilor
individuale prin calculul indicatorilor de variaţie, de concentrare, de asimetrie şi de exces.
Determinarea acestor indicatori oferã, deci, posibilitatea rezolvãrii unor probleme de cunoaştere statisticã
deosebit de utile, cum ar fi:
- verificarea reprezentativitãţii mediei ca valoare tipicã a unei serii statistice pentru care a
fost calculatã;
- analiza gradului de omogenitate a valorilor individuale ale seriei;
- compararea în timp şi în spaţiu a mai multor serii de repartiţie dupã caracteristici
independente sau interdependente;
- selectarea factorilor semnificativi de influenţã dupã care se structureazã unitãţile unei
colectivitãţi;
- separarea modului de acţiune a factorilor esenţiali de acţiunea factorilor întâmplãtori şi,
în mod implicit, identificarea felului în care acţioneazã factorii esenţiali de la o grupã la
alta.;
- caracterizarea statisticã a formei de variaţie a unei caracteristici.
Aceşti indicatori sunt clasificaţi dupã mai multe criterii, astfel:
1) dupã numãrul variantelor cuprinse în metodologia lor de generalitate, deosebim:
- indicatori simpli
- indicatori sintetici
2) dupã metodologia de calcul şi forma de exprimare, deosebim:
- indicatori ai variaţiei, calculaţi ca mãrimi absolute (exprimaţi în unitatea de mãsurã a
caracteristicii studiate)
- indicatori ai variaţiei, calculaţi ca mãrimi relative
Amplitudinea absolutã a variaţiei (A) se determinã pentru o serie de variante, ca diferenţã între varianta
maximã şi varianta minimã, ale aceleiaşi caracteristici:
A = xmax - xmin
În cazul unei distribuţii de frecvenţe pe intervale, amplitudinea absolutã a variaţiei se aproximeazã
prin diferenţa dintre limita superioarã a ultimului interval şi limita inferioarã a primului interval. Se observã
cã amplitudinea variaţiei se exprimã în unitatea de mãsurã a caracteristicii analizate. Amplitudinea poate fi
consideratã o mãsurã a variaţiei numai dacã seriile pentru care se calculeazã se referã la aceeaşi caracteristicã
înregistratã şi aceeaşi unitate de timp, dar în unitãţi de spaţiu diferite, sau în aceeaşi unitate de spaţiu, dar
pentru perioade de timp diferite.
Amplitudinea relativã a variaţiei (A%) se exprimã sub formã de coeficient sau în procente şi se calculeazã ca
raport între amplitudinea absolutã a variaţiei şi nivelul unui indicator al tendinţei centrale. Ca regulã
generalã, se ia ca bazã de comparare pentru calculul amplitudinii relative nivelul mediu al caracteristicii.
A
A% = ⋅ 100
x
Amplitudinea variaţiei se utilizeazã în prelucrarea statisticã la alegerea numãrului de grupe şi la
stabilirea mãrimii intervalului de grupare.
2) Abaterile individuale ca indicatori ai variaţiei exprimã cu câte unitãţi de mãsurã sau de câte ori
(sau cu cât la sutã) valoarea individualã a caracteristicii este mai mare sau mai micã decât mãrimile unui
indicator al tendinţei centrale sau decât mãrimea unui indicator de poziţie. Deci abaterile individuale sunt
exprimate în mãrimi absolute sau relative şi se calculeazã în funcţie de fiecare valoare individualã şi nivel
mediu.
Abaterile individuale absolute (di) se calculeazã ca diferenţã între fiecare variantã înregistratã şi nivelul
mediu al acestora.
d i = xi − x
pentru i = 1, ..., m.
Abaterile individuale relative (di%) se calculeazã ca raport între abaterile individuale absolute şi nivelul
mediu al caracteristicii şi se exprimã sub formã de coeficienţi sau în procente.
d max + = x max − x
d max − = x min − x
d
d max + % = max + ⋅100
x
d
d max − % = max − ⋅100
x
În cazul în care distribuţia este simetricã, (dmax+) = (dmax-), iar în inetriorul seriei la abaterile egale luate în
modul le corespund frecvenţe egale de apariţie, se asigurã o compensare a abaterilor nu numai pe total, ci şi
la nivelul centralizat al unitãţii.
Indicatorii simpli ai variaţiei, calculaţi pe baza relaţiilor dintre doi termeni ai seriei sau dintre fiecare termen
şi media lor, permit numai o caracterizare aproximativã a variaţiei unitãţilor colectivitãţii. Din aceastã cauzã
este necesarã completarea informaţiilor oferite de aceşti indicatori cu indicatorii sintetici ai variaţiei.
Σ xi − x
dx =
n
- pentru o serie de distribuţie de frecvenţe
Σ x i − x ni
dx =
Σn i
Σ xi − x f i
d=
100
σ 2x =
∑ (x i − x) 2
n
pentru o serie cu frecvenţe absolute
σ 2x =
∑ (x i − x) 2 n i σ 2x =
∑ (x i − x) 2 f i
∑ ni 100
pentru o serie cu frecvenţe relative
Proprietãţile dispersiei:
a) Pentru un şir de valori egale între ele, dispersia este nulã (deoarece media lor aritmeticã este
egalã cu fiecare din variantele înregistrate).
Daca _ x1 = x 2 = ... = x 0 = x ⇒ σ x2 = 0
b) Dacã fiecare valoare individualã a caracteristicii se va modifica într-un sens sau altul cu aceeaşi
constantã “a”, dispersia noii serii este egalã cu dispersia iniţialã
c) Într-o serie de distribuţie, dacã fiecare valoare individualã se simplificã de “h” ori, atunci
dispersia noii serii se simplificã faţã de dispersia iniţialã de h2 ori.
d) Dacã fiecare frecvenţã de apariţie a valorilor individuale se simplificã sau se multiplicã de un
anumit numãr de ori, mãrimea dispersiei calculatã pentru seria transformatã esteegalã cu mãrimea dispersiei
iniţiale.
Prin combinarea proprietãţilor (b, c, şi d) se obţine relaţia de calcul simplificat al dispersiei într-o
serie de distribuţie.
- pentru o serie cu frecvenţe absolute:
unde: a = se ia de regulã centrul de interval cu frecvenţa cea mai mare
xi − a 2
∑( h
) ni
σ x2 = h 2 − ( x − a) 2
∑ i n
h = se ia divizorul comun al şirului.
Din punct de vedere practic, aplicarea relaţiei de calcul simplificat se recomandã atunci când seria
prezintã valori individuale mari, când calculul se efectueazã manual, şi când media aritmeticã s-a calculat
dupã relaţia de calcul simplificat.
σ x = σ x2
Deci se extrage rãdãcina pãtratã din dispersie.
Abaterea medie pãtraticã se exprimã în unitatea de mãsurã concertã a caracteristicii urmãrite.
Valoarea sa este cu atât mai mare cu cât este mai intensã variaţia valorilor individuale ale caracteristicii.
Pentru aceeaşi serie statisticã, abaterea medie liniarã calculatã (dx) este mai micã sau cel mult egalã cu
abaterea medie pãtraticã (σx). Se apreciazã cã, pentru o serie statisticã cu tendinţã de normalitate, abaterea
medie liniarã reprezintã 4/5 din valoarea abaterii medii pãtratice:
4
dx =σ x ⋅
5
Chiar dacã conţinutul concret al abaterii medii pãtratice nu este la fel de clar în comparaţie cu
abaterile individuale şi abaterea medie liniarã, totuşi ea este prefertaã în analizele statistice. Preferinţa se
explicã prin faptul cã ea este parametrul legii normale de repartiţie.
Majoritatea modelelor utilizate în analiza statisticã (în analiza dispersionalã, în analiza regresiei şi
corelaţiei) se fundamenteazã pe ipoteza de normalitate a repartiţiei caracteristicii distribuţiilor implicate. Din
aceastã cauzã, abaterea medie pãtraticã se utilizeazã pe scarã largã şi în alte domenii cum ar fi în conducerea
unor procese economice, în prognozã, marketing, studiul calitãţii producţiei, etc.
Deoarece abaterea medie pãtraticã este exprimatã în aceeaşi unitate de mãsurã ca şi caracteristica
concretã, aceasta se poate utiliza la compararea gradului de variaţie numai pentru serii care se referã la
aceeaşi caracteristicã.
4) Coeficientul de variaţie (omogenitate) (V) se calculeazã ca raport între abaterea medie pãtraticã
şi media aritmeticã şi se exprimã sub formã de coeficienţi sau în procente.
Sunt necesare urmãtoarele observaţii:
- coeficientul de variaţie este expresia relativã a abaterii (σ x)
- coeficientul de variaţie (V) reprezintã o mãsurã sinteticã a omogenitãţii distribuţilor
statistice dupã o anumitã caracteristicã şi ia valori în intervalul (0; 100).
σx
Vx = ⋅ 100
x
Se observã cã valorile mici ale coeficientului de variaţie semnificã faptul cã media aritmeticã calculatã are un
grad ridicat de reprezentativitate, iar colectivitatea este omogenã. Colectivitatea este eterogenã şi media este
mai puţin reprezentativã atunci când valoarea lui V este apropiatã de limita maximã (100) sau (1) a mulţimii
sale de valori.
Calculul indicatorilor statistici ai variaţiei oferã informaţii utile referitoare la amploarea variaţiei valorilor
individuale în jurul unei valori centrale semnificative, atunci când unitãţile colectivitãţii sunt urmãrite dupã o
singurã variabilã, indiferent de natura ei.
Aceste informaţii trebuie completate cu altele referitoare la concentrarea (diversificarea) unitãţilor, la
asimetria distribuţiei. În cazul în care unitãţile colectivitãţii sunt însã structurate pe grupe, în funcţie de douã
sau mai multe variabile, calculul indicatorilor variaţiei trebuie adaptat în mod corespunzãtor.
Distribuţia frecvenţelor absolute şi relative pe variantele caracteristicii alternative notate cu 1-dacă există sau
se manifestă caracteristica la unitatea statistică supusă cercetării statistice, sau 0- dacă nu există caracteristica
avută în vedere, se prezintă astfel:
Grupe de Centrul Nr. muncitori fi xi - x (xi – x)fi (xi – x)2fi [(xi – a)/h]fi
muncitori intervalului xi
dupã
vechime
0–5 2,5 10 -15,7 -157 2464,9 90
5 – 10 7,5 40 -10,7 -428 4579,6 160
10 – 15 12,5 60 -5,7 -342 1949,4 60
15 – 20 17,5 80 -0,7 -56 39,2 0
20 – 25 22,5 50 4,3 215 924,5 50
25 – 30 27,5 30 9,3 279 2594,7 120
30 – 35 32,5 20 14,3 286 4089,8 180
35 – 40 37,5 10 19,3 193 3724,9 160
Σfi; i = 1, ..., k - Σ(xi – x)fi Σ(xi – x)2fi Σ[(xi – a)/h]2fi
300 -10 20367,0 820
x=
∑ x i fi =
5450
= 18,2 _ ani; a = 17,5; h = 5
∑ fi 300
Indicatori sintetici
1) Abaterea medie liniarã dx
dx =
∑ xi − x fi =
1956
= 6,5 _ ani
∑ fi 300
2) Dispersia (σx2)
σ 2x =
∑ (x i − x) 2 f i =
20367
= 67,89
∑ fi 300
xi − a 2
∑( h
) fi
820 2
σ 2x = ⋅ h 2 − (x − a) 2 = ⋅ 5 − (18,2 − 17,5) 2 = 67,84
∑ fi 300
σx 8,2
V= ⋅ 100 = ⋅ 100 = 45%
x 18,2
d 6,5
V' = x ⋅ 100 = ⋅ 100 = 35,7%
x 18,2
2. S-a efectuat o analiză statistică pe un număr de 95 studenţi. În urma distribuţiei pe grupe şi subgrupe
în funcţie de vârstă şi sex s-a obţinut următoarea situaţie:
Sex
Masculin 1 8 24 10 5 2 50
Feminin 2 9 21 8 4 1 45
Total 3 17 45 18 9 3 95
Pentru a studia mai uşor variaţiile caracteristicilor ce definesc fenomenele supuse studiului
statistic s-au realizat grupări prealabile ale unităţilor colectivităţii. Astfel s-au calculat medii pe fiecare
grupare a colectivităţii statistice precum şi o medie pentru întreaga colectivitate.
Pentru a se determina separat, atât la nivelul grupei cât şi la nivelul colectivităţii generale
influenţa caracteristicii de grupare xi cât şi a variabilelor caracteristicii yi este necesar a se calcula:
∑ yi ⋅ n j 2229
y0 = = = 23,46
∑nj 95
∑ (y j − y 0 )2 ⋅ n j
m
j=1 419
σ 02 = = =
m 95
∑nj
j=1
Interval n ij yi n ij ⋅ y i (y j − y 0 ) ( y i − y 0 )2 ( y i − y 0 ) 2 * n ij
j0 = 23,46
Dispersia totală= 4,417
Grupa I masculin
Grupe de studenţi Nr.de studenţi Centrul Nij*ji yj-yo (yj-y0)2 (yj-y0)2*nij
după Nij interva-lului
vârstă yi
18-20 1 19 19 -4,64 21,53 21,53
20-22 8 21 168 -2,64 6,97 55,76
22-24 24 23 552 -0,64 0,41 9,83
24-26 10 25 250 1,36 1,85 18,50
26-28 5 27 135 3,36 11,29 56,45
28-30 2 29 58 5,36 28,73 57,46
Total 50 1182 219,52
2. a. σII2=4,3733
Grupa a II-a feminin
Grupe de studenţi Nr.de Centrul Nij*ji yj-yo (yj-y0)2 (yj-y0)2*nij
după studenţi interva-lului
vârstă Nij yi
3. Media totală:
k
∑ yi n i
23,64 ⋅ 50 + 23,26 ⋅ 45 2229
y 0 = i =1 = = = 23,46
k 95 95
∑ ni
i =1
4. Media dispersiilor de grupă:
σ2 ⋅ n
σi = ∑ i i =
4,39 ⋅ 50 + 4,37 ⋅ 45
= 4,38
∑ i
n 95
5. Dispersia dintre grupe:
σ 2y / x = ∑ (yi − y 0 )2 ⋅ n i =
(23,64 − 23,46)2 ⋅ 50 + (23,26 − 23,46)2 ⋅ 45 = 3,31 = 0,034
∑ ni 95 95
6. Regula de adunare a dispersiilor:
2_INDICATORII TENDINTEI CENTRALE_11.doc 25
σ02 = σi2 + σ 2y / x = 4,38 + 0,034 = 4,415
7. Coeficientul de determinaţie:
σ 2y / x 0,034
R2 = 100 = 100 = 0,78%
σ02 4,415
8. Coeficientul de nedeterminaţie:
σ2 4,38
1 − R 2 = i2 100 = 100 = 99,22% ⇒ 0,78%+99,22%=100%
σ0 4,415
Se poate concluziona că R2>1-R2 şi, deci, “sexul” nu reprezintă un factor determinant pentru
vârstă, aceasta fiind influenţată de alţi factori.