Documente Academic
Documente Profesional
Documente Cultură
Introducere
X i 1 x i ni*
X
x
i 1
n
i 1
r X 100
ni 1
1 1
ni
* ni ni* % r
ni
100
ni
100, %
n
n ni
i 1
x '
i
i ni
x '
2 X i1
r
ni
11
479 1995,84
X 19,96 20 ani
r
5 4 ... 4 20
X 6,6 ani
10
Figura 2
Mediile se calculează pe baza tuturor valorilor individuale ale seriei,
ceea ce le face sensibile la valorile extreme, mai puţin semnificative.
n 1
L(Me )
2
unde n este numărul termenilor seriei.
calculul valorii medianei (se exprimă în unitatea de măsură a
caracteristicii respective).
pentru seriile simple (negrupate), mediana este:
termenul din mijloc dacă seria are număr impar de termeni
media aritmetică simplă a celor două valori din centrul seriei, dacă
numărul termenilor este par.
n 1i
n 1
IMe LMe) i1
sau
2 2
c) Se determină valoarea efectivă a medianei ţinând cont de
modalitatea de grupare a datelor.
Frecvenţa cumulată mai mare decat L(Me) = (80+1)/2 = 40,5 este 65,
şi prin urmare varianta „3 membrii de familie“ reprezintă mediana,
situată în mijlocul distribuţiei.
Tabelul 3
În cazul în care distribuţia de frecvenţe s-a obţinut prin gruparea pe
intervale, (cazul caracteristicilor continue) mediana se determină cu ajutorul
următoarei formule: r Me 1
1
ni 1 ni
2 i1
i1
Me x 0 hMe
unde Me: mediana nMe
x0 – limita inferioară a intervalului median;
hMe – mărimea intervalului median;
nMe - frecvenţa intervalului median;
Me 1
n
- suma frecvenţelor intervalelor anterioare celui median.
i
i1
EXEMPLUL 5: Gruparea
agenţilor economici
dintr-o ramură dupa
cifra de afaceri
(miliarde Rol)
Mediana are o anumită capacitate de a spune ce este comun în seria
statistică.
Spre deosebire de medie, mediana nu este influenţată de valorile
extreme ale seriei; de aceea ea poate înlocui cu succes media
atunci când apar valori aberante. Mediana este mărimea medie care
corespunde cel mai bine imaginii de mijloc a seriei.
1 60 40 20
2 60 40 20
20
D 800 100 800 100 0,5 850 um
20 20
Tabelul 6
ni ni
Xi Xi
Figura 10
Amplitudinea se utilizează frecvent în prelucrarea statistică la alegerea
numărului de intervale de grupare a datelor şi la stabilirea mărimii
intervalelor.
Ca măsură a împrăştierii valorilor individuale, amplitudinea variaţiei prezintă
dezavantajul utilizării exclusive a valorilor extreme care pot fi depărtate de
masa variantelor caracteristicii; prin urmare, amplitudinea variaţiei nu ţine
seama de toate observaţiile şi este sensibilă la prezenţa valorilor aberante.
De exemplu, următoarele trei serii vizualizate în figura 10 au aceeaşi
amplitudine dar prezintă variaţii (dispersări) diferite:
Amplitudinea este un indicator de împrăştiere "destul de rezonabil" numai dacă
valorile individuale ale seriei sunt repartizate în mod uniform, omogen (fără
să existe valori aberante).
Amplitudinea variaţiei poate dezinforma atunci când valorile extreme se
situează la distanţă mare de masa valorilor empirice. Din acest motiv acest
indicator nu oferă informaţii concludente privitor la gradul de variaţie a două
repartiţii.
Amplitudinea variaţiei se aplică în toate cazurile când interesează tocmai
valorile extreme şi în controlul calităţii proceselor de fabricaţie
bunuri/prestare servicii.
(2) Dispersia (varianţa)
x i x
2
r 2
2 x 'i x ni*
i 1
pentru serii cu frecvenţe relative exprimate procentual
x
r 2
'
i x ni* %
i 1
2
100
Utilizând datele referitoare la rata şomajului pe ţări (tabelul 7), din
tabel 8 coloana 7 şi 1, dispersia este:
Tabelul 8
x i x
r 2
'
ni
i 1 455,64
2 r
18,985
24
ni
i 1
Considerând exemplul referitor la timpul zilnic petrecut în faţa
televizorului, datele sistematizate pentru calculul dispersiei sunt
redate în tabelul 9, iar valoarea acesteia este:
x
r 2
'
i x ni
i 1 182299,50
2 r
911,4975
200
ni
i 1
Tabelul 9
(3) Abaterea medie pătratică (abaterea standard,
ecart tip, deviaţie standard)
În studiul variabilităţii se foloseşte rădăcina pătrată a dispersiei, indicator numit
abaterea medie pătratică. Se calculează ca o medie pătratică a abaterilor
valorilor individuale de la media lor şi se exprimă în unitatea de măsură a
caracteristicii, ceea ce o face improprie comparaţiilor.
Deoarece, în analiza variaţiilor individuale, mai importante sunt abaterile mari
în valoare absolută, abaterea media pătratică este cea mai indicată.
n
x x
x
2 r 2
'
x ni
i
pentru serii simple;
i1 i
i 1
n r
pentru serii cu frecvenţe absolute ni
i 1
x 'i x
r 2
ni*
i 1
pentru serii cu frecvenţe relative exprimate procentual
x
r
2
'
i x n i*%
i1
100
Considerând cele două exemple prezentate, abaterea medie pătratică este:
În cazul şomajului
18,985 4,36%
2
2
(68,26%)
media
4 (95.45%)
6 (99.73%)
Figura 11. Relaţia dintre amplitudine şi abaterea medie pătratică
4) Coeficientul de variaţie (omogenitate)
4,36
Cv 100 100 45,4%
x 9,6
Aşadar, colectivitatea considerată în acest exemplu este eterogenă.
Ţările incluse în analiză sunt foarte diferite din punct de vedere al
nivelului de dezvoltare şi al sistemului economic specific, ceea ce
determină diferenţe mari în mărimea indicatorului considerat. Se
poate încerca o grupare în: ţări dezvoltate, ţări mai puţin dezvoltate
şi fostele ţări socialiste.
În cazul exemplului cu cifra de afaceri realizată de 200 agenţi
economici, coeficientul de variaţie este egal cu 20,6% ceea ce
indică faptul că media este reprezentativă.
Analiza indicatorilor tendinţei centrale şi a indicatorilor variaţiei trebuie să se facă
în mod combinat. Interpretarea lor izolată poate conduce la erori. De
exemplu, două serii statistice pot avea aceeaşi dispersie, dar medii diferite,
ca în figura 12. Uneori, seriile statistice au aceeaşi medie, dar dispersii
diferite ca în figura 13.
Figura 13
Figura 12
C. Indicatori ai formei distribuţiei
Calculul şi analiza indicatorilor simpli şi sintetici ai împrăştierii
valorilor individuale ale caracteristicilor în jurul tendinţei lor
centrale oferă informaţii utile pentru cunoaşterea manifestării
fenomenelor de masă şi pentru fundamentarea deciziilor.
Pentru profunzimea analizei întreprinse, aceste informaţii trebuie
completate cu altele referitoare la concentrarea valorilor
individuale şi la deplasarea acestora faţă de anumite valori
tipice. Prin urmare, analiza împrăştierii (variaţiei) valorilor
individuale trebuie să fie urmată de analiza formelor în care
se distribuie acestea.
Forma unei distribuţii de frecvenţe se analizează, comparativ cu
distribuţia ideală, normală, prin indicatorii:
asimetriei (oblicităţii) – analizează deplasarea valorilor
individuale faţă de anumite valori tipice ale tendinţei centrale
boltirii (excesului, aplatizării) curbei frecvenţelor.
Seriile empirice cu care lucrează statistica tind deseori către
modelul repartiţiei normale, care este o distribuţie perfect
simetrică.
Distribuţia perfect simetrică se caracterizează prin
egalitatea dintre medie, mediană şi mod (modă).
Frecvenţele se distribuie simetric la dreapta şi la stânga
valorii centrale, care are frecvenţa maximă. Graficul are
formă “ de clopot ” (fig. 14). În acest caz, acţiunea factorilor
întâmplători are caracter regulat, astfel încât acţiunea lor
se repartizează uniform, în ambele sensuri, faţă de medie.
Tabelul 10
Repartiţia agenţilor economici după cifra de afaceri tinde
către repartiţia normală, concluzie care rezultă din figura
15 şi 16 şi din faptul că frecvenţele descresc către
capetele seriei.
Figura 16
Figura 15
Tabelul 11
Figura 17, b
Distribuţie cu asimetrie negativă sau oblică spre
stânga (figura 17,b) este distribuţia care are mai multe
valori extrem de mici şi mai puţine extrem de mari
comparativ cu distribuţia normală, care are aceeaşi
medie şi dispersie. Ea este cauzată de apariţia unor
valori extreme mici ale caracteristicii, de unde rezultă
următoarea relaţie de inegalitate:
1 r Me 1
ni 1 ni
2 i 1
i 1
Me x 0 hMe 28 4(100,5 90) / 46 28,91 miliarde lei
nMe
1 50 25
Mo x 0 hMo 24 4 27,45 miliarde lei
1 2 50 25 50 46
r
xi' ni 5812
i 1
X r
29,06 miliarde lei
200
ni
11
As x Mo As' 3x Me
indicatori care au unitatea de măsură a variabilei studiate şi
care sunt pozitivi sau negativi, în funcţie de tipul de
asimetrie (coada mai lungă a distribuţiei spre valorile mari
sau spre valorile mici).
2) Coeficientul de asimetrie Pearson, Cas
Cel mai frecvent, în practică se utilizează coeficienţii de
asimetrie Pearson (pentru distribuţii uşor asimetrice mai
ales), ca raport între asimetria absolută şi abaterea
medie pătratică, în două variante:
x Mo 3 x Me
Cas
'
C as
Cas 1, 1 C' as 3, 3
Observăm următoarele:
CasYK = 0 simetrie (cuartilele sunt echidistante);
CasYK > 0 asimetrie pozitivă (sau etalarea frecvenţelor spre
dreapta);
CasYK < 0 asimetrie negativă (sau etalarea frecvenţelor spre
stânga)
CasYK < 0,1 seria este considerată moderat asimetrică
CasYK > 0,3 seria este pronunţat asimetrică;
Coeficientul lui Yule şi Kendall nu poate fi utilizat în compararea
asimetriei mai multor repartiţii de frecvenţe.
Calculul şi interpretarea coeficienţilor de aplatizare prezentaţi trebuie
completat cu analiza graficului distribuţiei empirice comparativ cu
cel al distribuţiei normale.
Analiza asimetriei şi aplatizării are sens numai în cazul distribuţiilor
empirice unidimensionale care prezintă o singură valoare modală.
Cuartilele sunt 3 valori care împart seria în patru părţi egale, ele
delimitând câte 25% din observaţii. Ele sunt în număr de trei: Q1, Q2,
Q3 (figura 19); Q1 se numeşte cuartila inferioară, Q2 este egală
întotdeauna cu mediana, Q3 se numeşte cuartila superioară.
Cuartilele, ca şi mediana, se determină pe baza valorilor ordonate ale
seriei statistice. Prima operaţie constă în localizarea celor trei cuartile.