Sunteți pe pagina 1din 9

ANALIZA SERIILOR DE DISTRIBUłIE UNIDIMENSIONALE

3.3.1. Indicatorii tendinŃei centrale

Analiza tendinŃei centrale, în seriile de repartiŃie, presupune luarea în consideraŃie, nu numai a


valorilor individuale, ci şi a formei în care se repartizează frecvenŃele de apariŃie a acestor valori.

3.3.1.1. Mărimile Medii


Mărimile Medii sunt instrumente statistice ce exprimă, în mod sintetic şi generalizat, ceea ce este
normal esenŃial, tipic şi general în evoluŃia fenomenelor. Pentru aplicarea corectă a mediilor este
necesar să se respecte următoarele condiŃii:
a) calculul mediilor să se bazeze pe folosirea unui număr mare de cazuri individuale diferite, sub
care s-a înregistrat caracteristica, a căror variaŃie este întâmplătoare în raport cu fenomenul în totalitatea
lui;
b) valorile din care se va calcula media să fie omogene;
c) alegerea acelei forme de medie care corespunde cel mai bine formei de variaŃie a caracteristicii
cercetate şi informaŃiilor de care se dispune.
Media valorilor individuale ale unui fenomen de masă este expresia sintetizării într-un singur
nivel reprezentativ, ceea ce este esenŃial, tipic în apariŃia, manifestarea şi dezvoltarea lui. Mediile cele
mai frecvent întâlnite:
Media aritmetică ( X ). Se foloseşte în general când fenomenul supus cercetării înregistrează
modificări aproximativ constante într-o progresie aritmetică. Poate fi:
n
∑ xi
i=1
Media aritmetică simplă: X = ,
n
unde: X = media aritmetică
n = nr. variantelor individuale
∑ x i = suma valorilor individuale ale caracteristicii

Media aritmetică ponderată: se foloseşte pentru seriile de distribuŃie, când variante ale
caracteristicii se înregistrează de mai multe ori.
p
∑ x i n i
X = i = 1
p
∑ n i
i = 1
unde:
x1, x2,..., xp – niveluri individuale,
ni – frecvenŃa grupelor

X −a
∑ i  * ni
Formula de calcul a mediei simplificate: X = i  h 
*h + a
∑ ni
i
unde
a = valoarea caracteristicii cu frecvenŃă maximă

ObservaŃii:
• sensibilitatea ei, faŃă de valorile extreme ale seriei;
• devine nereprezentativă, dacă termenii seriei sunt foarte împrăştiaŃi;
• omogenitatea colectivităŃii este o condiŃie a reprezentativităŃii, pentru orice tip de mărime medie;
• este indicat a se calcula când frecvenŃele maxime sunt în cen-trul seriei.
Media armonică ( X h ) Se calculează din valorile inverse ale ter-menilor seriei, ca medie simplă
sau ponderată.
n
Pentru serii simple: X h = i = 1,p
1

i x i
∑ ni
Pentru serii de frecvenŃă: Xh = i
1
∑ *ni
i xi
ObservaŃii:
• pentru distribuŃiile de frecvenŃă este indicat a se folosi când în serie predomină valorile mici,
seria fiind asimetrică către valorile minime ale caracteristicii (frecvenŃa maximă este în prima grupă).
Media pătratică ( X p ) Se calculează prin extragerea rădăcinii pătrate din media aritmetică a
pătratelor termenilor seriei, ca medie simplă sau ponderată:
2
∑ xi
Pentru seriile simple: Xp =
n
2
∑ xi ni
Pentru seriile de frecvenŃă: X p =
∑ ni
ObservaŃii:
• Se foloseşte când dăm o importanŃă mare termenilor mari ai seriei sau în cazul în care termenii
seriei au valori pozitive şi negative.
• FrecvenŃa maximă va fi la ultima grupă a seriei.
Media geometrică ( X g ). Se bazează pe relaŃia de produs a termenilor seriei şi se mai numeşte şi
medie logaritmică.

Pentru seria simplă: X g = n ∏ x i , i = 1, n

∑ ni ni
Pentru seria frecvenŃelor: Xg = ∏x i , i = 1, n

Dacă logaritmăm rezultă:


∑ lg x i
Pentru seria simplă: lg X g =
n
∑ n i lg x i
Pentru seria frecvenŃelor: lg X g = .
∑ ni
Media ( X g ) se află prin antilogaritm.

ObservaŃii:
• nu poate fi folosită dacă în cadrul seriei există cel puŃin un termen negativ, expresia devine
imaginară;
• sau dacă există un termen zero, anulează produsul termenilor;
• mai este denumită şi medie de ritm, fiind folosită pentru cal-culul ritmului mediu de creştere.
RelaŃiile existente între aceste medii sunt date de inegalităŃile:

Xh ≤ Xg ≤ X ≤ Xp .

3.3.1.2. Indicatorii de poziŃie

Sunt denumiŃi şi medii de structură, iar dintre aceştia amintim:


• quantile de ordinul K:
- pentru K = 2 –mediana (Me);
- pentru K = 4 – quartilele (Q1, Q2 = Me, Q3);
- pentru K = 10 –decilele (D1, ….,D5 = Me, ….., D9)
• valoarea modală sau modul (Mo)
Aceşti indicatori evidenŃiază tendinŃa de aglomerare sau concentrare a valorilor individuale, către
anumite valori tipice. Se folosesc pentru: estimarea nivelului mediu; evaluarea asimetriei seriei etc.;
Mediana (Me) – reprezintă acea valoare a caracteristicii situată în mijlocul seriei după ce
termenii seriei au fost aranjaŃi crescător sau descrescător.
Cazul seriei simple
• număr impar de termeni: 1 5 9 12 16 20 25 ⇒ Me =12
8 + 12 20
• număr par de termeni: 1 5 8 12 16 20 Me = = = 10
2 2
Cazul seriei de distribuŃie de frecvenŃă
• Seria statistică fără intervale (ex. distribuŃia loturilor de produse după numărul rebuturilor):

Nr. rebuturi din lot Nr. de loturi FrecvenŃe


xi ni cumulate
0 10 10
1 20 30
2 40 70
3 15 85
4 10 95
5 5 100
TOTAL 100

Pentru această serie valoarea Me va fi acea valoare a caracteristicii corespunzătoare primei


∑ ni + 1
frecvenŃe cumulate ascendent ce depăşeşte valoarea lui . Această relaŃie ne dă locul medianei
2
pentru seriile de frecvenŃă cu intervale.
∑ ni + 1 100 + 1
ex. = = 50,5 –prima frecvenŃă mai mare este 70, Me = 2
2 2

Cazul seriei statistice cu intervale:


Pentru calculul Me se urmăresc etapele:
• cumularea crescătoare a frecvenŃelor
∑ ni + 1
• determinarea locului Me cu relaŃia ;
2
∑ ni +1
− ∑ n pMe
• calculul medianei cu formula: Me = X 0 + h 2
n Me
unde: X0 – limita inferioară a intervalului median; h – mărimea intervalului;
∑ n pMe = suma frecvenŃelor cumulate, precedente intervalului median;
n Me = frecvenŃa absolută a intervalului median.

Exemplu
Gruparea 0-5 5-10 10-15 15-20 20-25 25-30 30-35 TOTAL
muncitorilor după
vechime
Număr muncitori 5 7 10 12 18 15 7 74
FrecvenŃe cumulate 5 12 22 34 52 67 74

∑ n i + 1 74 + 1
Locul Me = = = 37,5 ∈ (20,25)
2 2
37,5 − 34
Me = 20+5 = 20,97 Me = 20,97
18
Quartile sunt acele valori ale caracteristicii ce împart seria ordonată în patru părŃi egale. Sunt în
număr de trei (Q1, Q2, Q3) şi se calculează cu relaŃiile:
∑n i +1
− ∑ n pQ1
Q1 = X 0 + h 4
n Q1
X 0= limita inferioară a intervalului Q1,
h = mărimea intervalului
∑ ni +1
= locul primei quartile Q1
4
∑ n pQ1 = frecvenŃe cumulate precedente ale intervalului Q1
n Q1 = frecvenŃa absolută a intervalului Q1
Q2 = Me
3
4
(∑ n i +1 − ) ∑n pQ 3
Q3 = X 0 + h
n Q3
3
X 0 = limita inferioară a intervalului Q3,
4
(∑ )
n i + 1 = locul Q3

∑ n pQ3 = frecvenŃe cumulate precedente intervalului Q3


nQ 3 = frecvenŃa absolută a Q3

Valoarea modală sau Modul (Mo)


Reprezintă acea valoare a caracteristicii, care are cea mai mare frecvenŃă de apariŃie. Se
calculează numai în distribuŃie de frecvenŃă. Pentru o repartiŃie de frecvenŃă pe variate M0 se identifică
pe calea simplei examinări a şirului de frecvenŃe. Mo = 2 (frecvenŃa maximă ∑(ni) = 40)
Număr rebuturi xi 0 1 2 3 4 5 TOTAL
Număr loturi ni 10 20 40 15 10 5 100

Pentru o serie de frecvenŃă pe intervale, determinarea M0 se face pe etape:


– determinarea intervalului modal, fiind intervalul de variaŃie al caracteristicii cu frecvenŃă
maximă
∆1
– estimarea valorii modale cu relaŃia: Mo = Xo + h
∆1 + ∆ 2
unde: X 0 = limita inferioară a intervalului modal
∆1 = diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului precedent
∆ 2 = diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului următor
h = mărimea intervalului.

Exemplu
Calculul M0 pe exemplul seriei de frecvenŃe (conform exemplului de la Me) unde intervalul
modal este (20,25)
Mo = 20 +5 (18 − 12 ) = 23 ,33 20 < 23,33 < 25
(18 − 12 ) + (18 − 15 )

ObservaŃii:
• Mо poate înlocui media când ea nu se poate calcula sau nu are sens a fi calculată: industria
confecŃiilor: nu există mărime medie, ci talia cea mai căutată (la fel la încălŃăminte)
• Mо este util pentru seria de repartiŃie asimetrică.
• Mе şi Mо se exprimă în aceleaşi unitate de măsură ca şi variabila studiată.

3.3.2. Indicatorii variaŃiei


Cu cât gradul de complexitate al unui fenomen este mai mare, cu atât gama factorilor de influenŃă
este mai largă şi implicit cu atât mai mare este variabilitatea termenilor unei serii de repartiŃie.
Indicatorii statistici ai variaŃiei rezolvă:
– verificarea reprezentativităŃii mediei ca valoare tipică a seriei de distribuŃie;
– verificarea gradului de omogenitate al seriei;
– verificarea sistematizării informaŃiilor prin gruparea statistică;
– caracterizarea gradului şi formei de variaŃie a unei variabile statistice.
Clasificarea indicatorilor variaŃiei:
1. După numărul variantelor cuprinse în metodologia lor de calcul:
– indicatori simpli;
– indicatori sintetici ai variaŃiei.
2. După metodologia de calcul şi forma de exprimare, deosebim:
– indicatori ai împrăştierii, calculaŃi ca mărimi absolute;
– indicatori de variaŃie calculaŃi ca mărimi relative, în raport cu valoarea unui indicator al
tendinŃei centrale (media).
3. După modul de sistematizare a datelor complexe:
– indicatori ai variaŃiei, calculaŃi pentru serii de distribuŃie unidimensionale.
– indicatori ai variaŃiei, calculaŃi pentru serii de distribuŃie multidimensionale.

Indicatorii simpli ai variaŃiei se caracterizează prin aceea că se calculează în cifre absolute sau
relative, prin compararea valorilor individuale extreme, sau prin compararea fiecărei valori individuale
cu valoarea lor medie.
Amplitudinea împrăştierii este expresia cantitativă a domeniului de variaŃie al unui fenomen şi se
calculează ca mărime absolută sau relativă.
Amplitudinea absolută: A = Xmax – Xmin
A
Amplitudinea relativă: A% = ⋅ 100
X
Se utilizează la alegerea numărului de grupe (r), la stabilirea mărimii interva-lului de grupare (h),
la dirijarea statistică a procesului de fabricaŃie.
Abaterile individuale (di) ne arată cu câte unităŃi de măsură, sau de câte ori valoarea individuală a
caracteristicii este mai mare sau mai mică decât mărimea unui indicator al tendinŃei centrale. Abaterile individuale
se calculează în cifre absolute sau relative:

Abaterile individuale absolute (di): di = Xi – X , pentru i = 1, n


di
Abaterile individuale relative (di%): di% ⋅ 100 , pentru i = 1, n
=
x
ObservaŃie. Indicatorii simpli ai variaŃiei permit o caracterizare parŃială şi aproximativă a variaŃiei
pentru că se calculează pe baza relaŃiei între doi termeni ai seriei, sau între fiecare termen şi media lor.

Indicatorii sintetici ai împrăştierii caracterizează gradul de variaŃie luând în considerare toŃi


termenii seriei. Indicatorii sintetizează într-o singură expresie numerică, variaŃia valorilor individuale,
faŃă de tendinŃa centrală a caracteristicilor urmărite într-o populaŃie statistică. În funcŃie de metodologia
de calcul în statistică se calculează:
()
• Abaterea medie absolută d reprezintă media aritmetică simplă sau ponderată a abaterilor
absolute ale termenilor seriei de la tendinŃa lor centrală.
∑ xi − x
Pentru serii simple: d =
i
pentru i = 1, k
n
∑ xi − x ⋅ni
Pentru serii de frecvenŃă: d = i
pentru i = 1, k
∑ i
ni
unde: k = numărul de variante distincte sau intervale de grupare; ni = frecvenŃe absolute
ObservaŃii:
Pentru seriile de distribuŃie pe intervale se iau centrele de interval (Xi).
Este concludentă numai pentru seriile cu grad mare de omogenitate.

( )
• Dispersia σ 2 se calculează ca o medie aritmetică simplă sau ponderată a pătratelor abaterilor
termenilor de la media lor.

∑ xi − x ( 2
)
Pentru seria simplă: σ =
2 i
pentru i = 1, p
n
(
∑ xi − x )2 * n i
Pentru seria de frecvenŃă : σ = i
2
∑ ni
i
(
∑ xi − x )2 * n *i
%

Pentru serii de frecvenŃe relative : σ =


2 i
100
2
 x −a 
∑ i  *ni
2
Formula de calcul simplificat al dispersiei : σ = i  h
∑ ni
 (
*h2 − x − a )2
i
unde: a = valoarea caracteristicii (Xi) corespunzătoare frecvenŃei maxime.

ObservaŃii:
• σ 2 şi x calculate pe baza seriilor de repartiŃie pe intervale, sunt mai puŃin exacte decât dacă s-ar
folosi date individuale negrupate.
• cu cât intervalele de grupare sunt mai mari, cu atât σ 2 şi x sunt mai puŃin semnificative.
• σ 2 este un indicator abstract, fără conŃinut economic.
• σ 2 măsoară variaŃia totală a caracteristicilor studiate, datorate cauzelor esenŃiale şi
întâmplătoare.

• Abaterea medie pătratică (abaterea standard). Se defineşte ca medie pătratică simplă sau
ponderată, a abaterilor valorilor individuale de la tendinŃa centrală, sau ca rădăcină pătrată a dispersiei.

Astfel: σ = σ 2
, unde σ = dispersia, calculată prin orice metodă.
2

ObservaŃii:
• abaterea medie pătratică se exprimă în unitatea de măsură a caracteristicii studiate, iar valoarea
sa este cu atât mai mare cu cât variaŃia valorilor individuale din care s-a calculat este mai mare;
• comparând σ cu d , calculate pentru aceeaşi serie: d ≤ σ ;
• în analizele statistice, se preferă σ , ca fiind un parametru al legii normale (majoritatea
metodelor statistice au la bază ipoteza normalităŃii);
• se pretează mai bine la calculul algebric;
• în analizele financiar-bursiere σ poate fi utilizată ca o măsură a riscului.

• Coeficientul de variaŃie (v). Este o măsură a dispersiei relative care descrie abaterea medie
pătratică ca procent din media aritmetică. Permite compararea împrăştierii valorilor individuale a mai
multor caracteristici cantitative ce nu sunt exprimate în aceeaşi UM.
σ
Se calculează cu relaŃia: V = * 100
x
ObservaŃii:
• coeficientul de variaŃie ia valori în intervalul 0-100%;
• dacă tinde spre 0, este o variaŃie slabă, o colectivitate omogenă şi o medie cu un grad mare de
reprezentativitate;
• dacă tinde spre 100%, variaŃia este intensă, colectivitatea eterogenă;
• practica a stabilit pragul de trecere de la omogenitate la eterogenitate:
– dacă „v” ≤ 35%, colectivitatea este omogenă, media reprezentativă, gruparea bine efectuată.
– dacă „v” ≥ 35%, colectivitatea este eterogenă, media nereprezentativă, gruparea trebuie refăcută.
3.3.3. Analiza variaŃiei într-o serie de repartiŃie bidimensională
Analiza detaliată a fenomenelor social-economice, cu grad mare de complexitate, necesită structurarea
colectivităŃii pe grupe relativ omogene, în funcŃie de variaŃia uneia sau a mai multor caracteristici de grupare.
Astfel, studiul împrăştierii unei caracteristici în întreaga colectivitate trebuie să se completeze cu
analiza împrăştierii din fiecare grupă şi dintre grupe, identificându-se astfel, rolul diferiŃilor factori de
influenŃă asupra variaŃiei caracteristicii în colectivitatea respectivă.
Regula de adunare a dispersiilor arată relaŃia dintre dispersia totală şi cele două dispersii

factoriale, cu formula: σ02 = σ2 + δ2


unde: σ 02 = dispersia totală; σ 2 = media dispersiilor parŃiale; δ = dispersia dintre grupe.
Pe baza ei se calculează:
δ2
• Coeficientul de determinaŃie R
2
= ⋅ 100
σ 02
– arată care este ponderea factorului principal de grupare în variaŃie totală a caracteristicii.
2
σ
• Coeficientul de nedeterminaŃie K
2
= ⋅ 100
σ02
– arată care este ponderea factorilor întâmplători în variaŃia totală a caracteristicii.
Între cei doi coeficienŃi există următoarea relaŃie: R 2 + K 2 = 1
Dacă: R 2 > K 2 , factorul principal de grupare acŃionează hotărâtor asupra variaŃiei caracteristicii
rezultative.
R2 < K2 , variaŃia caracteristicii rezultative se datorează influenŃei exercitate de alte cauze, aceasta
fiind independentă de variaŃia caracteristicii factoriale.

3.3.4. Analiza asimetriei repartiŃiilor empirice


În urma prelucrării informaŃiilor se obŃin serii de repartiŃie de frecvenŃă empirice, ce se pot
compara cu repartiŃii teoretice, a căror formă de repartiŃie este cunoscută. Cea mai frecventă serie de
repartiŃie, către care tind seriile empirice, este distribuŃia normală sau funcŃia GAUSS-LAPLACE, ale
cărei frecvenŃe se distribuie simetric, de-o parte şi de alta a frecvenŃei maxime, plasată în centrul seriei.
Graficul acestei distribuŃii are formă de clopot, în raport cu ordonata maximă, iar X = Me = Mo .
NoŃiunea de asimetrie se referă la felul în care frecvenŃele unei distribuŃii empirice se abat de la
curba normală a frecvenŃelor. Sunt cunoscute distribuŃii empirice: uşor asimetrice; pronunŃat asimetrice.
Reprezentările grafice ne oferă o imagine asupra asimetriei, dar gradul de asimetrie este măsurat
cu indicatori specifici, din care amintim pe cel mai important:

Coeficientul de asimetrie (Cas) a lui PEARSON


– se calculează ca raport între asimetria absolută (AS) şi abaterea medie pătratică.
X − Mo
As = X − Mo; Cas =
σ
– Cas are o valoare abstractă, arătând mărimea şi felul asimetriei, iar valorile lui sunt cuprinse în
intervalul (-1, 1).
– Dacă: Cas = 0, seria este simetrică;
Cas →0, asimetrie mică
Cas →(+/- 1), asimetrie pronunŃată
Cas în intervalul (0,1) asimetrie pozitivă
Cas în intervalul (-1,0) asimetrie negativă.

S-ar putea să vă placă și