Sunteți pe pagina 1din 6

SERIILE STATISTICE DE DISTRIBUȚIE DE FRECVENȚE

I. PARTEA TEORETICĂ: DEFINIȚIE, PROPRIETĂȚI,


REPREZENTARE GRAFICĂ, CALCULUL TENDINȚEI CENTRALE

Datele obținute în urma observării statistice se sistematizează sub forma seriilor


de distribuție de frecvențe. Aceste serii se obțin prin centralizare / grupare și pot fi de
variație (heterograde) sau atributive (homograde), constituind o modalitate de
prezentare a volumului și structurii colectivității (populației) statistice, în funcție de una
sau mai multe caracteristici. Pentru a caracteriza colectivitatea cercetată este necesar
să se cunoască nivelul de dezvoltare al fenomenelor, frecvența de apariție, forma de
variație, tendințele de concentrare către valorile tipice ale datelor individuale
înregistrate. Astfel, analiza seriilor de distribuție cu ajutorul unor indicatori și metode
specifice are drept scop, în cazul distribuțiilor unidimensionale, cunoașterea structurii
seriei statistice, a esenței fenomenelor și proceselor de masă, a caracterului tipic al
acestora, iar în cazul distribuțiilor multidimensionale și a legăturilor de cauzalitate dintre
variabile.
Contribuind la cunoașterea și înțelegerea complexității fenomenelor de masă, ca și
la evidențierea legităților specifice după care se dezvoltă, analiza statistică a seriilor de
distribuție trebuie să satisfacă anumite cerințe și anume:
a) să aibă un caracter sistemic: colectivitatea cercetată trebuie precis
determinată în timp, în spațiu și organizatoric, astfel încât, în funcție de natura
fenomenului cercetat, să fie alese cele mai adecvate metode de culegere, prelucrare,
analiză și interpretare și cel mai potrivit sistem de indicatori, care să evidențieze relațiile
de interdependență dintre părțile componente și întregul ansamblu de fenomene.
Fiecare serie de distribuție poate fi caracterizată printr-un sistem de indicatori și relații
de interdependență ce pot fi analizate fie pe aceeasi perioadă de timp și structură
organizatorică cu alte serii referitoare la diferitele variabile interdependente sau pentru
aceeași variabilă statistică luată în unități diferite de timp;
b) să utilizeze un sistem de indicatori, care din punctul de vedere al prelucrării
datelor primare să includă:
- indicatori care să permită caracterizarea structurii colectivității, calculați pe
baza frecvențelor de apariție ale valorilor individuale ale caracteristicii;
- indicatori care să caracterizeze esența fenomenului de masă, valorile tipice și
legăturile dintre aceștia, determinați utilizănd valorile individuale ale
caracteristicii;
- indicatori care să caracterizeze gradul de variabilitate față de tendința centrală
și forma de concentrare a valorilor caracteristicii studiate.
c) să pornească de la proprietățile seriilor de repartiție, și anume: omogenitatea,
variabilitatea, independența și tendința de concentrare a frecvențelor
atașate valorilor înregistrate.
Omogenitatea provine, în principal din faptul că acestea au același conținut, fiind
rezultatul combinării acelorași factori determinanți esențiali, ceea ce permite obținerea
unor indicatori sintetici, cu caracter de valori tipice. Omogenitatea statistică a unei serii
de distribuție presupune deci existenșa unei variații minime între termenii seriei.
Variabilitatea provine din faptul că fenomenele de tip statistic sunt determinate nu
numai de acțiunea unor factori esențiali, cu caracter sistematic, ci și de acțiunea unor
factori neesențiali, cu caracter aleator.
Independența provine din faptul că variantele seriei de distribuție au fost
înregistrate pentru unități de observare existente independent una de alta, chiar dacă
aparțin aceleiași colectivități.
Tendința de distribuție este rezultatul combinării acțiunii tuturor factorilor de
influență asupra unităților colectivității.
Aceste proprietăți ale seriilor de repartiție determină ca analiza lor să se facă
calculând și interpretând următoarele grupe de indicatori:
- indicatori de frecvență (de structură);
- indicatori ai tendinței centrale;
- indicatori de poziție;
- indicatori de variație;
- indicatori ai formei de repartiție (asimetrie și concentrare).
În utilizarea indicatorilor statistici în seriile de distribuție de frecvențe un rol
important revine reprezentărilor grafice prin care se identifică modelele de analiză
aplicate în funcție de specificul seriei. La reprezentarea grafică a distribuției de
frecvență sunt utilizate diagramele de distribuție sau de repartiție de frecvențe, care pot
fi: poligonul frecvențelor, curba cumulativă a frecvențelor, histograma în trepte, curba de
concentrare (curba Lorentz).
O imagine concludentă în legătură cu graficul de concentrare se realizează
utilizând curba Lorentz obținută prin unirea punctelor de coordonate ale valorilor
cumulate ale variabilelor înscrise pe cele două axe (pe abcisă se înscriu frecvențele
relative cumulate ale seriei, iar pe ordonată greutățile specifice cumulate ale valorilor
caracteristicii centralizate). Cu cât gradul de curbură al liniei empirice este mai mare, cu
atât concentrarea e mai accentuată din punct de vedere al caracteristicii respective.
Histograma conține o succesiune de dreptunghiuri cu bazele corespunzătoare
lungimii intervalelor și înălțimile egale cu numărul de observații din fiecare interval sau
cu ponderea lor. Dacă intervalele vor fi egale atunci și coloanele vor avea o lățime
egală. Permite vizualizarea distribuției de frecvențe relative sau absolute după o
variabilă numerică pe intervale.
Poligonul frecvențelor este și el utilizat pentru reprezentarea grafică a distribuțiilor
de frecvențe absolute sau relative, atunci când sistematizarea datelor s-a făcut după o
caracteristică numerică continuă sau discontinuă. Pentru construirea lui, din fiecare
valoare a caracteristicii sau din fiecare centru de interval se ridică o perpendiculară și se
marchează pe ea punctul aflat la o distanță egală cu frecvența pe intervalul respectiv.
Unind toate punctele astfel găsite rezultă un poligon numit poligonul frecvențelor care
se poate suprapune peste histogramă în cadrul aceluiași grafic sau într-un grafic
separat.
Indicatorii tendinței centrale se determină, în general, ca indicatori medii sau
indicatori de poziție, în funcție de natura caracteristicilor cercetate, de variația valorilor
individuale, de sursele de date, de scopul cercetării, etc. Tendința centrală poate fi
caracterizată printr-un anumit tip de medie (aritmetică, armonică, pătratică, geometrică,
etc.), modul și mediană.
Media aritmetică este principalul indicator al tendinței centrale. Ea este rezultatul
sistematizării într-o singură expresie a tuturor nivelurilor individuale observate, obținută
prin raportarea valorii totalizate a variabilei la numărul total al unităților și notată pentru
o variabilă X cu x .
n

∑ xi (1)
x= i=1
n
Media aritmetică simplă din relația (1) se utilizează atunci când pentru aflarea
nivelului mediu se apelează la toate variantele înregistrate într-o colectivitate, iar
mărimea acesteia nu este foarte mare.
De regulă, însă fenomenele de masă sunt numeroase și aceeași valoare
individuală poate fi întâlnită de mai multe ori, caz în care se utilizează media artimetică
ponderată.
k

∑ xi ni
x= i=1n (2)
∑ ni
i=1

unde:

x i reprezintă valorile individuale distincte înregistrate de unitățile seriei, care sunt


mai puțin numeroase decât unitățile colectivității. Numărul de unități distincte este “k” și:
k
k ≤ n=∑ ni
i=1

x i n i reprezintă valoarea centralizată a caracteristicii la toate unitățile ( ni ), care


prezintă același nivel ( x i).
Analiza tendinței centrale în seriile de distribuție presupune luarea în considerare
nu numai a valorilor individuale ale caracteristicilor urmărite, dar și a formei de
distribuție a unităților colectivității după caracteristica respectivă. Aceasta înseamnă că
în analiza seriilor de repartiție se consideră ca valoare tipică nu numai media, ci și
indicatorii de poziție (sau ai localizării) ca: modul și mediana.
Indicatorii de poziție, prin locul pe care îl ocupă în cadrul variantelor caracteristicii,
evidențiază tendința de aglomerare, de concentrare a frecvențelor în zona centrală a
distribuțiilor statistice. De asemenea, ei au o mare aplicabilitate, fiind utilizați în mod
special pentru: estimarea nivelului mediu, aprecierea gradului de semnificație a mediei,
evaluarea asimetriei distribuțiilor, obținerea unor informații utile despre modul de
repartizare a frecvențelor într-o serie, etc.
Valoarea modală a caracteristicii (M0), numită și valoare dominantă sau modul,
reprezintă acea valoare a caracteristicii care corespunde celui mai mare număr de
unități sau aceea care are cea mai mare frecvență de apariție.
În cazul distribuțiilor de variabile discrete, valoarea modală este ușor de stabilit,
prin simpla examinare a șirului de frecvențe absolute sau relative. Când seria este pe
variante, valoarea modală a caracteristicii este acea valoare individuală pentru care
frecvența de apariție este mai mare (acea valoare individuală care se repetă de cele
mai multe ori).
În cazul seriei de distribuție pe intervale, valoarea modului trebuie calculată. Când
seriile de distribuție au intervale egale, valoarea modală se determină în următoarele
etape:
 se identifică intervalul (grupa sau clasa) modal. Intervalul modal este intervalul cu
frecvența (absolută sau relativă) cea mai mare sau intervalul cu densitatea frecvențelor
maximă. În interiorul intervalului modal se caută (se estimează) valoarea modală;
 estimarea valorii modale. Această operație poate fi efectuată în mai multe
variante, și anume:
- dacă în interiorul intervalului modal frecvențele sunt simetric (sau
aproximativ simetric) distribuite, atunci modul coincide cu centrul intervalului modal;
- dacă distribuția frecvențelor în cadrul intervalului modal nu este simetrică,
atunci valoarea modală (dominantă sau cea mai probabilă) se determină în raport cu
abaterea frecvențelor intervalului premodal și a celui postmodal de la frecvența
intervalului modal, conform relației:
∆1
M 0=x 0 +h (3)
∆1 +∆ 2
unde:

x 0 reprezintă limita inferioară a intervalului modal;


h reprezintă mărimea intervalului modal;
∆ 1 reprezintă diferența dintre frecvența intervalului modal și frecvența intervalului
precedent;
∆ 2 reprezintă diferența dintre frecvența intervalului modal și cea a intervalului
următor.
Valoarea modală se poate determina și prin reprezentare grafică: modul
corespunde punctului maxim de pe abcisă în care graficul își atinge maximul.
Mediana (Me) reprezintă acea valoare a caracteristicii situată la mijlocul seriei sau
distribuției statistice cu valori individuale aranjate în ordine crescătoare sau
descrescătoare. Mediana împarte numărul unităților cercetate în două părți egale:
numărul valorilor individuale inferioare medianei este egal cu numărul valorilor
individuale superioare medianei. Datorită acestui fapt, mediana se mai numește
valoarea echiprobabilă a caracteristicii:

1
P( x i ≤ M e )=P (xi ≥ M e )= (4)
2

a) În cazul unei serii simple, determinarea medianei presupune ordonarea


crescătoare sau descrescătoare a valorilor individuale ale caracteristicii, după care se
identifică mediana astfel:
- dacă seria ordonată are un număr impar de termeni, mediana corespunde
n+1
cu valoarea individuală de rang , deci:
2
M e =x n+1 (5)
2

- dacă seria ordonată este alcătuită dintr-un număr par de termeni, mediana
se determină, în mod convențional, ca medie aritmetică între valoarea individuală de
rang []
n
2
și aceea de rang [ ]
n+ 1
2
, deci:

M =
( [ ] [ ])
x +x n
2
n+1
2 (6)
e
2

b) În cazul unei serii de distribuție de frecvențe analizăm situația seriei de


distribuție pe variante destincte și a seriei de distribuție pe intervale de variație.
În primul caz, mediana este acea valoare individuală a caracteristicii
k

corespunzătoare primei frecvențe cumulate crescător care depășește frecvența


∑ ni +1
i=1
2
.
Etapele de determinare a valorii mediane sunt următoarele:
- se determină intervalul median, adică intervalul care corespunde primei
frecvențe cumulate crescător care depașește ¿ ¿ ;
- în cadrul intervalului median, valoarea medianei se calculează prin interpolare
cu ajutorul relației:

[( ) ]
n m−1
1
2
∑ ni +1 − ∑ n i (7)
i=1 i=1
M e =x 0+ h ∙
nm

unde:
x 0 reprezintă limita inferioară a intervalului median;
h reprezintă mărimea intervalului median;
m reprezintă indexul intervalului median;
n m reprezintă frecvența intervalului median.

În concluzie, fiecare indicator prezentat ajută la interpretarea statistică a nivelului


și structurii seriei. În raport cu forma de repartiție a seriei se aleg indicatorii cu cea mai
mare încărcătură informațională, pentru caracterizarea seriilor empirice analizate.
Aceasta corespunde de fapt, principiilor statistice aplicate potrivit cărora nu există rețete
universale pentru calculul și interpretarea distribuțiilor statistice, ci doar particularizări
ale metodelor generale la aspectele concrete privind conținutul și forma de manifestare
a caracteristicilor la care se referă aceste serii. De aceea, alegerea celei mai
semnificative valori centrale cere, pe de o parte, o analiză atentă a distribuției, iar pe de
altă parte, luarea în considerare a principalelor particularități ale valorilor centrale.

II. APLICAȚIE

O anchetă cu privire la vârsta personalului dintr-o rețea de distribuție a condus la


următoarele rezultate:

Vârsta Nr. persoane


(ani)
Sub 20 10
20 - 30 25
30 - 40 40
40 - 50 50
50 - 60 15
Peste 60 ani 10
Total 150

Se cere: Să se reprezinte grafic această serie.

Rezolvare:
Histograma - distribuția celor 150 de persoane în funcție de vârstă

Frecvența absolută (numărul de persoane)


60

50

40

30

20

10

0
Sub 20 20 - 30 30 - 40 40 - 50 50 - 60 Peste 60 ani
Vârsta (intervalele sau clasele de vârstă)

Poligonul frecvențelor absolute - distribuția celor 150 de


angajați în funcție de vârstă
60
50
50
40
Numărul de angajați

40

30 25

20 15
10 10
10

0
10 20 30 40 50 60 70 80
Vârsta în ani (centrele intervalelor)

Reprezentarea grafică a seriei de distribuție de frecvențe pe intervale, adică


histograma și poligonul frecvențelor sugerează că distribuția are tendința de
normalitate, dar prezintă asimetrie la stanga, coada poligonului frevențelor absolute fiind
mai alungită spre stanga.

Bibliografie

1. Biji, Maria Elena și alții. Statistică pentru economiști. Editura Economică, București 2010
2. Korka, Mihai și alții. Aplicații statistice. Editura Bucovina viitoare, Suceava 2002

S-ar putea să vă placă și