Sunteți pe pagina 1din 4

Statistică AS, II

Curs 7

Indicatori numerici ai distribuţiilor statistice

Aşa cum am văzut, analiza de frecvenţe este o metodă utilă pentru punerea în valoare a
unor caracteristici ale distribuţiilor statistice. Cu toate acestea, ea este tributară necesităţii
de a manipula întreaga cantitate de date, toate valorile unei distribuţii (fie ele şi grupate).
Pentru a elimina acest neajuns sunt utilizaţi aşa numiţii indicatori sintetici. Aceştia sunt
descriptori numerici care condensează într-o valoare unică o anumită caracteristică a unei
întregi distribuţii de valori. Principalele avantaje pe care le oferă sunt concentrarea
semnificaţiei şi uşurinţa utilizării. În acelaşi timp, însă, trebuie să avem în vedere că, prin
natura lor sintetică, fiecare indicator pierde o anumită cantitate de informaţie care ţine de
alte caracteristici, pe care nu le surprinde.

Tipuri de indicatori sintetici:

Trei sunt caracteristicile distribuţiilor care sunt evaluate cu ajutorul indicatorilor sintetici:
tendinţa centrală, variabilitatea (împrăştierea, diversitatea), forma distribuţiei. Pentru fiecare
din aceste caracteristici se utilizează anumiţi indicatori specifici:
- Indicatori ai tendinţei centrale. Aceştia sunt valori tipice, reprezentative, care
descriu distribuţia în întregul ei;
- Indicatori ai variabilităţii. Sunt valori care descriu caracteristica de împrăştiere a
distribuţiei. O distribuţie care conţine aceeaşi valoare, ori de câte ori s-ar repeta ea,
are o variabilitate zero.
- Indicatori ai formei distribuţiei. Sunt valori care se referă la forma curbei de
reprezentare grafică a distribuţiei, prin comparaţie cu o curbă normală (oblicitate,
aplatizare)

Indicatorii tendinţei centrale

MODUL (Mo)

Modul este expresia cea mai directă a valorii tipice (reprezentative). În cazul unei
distribuţii simple, este valoarea cu frecvenţa cea mai mare de apariţie. În cazul unei
distribuţii de frecvenţe grupate, este clasa de interval cu frecvenţa cea mai mare de
apariţie.
Modul se află prin alcătuirea tabelei de frecvenţe (simple sau grupate) şi este valoarea
căreia îi corespunde frecvenţa absolută cea mai ridicată. Distribuţiile pot avea un singur
mod (unimodale), două moduri (bimodale) sau mai multe (multimodale)

- Exemplu: În seria de valori 5,8,3,2,5,4, Mo=5 (apare de cele mai multe ori).
Statistică AS, II

MEDIANA (Me)

Mediana este valoarea „din mijlocul” unei distribuţii, adică aceea care are 50% dintre valori
deasupra ei şi 50% dintre valori dedesubtul ei. Cu alte cuvinte, mediana este, în acelaşi
timp, percentila 50.
Mediana se găseşte prin alcătuirea tabelei de frecvenţe, în coloana frecvenţelor relative
procentuale cumulate, şi corespunde valorii de 50%. În cazul distribuţiilor cu număr impar
de valori, Me este chiar valoarea respectivă. În cazul distribuţiilor pare, Me se calculează ca
medie a celor două valori din mijlocul distribuţiei.

Exemplu: În seria de valori 5,8,3,2,5,4, ordonată crescător (2,3,4,5,5,8), Me=4,5 (ca medie
a valorilor 4 şi 5 aflate în mijlocul unei distribuţii pare). Dacă distribuţia noastră ar fi avut 5
valori (fără 2, de exemplu), Me=5.

MEDIA ARITMETICĂ (m)

Media este raportul dintre suma valorilor distribuţiei şi numărul acestora.


Notaţiile uzuale pentru medie sunt:
 µ (miu), atunci când este media întregii populaţii de referinţă
 m, atunci când se calculează pentru un eşantion (cazul cel mai frecvent)
Calcularea mediei pentru o distribuţie simplă de frecvenţe se face prin adunarea valorilor şi
împărţirea la numărul lor
Exemplu: Pentru distribuţia 5,8,3,2,5,4

Calcularea mediei pentru o distribuţie de frecvenţe grupate se face prin suma produsului
dintre fiecare valoare şi frecvenţa ei, care apoi se împarte la suma frecvenţelor (numărul
valorilor).
Exemplu: Pentru distribuţia: 5,8,3,3,3,2,4,2,3,5,4

NOTĂ: În expresia de mai sus:


X este variabila. ∑ X se înţelege ca „Sumă de la X1 la XN (numărul valorilor)
f este frecvenţa . ∑ f se înţelege ca „Sumă de la f1 la fk (unde k numărul grupelor de
frecvenţă)

Proprietăţile mediei aritmetice

Adăugarea\scăderea unei constante la fiecare valoare a distribuţiei, măreşte\scade media cu


acea valoare.

 Înmulţirea\împărţirea fiecărei valori a distribuţiei cu o constantă,


multiplică\divide media cu acea constantă.
 Suma abaterii valorilor de la medie este întotdeauna egală cu zero. o Suma pătratului
abaterilor de la medie va fi întotdeauna mai mică decât suma pătratelor abaterilor în
raport cu oricare alt punct al distribuţiei .

În final, prezentăm un exemplu ilustrativ de calcul al modului, medianei şi mediei pe o distribuţie


X de N=15 valori.N=15
Statistică AS, II

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
60 45 22 20 16 16 16 15 14 14 14 12 12 12 12

Media=20 Mediana =15 Modul = 12

ΣX/N=300/15 (N+1)/2 =8 (valoarea cea mai frecventă)

Valorile de mai sus arată cât de diferită poate fi uneori imaginea pe care o prezintă cei trei
indicatori cu privire la tendinţa centrală a unei distribuţii, în ciuda faptului că fiecare dintre ei se
referă la tendinţa centrală.

Valori nedeterminate şi clase deschise

Valorile „nedeterminate” sunt acele valori a căror mărime nu decurge din procesul de
măsurare, în acelaşi mod în care rezultă oricare valoare a seriei (Exemplu: La testul de
asociere verbală, dacă subiectul depăşeşte, să zicem 10 sec., se înregistrează valoarea 10,
fără a se aştepta, la infinit (?), un răspuns). Categorii „deschise” sunt acele categorii de
valori care au una dintre limite „liberă” (Exemplu: Câte ţigări fumezi zilnic? Se poate
înregistra numărul ţigărilor ca atare, dar ultima valoare este „30 sau mai mult).
În ambele situaţii de mai sus, utilizarea mediei este nesigură (şi incorectă). Indicatorul
recomandabil este mediana.
Tabloul de mai jos prezintă, în mod sintetic avantajele şi dezavantajele specifice
indicatorilor tendinţei centrale:
AVANTAJE DEZAVANTAJE
-Uşor de calculat - În general, nesigur, mai ales în cazul
(nesemnificativ în eşantioanelor mici, când se poate
prezent); modifica dramatic la o modificare
- Poate fi utilizat pentru minoră a unei valori;
orice tip de scală; - Poate fi greşit interpretat. Se identifică
MODUL
- Este singurul indicator total cu un scor anume, fără a spune
pentru scale nominale; nimic despre celelalte valori;
- Corespunde - Nu poate fi utilizat în statistici
unui scor real al inferenţiale;
distribuţiei;
- Poate fi utilizată pe - Poate să nu corespundă unei valori
scale ordinale şi de reale (N par);
interval\raport; - Nu reflectă valorile distribuţiei (un scor
- Poate fi utilizată şi pe extrem se poate modifica, fără a afecta
MEDIANA distribuţii de frecvenţă Me);
cu clase deschise sau - Este mai puţin sigură în
scoruri nedeterminate la extrapolarea de la eşantion la
marginile distribuţiei; populaţie;
- Greu de utilizat în statistici avansate.
- Reflectă valorile - De obicei nu corespunde unei valori
întregii distribuţii; reale;
-Are multe proprietăţi - Nu este tocmai adecvată pentru scale
statistice ordinale;
MEDIA dezirabile; - Conduce la interpretări greşite pe
- Adecvată pentru distribuţii
utilizare în statistici asimetrice;
avansate; - Poate fi puternic afectată de
scorurile extreme;
Statistică AS, II