Sunteți pe pagina 1din 39

GRUPAREA MATERIALULUI

STATISTIC.
SERIA STATISTIC DE
VARIAIE.
INDICATORII TENDINEI
CENTRALE
Subiecte n discuie
1. Clasificarea i gruparea datelor
statistice
2. Seria statistic de variaie,
particulariti, indicatori ai
seriei
3. Indicatorii medii
PRELUCRAREA PRIMAR A DATELOR
STATISTICE
Datele statistice obinute n timpul observrii sunt,
de regul, variate i de volum mare. Ele trebuie
sistematizate, centralizate i grupate pentru a fi
pregtite n vederea prelucrrii. Numai n urma
prelucrrii statistice pot fi evideniate trsturile i
tendinele eseniale din evoluia fenomenelor i
proceselor medico -sociale.

Prelucrarea primar a datelor statistice culese


cuprinde operaiile de clasificare, grupare,
centralizare, agregare, calcul de caracteristici
derivate, precum i construirea de tabele, serii i
grafice statistice.
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
Unitile colectivitii observate sunt repartizate
n clase cu caracter omogen.

Aceast operaie permite restrngerea volumului


mare de date iniiale i evideniaz structura
colectivitii analizate.

Prin grupare se pierde o parte din informaia


iniial, n schimb se nlesnete cunoaterea
proprietilor eseniale ale colectivitii i
nelegerea legturilor dintre caracteristicile
utilizate.
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE

Clasificarea trebuie s respecte mai multe reguli:


a) completitudinea toate unitile statistice s
fie incluse n clasele formate n urma clasificrii;
b) omogenitatea a include ntr-o clas numai
elemente de acelai tip;
c) unicitatea fiecare element s aparin unei
singure clase;
d) continuitatea variaiei s nu existe clase cu
frecven nul n cazul variabilelor cu variaie
continu.
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE

1. n funcie de numrul caracteristicilor


utilizate, gruprile pot fi simple sau
combinate.

a. Gruprile simple sunt cele realizate


dup o singur caracteristic de
grupare.

b. Gruprile combinate vizeaz simultan


dou sau mai multe caracteristici de
grupare.
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE

2. Dup coninutul caracteristicii


de grupare deosebim grupri:

a. cronologice
b. teritoriale
c. de persoan
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
3. Dup modul de variaie a
caracteristicii, gruparea se poate face:

a. pe variante
b. pe intervale egale de variaie
sau
c. pe intervale inegale de variaie
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE

Gruparea pe intervale egale presupune


urmtoarele operaiuni:
stabilirea caracteristicii de grupare;
calcularea amplitudinii variaiei;
stabilirea mrimii intervalului de grupare;
precizarea limitelor superioare i inferioare ale
intervalelor de grupare;
determinarea numrului unitilor statistice care
sunt incluse n fiecare interval.
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE

Amplitudinea variaiei (A) se stabilete ca


diferen ntre valoarea maxim (xmax) i
valoarea minim (xmin) nregistrat de
caracteristica respectiv:
A = xmax xmin

Mrimea intervalului de grupare (h) se


determin pe baza raportului dintre amplitudinea
variaiei (A) i numrul de grupe (k) ales:
h = A/k
CLASIFICAREA I GRUPAREA
DATELOR STATISTICE

Intervalele de grupare se definesc prin


precizarea limitei inferioare i superioare.

Determinarea primului interval de grupare


pornete de la valoarea minim a
caracteristicii (limita inferioar) la care se
adaug mrimea intervalului de grupare,
obinndu-se limita superioar.
2. SERIA STATISTIC DE VARIAIE

- Seria statistic de variaie este irul de valori


numerice ale caracteristicii, ordonate cresctor
sau descresctor n funcie de mrimea acestora.
Seria de variaie reprezint corespondena a
dou iruri: cel al variantelor caracteristicii sau
intervalelor de valori ale variantelor (x) i cel al
frecvenelor (f), motiv pentru care se mai
numete i serie de frecvene. Suma frecvenelor
variantelor corespunztoare corespunde cu
numrul de cazuri cercetate ( f = n).
PARTICULARITILE SERIEI DE
VARIAIE

omogenitatea termenilor: variantele


individuale sunt de aceeai natur i cu
valori apropriate, fiind determinate n
cea mai mare msur de aciunea
acelorai factori eseniali;
independena termenilor seriei: fiecare
valoare este specific unui element al
colectivitii i nu depinde de valoarea
nregistrat la celelalte elemente;
PARTICULARITILE SERIEI DE
VARIAIE
variabilitatea valorilor individuale: aciunea mai
puternic a unor factori ntmpltori determin
abaterea mrimilor individuale de la tendina
central impus de factorii eseniali;

forma repartiiei: deriv din modalitatea specific


de combinare a influenelor factorilor eseniali i
neeseniali; exist serii cu o repartiie relativ
uniform a frecvenelor i altele cu unul sau mai
multe puncte de concentrare.
INDICATORI AI SERIEI DE VARIAIE

Analiza complet a seriilor de distribuie a frecvenelor


presupune calcularea urmtorilor indicatori:
A. indicatori de nivel i de frecvene;
B. indicatori medii: media aritmetic, ptratic, armonic,
geometric, cronologic; mediana, modul, cuartile, decile,
centile;
C. indicatori simpli i sintetici ai variaiei: amplitudinea
variaiei, abateri individuale, abatere medie liniar, abaterea
medie ptratic (abaterea standard, abaterea tip), dispersia
(variana), coeficientul de variaie;
D. indicatori ai asimetriei;
E. indicatori ai concentrrii.
INDICATORII MEDII

Indicatorii medii sunt mrimi tipice, caracteristice,


ce definesc un fenomen variabil.

Pentru ca indicatorii medii s aib coninut


real i s fie reprezentativi pentru
colectivitatea analizat este necesar s fie
ndeplinite cteva condiii:
omogenitatea colectivitii;
volum suficient de mare de date individuale;
forma adecvat a indicatorului.
MEDIA
Media este un indicator al tendinei
centrale care arat nivelul la care ar fi
ajuns caracteristica dac n toate cazurile
individuale factorii eseniali i neeseniali
ar fi acionat constant.
Este valoarea tipic pentru reprezentarea
unei colectiviti, dar este posibil s nu
coincid cu nici una din valorile
individuale nregistrate de caracteristic
n colectivitatea respectiv.
MEDIA
Dup Yule i Kendall condiiile pe care
trebuie s le ndeplineasc o mrime
medie ar fi:
- S fie definit n mod precis,
independent de dorina utilizatorului;
- S fie expresia, sinteza tuturor
observaiilor nregistrate;
- S posede proprieti simple, evidente,
clare chiar i pentru nespecialiti;
- S fie simplu i rapid de calculat;
- S fie puin sensibil la fluctuaiile de
selecie;
- S poat fi studiat rapid cu ajutorul
calcului algebric.
MEDIA ARITMETIC simpl

Media aritmetic simpl este valoarea


medie care se obine prin divizarea
sumei valorilor individuale dintr-o
colectivitate omogen, la numrul total
al cazurilor studiate.
MEDIA ARITMETIC ponderat

Media aritmetic ponderat este


valoarea medie care se obine din suma
produsului valorilor dintr-o colectivitate
omogen, cu frecvenele corespunztoare,
divizat la numrul total al cazurilor
studiate.
n cazul n care unitile nu sunt grupate pe variante, ci
pe intervale de variaie, xi reprezint centrul de interval.
Centrul fiecrui interval se determin ca medie
aritmetic simpl ntre limita superioar i limita
inferioar a intervalului respectiv.
PROPRIETILE MEDIEI ARITMETICE

1) Definiia dat mediei aritmetice este valabil


numai dac valorile individuale nregistrate sunt
numerice. Pentru o serie cu valori nenumerice
nu se poate calcula media aritmetic;
2) Mrimea mediei aritmetice calculate este
unic; o serie nu posed mai multe medii
aritmetice distincte;
3) Mrimea mediei aritmetice poate sau nu s
coincid cu vreo valoare individual nregistrat;
PROPRIETILE MEDIEI ARITMETICE

4) Media are ntotdeauna valoarea cuprins

ntre valoarea minim din serie (Xmin) i

valoarea maxim (Xmax);

5) Suma abaterilor valorilor individuale de

la media lor este ntotdeauna egal cu

zero (adic distanele fa de centru se

balanseaz, se compenseaz reciproc);


PROPRIETILE MEDIEI ARITMETICE

6) Media aritmetic este legat de toate


valorile numerice nregistrate i, n
consecin, este sensibil la prezena
valorilor aberante.
7) Dac o serie este alctuit din mai multe
serii componente, pentru care s-au
calculat medii pariale, atunci media
ntregii serii poate fi calculat ca o medie
ponderat din mediile pariale.
MEDIA ARMONIC

Se mai numete momen de ordin -1


Pentru un ir simplu de valori: n
xh
1
x
i

Pentru o serie de frecvene sau de date grupate pe


intervale de grupare x arm
n
1
x f
i
MEDIA GEOMETRIC
Se utilizeaz atunci, cnd valorile seriei sunt
dispuse n progresie geometric. Este cazul mediei
unor titruri (utilizate n microbiologie, virusologie,
imunologie, serologie) care se succed n proporie
geometric: 1/2; 1/4; 1/8; 1/16; 1/32; 1/64 etc.
n aceste cazuri se calculeaz media geometric a
numitorilor titrurilor.

n cazul mediei geometrice se face produsul


termenilor seriei, din care se extrage rdcina de
un indice egal cu numrul termenilor seriei.
INDICATORI DE POZIIE
Mediile se calculeaz pe baza tuturor valorilor
individuale ale seriei, ceea ce le face sensibile la
valorile extreme, mai puin semnificative.

Uneori, valorile extreme ale seriei sunt excesiv de


ndeprtate de centrul seriei, ceea ce afecteaz n
mare msur reprezentativitatea mediei.

Alteori, unitile seriei au tendina de a se


concentra la una din extremitile seriei, rezultnd
distribuii asimetrice la dreapta sau la stnga.

Pentru aceasta se calculeaz indicatorii medii de


poziie (de structur):
mediana; cuartilele; decilele; modulul.
MEDIANA
Mediana este acea valoare a unei serii statistice
ordonate cresctor sau descresctor, care mparte
seria n dou pri egale.

Mediana este valoarea din centrul seriei: jumtate


din termeni sunt mai mici sau egali cu mediana,
jumtate sunt mai mari sau egali.

Mediana este o mrime care depinde n primul rnd


de numrul termenilor. Se mai numete medie de
poziie.
MEDIANA

Pentru seriile simple, mediana este


termenul din mijloc (dac seria are numr
impar de termeni) sau se determin, n
mod convenional, ca medie aritmetic
simpl a celor dou valori din centrul
seriei, dac numrul termenilor este par
Spre deosebire de medie, mediana nu este
influenat de valorile extreme ale seriei;
de aceea ea poate nlocui cu succes media
atunci cnd apar valori aberante!
CUARTILE, DECILE, CENTILE

Cuartilele sunt valori care mpart seria


statistic n 4 pri egale (Q1 Q3 ).
Decilele sunt mrimile care mpart seria
statistic n 10 pri egale (D1 D9).
Centilele sunt mrimile care mpart seria
statistic n 100 de pri egale (C1 C99).
Decilele i, mai ales, centilele se
calculeaz doar pentru seriile statistice cu
numr mare de grupe i cu amplitudine
mare a variaiei. Aceti indicatori sunt
utilizai ndeosebi pentru seriile pronunat
asimetrice.
MODULUL (DOMINANTA)

Definiie: Valoarea modal este valoarea


cel mai frecvent ntlnit n cadrul
colectivitii statistice analizate
Avantaje:
Poate fi calculat pentru variabile calitative
(exprimate prin cuvinte) (de ex.: culoarea
ochilor, culoarea prului, starea civil etc.)
ansele ca rezultatul s fie o valoare
existent n realitate sunt mult mai mari
dect la medii
MODULUL

n cazul seriilor de variaie grupate modulul se


calculeaz dup formula:
1
Mo = XMo +h
1 + 2
unde:
XMo limita inferioar a intervalului modal;
h mrimea intervalului modal (cu frecvena cea
mai mare);
1 diferena dintre frecvena intervalului modal
i a intervalului precedent;
2 diferena dintre frecvena intervalului modal
i a intervalului urmtor;
MODULUL

Se consider urmtoarea distribuie:

Salariu Medici
400-600 5
600-800 10
800-1000 15
1000-1200 30


1200-1400 20

(30 15) 15
Mo1.000200(3015)(3020)1.000200251.120
MODULUL
Observaii:

1) Pe graficul repartiiei statistice valoarea


modal corespunde punctului n care graficul i
atinge maximul;

2) Are avantajul principal fa de medie i


cuantile c se determin rapid si are o
semnificaie simpl;

3) Exist n practic serii fr modul, precum i


serii bimodale sau plurimodale. Aceasta impune
separarea unitilor colectivitii n dou
distribuii de frecvene.
MODULUL

Serie de date unimodal:

Nota f
1 5
2 7
3 12
4 20
5 38
6 46
7 37
8 20
9 10
10 5
Total 200
MODULUL

Serie de date
bimodal:
Nota f
1 5
2 13
3 22
4 41
5 14
6 7
7 25
8 41
9 27
10 11
Total 200
INDICATORII ASIMETRIEI

Seriile empirice cu care lucreaz statistica


tind deseori ctre modelul repartiiei
normale, care este o distribuie perfect
simetric.
Distribuia perfect simetric se
caracterizeaz prin egalitatea dintre medie,
median i modul. Frecvenele se distribuie
simetric la dreapta i la stnga valorii centrale,
care are frecvena maxim. Graficul are form
de clopot
INDICATORII ASIMETRIEI

Asimetria pozitiv este caracteristic


acelor colectiviti n care predomin
valorile mici ale caracteristicii, de unde
rezult urmtoarea relaie de inegalitate:
Mo < Me < X .
Pentru acest tip de distribuie de
frecvene, media reprezint mai bine
valorile mici ale seriei, care sunt
predominante; dimpotriv, valorile mari
sunt mult distanate fa de medie.
INDICATORII ASIMETRIEI

Asimetria negativ este specific seriilor de


distribuie de frecvene n care predomin
valorile mari ale caracteristicii, astfel nct:

x < Me < Mo

n acest caz, media este semnificativ


pentru valorile mari ale caracteristicii;
termenii cu valori mici ai seriei statistice nu
sunt bine reprezentai.
INDICATORII ASIMETRIEI

Distribuiile de frecvene care sunt


numai uor asimetrice verific
urmtoarea legtur ntre medie,
median i modul:

Mo = x 3( x Me ).

S-ar putea să vă placă și