Sunteți pe pagina 1din 39

GRUPAREA MATERIALULUI

STATISTIC.
SERIA STATISTIC DE
VARIAIE.
INDICATORII TENDINEI
CENTRALE

Subiecte n discuie
1. Clasificarea i gruparea datelor
statistice
2. Seria statistic de variaie,
particulariti, indicatori ai
seriei
3. Indicatorii medii

PRELUCRAREA PRIMAR A DATELOR


STATISTICE
Datele statistice obinute n timpul observrii sunt,
de regul, variate i de volum mare. Ele trebuie
sistematizate, centralizate i grupate pentru a fi
pregtite n vederea prelucrrii. Numai n urma
prelucrrii statistice pot fi evideniate trsturile i
tendinele eseniale din evoluia fenomenelor i
proceselor medico -sociale.
Prelucrarea primar a datelor statistice culese
cuprinde
operaiile
de
clasificare,
grupare,
centralizare, agregare, calcul de caracteristici
derivate, precum i construirea de tabele, serii i
grafice statistice.

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
Unitile colectivitii observate sunt repartizate
n clase cu caracter omogen.
Aceast operaie permite restrngerea volumului
mare de date iniiale i evideniaz structura
colectivitii analizate.
Prin grupare se pierde o parte din informaia
iniial, n schimb se nlesnete cunoaterea
proprietilor
nelegerea
utilizate.

eseniale
legturilor

ale
dintre

colectivitii

caracteristicile

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
Clasificarea trebuie s respecte mai multe reguli:
a) completitudinea toate unitile statistice s
fie incluse n clasele formate n urma clasificrii;
b) omogenitatea a include ntr-o clas numai
elemente de acelai tip;
c) unicitatea fiecare element s aparin unei
singure clase;
d) continuitatea variaiei s nu existe clase cu
frecven nul n cazul variabilelor cu variaie
continu.

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
1. n funcie de numrul caracteristicilor
utilizate, gruprile pot fi simple sau
combinate.
a. Gruprile simple sunt cele realizate
dup o singur caracteristic de
grupare.
b. Gruprile combinate vizeaz simultan
dou sau mai multe caracteristici de
grupare.

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
2. Dup coninutul caracteristicii
de grupare deosebim grupri:
a. cronologice
b. teritoriale
c. de persoan

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
3.
Dup
modul
de
variaie
a
caracteristicii, gruparea se poate face:

a. pe variante
b. pe intervale egale de variaie
sau
c. pe intervale inegale de variaie

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
Gruparea
pe
intervale
urmtoarele operaiuni:

egale

presupune

stabilirea caracteristicii de grupare;


calcularea amplitudinii variaiei;
stabilirea mrimii intervalului de grupare;
precizarea limitelor superioare i inferioare ale
intervalelor de grupare;
determinarea numrului unitilor statistice care
sunt incluse n fiecare interval.

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
Amplitudinea variaiei (A) se stabilete ca
diferen ntre valoarea maxim (xmax) i
valoarea
minim
(xmin)
nregistrat
de
caracteristica respectiv:
A = xmax xmin
Mrimea intervalului de grupare (h) se
determin pe baza raportului dintre amplitudinea
variaiei (A) i numrul de grupe (k) ales:
h = A/k

CLASIFICAREA I GRUPAREA
DATELOR STATISTICE
Intervalele de grupare se definesc prin
precizarea limitei inferioare i superioare.
Determinarea primului interval de grupare
pornete

de

la

valoarea

minim

caracteristicii (limita inferioar) la care se


adaug

mrimea

intervalului

obinndu-se limita superioar.

de

grupare,

2. SERIA STATISTIC DE VARIAIE


-

Seria statistic de variaie este irul de valori


numerice ale caracteristicii, ordonate cresctor
sau descresctor n funcie de mrimea acestora.

Seria de variaie reprezint corespondena a


dou iruri: cel al variantelor caracteristicii sau
intervalelor de valori ale variantelor (x) i cel al
frecvenelor

(f),

motiv

pentru

care

se

mai

numete i serie de frecvene. Suma frecvenelor


variantelor

corespunztoare

corespunde

numrul de cazuri cercetate ( f = n).

cu

PARTICULARITILE SERIEI DE
VARIAIE
omogenitatea

termenilor:

variantele

individuale sunt de aceeai natur i cu


valori apropriate, fiind determinate n
cea

mai

mare

msur

de

aciunea

acelorai factori eseniali;


independena termenilor seriei: fiecare
valoare este specific unui element al
colectivitii i nu depinde de valoarea
nregistrat la celelalte elemente;

PARTICULARITILE SERIEI DE
VARIAIE
variabilitatea valorilor individuale: aciunea mai
puternic a unor factori ntmpltori determin
abaterea mrimilor individuale de la tendina
central impus de factorii eseniali;

forma repartiiei: deriv din modalitatea specific


de combinare a influenelor factorilor eseniali i
neeseniali; exist serii cu o repartiie relativ
uniform a frecvenelor i altele cu unul sau mai
multe puncte de concentrare.

INDICATORI AI SERIEI DE VARIAIE


Analiza complet a seriilor de distribuie a frecvenelor
presupune calcularea urmtorilor indicatori:
A. indicatori de nivel i de frecvene;
B. indicatori medii: media aritmetic, ptratic, armonic,
geometric, cronologic; mediana, modul, cuartile, decile,
centile;
C. indicatori simpli i sintetici ai variaiei: amplitudinea
variaiei, abateri individuale, abatere medie liniar, abaterea
medie ptratic (abaterea standard, abaterea tip), dispersia
(variana), coeficientul de variaie;
D. indicatori ai asimetriei;
E. indicatori ai concentrrii.

INDICATORII MEDII
Indicatorii medii sunt mrimi tipice, caracteristice,
ce definesc un fenomen variabil.

Pentru ca indicatorii medii s aib coninut


real i s fie reprezentativi pentru
colectivitatea analizat este necesar s fie
ndeplinite cteva condiii:

omogenitatea colectivitii;
volum suficient de mare de date individuale;
forma adecvat a indicatorului.

MEDIA
Media

este

un

indicator

al

tendinei

centrale care arat nivelul la care ar fi


ajuns caracteristica dac n toate cazurile
individuale factorii eseniali i neeseniali
ar fi acionat constant.
Este valoarea tipic pentru reprezentarea
unei colectiviti, dar este posibil s nu
coincid cu nici una din valorile
individuale nregistrate de caracteristic
n colectivitatea respectiv.

MEDIA
Dup Yule i Kendall condiiile pe care
trebuie s le ndeplineasc o mrime
medie ar fi:
S
fie
definit
n
mod
precis,
independent de dorina utilizatorului;
S
fie
expresia,
sinteza
tuturor
observaiilor nregistrate;
- S posede proprieti simple, evidente,
clare chiar i pentru nespecialiti;
- S fie simplu i rapid de calculat;
- S fie puin sensibil la fluctuaiile de
selecie;
- S poat fi studiat rapid cu ajutorul
calcului algebric.

MEDIA ARITMETIC simpl

Media aritmetic simpl este valoarea


medie care
sumei

se

valorilor

obine

prin

individuale

divizarea
dintr-o

colectivitate omogen, la numrul total


al cazurilor studiate.

MEDIA ARITMETIC ponderat


Media

aritmetic

ponderat

este

valoarea medie care se obine din suma


produsului

valorilor

dintr-o

colectivitate

omogen, cu frecvenele corespunztoare,


divizat

la

numrul

total

al

cazurilor

studiate.
n cazul n care unitile nu sunt grupate pe variante, ci
pe intervale de variaie, xi reprezint centrul de interval.
Centrul

fiecrui

aritmetic

simpl

interval

se

ntre

limita

inferioar a intervalului respectiv.

determin
superioar

ca
i

medie
limita

PROPRIETILE MEDIEI ARITMETICE


1) Definiia dat mediei aritmetice este valabil
numai dac valorile individuale nregistrate sunt
numerice. Pentru o serie cu valori nenumerice
nu se poate calcula media aritmetic;
2) Mrimea mediei aritmetice calculate este
unic; o serie nu posed mai multe medii
aritmetice distincte;
3) Mrimea mediei aritmetice poate sau nu s
coincid cu vreo valoare individual nregistrat;

PROPRIETILE MEDIEI ARITMETICE


4) Media are ntotdeauna valoarea cuprins
ntre valoarea minim din serie (Xmin) i
valoarea maxim (Xmax);
5) Suma abaterilor valorilor individuale de
la media lor este ntotdeauna egal cu
zero (adic distanele fa de centru se
balanseaz, se compenseaz reciproc);

PROPRIETILE MEDIEI ARITMETICE


6) Media aritmetic este legat de toate
valorile

numerice

consecin,

este

nregistrate
sensibil

la

i,

prezena

valorilor aberante.
7) Dac o serie este alctuit din mai multe
serii

componente,

calculat

medii

pentru

pariale,

care

atunci

s-au
media

ntregii serii poate fi calculat ca o medie


ponderat din mediile pariale.

MEDIA ARMONIC

Se mai numete momen de ordin -1


Pentru un ir simplu de valori:

xh

n
1
x
i

Pentru o serie de frecvene sau de date grupate pe


intervale de grupare

x arm

1
x f
i

MEDIA GEOMETRIC

Se utilizeaz atunci, cnd valorile seriei sunt


dispuse n progresie geometric. Este cazul mediei
unor titruri (utilizate n microbiologie, virusologie,
imunologie, serologie) care se succed n proporie
geometric: 1/2; 1/4; 1/8; 1/16; 1/32; 1/64 etc.
n aceste cazuri se calculeaz media geometric a
numitorilor titrurilor.

n cazul mediei geometrice se face produsul


termenilor seriei, din care se extrage rdcina de
un indice egal cu numrul termenilor seriei.

INDICATORI DE POZIIE
Mediile se calculeaz pe baza tuturor valorilor
individuale ale seriei, ceea ce le face sensibile la
valorile extreme, mai puin semnificative.
Uneori, valorile extreme ale seriei sunt excesiv de
ndeprtate de centrul seriei, ceea ce afecteaz n
mare msur reprezentativitatea mediei.
Alteori, unitile seriei au tendina de a se
concentra la una din extremitile seriei, rezultnd
distribuii asimetrice la dreapta sau la stnga.
Pentru aceasta se calculeaz indicatorii medii de
poziie (de structur):
mediana; cuartilele; decilele; modulul.

MEDIANA
Mediana este acea valoare a unei serii statistice
ordonate cresctor sau descresctor, care mparte
seria n dou pri egale.

Mediana este valoarea din centrul seriei: jumtate


din termeni sunt mai mici sau egali cu mediana,
jumtate sunt mai mari sau egali.

Mediana este o mrime care depinde n primul rnd


de numrul termenilor. Se mai numete medie de
poziie.

MEDIANA
Pentru

seriile

simple,

mediana

este

termenul din mijloc (dac seria are numr


impar de termeni) sau se determin, n
mod convenional, ca medie aritmetic
simpl a celor dou valori din centrul
seriei, dac numrul termenilor este par
Spre deosebire de medie, mediana nu este
influenat de valorile extreme ale seriei;
de aceea ea poate nlocui cu succes media
atunci cnd apar valori aberante!

CUARTILE, DECILE, CENTILE


Cuartilele sunt valori care mpart seria
statistic n 4 pri egale (Q1 Q3 ).
Decilele sunt mrimile care mpart seria
statistic n 10 pri egale (D1 D9).
Centilele sunt mrimile care mpart seria
statistic n 100 de pri egale (C1 C99).
Decilele i, mai ales, centilele se
calculeaz doar pentru seriile statistice cu
numr mare de grupe i cu amplitudine
mare a variaiei. Aceti indicatori sunt
utilizai ndeosebi pentru seriile pronunat
asimetrice.

MODULUL (DOMINANTA)

Definiie: Valoarea modal este valoarea

cel mai frecvent ntlnit n cadrul


colectivitii statistice analizate

Avantaje:
Poate fi calculat pentru variabile calitative
(exprimate prin cuvinte) (de ex.: culoarea
ochilor, culoarea prului, starea civil etc.)
ansele ca rezultatul s fie o valoare
existent n realitate sunt mult mai mari
dect la medii

MODULUL
n cazul seriilor de variaie grupate modulul se
calculeaz dup formula:
1
Mo = XMo +h
1 + 2
unde:
XMo limita inferioar a intervalului modal;
h mrimea intervalului modal (cu frecvena cea
mai mare);
1 diferena dintre frecvena intervalului modal
i a intervalului precedent;
2 diferena dintre frecvena intervalului modal
i a intervalului urmtor;

MODULUL
Se consider urmtoarea distribuie:
Salariu

Medici

400-600

600-800

10

800-1000

15

1000-1200

30

(
3
0

1
5
)
1
5
Mo1.000200(3015)(3020)1.000200251.120
1200-1400

20

MODULUL
Observaii:
1)

Pe

graficul

repartiiei

statistice

valoarea

modal corespunde punctului n care graficul i


atinge maximul;
2) Are avantajul principal fa de medie i
cuantile

se

determin

rapid

si

are

semnificaie simpl;
3) Exist n practic serii fr modul, precum i
serii bimodale sau plurimodale. Aceasta impune
separarea unitilor colectivitii n dou
distribuii de frecvene.

MODULUL

Serie de date unimodal:


Nota

12

20

38

46

37

20

10

10

Total

200

MODULUL

Serie de date
bimodal:
Nota

Total

f
1

13

22

41

14

25

41

27

10

11
200

INDICATORII ASIMETRIEI
Seriile empirice cu care lucreaz statistica
tind

deseori

ctre

modelul

repartiiei

normale, care este o distribuie perfect


simetric.
Distribuia

perfect

simetric

se

caracterizeaz prin egalitatea dintre medie,


median i modul. Frecvenele se distribuie
simetric la dreapta i la stnga valorii centrale,
care are frecvena maxim. Graficul are form
de clopot

INDICATORII ASIMETRIEI
Asimetria
acelor

pozitiv

colectiviti

este
n

caracteristic

care

predomin

valorile mici ale caracteristicii, de unde


rezult urmtoarea relaie de inegalitate:
Mo < Me < X .
Pentru

acest

frecvene,
valorile

tip

media
mici

ale

de

distribuie

reprezint
seriei,

mai
care

de
bine
sunt

predominante; dimpotriv, valorile mari


sunt mult distanate fa de medie.

INDICATORII ASIMETRIEI
Asimetria negativ este specific seriilor de
distribuie de frecvene n care predomin
valorile mari ale caracteristicii, astfel nct:
x < Me < Mo
n

acest

pentru

caz,

valorile

media
mari

este
ale

semnificativ
caracteristicii;

termenii cu valori mici ai seriei statistice nu


sunt bine reprezentai.

INDICATORII ASIMETRIEI

Distribuiile
numai

de

uor

urmtoarea

frecvene

care

asimetrice
legtur

ntre

median i modul:
Mo = x 3( x Me ).

sunt

verific
medie,