Sunteți pe pagina 1din 5

Biostatistica

curs 7

Măsurile valorilor centrale

Parametrii urmăriţi în analiza unei serii statistice sunt:

Media aritmetică:
Se aplică datelor care au valori numerice; se obţine făcând raportul dintre suma tuturor
valorilor şi numărul acestora.
Ex: Vom calcula media aritmetică a următoarei serii de valori:
39, 42, 73, 67, 24 , 55.
Aceasta va fi: (39 + 42 +73 +67 + 24 + 55) / 6

În cazul general: avand observaţiile x1 , x2 , … , xn , media aritmetică se va calcula cu


formula:

unde n=nr observatiilor seriei


Mediana:
Când observaţiile sunt aşezate în ordine (descendentă sau ascendentă),
mediana va fi valoarea care împarte grupul de valori în două părţi egale.

Ex. 1: Avem seria de valori:


C, E, B, D, A, A, B, F, C, C, D.
Le vom aranja în ordine ascendentă:

A, A, B, B, C, C, C, D, D, E, F.
Mediana va fi elementul încercuit.
Ex. 2: Avem seria de valori:
61 , 82 , 53 , 35, 74 , 49.
Aranjăm elementele în ordine ascendentă:
35 , 49 , 53 , 61 , 74 , 82.
Daca numarul observatiilor este par, atunci mediana va semisuma
valorilor din mijlocul şirului: (53 + 61) / 2 = 57

c) Modulul:
Este valoarea care are frecvenţa cea mai mare din setul de observaţii.
Exemplu: Avem mulţimea de valori:
A, O, O, B, B, AB, AB, A, A, O, O, O, AB, B, O, B, A, O, AB, O, O, B, O, A.
Valoarea A are 5 apariţii.
Valoarea B are 5 apariţii.
Valoarea AB are 4 apariţii.
Valoarea O are 10 apariţii. Aceasta va fi modulul seriei de valori.
Măsuri ale împrăştierii sau variabilităţii
Măsurile valorii centrale nu ne dau nici o indicaţie privind împrăştierea sau variabilitatea într-
un set de observaţii. Ex: considerand două comunităţi A şi B; media valorii luata in studiu in
cele doua comunităţi este aceeaşi, însă distribuţiile valorilor (împrăştierea acestora) este
diferită

CA CB
4000 8000
6000 8000
8000 9000
10000 10000
12000 11000
14000 12000
16000 12000
 
X A  10000
X B  10000

O măsură utilă de caracterizare a împrăştierii este range-ul(amplitudinea), definit ca diferenţa


între cea mai mică şi cea mai mare valoare a seriei.

Varianţa (dispersia) şi deviaţia standard:

Varianţa este media pătratelor deviaţiilor (abaterilor) de la medie.


Când calculăm varianţa unei serii statistice, suma pătratelor deviaţiilor de la medie se împarte
la (n – 1), deoarece aceasta dă o mai bună estimare a varianţei populaţiei totale.
Numitorul (n – 1) este numit numărul gradelor de libertate a varianţei.
Formula de calcul a varianţei pentru o serie de valori x1 , x2 , … , xn va fi:

n – nr. de obs din serie

Pentru a se putea caracteriza gradul de împrăştiere ale valorilor unei serii, se defineşte o
mărime specială, numită deviaţie standard.

Rădăcina pătrată a varianţei se numeşte deviaţie standard

n 2

 ( xi  x)
  i 1

n 1

Eroarea standard (e.s.) este dată de formula:

 2
e.s.  
n n
Ex: Valorile variaţiei într-un set de observatii sunt prezentate în tabelul:

Vârsta Deviaţia absolută Pătratul


(rezultate) de la medie deviaţiei
1 68 13.8 190.44
2 65 10.8 116.64
3 59 4.8 23.04
4 59 4.8 23.04
5 57 2.8 7.84
6 52 2.2 4.84
7 49 5.2 27.04
8 48 6.2 38.44
9 48 6.2 38.44
10 48 6.2 38.44
11 47 7.2 51.44
  Total 596 74.2 633.64

596
X   54.2
11
nr. grad. de de libertate: 11-1=10.
mediana: 52.
modulul: 48.
Rangul: 68 – 47 = 21

633.64
2   63.36 n 2

10  ( xi  x)
  i 1

n 1

 2 7.96 7.96
e.s.   e.s.    2 . 510
n n 10 3.316
Intervalul de cofidenta a mediei: [ -2s, +2s] pt p=0.05

Coeficientul de variabilitate

Este utilizat în scopul stabilirii gradului de omogenitate a unui


esantion si se obtine prin raportarea abaterii standard la media
esantionului.
V=s/m
Rezultatul obtinut se raporteaza apoi în procente.
V =s / m * 100
Unde: s este abaterea standard a esantionului studiat;
         m este media grupului.

Coeficientul de variabilitate
Interpretarea coeficientului de variabilitate se face în functie de valorile obtinute:
a. daca coeficientul este cuprins între 0 si 15%, înseamna ca împrastierea datelor este foarte
mica, iar media este reprezentativa, deoarece esantionul masurat este omogen;
b. daca valoarea lui este între 15 si 30%, împrastierea datelor este medie, media fiind înca
suficient de reprezentativa;
c. daca coeficientul depaseste 30%, media aritmetica nu este reprezentativa pentru esantionul
în cauza, fiind recomandata utilizarea medianei din cauza lipsei de omogenitate a grupului.
Obs. Coef. de variabilitate poate fi aplicat doar variabilelor de tip numeric

Indicii de asimetrie si boltire

Indicele de asimetrie (de oblicitate) ne arata în ce masura media se îndeparteaza de mediana,


si în ce masura curba de distributie normala a datelor se departeaza de mijloc, deplasându-se
spre stânga sau spre dreapta.
• Sunt considerate distributii relativ normale cazurile în care acesti indicatori nu
depasesc: ± 1.96.
• Vorbim despre o asimetrie pozitiva în situatia în care media este mai mare decât
mediana, caz în care indicele de asimetrie ia valori pozitive si apare o distributie a
datelor spre stânga.
• O formula simpla de calcul a oblicitatii este:
• Asimetria = 3(Media – Mediana) / Abaterea standard
• O alta formula de calcul este:
oblicitatea = å(x-m)3 / ns3

Unde: m este media; n este numarul de subiecti; iar s este abaterea standard a esantionului.

• În figura de mai jos este prezentat cazul unei asimetrii pozitive situatia în care
valoarea mediei este mai mare decât cea a medianei.
• De asemenea exista si o asimetrie negativa în situatia în care valoarea mediei este mai
mica decât cea a medianei. Indicele de asimetrie ia o valoare negativa în acest caz.

Boltirea (kurtosis – "cocoasa") se refera la înaltimea curbei, comparativ cu cea normala.

Putem avea distributii:


- leptocurtice (cu cocoasa înalta)
- platicurtice (mai aplatizate).
Valorile pozitive indica distributii "înalte", leptocurtice, iar
cele negative distributii "plate", platicurtice.
Pentru a fi considerata normala, valoarea boltirii distributiei trebuie sa nu depaseasca ±1,96.
Indicatorul se obtine cu ajutorul formulei:

Boltirea = å(x-m)4 / ns4 – 3

Unde: m este media; n este numarul de subiecti; iar S este abaterea standard.

S-ar putea să vă placă și