Sunteți pe pagina 1din 34

Statistica

descriptiv
ef de Lucrri Dr. Mdlina Vleanu
mvaleanu@umfcluj.ro

MSURI DE TENDINA CENTRALA

Media aritmetica,
Mediana,
Modul,
Media geometrica, Media armonica, Valoarea centrala

MSURI DE DE DISPERSIE

Minim, Maxim, Amplitudine,


Variatia,
Abaterea standard,
Coeficientul de variatie,
Eroarea standard,
Amplitudinea

MSURI DE LOCALIZARE
Cvartile, Decile, Percentile

MSURI DE SIMETRIE
Asimetria
Boltirea
Observatie: Toate masuratorile se refera la seria unidimensionala: X: X 1, X2,, Xn

MSURAREA TENDINEI CENTRALE


se face printr-o serie de indicatori care
descriu valorile de la mijlocul unei
distributii de frecventa;
acesti indicatori dau o masura sumara
a distributiei respective.
Seriile pot consta din:
esantioane de observatii
observatii asupra intregii populatii.

MSURI ALE TENDINEI CENTRALE

Media aritmetica
n

X 1 X 2 ... X n
X

X
i 1

Exemplu
Numar de zile de spitalizare: 19, 21, 21, 24, 30, 20, 19, 19
Talia esantion: 8
Media: (19+21+21+24+30+20+19+19)/8
=173/8=21.625

MSURI ALE TENDINEI CENTRALE

Media aritmetica

Proprieti ale mediei aritmetice:


Orice valoare a seriei este luat n considerare n calculul
mediei.
Valorile extreme pot influena media aritmetic
distrugndu-i reprezentativitatea.
Media aritmetic se situeaz printre valorile seriei de date.
Suma diferenelor dintre valorile individuale din serie i
medie este zero.

MSURI ALE TENDINEI CENTRALE

Media aritmetica
Proprieti ale mediei aritmetice:
Schimbarea originii scalei de msur a variabilei X din
care provine seria de date are influen asupra mediei.
Transformarea scalei de msur a variabilei X
influeneaz media aritmetic.
Suma ptratelor abaterilor valorilor seriei de la media
aritmetic este minimul sumei ptratelor abaterilor
valorilor seriei de la o valoare X a dreptei reale
(principiul sau criteriul celor mai mici ptrate )

Exemplu
Numar de zile de spitalizare: 19, 21, 21, 24, 30, 20, 19,
190
Talia esantion: 8
Media: (19+21+21+24+30+20+19+190)/8
=344/8=43

este necesar s introducem i ali


indicatori de centralitate

MSURI DE TENDIN CENTRAL


Media aritmetic modificat
media aritmetic a seriei fr p% (p=5)
dintre valorile extreme

Media aritmetica ponderata

n
Wi X i
i1n
.
X
W

(Wi este ponderea iasociata


elementului Xi)
1 i

MSURI ALE TENDINEI CENTRALE


Mediana
Mediana este o valoare astfel nct jumtate
dintre valori i sunt inferioare (sau egale) i
cealalt jumtate superioare (sau egale).
nu este influentata de valorile extreme ale seriei

MSURI ALE TENDINEI CENTRALE

Mediana
Procedura de calcul a medianei:
Se ordoneaz datele seriei n ordine cresctoare.
Se localizeaz poziia medianei n acest ir i se
determin valoarea ei.

Me X n 1 , dac n impar
2

Xn Xn
Me

, dac n par

MSURI DE TENDINA CENTRALA modulul


Modul (valoarea modal sau dominanta) unei serii statistice este
valoarea care are cea mai mare frecven din serie.

poate fi determinat si pentru o variabila calitativ

Dac seria statistic este prezentat sub forma unei tabele de clase
frecvene, modul corespunde centrului clasei de frecven maxim.
distribuie de frecvene unimodal: tabelul de frecvene are un singur maxim
distribuie de frecvene multimodal: mai multe maxime.
Exemplu: 12, 14, 12, 9,5 -unimodal;
modulul=12

12, 14, 12, 14, 9, 5 - bimodal

MSURI DE TENDIN CENTRAL


Proprieti
Dac datele au o distribuie simetric, media,
mediana si modulul sunt egale.

Distribuie simetric

Mediana

Distribuie asimetric (skew)

Media
Modul

Modul Mediana Media

MSURI DE TENDIN CENTRAL


Proprieti
Asimetrie spre dreapta= asimetrie ( Skew) pozitiv
Modul < Mediana < Media

MSURI DE TENDIN CENTRAL


Proprieti
Asimetrie spre stnga= asimetrie (Skew)
negativ
Media < Mediana < Modul

nX
.1m
X
X
n
1
2
n
1

.ax2X

X
n
m
i

MSURI DE TENDINA CENTRALA


Alte masuri de tendinta centrala:

M
ediageom
etrica
M
ediaarm
onica
Valoareacentrala

MSURI DE LOCALIZARE

Indicatori de localizare sau amplasare

(generalizri pentru mprirea n 4, 10 sau 100 de


grupuri)

Cvartilele
Decilele
Percentilele

25%

25%

250

25%

500

750

25%

1000

Software
Excel
Average, Geomean, Harmean, Percentile
Descriptive statistics

Epiinfo - Analysis Means


SPSS - Analysis Descriptive Statistics
Statistica
Descriptive statistics

MSURAREA DISPERSIEI
Se face printr-o serie de indicatori care
descriu variatia si raspandirea unei serii de
valori.

Minim
Maxim
Amplitudinea
Media deviaiei
Variaia (dispersia)
Abaterea standard (ecartul tip)
Eroarea standard
Coeficientul de variaie.

MSURI DE DISPERSIE
Amplitudinea

A = Xmax - Xmin.
Xmax=max{X1,,Xn}
Xmin= min {X1,,Xn}

Este folosita pentru a masura paleta de


imprastiere a valorilor unei serii statistice
Nu ofera informatii privind gradul de
imprastiere a valorilor unei serii
statistice

n
X

i
ii

1
A
D
n
X
M
e
i1

MSURI DE DISPERSIE

M
ediadedleavm
iaediieei
-M
edi
add
e
v
i
a

i
e
i
elam
ediana

= ,

=
M
e
A
D

Variaia
- Exprim gradul de distribuie, care ne spune
ct de tare sunt rspndite valorile n jurul
mediei
Variatie mare:
Media

Variatie mica:

Media

Variatia
n

Variaia pentru populaie

(X
i 1

X)

N
n

Variaia pentru eantion

s
2

2
(
X

X
)
i
i 1

Ajusteaz tendina de subestimare a variaiei


populaiei fa de variaia eantionului
22

n 1

Notaii
Parametri Parametri
pentru
pentru
eantioan populaie
e
Deviaia
standard
Media
(aritmetic
)

MASURI DE DISPERSIE

VARIATIA - EXEMPLU
Pacient Greuta
te (kg)

xi

1
2
3
4
5
6
7
8
9
10

7.0
11.7
12.6
15.7
15.9
16.0
16.0
17.0
17.5
17.7

49.00
136.89
158.76
246.49
252.81
256.00
256.00
289.00
306.25
313.29

Total

147.1

2264.4
10 9

10

xi
i 1

xi
i 1

10

s2

i
i 1

10

x
i 1

10
10 1

(147.1) 2
2264.49
10
s2
10 1
s 2 11.18kg 2

esia)

rd
d

n
2
(s2i
X

)
i
1n
1S2
,
S2=s2

MSURI DE DISPERSIE

Abaterea standard
(deviaia standard, ecartul tip)

Este indicatorul cel mai utilizat pentru masurarea


dispersiei unei serii de variatie
Unitate de msur: unitatea de msur a variabilei

X
X

1
S
2
3S

MSURI DE DE DISPERSIE - aplicatii


Pentru o variabil cu distribuie simetric (normal), avem
proprietile:

intervalul conineaprox.68.3%dinvalori
intervalul conineaprox.95.5%dinvalori
intervalul conineaprox.99.7%dinvalori
Observatie: Valorile care nu sunt in acest interval se numesc
valori aberante.

Distribuia normal (Gauss)

p)andard
nuldevariaie

E
Ssn

S= .
.
C
V
=.

MSURI DE DISPERSIE

Eroarea standard

Este indicatorul cel mai utilizat pentru m surarea dispersiei


unei serii de variaie
INDICATOR DE DISPERSIE CARE ARATA IMPRASTIEREA
MEDIILOR ESANTIOANELOR IN JURUL MEDIEI
POPULATIEI
Folosit in statistica inferenial (intervale de ncredere)

Coeficientul de variaie

Nu are unitate de masura si poate fi exprimat procentual.


Este folosit pentru a compara variatia relativa sau
imprastierea distributiilor diferitelor serii, esantioane sau
populatii sau a diferitelor caracteristici ale unei singure
seriei.

MSURI DE DE DISPERSIE

Coeficientul de variaie interpretare


CV este sub 10%: populaia poate fi considerat omogen;
CV este ntre 10%-20%: populaia poate fi considerat
relativ omogen;
CV este ntre 20%-30%: populaia poate fi considerat
relativ eterogen;
CV este peste 30%: populaia poate fi considerat
eterogen.

MSURI DE ASIMETRIE
ASIMETRIA (Skewness)
Asimetrie: coada (tail) la stanga sau dreapta
- Masoar abaterea de la aspectul simetric n
comparaie cu o distribuie normal
n

3
[(
X

X
)
/
S
]
i
i 1

n
1

(4
)Si43
X

MSURI DE ASIMETRIE
EXCESUL (KURTOSIS)
Exces: ( ) aplatizare, boltire

Msoar nlimea aplatizrii n comparaie


cu o distribuie normal

ASIMETRIE SI EXCES
(SKEWNESS, KURTOSIS)- proprieti
Pentru o distribuie normal:
asimetria si excesul au valori
apropiate de 1.

Exemplu:
Varsta pacientilor sositi la cabinetul
stomatologic in regim de urgenta in
data de 2 martie: 19, 21, 21, 24, 30, 20

Media varstei:
= 19 + 21 + 21 + 24 + 30 + 20 / 6
= 22.5

Talie esantion:
n=6

df = 5
n = 2.45

media

(x
media)

(xmedia)2

19

22.5

-3.5

12.25

21

22.5

-1.5

2.25

Variaia:
s2 = 81.5 / 5
s2 = 16.3

Deviatia standard:
S = 16.3
S = 4.04

21

22.5

-1.5

2.25

24

22.5

1.5

2.25

Eroarea standard:
SE = 4.04 / 2.45
SE = 1.65

30

22.5

7.5

56.25

20

22.5

-2.5

6.25

81.5

Coeficientul de variaie:
CV = 4.04 / 22.5
CV = 0.18 or 18%

Problem
Pentru un eantion de n = 36 pacienti cardiaci sa gasit media tensiunii arteriale sistolice de 150
mm Hg cu o deviatie standard de 12mm.
Presupunnd c TAS urmeaz o distribuie
normal, s se determine:
a) In ce interval sunt situate aproximativ 68%
din valorile tensiunii sistolice ale pacientilor?
b) In ce interval sunt situate aproximativ 95%
din valorile tensiunii sistolice ale pacientilor?
c) Cati pacienti (in %) au tensiunea sistolica
peste 162 mm?

S-ar putea să vă placă și