Sunteți pe pagina 1din 40

Indicatori statistici

 Minim, maxim
 Media
 Deviaţia standard
 Mediana
 Cuartile
 Centile, decile
POPULAŢIE

√ √

INDIVID √ √

EŞANTION
Definiţii
 Vom numi populaţie statistică o mulţime de elemente
care au una sau mai multe însuşiri comune şi care fac
obiectul unei cercetări statistice
 Vom numi individ statistic un element al unei populaţii
statistice indiferent de natura acesteia.
 Un eșantion inseamnă un grup de indivizi selectaţi dintr-o
populație statistică printr-o procedură bine stabilită, astfel
incat sa reprezinte cat mai corect caracteristicile populaţiei.
 O caracteristică care se schimbă de la individ la individ sau
la acelaşi individ în timp sau ca răspuns la condiţiile de
mediu, de boală de medicaţie etc, se numeşte variabilă
2.Clasificarea datelor
Tipuri de date
 Date numerice, întregi sau zecimale –
vârstă, greutate, talie, hemoglobină, transaminaze,
calcemie, glicemie etc.
 Date ordinale – stadiul evolutiv, starea la
externare, gradul de rudenie, anul de studii etc.
Codurile folosite au o ordine clara.
 Date nominale – codul bolii, grupa sanguină,
consistenţa ficatului, culoarea ochilor etc.
Codurile folosite NU au o ordine.
 Date alfanumerice – nume, prenume,
adresă, loc de muncă, descrierea bolii, în general
texte sau alte simboluri.
Indicatori fundamentali

Deviaţia standard

MEDIA
Media aritmetică

 Media unei serii statistice este raportul dintre suma


valorilor seriei şi numărul lor.
 Media este indicatorul care arată tendinţa centrală a
seriei, şi de obicei arată unde tind datele să se
aglomereze.
 Media mai multor valori egale este egală cu fiecare din
valori
 Deşi se obţine din valori concrete, măsurate în practică,
media este un număr abstract
Calculul dispersiei
(Engl: variance)

 Este bine de reţinut că:


1. La medii aproximativ egale, este mai
împrăştiată seria cu dispersia mai mare.
2. La dispersii aproximativ egale, este mai
împrăştiată seria cu media mai mică.
Abaterea standard
(Engl: standard deviation)

 Dispersia are dezavantaje:


1. Se exprimă cu unităţile de măsură ale variabilei, ridicate la
pătrat
2. Are în general valori foarte mari comparativ cu media.
 De aceea se mai foloseşte un alt indicator, numit abatere
standard care este radicalul dispersiei. Se notează cu 
şi are deci formula:

 Abaterea standard = Abaterea medie pătratică


Coeficientul de variaţie

 Este raportul dintre deviaţia standard şi medie, atunci


când media este diferită de 0, şi se măsoară în
procente:

 Pentru seriile de mai sus, coeficientul de variaţie este


mai mare pentru cea mai împrăştiată, adică pentru cea
cu deviaţia standard mai mare:
1. C.V.x= 10,5 / 180 = 0,058 = 5,8 %.
2. C.V.y = 13,3 / 180 = 0,073 = 7,3%.

Excel
Indicatori de asimetrie
Maxim

Cuartila 3 – 75%

Mediana – 50%

Cuartila 1 – 25%

Minim
Indicatori de asimetrie
 Mediana (Engl: median) este o valoare, pentru
parametrul măsurat (greutate, înălţime etc.), situată la
mijlocul seriei de valori, dacă indivizii sunt ordonaţi
crescător sau descrescător.

 Jumătate din valori sunt mai mari decât mediana şi


jumătate mai mici.

 Cuartila Q1 este valoarea parametrului măsurat


pentru care un sfert din indivizi au valori mai mici şi
trei sferturi mai mari decât această valoare.

 Analog, cuartila Q3 este valoarea faţă de care trei


sferturi din indivizi au valori mai mici şi un sfert - mai
mari.
Alţi indicatori statistici
 Decile. Pe eşantioane mai mari de multe sute de
indivizi. Sunt 9 decile, fiecare corespunzând unui
procent de 10%, 20%,……,90% din eşantion,
asemănător cuartilelor. Decila a 5-a este mediana.
 Centile. Folosite, în studii pe mii de cazuri, de obicei
de un interes mai larg, naţional, internaţional, şi sunt
corespunzătoare precentelor de 1%, 2%,…,99% din
lot. Centila a 50-a este mediana.
 Modul. Clasa sau valoarea corespunzătoare
frecvenţei maxime dintr-o serie statistică se numeşte
mod.

Excel
Distributia datelor
 Graficul Histogramă
 Poligonul frecvenţelor
 Curba Gauss
Supravieţuirea în cancerul
mamar

 Graficul histograma este echivalentul grafic al tabelului


de frecvenţe absolute
 Vom reprezenta prin bare verticale fiecare clasă
 O bară are o înălţime proporţionlă cu frecvenţa absolută
 Fiecare bară (clasă) are aceeaşi lăţime
 Înălţimea barelor este proporţională cu frecvenţele
absolute (numărul de indivizi din clasă)
 Se observă că datele sunt distribuite asimetric
Lungimea claselor
 Cea mai importantă decizie în construcţia unei
histograme este alegerea lungimii unei clase
 Se împarte amplitudinea absolută la numărul de clase
(bare) dorit:
 Lungimea = (Max – Min)/numar clase
 Numărul de clase este 8-10-12 pentru eşantioane de
zeci de indivizi şi 15-20 pentru eşantioane de sute de
indivizi
 Distribuţie simetrică, cu uşoare iregularităţi
datorate faptului că a fost aleasă o lungime a
claselor prea mică
 Distributia taliei este relativ simetrică
 Tensiunea arterială are o distribuţie asimetrică din
cauza prezenţei pacienţilor cu hipertensiune (cei
reprezentaţi prin barele din dreapta)
 Bilirubina totală este distribuită puternic asimetric
spre valorile mari (spre dreapta)
 Hemoglobina se distribuie simetric
 Distribuţie bimodală, arată că eşantionul are
două subeşantioane diferite, este eterogen
 Distribuţie aproape simetrică
Curba Gauss -
curba repartiţiei NORMALE

 Unul din cazurile cele mai importante


este acela când repartiţia datelor
respectă densitatea ideală - aşa numita
repartiţie Gauss sau normală
Curba Gauss
Coeficientul de inteligenţă

Media=100, Deviaţia standard=15


Greutatea

Media = 70 Kg, Deviaţia standard = 10 Kg


Talia

Media=167cm, Deviaţia standard=8cm


Graficul cu coloane/bare

25

25 21
18
20
14
Nr.pacienţi

12
15

10

0
2006 2007 2008 2009 2010

Anul internării
Repartiţia pe sexe şi m ediu de provenienţă a tuturor
celor 190 de pacienţi
80 feminin
59,1%
70
masculin
Număr de pacienţi

60

50 40,9%
48% 52%
40

30

20

10
36 39 47 68
0

rural urban
Comparare mediilor
± deviaţii standard
100
Media +/- deviatia standard

79.914
77.088
80
72.964
68.346

60

40

20

0
U M-U M-S S

Vârsta
100
80

nr. subiecţi
60
Căsătorit
40
Necăsătorit
20
0
Necăsătorit
Căsătorit
starea civilă
vârsta (ani)
Graficul circular - Pie
Fe-
mei
175
41.87 Repartiţia lotului în funcţie de IMC (nr, %)
%
Băr-
baţi Supra
243 pon-
58.13 deral
% 40
13.65
%

Normo
Rural pon-
Ur- 180 deral
ban 43.06 240
Sub
238 % 81.91
pon-
56.94 %
deral
% 13
4.44%
Graficul circular - Pie
Perioada
>36 de la debut Repartiţia tumorilor mucinoase ale ovarului (nr, %)
alte tipuri
luni 227
94 1-6 23.55%
22.49 luni
% 171
40.91
%
13-36
luni tumori mucinoase fara
60 7-12 luni 189 548
14.35 93 19.61% 56.85%
% 22.25%
Graficul liniar – tendinţă ascendentă
Graficul liniar – tendinţă descendentă

Evoluţia temperaturii pe durata spitalizării

39.0

38.5
!
Temperatura (grade Celsiuis)

38.0

37.5

37.0

36.5

36.0
4D 4P 4S 5D 5P 5S 6D 6P 6S 7D 7P 7S 8D 8P 8S
Compararea evoluţiei în timp

Total HIV p HIV Total VHB p VHB HIV alte cai


70

60

50

40

30

20

10

0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Compararea în evoluţie pentru
medii ± deviaţii standard
U M-U M-S S
25

23.109 23.267
22.305 22.699
20

17.108 16.711
16.614 16.952
15

12.257 11.857 11.686 10.743


10

9.029 8.794
7.824 6.588
5

0
M0 M1 M2 M3

S-ar putea să vă placă și