Sunteți pe pagina 1din 40

Statistică descriptivă

Calculul parametrilor

Călinici Tudor
2015
Obiective educaționale
 Definirea și calculul valorii prevalenței, sensibilității,
specificității, valorii predictive pozitive, valorii
predictive negative, incidenței, morbidității, mortalității
și riscului relativ
 Definirea și calculul valorilor parametrilor de
centralitate: media aritmetică, mediană, modul, valoare
centrală
 Definirea și calculul valorilor parametrilor de
dispersie: minim, maxim, amplitudine, variație, abatere
standard, coeficient de variație, eroare standard
 Calculul cvartilelor
 Interpretarea valorii asimetriei și boltirii
 Utilizarea Excel pentru calculul parametrilor de
centralitate și dispersie
Statistica descriptivă
 Culegerea de date

 Prezentarea datelor

 Calculul parametrilor
Variabile calitative

◦ Proporţii
◦ Rate
◦ Rapoarte

Boala prezentă Boala absentă TOTAL


Expunere DA a b a+b
Expunere NU c d c+d
TOTAL a+c b+d a+b+c+d
Proporţia
Boala prezenta Boala absenta TOTAL
Fumat DA 84 313 397
Fumat NU 50 370 420
TOTAL 134 683 817

Proporţia celor expuşi la factorul de risc 397 / 817 = 48,59%

Proporţia celor neexpuşi la factorul de risc 420 / 817 = 51,41%


Prevalenţa
Boala prezenta Boala absenta TOTAL
Fumat DA 84 313 397
Fumat NU 50 370 420
TOTAL 134 683 817

Prevalenţa – număr de bolnavi / număr de persoane examinate

Prevalenţa bolii la fumători 84 / 397 = 21,15%

Prevalenţa bolii în eşantion 134 / 817= 16,40 %

Extrapolând la populaţie, prevalenţa va fi considerată ca numărul total de


bolnavi aflaţi într-o populaţie la un moment dat.
Teste diagnostice

Sensibilitatea = persoane bolnave cu test pozitiv / număr total de persoane


bolnave
Specificitatea = persoane fără boală cu test negativ / număr de persoane fără
boală

Valoare predictivă pozitivă = persoane bolnave diagnosticate pozitiv / număr


total de teste pozitive
Valoare predictivă negativă = persoane fară boală cu test negativ / număr
total de teste negative
Exemplu

 Se = persoane bolnave cu test pozitiv / număr


total de persoane bolnave = 154/379 = 40,6%
 Sp = persoane fără boală cu test negativ / număr
de persoane fără boală = 23362 / 23724 = 98,5%
 VPP = persoane bolnave cu test pozitiv /total
teste pozitive = 154/516 = 29,8%
 VPN = persoane fără boală cu test negativ / total
teste negative = 23362/23587 = 99%
Morbiditate, mortalitate
 Mortalitate= numar decese / talie
populaţie x 1000
 Morbiditate = prevalenţa
 Incidenţa = numar de persoane care fac o
anumită afecţiune într-o perioadă de timp
Rate

 Noţiunea de rată nu este sinonimă cu cea


de proporţie
 Rata poate trece de 100%
 Rata schimbării = (valoare nouă-valoare
veche)/valoare veche x 100
RAPOARTE
Boala prezentă Boala absentă TOTAL
Expunere DA 84 313 397
Expunere NU 50 370 420
TOTAL 134 683 817

 Riscul relativ = prevalența la expuşi /


prevalența la nonexpuşi
84
 RR > 1 efect nociv RR  397 
0,21
 1,77
50 0,11
 RR < 1 efect protector 420
Calculul parametrilor numerici
sintetici – variabile cantitative
 Media aritmetică – cel mai uzual parametru
descriptiv

 Este el suficient?

 Exemplu: o populaţie cu probleme tensionale


(hipotensivi şi hipertensivi), echilibraţi între
ei ca număr, va avea media aritmetică a
tensiunii o valoare normală... Nu corespunde
cu realitatea
Parametrii statistici descriptivi
 Parametrii de centralitate

 Parametrii de dispersie

 Parametrii de localizare

 Parametrii de “normalitate”
Parametrii de centralitate
 Media aritmetică a unei serii statistice x1,...xn

 Fie seria: 20, 10, 30, 40, 30, 20


Media = (20+10+30+40+30+20)/6 = 25
Proprietăţi ale mediei aritmetice
 Orice valoare a seriei este luată în calcul
 Valorile extreme pot influenţa media
aritmetică distrugându-i reprezentativitatea
 Media aritmetică se situează printre valorile
seriei date
 Suma diferenţelor dintre valorile individuale
din serie şi medie este 0
 Suma pătratelor abaterilor valorilor seriei de
la media aritmetică este minimul sumei
pătratelor abaterilor valorilor seriei de la
orice valoare reală
Mediana
 Este o valoare astfel încât jumătate din
observaţii îi sunt inferioare sau egale şi cealaltă
jumătate îi sunt superioare sau egale

 Procedura de calcul
◦ Se ordonează datele seriei în ordine crescătoare
◦ Se localizează mediana şi se detrmină valoarea ei
astfel:
 Dacă volumul n al seriei este impar:

• Dacă volumul n al seriei este par:


Calcul mediană
 Fie seria: 20, 10, 30, 40, 30, 20
 Seria ordonată este 10, 20, 20, 30, 30, 40
 Talia seriei este 6 (număr par), valoarea medianei
va fi media aritmetică a valorilor de pe pozițiile 3
și 4 din seria ordonată adică (20+30)/2 = 25

 Fie seria: 20, 10, 30, 40, 30, 20, 50


 Seria ordonată este 10, 20, 20, 30, 30, 40, 50
 Talia seriei este 7 (număr impar), valoarea medianei
va fi valoarea a 4-a din seria ordonată adică 30
Modulul - dominanta
 Cea mai des întâlnită valoare din serie

 Serii
◦ Fără modul
◦ Unimodale
◦ Multimodale
Exemplu calcul modul
 Fie seria: 20, 10, 30, 40, 30, 20, 50, 20
 F(10)=1; F(20)=3; F(30)=2; F(40)=1; F(50)=1
 Modulul este 20, seria este unimodală

 Fie seria: 20, 10, 30, 40, 30, 20, 50, 20,30
 F(10)=1; F(20)=3; F(30)=3; F(40)=1; F(50)=1
 Modulul este (20, 30) seria este bimodală
Valoare centrală

Fie seria 20, 10, 30, 40, 30, 20, 50, 20,30
Vc = (10+50)/2 = 30

Media geometrică

Media armonică
Media ponderată
 Fie dată o serie de valori x1, , x2, ... , xn şi o
serie de ponderi p1, p2, ... , pn se defineşte
media valorilor x1, , x2, ... , xn ponderată
de către p1, p2, ... , pn cu valoarea
n

x p i i
MP  i 1
n

p
i 1
i
Exemplu de calcul
 ECTS anatomie – 6; Nota 10
 ECTS fiziologie – 6; Nota 9
 ECTS bacteriologie – 6; Nota 8
 ECTS Științele comportamentului 2; Nota 6
 ECTS Educație pentru sănătate -2; Nota 7
 ECTS Sociologie – 2; Nota 8
 ECTS Bazele nursingului – 6; Nota 7

 Media ponderată =
(10*6+9*6+8*6+6*2+7*2+8*2+7*6)/(6+6+6+2
+2+2+6)=246/30 = 8.2
Măsuri de dispersie

 Măsurile de dispersie oferă informaţii despre


extinderea împrăştierii datelor, sau reciproc, a
gradului lor de aglomerare
Parametrii de dispersie
 Minimul

 Maximul

 Amplitudinea =Maxim - Minim

Fie seria 20, 10, 30, 40, 30, 20, 50, 20,30
Min=10
Max=50
Amplitudinea = 50-10 =40
Variaţia
 Prezintă dispersia datelor în jurul mediei
aritmetice

 Fie seria: 20, 10, 30, 40, 30, 20; Media = 25


Variația = [(20-25)2 +(10-25)2+(30-25)2+
+40-25)2+(30-25)2+(20-25)2]/6 = 550/6=91.66
VARIANŢA
 In inferenţa statistică se utilizează variaţia de
eşantionare sau varianţa

n 2
S 
2
s
n 1

26
Abaterea standard

 Fie seria: 20, 10, 30, 40, 30, 20;


 Abaterea standard S = 91.66 = 9.57
Coeficientul de variaţie

Fie seria: 20, 10, 30, 40, 30, 20;


Media = 25; Abaterea standard = 9.57

CV = 9.57/25 = 0.38
Reguli empirice de interpretare ale
coeficientului de variaţie
 Dacă CV <10% seria este omogenă

 Dacă CV între 10 % şi 20 % seria este


relativ omogenă

 Dacă CV între 20 % şi 30 % seria este


relativ eterogenă

 Dacă CV >30% seria este eterogenă


VARIAȚIE, VARIANȚĂ, ABATERI, DEVIERI…

 Statistică descriptivă (eșantion  Statistică inferențială


(aproximare pentru întreaga
sau întreaga populație ) populație pe baza eșantionului)
n 2
S 
n 2
(X i  X) 2

n 1
s
s2  i 1

n • varianţa
• variația
• variaţia de eşantionare
• Ecartul tip • Abaterea (deviația)
• Abaterea (deviația) standard standard
a populației 𝑠 = 𝑠2 𝑆= 𝑆2

• Coeficientul de variație al • Coeficientul de variație


populației 𝑠
𝐶𝑉 = (%) 𝑆
𝑋 𝐶𝑉 = (%)
𝑋
Eroarea standard

Fie seria: 20, 10, 30, 40, 30, 20;


Talia = 6; Abaterea standard = 9.57

Es = 9.57/ 6 = 3.9
Parametrii de localizare
 Cvartilele

 Percentilele

 Decilele
Exemplu de calcul cvartile
 Fie seria: 20, 10, 30, 40, 30, 20, 50, 10, 60,
50
 Seria ordonată este

10,10, 20, 20, 30, 30, 40, 50, 50,60

C1 C2=Me C3
Parametrii de normalitate
 Asimetria

 Boltirea
Asimetria
Boltirea
TEMĂ
TEMĂ
 Calculaţi media, mediana, variaţia, varianţa,
amplitudinea, deviaţia standard, coeficientul de
variaţie pentru durata de spitalizare și varsta
 Care dintre parametrii medie, mediană sau
modul caracterizează mai bine seriile de valori?
 Durata de spitalizare este legată de faptul că au
primit antibiotice?
 Durata de spitalizare este legată de rezultatul
antibiogramei?
 Durata de spitalizare este legată de faptul că au
suferit o manoperă chirurgicală?
TEMĂ
 Scrieţi răspunsurile într-un fişier Word
folosind toate elementele de formatare
învăţate
 expediaţi fisierul Word ataşat la un email pe
adresa tcalinici@umfcluj.ro până cel târziu
duminică 08.11 la ora 8.11 PM
 emailurile ulterioare nu vor fi luate în
considerare
 În corpul email-ului vă rog să vă scrieți
numele și grupa
Vă mulţumesc pentru atenţie