Sunteți pe pagina 1din 34

STATISTICĂ DESCRIPTIVĂ

Calculul parametrilor
PARTEA II
Conf. Dr. Ing. Ovidiu-Constantin NOVAC
ovnovac@uoradea.ro
Obiectivele cursului

Definirea și calculul:
prevalenței, sensibilității, specificității, valorii predictive pozitive, valorii
predictive negative, incidenței, morbidității, mortalității și a riscului relativ
Definirea și calculul valorilor parametrilor de centralitate:
media aritmetică, mediana, modulul, valoarea centrală
Definirea și calculul valorilor parametrilor de dispersie:
minim, maxim, amplitudine, variație, abatere standard,
coeficient de variație, eroare standard
Calculul cvartilelor
Interpretarea valorii asimetriei și boltirii
Statistica descriptivă

Culegerea de date
Prezentarea datelor
Calculul parametrilor
Variabile calitative

• Proporţii
• Rate
• Rapoarte
Proporţia

Boala prezentă Boală absentă Total


Fumat DA 84 313 397
Fumat NU 50 370 420
Total 134 683 817

Proporţia celor expuşi la factorul de risc (fumat) 397 / 817 = 48,59%

Proporţia celor neexpuşi la factorul de risc (fumat) 420 / 817 = 51,41%


Prevalența
Boala prezentă Boală absentă Total
Fumat DA 84 313 397
Fumat NU 50 370 420
Total 134 683 817

Prevalenţa = număr de bolnavi / număr de persoane examinate


Prevalenţa bolii la fumători 84/397 = 21,15 %
Prevalenţa bolii în eşantion 134/817= 16,40 %
Extrapolând la populaţie, prevalenţa va fi considerată ca numărul total de bolnavi aflaţi într-o populaţie la
un moment dat.
Teste diagnostice

Boala prezentă Boală absentă Total


Teste pozitive 100 30 130
Teste negative 10 160 170
Total 110 190 300

Sensibilitatea = persoane bolnave cu test pozitiv / număr total de persoane bolnave = 100/110 = 90,91%
Specificitatea = persoane fără boală cu test negativ / număr de persoane fără boală =160/190 = 84,21%
Valoare Predictivă Pozitivă = persoane bolnave diagnosticate pozitiv / număr total de teste pozitive
= 100/130 = 76,92%
Valoare Predictivă Negativă = persoane fară boală cu test negativ / număr total de teste negative
=160/170 = 94,12%
Morbiditate, mortalitate

Incidenţa = numar de persoane care fac o anumită afecţiune într-o perioadă de timp

Morbiditate = Prevalenţa = nr. total de bolnavi dintr-o populatie la un moment dat

Mortalitate= numar decese / talie populaţie x 1000


Rate

Noţiunea de rată nu este sinonimă cu cea de proporţie


Rata poate trece de 100% !!!!
Rata schimbării = (valoare nouă-valoare veche)/valoare veche (x 100)
Exemplu:
◦ Ziua 1: 10 cazuri de îmbolnăvire
◦ Ziua 2: 25 cazuri de îmbolnăvire
Rata schimbarii=Creștere de (25-10)/10= 150%
Rapoarte

Boala prezentă Boală absentă Total


Expunere DA 84 313 397
Expunere NU 50 370 420
TOTAL 134 683 817

Riscul relativ RR = Prevalența la Expuşi / Prevalența la Nonexpuşi

RR > 1 efect nociv


RR < 1 efect protector
Calculul parametrilor numerici sintetici
Variabile cantitative

Media Aritmetică – cel mai uzual parametru descriptiv

Este suficient acest parametru - MA ?

Exemplu: o populaţie cu probleme tensionale (hipotensivi şi hipertensivi),


echilibraţi între ei ca număr, va avea media aritmetică a tensiunii o valoare
normală ......
Corespunde cu realitatea ? - NU
Parametrii statistici descriptivi

Parametrii de centralitate
Parametrii de dispersie
Parametrii de localizare
Parametrii de “normalitate”
Parametrii de centralitate

Media aritmetică (MA) a unei serii statistice X1, ... ,Xn

Ex. Fie seria: 20, 10, 30, 40, 30, 20


MA= (20+10+30+40+30+20)/6 = 25
Proprietăţi ale mediei aritmetice

Orice valoare a seriei este luată în calcul.


Valorile extreme pot influenţa media aritmetică distrugându-i reprezentativitatea.
Media aritmetică se situează printre valorile seriei date.
Suma diferenţelor dintre valorile individuale din serie şi medie este 0.
Suma pătratelor abaterilor valorilor seriei de la media aritmetică este minimul sumei
pătratelor abaterilor valorilor seriei de la orice valoare reală.
Mediana
Mediana este o valoare astfel încât jumătate din observaţii îi sunt inferioare sau egale şi cealaltă
jumătate îi sunt superioare sau egale
Procedură de calcul
Se ordonează datele seriei în ordine crescătoare
Se localizează mediana şi se determină valoarea ei astfel:

Dacă talia n a seriei este impară:

Dacă talia n a seriei este pară:


Calcul mediană

Fie seria: 20, 10, 30, 40, 30, 20 - număr par de elemente
Seria ordonată este 10, 20, 20, 30, 30, 40
Talia seriei este 6 (număr par), valoarea medianei va fi media aritmetică a valorilor de
pe pozițiile 3 și 4 din seria ordonată, Me = (20+30)/2 = 25

Fie seria: 20, 10, 30, 40, 30, 20, 50 - număr impar de elemente
Seria ordonată este 10, 20, 20, 30, 30, 40, 50
Talia seriei este 7 (număr impar), valoarea medianei va fi valoarea a 4-a din seria
ordonată, Me = 30
Modulul - dominanta

Modulul – dominanta = valoarea cea mai des întâlnită dintr-o serie

Serii:
- Fără modul
- Unimodale
- Multimodale
Exemplu calcul modul

Fie seria: 20, 10, 30, 40, 30, 20, 50, 20


F(10)=1; F(20)=3; F(30)=2; F(40)=1; F(50)=1
Modulul = 20, seria este unimodală

Fie seria: 20, 10, 30, 40, 30, 20, 50, 20,30
F(10)=1; F(20)=3; F(30)=3; F(40)=1; F(50)=1
Modulul = (20, 30) seria este bimodală
Valoare centrală

Fie seria 20, 10, 30, 40, 30, 20, 50, 20, 30
Vc = (50+10)/2 = 30
Media geometrică

Media armonică
Media ponderată (MP)

Fie dată o serie de valori x1, , x2, ... , xn şi


o serie de ponderi p1, p2, ... , pn
se defineşte media valorilor x1, x2, ... , xn ponderată de către p1, p2, ... , pn
cu valoarea:
Exemplu de calcul

Anatomie nota 10 ECTS 6


Fiziologie nota 9 ECTS 6
Bacteriologie nota 8 ECTS 6
Științele comportamentului nota 6 ECTS 2
Educație pentru sănătate nota 7 ECTS 2
Sociologie nota 8 ECTS 2
Bazele nursingului nota 7 ECTS 6
MP = (10*6+9*6+8*6+6*2+7*2+8*2+7*6)/(6+6+6+2+2+2+6) = 246/30 = 8.20
Măsuri de dispersie

Măsurile de dispersie oferă informaţii despre extinderea împrăştierii


datelor, sau reciproc, a gradului lor de aglomerare.
Parametrii de dispersie

Minimul - Min
Maximul - Max
Amplitudinea = Maxim - Minim
Fie seria 20, 10, 30, 40, 30, 20, 50, 20,30
Min=10
Max=50
Amplitudinea = 50 -10 = 40
Variaţia
Variația - prezintă dispersia datelor în jurul mediei aritmetice (MA)

Fie seria: 20, 10, 30, 40, 30, 20; MA = 25


Variația = [(20-25)^2 +(10-25)^2+(30-25)^2+ (40-25)^2+(30-25)^2+(20-25)^2]/6 =
= 550/6 =
= 91.66
Varianţa

In inferenţa statistică se utilizează variaţia de eşantionare sau varianţa


Abaterea standard

Abaterea standard (S) este rădăcina pătrată a varianței

fie seria: 20, 10, 30, 40, 30, 20;


Abaterea standard S = = 9.57
Coeficientul de variaţie
(Cv)
Coeficientul de variație (Cv) este egal cu raportul dintre abaterea standard (S) și media
aritmetică (MA).

Fie seria: 20, 10, 30, 40, 30, 20;


MA = 25;
Abaterea standard (S) = 9.57
Cv = 9.57/25 = 0.38 = 38%
Reguli empirice de interpretare ale
coeficientului de variaţie

Reguli empirice de interpretare ale coeficientului de variaţie:


Dacă Cv < 10% - seria este Omogenă
Dacă Cv ϵ (10 % , 20 %) - seria este Relativ Omogenă
Dacă Cv ϵ (20 %, 30 %) seria este Relativ Eterogenă
Dacă Cv > 30% - seria este Eterogenă
Eroarea standard
(Es)

Eroarea standard este raportul dintre abaterea standard și rădăcina pătrată a taliei seriei.
Fie seria: 20, 10, 30, 40, 30, 20;
Abaterea standard = 9.57
Talia seriei= 6;
Es = 9.57/ = 3.9
Parametrii de localizare

Cvartilele
Percentilele
Decilele
Exemplu de calcul - Cvartile

Fie seria: 20, 10, 30, 40, 30, 20, 50, 10, 60, 50
Seria ordonată este 10, 10, 20, 20, 30, 30, 40, 50, 50, 60
Cvartile: C0=Min seriei, C1=25% din serie, C2=Me=50% din serie, C3=75% din serie, C4=Max seriei
Parametrii de normalitate

Asimetria

Boltirea
Asimetria
Boltirea