Sunteți pe pagina 1din 67

BIOSTATISTICA

CURS 3

Dana Popescu-Spineni

FIZIOKINETOTERAPIE
2021-2022
“Unelte”

Vom învăţa prin acest curs să folosim două


excelente instrumente pentru profesia pe care o veţi
practica, familiarizându-ne cu biostatistica, prin
intermediul calculatorului.
“În a few minutes
a computer can make
a mistake so great that
it would have taken
many man many
months to equal it.”
Bill Gates
BIOSTATISTICĂ INTUITIVĂ

Curs orientat către înţelegerea conceptelor şi a


demersului logic statistic, fără a fi bazat pe formule
matematice (Motulsky H., Glantz S.), în ideea dezvoltării
capacităţii de utilizare a softurilor statistice
APLICABILITATE
DECIZIE

CUNOȘTINȚE CONTEXT

INFORMAȚII SEMNIFICAȚIE

CARACTERISTICĂ
DATE
Date: semnele vitale pacient (ritm cardiac, frecvența
respiratorie, tensiunea arterială, tempertura)

Cine ? Informații: serii ale semnelor vitale


Ce ? colectate în timp, plasate în context și
Unde ? utilizate pentru comparații longitudinale
Când ?

Cunoștințe: recunoașterea tiparelor


De ce ?
evolutive și identificarea
intervențiilor; reflectă sinteza
Cum ?
informațiior bazate pe cunoștințe și
experiență

Decizie: acuratețea sintezei informațiilor și


selecția adecvată a intervenției
 BIOSTATISTICA- studiul fenomenelor
biologice şi medicale
 Se ocupă de :
 culegerea,
 centralizarea şi gruparea datelor
 prelucrarea datelor
 Permite :
 determinarea unor indicatori pentru descrierea
fenomenelor biomedicale studiate, pe baza unor
regularităţi sau variabilităţi statistice.
 Aplicarea unor teste statistice pentru analiza acestor
fenomene
 Managerul, ca și cercetătorul, face parte din categoria
oamenilor care îşi pun întrebări. În cel mai simplu caz,
întrebările sunt pentru a descrie ceva, adică întrebări
precum : „Ce?” „Cum?” „Când? „Unde?” „Cine?” Pentru
astfel de răspunsuri avem la dispoziţie STATISTICA
DESCRIPTIVĂ.

 Dar indiferent cât de exactă ar fi o descriere, ea nu este


suficientă. Ştiinţa are nevoie de răspunsuri la întrebări mult
mai grele, care încep cu „De ce?”, adică are nevoie de
explicaţii, pentru care avem la dispoziţie STATISTICA
ANALITICĂ, INFERENȚIALĂ. Statistica inferenţială
permite generalizarea rezultatelor obţinute prin studierea
unei parti din populaţie, la toată populaţia respectivă.
Microsoft Excel

 Pachet de programe destinat tratării datelor în formă


tabelară și prezentării grafice informaţiei conţinute în
aceste tabele

 Este dotat cu o funcţie pentru tratarea datelor din tabel


ca bază de date. Poate fi folosit pentru:
 Colectarea și managementul datelor medicale
 Sumarizarea tabelară și grafică
 Analiza statistică a datelor
EPI INFO – SOFT STATISTIC GRATUIT
CDC SUA

http://www.cdc.gov/epiinfo
Microsoft Excel
Microsoft Excel
INDUCŢIE

Inferenţă Statistică

TEORII
OBSERVAȚII
GENERALE

Predicţie Statistică

DEDUCŢIE
STATISTICĂ DESCRIPTIVĂ

Concepte statistice
Tipuri de variabile
Sintetizarea numerică și grafică a datelor
Limbaj medical – Limbaj statistic
“Do you speak the language?”
Concepte Statistice

 Colectivitatea statistică (populaţia statistică) formează


obiectul analizei statistice şi este reprezentată de
totalitatea elementelor care au anumite caracteristici
(însuşiri sau atribute) comune.
 Trăsătura comună a tuturor unităţilor unei populaţii care
poate să prezinte interes în cadrul unei analize statistice
se numeşte caracteristică / variabilă.
 Numărul elementelor populaţiei reprezinta volumul sau
talia populaţiei.
 Unitatea statistică este reprezentată de fiecare element
component al colectivităţii statistice.
 O populaţie statistică poate fi:

 în medicină, mulţimea bolnavilor internaţi, mulţimea


hematiilor din sângele unei persoane, mulţimea
microbilor dintr-o cultură etc.
 într-un studiu demografic, populaţia unei ţări
 un grup de indivizi (populaţia şcolară dintr-un oraş la un
moment dat, populaţia vârstnică dintr-o anumită
regiune la un moment dat)
 un grup de evenimente sau fenomene
 o mulţime de obiecte

 Unităţi statistice pot fi:


 persoana, familia, căsătoria, născutul viu, gravida,
cabinetul medicului de familie etc.

18
 Exemplu: Să presupunem că interesează studiul
numărului de leucocite la bolnavii internaţi într-un
spital de boli infecţioase

 Populaţia statistică este formată din mulţimea


bolnavilor internaţi într-o anumită perioadă (un an),

 O unitatea statistică este constituită din fiecare bolnav,

 Caracteristica studiată este numărul de leucocite ale


bolnavului la internare.

19
 Exemplu: Să presupunem că într-un studiu
prezintă interes numărul de pacienţi consultaţi
zilnic în cabinetele medicilor de familie dintr-o
anumită zonă

 Populaţia statistică este reprezentată de mulţimea

cabinetelor,

 O unitate statistică este reprezentată de oricare cabinet,

 Numărul de pacienţi consultaţi zilnic reprezintă o


caracteristică/variabilă.

20
 Variabila se defineşte ca o cantitate observabilă sau un o
caracteristică, un atribut care variază de la un membru la
altul al unei populaţii luate în studiu. De exemplu, dacă
măsurăm greutatea fiecărui elev dintr-o clasă vom avea o
serie de numere care vor varia de la un elev la altul.

 Variabilă versus Constantă: Spre deosebire de variabilă,


constanta reprezintă un număr specific care rămâne
acelaşi indiferent de condiţii. De exemplu, punctul de
îngheţare al apei este acelaşi în orice condiţii, şi anume
0ºC.
 Varianta este valoarea concretă sub care se înregistrează o
variabilă.
Temă: Să identificaţi tipul fiecărei variabile din Setul Minim de Date la
nivel de Pacient (SMDP) din Foaia de Observaţie Clinică Generală
(FOCG)
 Variabilele statistice pot fi de două tipuri:
 De natură cantitativă, asociate unor caracteristici
susceptibile de a fi măsurate, fiind exprimabile
numeric
 De natură calitativă, asociate unor caracteristici
care nu pot fi măsurate, sunt rezultatul aprecierii
Variabilele cantitative

 Variabile continue asociate unor caracteristici


măsurabile care pot lua orice formă numerică (inclusiv
o fracţiune zecimală sau ordinală)
-Calculul mediei are întotdeauna
semnificaţie.

 Variabile discontinue sau discrete asociate unor


caracteristici măsurabile care iau valori numai numere
întregi
-Valoarea mediei nu are întotdeauna
semnificaţie.
Variabilele Calitative
 Sunt asociate unor caracteristici care nu se
exprimă în unităţi de măsură.
 Sunt nemăsurabile, finite, iar calculul mediei
valorilor ei nu are sens.
 Variabilele calitative pot fi:
 Nominale – grupează subiecţii în categorii ce nu pot
fi ordonate dupa un criteriu logic
 Ordinale – subiecţii sunt grupati în categorii ce pot fi
ordonate dupa un criteriu logic
 Dihotomice –nu accepta decat doua alternative pt.
gruparea subiectilor
Exemplu: CHESTIONAR SCĂRIȘOARA

 Informaţii de identificare
 Informaţii demografice
 Informaţii clinice
 Informaţii epidemiologice
Exemplu: CHESTIONAR SCĂRIȘOARA
Exemplu: BAZĂ DE DATE SCĂRIȘOARA- CODIFICATĂ !
Ancheta Epidemiologica – Planeta Marte

Problema de studiat: Spitalul in care suntem angajaţi işi


propune să ofere servicii de e-health/e-sănătate marţienilor.
Suntem trimişi să culegem informaţii în acest scop. Începem
prin a studia înălţimea marţienilor.

?
Metoda de lucru

Să presupunem că din mergem pe marte şi începem prin a


măsura înălţimea (caracteristica sau variabila) tuturor
marţienilor obţinând următoarele valori (variantele
variabilei):

129,144,122,130,135,130,135,121,127,121,128,128,123,138,12
9,140,122,
32,129,135,132,132,143136,142,138,147,140,142,149,143,130,
126,129,127,140,130,134,136,149,138,142,138,142,143,14012
5,126,128,139,132,129,137,139,122,123,128,124,130,133,119,1
15,137,126,122,130,135,125,128,135,126,128,113,130,123,123,
123,128,135,122,132,120,131,117,130,128,129,132,139,139,12
9,140132,139,135,126,129,133,141.
Dacă încerc să fac o scară a frecvenţei valorilor obţinute, şi pun
unul sub altul marţienii (cerculeț) cu aceeaşi înălţime
(rotunjind cifrele),

Obţin o anumită formă, (ca cea din slide-ul următor), care


reprezintă felul în care se distribuie (distribuţia) înălţimile
marţienilor (distribuţie de frecvenţă a înălţimilor).
f

124 cm 138 cm
Medie =
132 cm
117 cm 145 cm
Se observă că majoriatea au o înălţime cu variante cuprinse
între 124cm şi 138cm, şi că foarte puţini au sub 117cm sau
peste 145cm.

Dacă încerc să desenez o linie care să delimiteze limita


superioară a acestei forme, obţin o linie curbă care
seamănă foarte mult cu un clopot.

Majoritatea marţienilor au o înălţime aflată mai aproape de


medie (132cm), de centru, decât la distanţă faţă de ea, şi
un număr aproximativ egal de persoane sunt mai înalte sau
mai scunde faţă de medie, înălţimile se împrăştie simetric
în jurul mediei.
SINTEZA NUMERICĂ A DATELOR
Cum am putea folosi un limbaj numeric, sintetic, pentru
toată informaţia pe care am adunat-o?
Cu alte cuvinte, cum calculăm parametrii statistici ai
distribuţiei pe care o avem? Întreaga muncă pe care am
depus-o poate fi sintetizată prin cei 3 parametri statistici care
definesc orice distribuţie normală de variabilă.

Volumul Media Deviaţia Standard a


populaţiei ? populaţiei, cm populaţiei, cm
200 132 7
“PARAMETRII” -
CARACTERISTICI
Simbol în
POPULAŢIE
volumul N
media μ
deviaţia standard σ
INDICATOR DE TENDINŢĂ CENTRALĂ

 Media : suma tuturor valorilor (notate cu x)


dintr-o distribuţie, divizată cu numărul acestor
valori (notat cu n).

μ = Σ x/ n
Media
 Suma tuturor valorilor dintr-o distribuţie de frecvenţă
divizată cu numărul acestor valori
 Ex.: 5 persoane de sex masculin incluse într-un studiu privind
medicamentele antihipertensive au vârstele: 52, 55, 56. 58, 59 ; suma
acestora este 280; prin divizarea cu 5 obţinem media de vîrstă a grupului
de 56 de ani.

 Este foarte sensibilă la valorile extreme, deci nu este un


parametru care să poată caracteriza distribuţiile asimetrice
 Ex.: dacă în exemplul de mai sus ar exista un al şaselea pacient cu vârsta
de 92 de ani, atunci media de vârstă ar fi de 62 de ani, deşi un singir
bărbat est peste 60 de ani; în aceste condiţii mediana ar fi de preferat ca
„punct de mijloc”.

 Rezistă cel mai bine fluctuaţiilor dintre diferite eşantioane


(eşantioane reprezentative repetate ale aceleiaşi populaţii tind să
aibă medii foarte similare , ceea ce se numeşte teorema limitei
centrale (calcul SE).
Distribuţie asimetrică pozitivă

Mod Mediană Medie

38
Mediana
 Împarte distribuţia de frecvenţă în două atunci când toate variabilele
sunt listate în ordine: jumătate la stânga ei, jumătate la dreapta ei

 În cazul unui număr par de variabile, mediana se calculează ca medie a


celor două variabile centrale
 în ex. din slide-ul anterior, vârsta mediană a primilor 5 pacienţi din
studiu este de 56 de ani, având aceeaşi valoare ca şi media; în cazul
în care luăm în considerare primii 6 pacienţi, există două vârste
„centrale”: 56 şi 58 de ani. Mediana reprezintă media aritmetică a
acestora, adică 57 de ani.

 Nu este influenţată de valorile extreme, fiind foarte utilă ca măsură


centrală a distribuţiilor de frecvenţă asimetrice

 Coincide cu percentila 50
Rangul medianei:
Se disting două situaţii:

 Pentru serii cu număr impar de valori (2k +1),


mediana este valoarea de rang k+1.

 Pentru serii cu număr par de valori (2k), mediana


se află între valorile de rang k şi k+1, convenindu-
se a fi reprezentată de media aritmetică a celor
două valori.
Mod
 valoarea care apare cu cea mai mare frecvenţă
(distribuţie unimodală)
 dacă apar două variabile cu cea mai mare frecvenţă,
distribuţia se numeşte bimodală (o distribuţie bimodală
sugerează faptul că două populaţii sunt amestecate, aşa
încât ne putem gândi la împărtirea acestei populaţii în 2
subpopulaţii unimodale care să fie analizate prin
intermediul testelor pentru distribuţii normale)
 dacă mai mult de 2 variabile apar cu cea mai mare
frecvenţă, distribuţia se numeşte multimodală
 este total neinfluenţat de valorile extreme ale
distribuţiei
Distribuţie Bimodală

Mod Medie Mod


Mediană
42
A

Poziţia
parametrilor
50% sub medie

f
B

Medie
Mediană
Mod
43
Distribuţie asimetrică pozitivă

Mod Mediană Medie

44
Distribuţie asimetrică negativă

Medie Mediană Mod

45
Relaţia dintre măsurile tendinţei
centrale depinde de forma distribuţiei

 Dacă modul = mediana = media atunci distribuţia


este unimodală şi simetrică, deci normală
 Dacă modul < mediana < media atunci distribuţia
este uşor asimetrică spre stânga
 Dacă modul > mediana > media atunci distribuţia
este uşor asimetrică spre dreapta
 Dacă modul > media > mediana atunci distribuţia
este puternic asimetrică spre dreapta
 Dacă modul < media < mediana atunci distribuţia
este puternic asimetrică spre stânga
Exemple

Ex: Precizaţi care este mediana şi care este modul


pentru următorul set de date:
3,3,9,5,4,0,6,3,4,0,3,3,3,4,4,5,6,9
0,0,3,3,3,3,3,3,4,4,4,4,5,5,6,6,9,9
Ex: precizaţi care este modul pentru eşantionul de 23
de pacienţi cu următoarele grupe sangvine:
GRUPA SANGVINĂ FRECVENŢA
(NUMĂR DE PACIENŢI)
A 5
B 5
AB 3
O 10
INDICATORI DE TENDINŢĂ CENTRALĂ

 Media
 Mediană
 Mod
Avantaje Dezavantaje

Media -calculată pe baza tuturor -distorsionată de valorile extreme, deci


variabilelor nu este un parametru care să poată
-definit şi deci mangerizat caracteriza distribuţiile asimetrice
matematic - distorsionată de distribuţie asimetrică
-distribuţia eşantionului a variabilelor
cunoscută
-rezistă cel mai bine fluctuaţiilor
dintre diferite eşantioane
Mediana -nedistorsionată de valorile -ignoră majoritatea informaţiei
extreme, fiind foarte utilă ca - într-o oarecare măsură, slabă
măsură centrală a distribuţie de eşantinare
distribuţiilor de frecvenţă - nedefinit matematic
asimetrice
-nedistorsionată de distribuţie
asimetrică a variabilelor
Modul - uşor de calculat -ignoră majoritatea informaţiei
- util pentru datele nominale - slabă stabilitate de eşantionare
- nedefinit matematic
Marţieni şi
Venusieni

Medie

Cât de mult variază înălţimile în fiecare populaţie (marţieni şi


venusieni) se exprimă în forma mai largă sau mai îngustă a
clopotului, deci am putea să o cuantificăm atât prin mărimea
suprafeţei de sub clopot (varianţă), cât şi prin distanţa de la medie
la fiecare variabilă (deviaţia standard). Două populaţii “normale”
(baze de date) pot avea aceeaşi medie dar deviaţii standard diferite
(distanţa de la medie la marginea clopotului). Cu cât SD este mai
mare, cu atât mai mare este variabilitatea (datele sunt mai
“răspândite”, mai “împrăştiate”).
f

124 cm 138 cm
Medie =
132 cm
117 cm 145 cm
VARIANŢA

 media ponderată a abaterilor pătratice dintre


valorile observate şi media lor
k

(x  x)
i 1
i
2
 fi
 x2  k

f
i 1
i
AMPLITUDINEA

 diferenţa dintre valoarea maximă (Xmax) şi


minimă (Xmin) din serie:
A = Xmax – Xmin

 dezavantaj: se bazează doar pe valorile


extreme ale seriei
 nu oferă nici o informaţie despre cât de
aglomerate sunt datele între extreme
DEVIAŢIA STANDARD

 distanţa fiecărui punct faţă de centrul seriei,


abatere care poate fi în sens pozitiv, cât şi în
sens negativ

x    2
x
INDICATORI DE DISPERSIE

Oferă informaţii despre extinderea, împrăştierea


datelor:

 Amplitudine
 Deviaţie standard
 Varianţă
 Coeficient de variaţie
Distribuţia Normală

Datele sunt distribuite similar în stânga şi în dreapta


mediei, aşa încât distribuţia este simetrică.

Are formă de clopot.

Depinde de doi parametri:


 μ = media (populaţiei)
 σ = deviaţia standard (a populaţiei)
Această formă de distribuţie apare atât de des, încât matematicienii au
numit-o distribuţie normală sau gaussiană.
Ex.: dacă AV a unei populaţii este normal distribuită, cu o medie de 70 şi
o DS de 5, atunci putem spune că 68.3% din populaţie are o AV cuprinsă
între 65 şi 75, 95,5% din populaţie are o AV cuprinsă între 60 şi 80 şi
99.7% din populaţie are o AV cuprinsă între 55 şi 85 (teorema limită
centrală)

Medie

1 sd 1 sd 1 sd 1 sd 1 sd 1 sd

68.3%
95,5%
99.7% 57
Coeficientul de variaţie (CV%)

 un indicator procentual al raportului dintre


deviaţia standard şi media caracteristicii
studiate:
COEFICIENTUL DE VARIAȚIE

 Gradul de omogenitate al seriei relativ la pragurile


coeficientului de variaţie:

CV% ≤ 10% Serie omogenă cu dispersie mică


10% < CV% ≤ 20% Serie relative omogenă
20% < CV% ≤ 30% Serie relative eterogenă
30% < CV% Serie eterogenă
Indicatori de localizare

 Ca indicatori de localizare sau de amplasare se utilizează


cuantilele. Cuantilele sunt valori ale variabilei care împart
seria statistică ordonată în n părţi, cuprinzând acelaşi
efectiv, egal cu 1/n din efectivul total.

 Dacă n ia următoarele valori, cuantilele pot fi:


 pentru n = 4, cvartile;
 pentru n = 10, decile;
 pentru n = 100, centile.

60
 Cvartilele împart seria de valori observate în patru părţi de
frecvenţe egale cu ¼. Se notează Q1, Q2, Q3.
 Astfel prima cvartilă sau cvartila de 25 % este o valoare cu proprietatea ca 25 %
dintre datele seriei sunt mai mici sau egale cu ea iar 75 % mai mari sau egale cu
prima cvartilă.
 A doua cvartilă sau cvartila de 50 % este reprezentată de mediană.
 A treia cvartilă sau cvartila de 75 % este o valoare având proprietatea ca 75 %
dintre datele seriei sunt mai mici sau egale cu ea iar 25 % mai mari sau egale cu
a treia cvartilă.

 Decilele, în număr de nouă, împart seria de valori în intervale


conţinând fiecare 10 % din observaţii. A cincea dintre ele se
confundă cu mediana. Se notează D1,….., D9.

 Centilele, în număr de 99, separă seria de variaţie în o sută de


intervale egale, conţinând fiecare 1 % din observaţii. A cincizecea
dintre ele se confundă cu mediana.
61
Măsuri ale Avantaje Dezavantaje
împrăştierii

Amplitudinea - uşor de determinat - utilizează numai două valori


- este distorsionată de valorile
extreme
- tinde să crească odată cu creşterea
volumului eşantionului

Varianţa - utilizează toate valorile - unitatea de măsură este pătratul


- este definită matematic unităţii seriei de date
- este sensibilă la valorile extreme
- nu este un parametru care să poată
caracteriza distribuţiile asimetrice

Deviaţia - are avantajele varianţei - sensibilă la valorile extreme


Standard - unitatea de măsură este - - nu este un parametru care să
aceeaşi cu a seriei de date poată caracteriza distribuţiile
- este uşor de interpretat asimetrice
INDICATORI DE LOCALIZARE

QUANTILE – impartirea in “n” intervale

 CAZURI PARTICULARE
 MEDIANA n = 2
 QUARTILE n = 4
 DECILE n = 10
 CENTILE n = 100
 PROMILE n = 1000
 Calcul: dupa ordonare!

From Primer of Biostatistics by Stanton A Glantz


De reținut:
 Identificarea corectă a variabilelor investigate
permite analiza statistică corectă
 Întotdeauna cînd este posibil colectăm date
cantitative
 Transformarea datelor cantitative în calitative
se face cu pierdere de informaţie
 Scopul statisticii descriptive este de a
prezenta realitatea statistică
 Scopul statisticii inferenţiale este de a
concluziona existenţa sau nu a diferenţei
semnificative statistic
STATISTICĂ DESCRIPTIVĂ ÎN EXCEL

Tools – Add-Ins – Analysis ToolPak

Rezultate
Multumesc pentru atenţia acordată!

S-ar putea să vă placă și