Sunteți pe pagina 1din 49

Elemente de

biostatistica
De ce avem nevoie de statistica?

pentru concluzii cât mai valide din cantitati


limitate de date.
calculele statistice extrapoleaza de la
esantion la populatie
Ce pot face calculele statistice?
Estimarea statistica
– ex: media - estimare punctuala
– interval de încredere
Testarea statistica a unei ipoteze
– decizia daca o asociere observata este reala,
sau datorata întâmplarii / p
Construirea de modele statistice
- testeaza cît de bine se încadreaza datele
experimentale într-un model matematic (ex:
regresia lineara)
Termeni statistici
Colectivitate statistică
- totalitatea elementelor care au caracteristici
comune şi care formează obiectul analizei statistice

Colectivitatea statistică generală = populaţia


- totalitatea elementelor, de un anumit tip, existente
teoretic sau practic
Ex.: mulţimea microbilor dintr-o cultură
Termeni statistici
• Colectivitatea statistică parţială
– o parte din totalitatea unităţilor de observare existente,
supusă studiului
– constituită aleator = eşantion = mostră
- partea extrasă întâmplător dintr-o populaţie, după criterii
bine stabilite
Ex.: totalitatea hematiilor numărate cu ocazia unei HLG
– constituită nealeator
- partea extrasă dintr-o populaţie, în funcţie de unul sau mai
multe criterii, dar neîntâmplător
Ex.: totalitatea pacienţilor cu colecistită acută dintr-un spital
Termeni statistici
Unitatea statistică
unitate de observare, fiecare element
component al colectivităţii statistice
Ex.: gravida, dispensarul
Caracteristica (variabila)
- trăsătură comună unităţilor unei populaţii
- reţinută pentru investigaţie
- caracteristicile pot fi calitative sau cantitative
Caracteristicile calitative
nominale
- nume/simboluri ce nu pot fi ordonate una în
raport cu cealalta
ex.: nume, grupa sg., sex, rasa, culoare ochi, dg., etc
– variabile dihotomice (binare, bimodale)
ex.: mort/viu, fumator/nefumator, prezent/absent,
normal/anormal, DA/NU
ordinale
ex. stadiul bolii (usor, moderat, sever)
Caracteristicile cantitative
- măsurabile
continue
ex.: înălţime, greutate, glicemie, varsta
discontinue (discrete) = numere întregi
ex.: numărul de sarcini, numărul de N-N vii, etc.
dihotomice – care pot avea doar 2 valori

Caracteristicile cantitative pot fi transformate in


caracteristici calitative (varsta, inaltime → clase)
Statistica descriptiva

utila in prezentarea unui set de date


permite inţelegerea facilă a caracteristicilor
evenimentelor studiate
“descrierea" poate fi făcută grafic sau prin
indicatori
Statistica descriptiva
- variabile nominale -
tabel de frecventa (a observatiilor pe
categorii)
grafic: bare, rozeta, s.a.
modulul (categoria cea mai frecventa)
Tabel de frecventa
Diagrama
Histograma
Diagrama circulara - rozeta
Distributia pe orase a cazurilor incluse in studiu
Radar chart
Statistica descriptiva
- variabile cantitative -
masura tendintei centrale
- Media
- Mediana
- Modul
masura dispersiei
- Deviatia standard
- Varianta
distributia normala
Indicatori de tendinţă centrală ai
caracteristicilor cantitative
Media aritmetica
Mediana
Modulul

Utilizati pentru:
Prezentarea in rezumat a unor date
Ca puncte de referinta in compararea unor
grupuri de date
Media aritmetică
suma tuturor scorurilor împărţită la
numărul de scoruri
ex: a+b+c+d+e+f / 6
suma abaterilor valorilor individuale de la
media aritmetică e 0

2, 5, 2, 1, 5
2, 5, 2, 1, 5
media = 3
Media aritmetică
are întotdeauna semnificaţie în cazul
datelor de tip continuu
nu are întotdeauna semnificaţie în cazul
datelor discrete
dezavantaj: sensibilă la valori extreme
x1 87 87
x2 95 95
x3 98 98
x4 101 101
x5 105.0 1050
medie 97.2 286.2
Media aritmetică ponderată
suma produsului dintre valorile variabilei şi
frecvenţa lor în serie / numărul valorilor (exprimat
ca sumă a frecvenţelor)
permite generalizarea rezultatelor la nivelul
populaţiei
Media aritmetică ponderată
suma produsului dintre valorile variabilei şi frecvenţa lor în
serie / numărul valorilor (exprimat ca sumă a frecvenţelor)

Ex.: 2 clase
A. 5 elevi: 10,10,10,10,9 – media pe clasa 49/5=9.8
B. 10 elevi: 10,9,8,9,7,4,7,3,4,5 – media 66/10=6.6

• Media pe scoala?
• Media ponderata pe scoala: (9.8 x 5 + 6.6 x 10) : 15 = 7.66
• Media pe scoala 9.8+6.6 : 2 = 8.2 – gresit!!
Interpretarea gresita a datelor

“In medie, rezultatele elevilor din clasa mea la


matematica sunt bune.
Jumatate dintre elevi cred ca 2+2=3, cealalta
jumatate ca 2+2=5.”
Mediana

valoarea care apare la mijlocul secvenţei


ordonate a scorurilor (împarte şirul de
rezultate ordonate în două părţi egale)

folosită la stabilirea dozelor medii (DL50,


DE50)
Mediana
serii cu număr impar de valori: (2 K + 1)
mediana este valoarea de la pozitia (K+1)
• ex: 1+2+2+3+4+5+6
mediana: 3

serii cu număr par de valori (2k) –


mediana este reprezentată de media
valorilor K şi K+1
Mediana
0,10, 20, 30
Mediana
15
Mediana
14,28,0,1,1
Pasul 1: ordonare
0,1,1,14,28
Mediana
1
Nu e influenţată de valorile extreme ale
seriei
x1 87 87
x2 95 95
x3 98 98
x4 101 101
x5 105.0 1050
Modulul
numărul care apare cel mai frecvent într-
un şir de scoruri

ex: 1+2+2+3+4+5+6 → modulul: 2


Poate exista mai mult de un modul ?
1,2,2,3,4,4,5,6,7

2 si 4
Modul
1,1,2,2,3,3,4,4

NU exista modul
Repartitie uniforma
Modul
oferă informaţii asupra omogenităţii seriei
de variaţie
– repartiţia are 2 maxime = repartiţie bimodală
– repartiţia are mai mult de 2 maxime =
repartiţie multimodală
– repartiţia are un minim = antimodală
poate fi utilizat si pentru variabile calitative
Repartitie unimodala
Repartitie bimodala
Repartitie bimodala
Media, mediana, modul
2, 1, 0, 1, 5, 3, 4, 2, 0, 3, 1, 2
Media
2
Mediana
2
Modulul
1 si 2
Media geometrica

Radical de ordinul N din produsul numerelor

n

M
G x
n1
x2
x3 
...
xnxi n

i1
Intervalul:
• între valoarea minimă şi maximă

Quantile:
valori care împart distribuţia şirului în valori egale:
• mediana – împarte distribuţia în 2 părţi egale
• quartila – împarte distribuţia în 4 părţi egale
• centila – împarte distribuţia în 100 de părţi egale

Box plot
modalitate de prezentare a distribuţiei bazată pe valorile
centile
Boxplot
Boxplot
Care este mediana si care sunt quartilele

6, 3, 9, 8, 4, 10, 8, 4, 15, 8, 10
Ordonarea datelor
Q1 Q2 Q3

3, 4, 4, 6, 8, 8, 8, 9, 10, 10, 15,

Quartila Quartila
inf. = 4 Median sup. = 10
a=8

Intervalul inter-quartile = 10 - 4 = 6

S-ar putea să vă placă și