Sunteți pe pagina 1din 47

Elemente de

biostatistica
Statistica descriptiva
- variabile cantitative -
masura tendintei centrale
- Media
- Mediana
- Modul
masura dispersiei
- Deviatia standard
- Varianta
distributia normala
Dispersia
indepartarea, abaterea valorilor fata de
valori centrale

Media

x
x
x

x x
x
Indicatori ai dispersiei

• Amplitudinea (A): diferenta între valorile maxima si


minima ale seriei de date:
A = X max - X min
Varianţa
Deviaţia standard
Varianta
Media patratului deviatiilor de la medie

Σ(Xi – X)2
n
Deviatia (abaterea) standard
– dă informaţii despre distribuţia datelor
obţinute
– o măsură a distribuţiei, calculată din mulţimea
de valori în care fiecare diferă de media
aritmetică a acestora
– cu cât deviaţia e mai mică, cu atât grupul e
mai omogen

S = SD = σ = ∑ (xi-x)2

n-1
Deviatia (abaterea) standard
Atentie la utilizarea DS ca index comparativ al
dispersiei!
G elefantilor la nastere Greutatea soriceilor la
(kg) nastere (kg)
929 853 0.72 0.42
878 939 0.63 0.31
895 972 0.59 0.38
937 841 0.79 0.96
801 826 1.06 0.89
n=10 n=10
xmediu= 887.1 xmediu = 0.68
sd = 56.50 sd = 0.255

Elefantii prezinta variatii mai mari ale greutatii la nastere, comparativ cu soriceii?
Coeficientul de variatie
Raport procentual între abaterea standard şi
valoarea medie a şirului
SD
CV = x 100
medie
Se utilizeaza in compararea a 2 grupuri cand mediile
pentru cele 2 grupuri :
 sunt semnificativ diferite
 sunt exprimate in unitati de masura diferite
Coeficientul de variatie

G elefantilor la nastere Greutatea soriceilor la


(kg) nastere (kg)
929 853 0.72 0.42
878 939 0.63 0.31
895 972 0.59 0.38
937 841 0.79 0.96
801 826 1.06 0.89
n=10, media = 887.1 n=10, media 0.68
sd = 56.50 sd = 0.255
CV = 0.0637 CV = 0.375
Coeficientul de corelatie
index numeric care indica gradul de
corespondenţă dintre 2 seturi de măsurători
ex: coeficientul de corelaţie Pearson
(valorile lui r semnificativ diferite de 0 arată că
aceste rezultate nu se datorează întâmplării)
Statistica descriptiva
- variabile cantitative -
masura tendintei centrale
- Media
- Mediana
- Modulul
masura dispersiei
- Deviatia standard
- Varianta
distributia normala
Distribuţia normală – curba Gauss

SD de la medie
Distribuţia normală – curba Gauss
curbă de distribuţie a
frecvenţelor şi
probabilităţilor
formă de clopot
unimodală
simetrică

SD de la medie
Distribuţia normală – curba Gauss

extremităţile distribuţiei
nu ating linia bazală
se extind de la minus
infinit la plus infinit
media este la mijlocul
curbei, coincide cu
mediana şi modulul

SD de la medie
Distribuţia normală – curba Gauss

mediana determină
poziţia curbei pe axul
orizontal
deviaţia standard
determină extensia curbei

SD de la medie
Zona (-1SD, 1SD) cuprinde 68.3% din date
Zona (-1.96 SD, 1.96 SD) cuprinde 95% din date
Zona (-2.58 SD, 2.58 SD) cuprinde 99% din date
Distribuţia normală – curba Gauss
Distributia asimetrica
(skewness)

Coeficient de asimetrie (skewness) pozitiv


Coeficient de asimetrie (skewness) negativ
Modul
Mediana
Medie
Distributie asimetrica negativa bimodala

Test de inteligenta
Distributia asimetrica
Mean 737.8128753
Standard Error 1.854673874
Median 752
Mode 843
Standard Deviation 101.5508046
Sample Variance 10312.56591
Kurtosis 0.050126434
Skewness -0.648470036
Range 624
Minimum 301
Maximum 925
Sum 2211963
Count 2998

asimetrie negativa, aglomerare spre scoruri mari


Mean 624.4124755
Standard Error 1.558121151
Median 626
Mode 684
Standard Deviation 86.21916575
Sample Variance 7433.744542
Kurtosis -0.280668553
Skewness -0.045138512
Range 625
Minimum 233
Maximum 858
Sum 1911951
Count 3062
Kurtozis (boltirea)

Platkurtozis Leptokurtozis
aceeasi medie, mediana, modul
Statistica descriptiva
- variabile cantitative -
masura tendintei centrale
- Media
- Mediana
- Modulul
masura dispersiei
- Deviatia standard
- Varianta
distributia normala
Statistica inferentiala
Estimare statistica
– a parametrilor unei populatii pe baza
rezultatelor unui esantion
– aplicarea “Intervalului de incredere”
Testarea unor ipoteze
– aplicarea “Testelor de semnificatie statistica”.
Esantionajul
procedee de selecţie aleatoare a cazurilor:
– tragerea la sorţi
– cu ajutorul unui tabel cu numere aleatoare
sau a unor numere aleatoare generate pe
calculator
– pasul de numărare: se calculează raportul nr.
de indivizi din populaţie / nr de indivizi ai
eşantionului
Esantionajul
se doreste estimarea greutatii medii la
nastere a NN din Romania
esantion 100 din nascutii vii in Maternitate
Brasov in anul 2009

Toti NN
vii din
SOG-BV, Esantion randomizat
2009 100 NN

Toti NN vii din Populatia esantionata


Romania
Populatia tinta
Tipuri de eşantionaj
1. eşantionaj aleator simplu sau elementar
– extragerea la sorţi a unităţilor ce vor compune eşantionul
– baza de sondaj = lista din care se vor extrage aleator unităţile de
selecţie
ex.: lista tuturor nou-născuţilor
– calitatea eşantionului:
adecvată: să conţină toată populaţia
completă: să conţină toate categoriile care interesează studiul
să nu repete aceleaşi unităţi de mai multe ori
să fie exactă (persoanele de pe listă să existe)
să fie adusă la zi – actualizată
să fie convenabilă pentru nevoile studiului
Tipuri de eşantionaj
2. eşantionaj sistematic:
– extragerea unităţilor din listă se face cu un
pas de numărare
– risc: introducerea unor erori sistematice
(pentru că fiecare unitate extrasă depinde de
precedenta)
Tipuri de eşantionaj
3. eşantionaj stratificat
– folosit atunci când în teritoriul populaţiei de referinţă,
(ţintă) straturile se deosebesc substanţial din punct de
vedere al caracteristicilor
ex.: fertilitatea diferă în funcţie de vârstă
– stratul = subpopulaţie cu unele caracteristici
asemănătoare
– indicat când straturile sunt eterogene între ele şi
omogene în interior
– avantaj: creşterea preciziei, a reprezentativităţii,
obţinerea unor rezultate valabile pentru generalizare
3. eşantionaj stratificat
Ex.1 : esantion:120 de barbati si 60 de femei
- nu poate fi considerat reprezentativ pentru populatia
adulta a tarii
- poate fi considerat reprezentativ în cazul în care
indivizii selectati sunt suferinzi de o maladie despre care
se stie ca are incidenta dubla la barbati fata de femei.
Ex.2 : populatie stratificata dupa varsta: sub 21 ani, 21-30
ani, 31-40 ani, 41-50 ani, 51-60 ani, peste 60 ani.
Tipuri de eşantionaj
4. eşantionajul în cuiburi (ciorchine, cluster, grappes):
– folosit când lipseşte o bază de sondaj care să conţină
unităţile de observaţie sau când întocmirea ei este
greoaie ori costisitoare
– cuibul = unitate de selecţie heterogenă în care sunt
agregate mai multe unităţi de observare
– extragerea aleatoare a cuiburilor este urmată de analiza
tuturor unităţilor din cuiburile extrase
ex. gravidele fac parte din familii, care aparţin unor colectivităţi
(comune), din ţară – în loc de totalitatea gravidelor din ţară
eşantionul: gravidele din 10% din comunele ţării
4. eşantionajul în cuiburi
- nu este indicat daca
exista diferente mari
intre cuiburi
Tipuri de eşantionaj
5. eşantionajul multistadial:
– se fac mai multe extrageri: grupuri de rang1,2,...
– se foloseşte cel bi sau tristadial
6. eşantionajul multifazic
– combină procedeele anterioare
– constă din constituirea unui eşantion primar pentru
obţinerea informaţiilor cu caracter general, urmat de
alcătuirea unuia sau mai multor subeşantioane ale
eşantionului primar, pentru obţinerea de informaţii
superioare
6. eşantionajul
multifazic
– Ex: esantionaj
stratificat + in cuiburi
– avantaj legat de
costuri (cuiburi)
– reduce eroarea prin
stratificare
Determinarea mărimii eşantionului
– cu ajutorul tabelelor
– cu ajutorul formulelor
Statistica inferentiala
Estimare statistica
– a parametrilor unei populatii pe baza
rezultatelor unui esantion
– aplicarea “Intervalului de incredere”
Testarea unor ipoteze
– aplicarea “Testelor de semnificatie statistica”.
Esantionajul
se doreste estimarea greutatii medii la nastere a NN din
Romania; esantion 100 din NN vii in Maternitate BV in 2009

Esantion randomizat
G medie esantion - G medie pop. esantionata 100 NN
3.5 kg – 3.27 kg = 0.23kg G medie esantion 3.5 kg
Sampling error sd = 0.25kg

Toti NN
vii din
SOG-BV, Populatia esantionata
2009 G medie pop. esantionata 3.27kg
Toti NN vii din sd = 0.38 kg
Romania
Populatia tinta
Sampling error (Eroare de esantionaj)

- Diferenta intre media esantionului si media populatiei


esantionate
- Nu poate fi evitata decat prin masurarea tuturor indivizilor
populatiei
- Poate fi estimata: Eroare standard
- Este cu atat mai mica cu cat numarul subiectilor din
esantion este mai mare

s
S- deviatia standard a esantionului S .E. X 
n – nr. subiecti esantion n
Estimarea mediei
Utilizand proprietatile
distributiei normale se poate
estima intervalul in care se
incadreaza media populatiei

Populatie Esantion µ x

Medie µ x

Deviatie σ s
Standard (SD)
Interval de incredere
Intervalul in care se poate incadra un parametru al unei
populatii, cu o anumita probabilitate

Interval de incredere 95% (exista 95% sanse ca media


populatiei sa se gaseasca in acel interval)
Media esantionului  1.96 x Eroarea standard
s
Zona (-1SD, 1SD) cuprinde 68.3% din date
S .E. X 
Zona (-1.96 SD, 1.96 SD) cuprinde 95% din date n
Zona (-2.58 SD, 2.58 SD) cuprinde 99% din date
Statistica inferentiala
Estimare statistica
– punctuala – ignora eroarea de esantionare
– prin aplicarea “Intervalului de incredere”
Testarea unor ipoteze
– aplicarea “Testelor de semnificatie statistica”.
Testarea unor ipoteze
- aplicarea “testelor de semnificatie statistica”-

- numai pentru testarea unei diferente


Ipoteza de lucru: testul de stress creste pulsul.
Etape:
1. Decideti diferenta de testat
Intre subiectii supusi testului de stress si cei care nu au fost supusi
2. Formulati ipoteza nula:
H0: test=control
3. Ipoteza alternativa:
H1 : test  control
Testarea unor ipoteze
- aplicarea “testelor de semnificatie statistica”-

4. Alegerea testului de semnificatie.


5. Rezultatele testului estimeaza probabilitatea ca
diferentele sa fie datorate erorii de esantionare
6. Pe baza acestei probabilitati se respinge sau nu ipoteza
nula
7. Concluzia, in context:
…din datele analizate a reiesit ca subiectii care au fost supusi
testului de efort au avut, in medie, valori mai mari ale pulsului,
comparativ cu grupul control.
Erorile de tip I si II, puterea si
marimea esantionului

S-ar putea să vă placă și