Documente Academic
Documente Profesional
Documente Cultură
BIOSTATISTICĂ PENTRU
CERCETAREA MEDICALĂ
Conținutul acestui curs:
• Tipuri de date
• Sintetizarea datelor
• Reprezentari grafice
• Distribuția normală
• Eșantionare
• Eroarea standard si intervale de încredere
• Teste de semnificație: principii, interpretarea valorii p,
erori, legatura cu intervalele de incredere, teste de
semnificatie multipla
• Metode de inferență pentru medii
• Tabele de contingență, testul hi-patrat, testul Fisher
• Corelatia si regresia
Tipuri de date
• Datele calitative (variabilă categorială,
variabilă de clasificare sau atribut) apar
atunci când indivizii pot aparține unor (fi
clasificați în) clase separate.
• Datele cantitative sunt numerice și sunt
obținute fie prin numărare (întregi - discrete)
fie sunt rezultatul unei măsurători (valori din
interval – continue).
Tipuri de date
• Populație - nr mare de indivizi
- caracter dinamic
- este bine definită la un moment de timp dat
• Eșantion-ul este parte “mică” din populaţie (se poate
extrage suficientă informaţie pentru a se face inferenţe
asupra caracteristicilor studiate la nivelul populaţiei)
• Variabilele sunt calități sau cantități care pot să aibă
valori diferite de la un membru al unui grup (eșantion) la
altul.
• O statistică este o formulă a cărei valoare se obține cu
ajutorul datelor dintr-un eșantion.
Sintetizarea datelor
Numărul de persoane care aparțin unei anumite categorii se numeşte frecvenţă.
Proporţia persoanelor care aparțin unei anumite categorii se numește frecvență
relativă.
Muțimea valorilor frecvenţelor pentru toate categoriile posibile se numeşte
distribuţie de frecvenţă a variabilei.
Frecvenţa cumulată pentru o valoare a unei variabile reprezintă numărul de
indivizi cu valori mai mici sau egale cu această valoare.
Frecvenţa cumulată relativă pentru o valoare este proporţia de indivizi din
eşantion cu valori mai mici sau egale cu această valoare.
Mediana este valoarea centrală a distribuţiei astfel încât jumătate dintre
observaţii sunt mai mici sau egale decât valoarea ei şi jumătate sunt mai mari sau
egale cu aceasta (cuartile).
Media artimetică, de obicei întâlnită sub denumirea simplă de medie, se obține
prin însumarea valorilor tuturor observațiilor și apoi prin împărțirea sumei la
numărul lor.
Amplitudinea este diferenţa dintre cea mai mare şi cea mai mică valoare.
Varianța sau dispersia este media aritmetică a pătratelor diferențelor dintre
observații și media lor.
Abaterea standard (SD = standard deviation) este rădăcina pătrată din varianță
sau dispersie.
Reprezentari grafice
Oy: Sănătoși
Frecvența relativă
Pacienți cu
Frecvența
accident vascular
Presupuneri:
Observaţiile din grup sunt independente între ele (eșantion mare
şi mic)
Observațiile provin dintr-o distribuție normală (esantion mic)
Date în perechi
Interval de încredere (CI) pentru media diferențelor bazat pe
distribuția normală (eșantion mare) sau distributia t (esantion
mic).
Test de semnificație:
- Ipoteza nulă: Media schimbărilor în populație este 0.
- Ipoteza alternativă: Există o schimbare (în orice direcție).
Diferența dintre media observată în eşantionul și media
populației (aici 0) împărţită prin eroarea standard (statistica
testului) va urma distribuţia normală standard (eșantion mare)
sau distributia t (esantion mic) cu n – 1 grade de libertate.
Presupuneri:
Observațiile din fiecare grup sunt independente între ele
(diferenţele intre observaţiile corespondente sunt
independente) (eșantion mare şi mic)
Diferențele urmează o distribuție normală (eșantion mic)
Studierea efectului marimii esantionului (eșantion mare şi
mic)
Date independente
Intervalul de încredere pentru diferența mediilor bazat pe
distribuția normală (eșantion mare) sau distributia t (esantion
mic).
Ipoteza nulă pentru testarea egalitatății cu 0 a diferenţei mediilor.
Diferența dintre media observată în primul eşantion și cel de-al
doilea împărţită prin eroarea standard va urma distribuţia
normală standard (eșantioane mari) sau distributia t (esantioane
mici) cu n1 + n2 – 2 grade de libertate.
Presupuneri:
Observațiile din fiecare grup si grupurile sunt
independente între ele (eșantion mare şi mic)
Distribuția observatiilor este normală pentru fiecare grup
(eșantion mic)
Varianțele sunt aceleași în fiecare populație (eșantion
mic)
Atentie la calculul erorii standard!
Tabele de contingență
Tabel încrucișat pentru două variabile categoriale sau calitative
(tabel de contingenţă).