Sunteți pe pagina 1din 40

INTRODUCERE N BIOSTATISTIC

Dr. Liliana Iliescu

Definiii

Statistica este disciplina care se ocup cu culegerea, nregistrarea, gruparea, analiza i interpretarea datelor referitoare la un anumit fenomen, precum i cu formularea unor previziuni privind comportarea viitoare a acestui fenomen.

Definiie

Biostatistica este o ramur a statisticii, specializat n studiul fenomenelor biologice, deci i al celor medicale Se ocup de culegerea, centralizarea i gruparea datelor, de prelucrarea i determinarea unor indicatori pentru descrierea fenomenelor biomedicale studiate, pe baza evidenierii unor regulariti sau variabiliti statistice Aplic i dezvolt tehnici statistico-probabilistice pentru analiza datelor biomedicale

Definirea termenilor
Mulimea pe care se realizeaz un studiu statistic se numete populaie statistic. Elementele componente ale unei populaii se numesc uniti statistice sau indivizi. Numrul total de uniti statistice se numete efectivul total al populaiei statistice. O parte a populaiei statistice aleas special pentru a fi studiat se numete eantion. Proprietatea sau indicatorul n funcie de care se cerceteaz o populaie statistic se numete caracteristic sau variabil statistic.

Definirea termenilor

Caracteristica statistic reprezint acea proprietate care este comun tuturor unitilor unei colectiviti statistice. Deoarece variaz de la o unitate la alta, mai poart numele de variabil statistic (ex: pentru ceramica neolitic o caracteristic o reprezint tehnica de lucru cu mna, ce poate ns varia de la un meter la altul). Nivelul variabilei la fiecare unitate sau grup de uniti, se numete variant.

Definiii
Numrul de apariii (nregistrri) ale unei variante ntr-o colectivitate statistic reprezint frecvena caracteristicii (ex: numrul de fragmente ceramice, numrul de arme, numrul de obiecte din os, numrul de morminte, numrul siturilor arheologice aparinnd unei anume culturi neolitice, etc.)

Caracteristicile statistice se difereniaz dup mai multe criterii


DUP CONINUT: caracteristici de timp caracteristici de spaiu caracteristici atributive

Caracteristicile statistice se difereniaz dup mai multe criterii


DUP MODUL DE EXPRIMARE: caracteristici calitative caracteristici cantitative

Caracteristici cantitative
O caracteristic se numete cantitativ dac se poate exprima cifric sau numeric. Ex: media general, salariul, nlimea, greutatea.

Caracteristici cantitative

O caracteristic cantitativ se numete discontinu sau discret dac nu poate lua dect valori numerice ntregi (Ex: nr. copii, nr. decese, nr. cstorii). O caracteristic cantitativ care poate lua orice valoare dintr-un interval de lungime finit sau infinit se numete caracteristic cantitativ continu (Ex: nlimea, greutatea, TA). Intervalele n care o caracteristica ia valori se numesc grupe sau clase de valori (Ex: grupele de vrst).

Caracteristici calitative
Exprim o nsuire sau o calitate a unitii statistice Ex: masculin/feminin; urban/rural; bolnav/sntos forma = alungit, rotund, oval - n descrierea unor obiecte caracterul =flegmatic, melancolic, sangvinic, coleric - n descrierea unor persoane. Se observ c setul valorilor posibile pentru caracteristicile calitative este finit.

Tipuri de mrimi utilizate

Mrimi absolute: obinute prin msurtoare sau numrare direct: 1 copil, 2 prini, 2 soacre, 4 bunici Mrimi relative Mrimi medii

Tipuri de mrimi utilizate mrimi relative


Mrimi absolute Mrimi relative: raportul dintre dou mrimi absolute; raport subunitar, care se nmulete cu un multiplu de 10 Mrimi medii

Mrimi relative: exemple


Prevalena % (procente) Mortalitatea infantil %o (promile) Indicele de asigurare cu medici %oo (prodecimile) Incidena specific prin HVA %ooo (procentimile) Indicele de centenari %oooo (pri per milion)

Tipuri de mrimi utilizate mrimi medii


Mrimi absolute Mrimi relative Mrimi medii: se obin tot prin raportarea a dou mrimi absolute, dar raportul, fiind supraunitar, nu se mai nmulete cu un multiplu de 10 (Ex. durata medie de spitalizare = zile spitalizare/ nr. pacieni

Tipuri de indicatori- indicatori de structur


Ex: structura populaiei pe sexe, pe etnii; structura pacienilor dup starea la externare Arat ct reprezint o parte dintr-un ntreg (n/N) x 100; Suma prilor componente este ntotdeauna 100%

Tipuri de indicatori indicatori de frecven

Arat intensitatea unui fenomen ntr-o populaie Ex: natalitatea (crude birth rate)

Prelucrarea datelor statistice


Principalii indicatori care caracterizeaz un ir de date sunt fie indicatori de tendin central, fie indicatori ce caracterizeaz mprtierea datelor n jurul unei valori medii (indicatori de variabilitate statistic).

Indicatori de tendin central


Media Mediana - este acea valoare din irul de date care mparte n dou pri egale irul ordonat de valori (irul este ordonat cresctor), situndu-se la mijlocul seriei statistice Modul - - constituie valoarea care apare cel mai des, deci valoarea cu numrul cel mai mare de apariii (varianta cu frecvena cea mai mare)

Indicatori de tendin central


Mediana - este acea valoare din irul de date care mparte n dou pri egale irul ordonat de valori (irul este ordonat cresctor), situndu-se la mijlocul seriei statistice 5, 5, 10, 10, 10, 15, 15, 15, 20, 25 I have found that listing the data out in order is the easiest way to find the median. The numbers 10 and 15 both fall in the middle. I have to average these two numbers to get the median. 10 + 15 = 12.5 2

Indicatori de tendin central


Se calculeaz pentru seria simpl, dar i pentru seria grupat Dac datele pe care le studiem conin valori care se repet des, se obinuiete s se grupeze datele care au aceeai valoare . Numrul de apariii ale unei valori anume se numete frecvena de apariie

INDICATORI DE TENDIN CENTRAL - PENTRU CARACTERISTICILE CANTITATIVE


SERIA SIMPL SERIA GRUPAT

x coloana variantelor (caracteristica cantitativ studiat)

x coloana variantelor f coloana frecvenelor sau pondere (gr. specific)

Media aritmetic simpl

Medie ponderat

Mediana
Modul nu este !! (frecvena de apariie a oricrei variante este 1)

Mediana se calculeaz n funcie de frecvena cumulat Modulul -Varianta cu frecvena cea mai mare

Vrsta modal la deces


Nr.deces e

30
MODULUL

25 20 15 10 5 0

1 an

5 ani

10 ani

15 ani

20 ani

30 ani

40 ani

50 ani
Varsta

Utilitatea medianei
Utilitatea practic a medianei: n caz de variante cu valori prea mari, mediana arat mai bine tipicul seriei I 2500 g 3000 g 3500 g II 2500 g 3000 g 5000 g Doza letal 50 sau DL50 = doza care omoar
jumtate din animalele de experien

Poziia Medianei pentru seria grupat


X (kg) 53 54 f (nr. persoane) 1 3 fcumulat 1 4

55
56 57

5
4 2 15

9
13 15

Mediana: valoarea de la mijlocul seriei; Poziia Medianei = (n+1):2= (15+1):2=8 Dar frecvena cumulat 9 l conine pe 8, deci mediana are valoarea 55 Kg

INDICATORI DE VARIABILITATE STATISTIC PENTRU CARACTERISTICILE CANTITATIVE

1. Mrimi absolute : rangul (amplitudinea variaiei) deviaia medie deviaia standard (sigma) Ptratul deviaiei standard se numete VARIAN

2. Mrimi relative : coeficientul de variaie. coeficientul de precizie

d2 xf n

Deviaia Standard (D.S.)


Este o msur a impreciziei unui set de date, exprim ct sunt de deprtate datele de media lor. Deviaia Standard (DS) i multiplii ei au o importan practic deosebit. Conform teoriei, 95% dintre valori cad n intervalul -2DS +2DS, iar ntre -3DS i 3DS cad restul pn la 99%. ntre -4DS i +4DS cade ntregul set de valori. DS se exprim n unitile de msur ale datelor. mprind procentual DS la medie obinem coeficientul de variaie (CV) exprimat n procente. (De fapt cifra 2 i 3 sunt aproximri ale valorilor de 1.96 i 2.58 care sunt adevratele limite- valori pentru t tabelar!!) n practic ns se obinuiete s se noteze 2DS i 3DS din comoditate

Coeficientul de variaie (CV) reprezint raportul procentual dintre deviaia standard i media aritmetic a seriei de observaii respective:

CV x 100 x
CV.
CV.

< 10%
10 - 30%

dispersie mic
dispersie medie

colectivitate omogen

CV.

> 30%

dispersie mare

colectivitate eterogen

C.P. x100 x

COEFICIENTUL DE PRECIZIE (CP.)

Rangul:

R = X n - Xi sau Xmax -Xmin

Serie simpl

Serie grupat

x
7 8

f
2 4

d
- 2,8 - 1,8

d2
7,84 3,24

d2f
15,68 12,96

9
10 11 12

7
11 8 3 35

- 0,8
+ 0,2 + 1,2 + 2,2

0,64
0,04 1,44 4,84

4,48
0,44 11,52 14,52 59,60

x = 9,8 zile; Deviaia standard n cazul seriei grupate:

d2 xf n 1

59,60 1,75 1,3 zile 34

Rezultatul final (reducerea datelor statistice) este: x = 9,8 zile = 1,3 zile n =35 Perioada de incubaie a tusei convulsive, la lotul de 35 bolnavi studiat, este de: 9,8 1,3 zile.

Prelucrarea caracteristicilor calitative

Definiia probabilitii;

Probabilitatea matematic se stabilete a priori; probabilitatea empiric (experimental) Probabilitatea fundamental se stabilete a posteriori; probabilitatea empiric (experimental)

PA = Nr. cazuri favorabile/nr.cazuri posibile sau existente

nr. nascuti vii de sex M 51,5 % nr. nascuti vii de sex F 48,5 %

Masculin: p = 0,515 Feminin: q = 0,485 P = 51,5 % Q = 48,5 % n P x 100 p+q=1 N P + Q = 100

Probabiliti
P reprezint probabilitatea unui eveniment de a se produce Q reprezint contraprobabilitatea P = 51% - probabilitatea de a se nate bieel Q = 49% - probabilitatea de a se nate feti sau de a NU se nate bieel

In biostatistic, n studiul fenomenelor de mas (medico-biologice) acioneaz probabilitatea fundamental, care este o probabilitate medie. Probabilitatea producerii unui eveniment merge de la imposibilitatea producerii lui i pn la certitudine, i variaz ntre 0 1 sau 0 100, fr a atinge cele dou extreme. Cu ct probabilitatea se apropie de 1 sau 100 cu att probabilitatea producerii evenimentului este mai mare. Dac p sau P este egal cu sau 50%, atunci sunt anse egale ca evenimentul s se produc sau s nu se produc.

Prelucrarea datelor statistice calitative

Probabilitatea nu se aplic pe caz n parte, ci pe colectivitate Prelucrarea datelor statistice n cazul caracteristicilor calitative, se realizeaz prin calculul frecvenei acestora Frecvena relativ a apariiei unui eveniment este considerat probabilitatea acelui eveniment. De aceea, frecvena se noteaz cu P Calculul variaiei (dispersiei) unei frecvene (deviaia standard)

PxQ

Calculul erorii standard pentru caracteristici calitative


n

PxQ n

Generalizarea datelor Intervalul de ncredere sau de siguran statistic

IC x t
IC = Limit Inf.

IC P t
Limit Sup.

Definiia Intervalului de Confiden (de ncredere sau siguran statistic)

Este intervalul n care pornind de la media pe eantion, dac studiem caracteristici cantitative sau de la frecvena pe eantion, n cazul caracteristicilor calitative, putem estima, media sau frecvena pentru colectivitatea general (N) IC stabilete media sau frecvena pentru colectivitatea general (N). Media sau frecvena pentru N este estimat cu un grad ridicat de probabilitate, i nu stabilit cu certitudine

Testul T student

Utilizat pentru testarea semnificaiei diferenei dintre dou medii sau dou frecvene, luate dou cte dou Dac t calculat > t tabelar, atunci diferena dintre cele dou medii sau frecvene este semnificativ statistic, deci are la baz factori obiectivi, care pot fi evideniai prin continuarea cercetrii

Formula pentru t calculat: variana (var) reprezint ptratul deviaiei standard

Testul chi ptrat


Pentru testarea semnificaiei diferenei dintre dou sau mai multe frecvene; dintre dou sau mai multe distribuii NU se utilizeaz pentru medii !!!

Testul chi ptrat: O= frecv. obs; E = frecv. Ateptate sau teoretice

S-ar putea să vă placă și