Sunteți pe pagina 1din 29

NOTIUNI DE STATISTICA I

C. Bicu, 2007

De ce avem nevoie de statistic?


Vrem sa tragem concluzii ct mai valide din cantit i limitate de date. Diferen e importante sunt deseori mascate de variabilitatea biologic i/sau imprecizia experimental Mintea uman exceleaz n gsirea de tipare i rela ii, dar tinde s generalizeze n exces.

De ce avem nevoie de statistic?

Calculele statistice extrapoleaz de la eantion la popula ie


n cercetarea biomedical se presupune c popula ia este infinit, sau cel pu in foarte mare n compara ie cu eantionul nostru.

De ce avem nevoie de statistic?


Control de calitate O fabric de cmi: se extrage la ntmplare un eantion din ntreaga popula ie de cmi, iar concluziile legate de calitatea eantionului se extrapoleaz la toat produc ia.

De ce avem nevoie de statistic?


Sondajul politic Se extrage la ntmplare un eantion de votan i, iar rezultatul se extrapoleaz la ntreaga popula ie de votan i

De ce avem nevoie de statistic?


Studii clinice Eantionul de pacien i studiat este rareori extras la ntmplare. Totui, pacien ii inclui n studiu sunt reprezentativi pentru al i pacien i similari, iar extrapolarea de la eantion la popula ie se poate face. Care este defini ia precis a popula iei?
To i pacien ii care vin la acel spital? To i pacien ii din ora? Din ar? Din lume?

Ce pot face calculele statistice?


Estimarea statistic
ex: media - estimare punctual interval de ncredere

Testarea statistic a unei ipoteze


decizia dac o asociere observat este real, sau datorat ntmplrii / p

Construirea de modele statistice


testeaz ct de bine se ncadreaz datele experimentale ntr-un model matematic (ex: regresia linear)

Tipuri de variabile
Variabila = orice calitate, caracteristic sau constituent al unei persoane sau lucru, care poate fi msurat toat cercetarea medical = studiul rela iilor dintre variabile cercettorii medicali sunt interesa i de studierea fie a asocia iilor, fie a diferen elor dintre variabile.

Tipuri de variabile
Variabile nominale
variabile sub form de nume sau alte simboluri reprezentnd categorii ce nu pot fi ordonate una n raport cu cealalt numele, grupa sanguin, sexul, rasa, culoarea ochilor, diagnosticul etc. variabile dihotomice (binare, bimodale) = variabile ce nu pot lua dect dou valori
mort/viu, fumtor/nefumtor, prezent/absent, normal/anormal - DA/NU

Tipuri de variabile
Variabile ordinale
variabile ce sunt clasificate n mai mult de dou categorii i la care exist o ordine natural ntre categorii evolu ia, stadializri, clasificri, scoruri etc.

Tipuri de variabile
Variabile cantitative
continue
variabile cu un numr poten ial infinit de valori de-a lungul unui continuum nl imea, greutatea, TA, vrsta etc.

discontinue (discrete)
variabile ce pot fi descrise numai prin unit i ntregi ce nu pot fi msurate n intervale mai mici dect unitatea AV, nr. copii etc.

Tipuri de variabile - statistic descriptiv


Variabile nominale tabel de frecven (frecven a observa iilor pe categorii) grafic: bare, plcint modul (categoria cea mai frecvent)

F ig u r a I I.3 . D i s t r ib u i a p e o r a e a c a z u r i lo r in c lu s e n s t u d iu

TIMISOARA

11 (6,7%) 3 (1,8%) 10 (6%) 13 (8%) 23 (14%)

TARGU MURES

SIBIU

IASI

CLUJ

BUCURESTI

98 (60%) 6 (3,7%)

BRASOV

Tipuri de variabile - statistic descriptiv


Variabile ordinale tabel de frecven , mediana, modul utilitatea mediei este discutabil (intervalele dintre categorii nu sunt egale ca mrime) deseori, media este furnizat - se presupune c intervalele scalei sunt egale sau, cel pu in aproximativ egale

Clasa NYHA I II III IV TOTAL

Frecventa Frecventa Frecventa relativa cumulata 23,8% 23,8% 5 % % 7 6 3 21


33,3% % 28,6% % 57% % 85,7% %

% 14,3%
100% %

% 100%

Tipuri de variabile - statistic descriptiv


Variabile cantitative msura tendin ei centrale (media, mediana, modul) msura dispersiei (devia ia standard, varian a) distribu ia normal

47,5%

SD =

(x-x)2 n-1

SD = deviatia standard
arata gradul de dispersie al valorilor

SEM = eroarea standard a mediei


CI95% al mediei SEM = SD / \/n

Variabile i teste statistice


distribu ie normal Variabil numeric distribu ie normal teste parametrice corela ie/regresie teste neparametrice Mann-Whitney U, Wilcoxon Student (t) Regresie linear multipl

Variabil ordinal

Variabil dihotomic

X2 Fisher exact

Regresie logistic

Interval de timp

Log rank

Modelul lui Cox

Compara ia a 2 grupuri distribu ie normal teste parametrice Compara ia a 3 grupuri Corela ia a 2 variabile n acelai grup distribu ie nonnormal Variabil ordinal teste nonparametrice Corela ia a 2 variabile n acelai grup Compara a a 2 grupuri Compara ia a 3 grupuri Variabil dihotomic Interval de timp

Student (t) Test F (ANOVA)

Regresie linear multipl

Variabil cantitativ

Corela ie (coeficient Pearson)/ regresie Corela ie (coef. Spearman)

Mann-Whitney U, Wilcoxon Kruskall-Wallis Regresie logistic Modelul lui Cox

X2 Fisher exact Log rank

NOTIUNI DE STATISTICA II

C. Bicu, 2005

P si intervalele de incredere

Cristian Baicus nov 2005

popula ie

eantionare

p, CI

eantion

Incertitudinea statistica
Incertitudinea (prezenta chiar intr-un esantion reprezentativ) care apare atunci cand folosim datele esantionului pentru a trage concluzii asupra populatiei