Sunteți pe pagina 1din 10

Biostatistic - Cursul I

CURSUL I

1.Introducere
Statistica este asociat cu un anumit tip de prelucrare a informaiilor din lumea nconjurtoare i anume acel
tip de prelucrare care clasific, centralizeaz informaiile n tabele, i grafice, grupeaz informaiile,
descoper legturi ntre ele, descoper eventuale cauzaliti, analizeaz fenomene complexe. n plus,
statistica face i generalizri ale unor ipoteze descoperite de obicei empiric. Chiar dac nu avem o idee
precis, cu toii gndim despre aceast tiin c nu opereaz cu informaii referitoare la un pacient sau o
plant sau un obiect sau la un numr foarte restrns de astfel de entiti. tim c statistica este tiina care
prelucreaz informaii care se refer la un numr mare de entiti cum ar fi pacieni sau indivizi sntoi sau
sau plante sau obiecte de alt natur.
Utilitatea statisticii este pus mai bine n eviden atunci cnd trebuie studiate fenomene complexe n care
intervin factori sau mrimi care se afl n relaii complexe ce nu pot fi descrise satisfctor prin ecuaii sau
formule, sau prin relaii cantitative de dependen. De exemplu, n tehnic, dac suntem la un moment dat
interesai de consumul de carburant al unui motor, exist n mod sigur o determinare destul de exact a
acestuia n funcie de puterea motorului, tipul su, viteza de deplasare, i ali civa parametri. Cunoscnd
parametrii de care depinde consumul, aplicm o formul i obinem consumul de carburant al acelui motor.
Ceea ce obinem este valabil pentru orice motor de acelai tip i care funcioneaz n aceleai condiii.
Atunci cnd vorbim de prelucrarea statistic a informaiilor, folosim expresia prelucrare a datelor.
Informaiile referitoare la un pacient sau la un individ normal sau la orice alt obiect le numim Date. Numele,
prenumele, vrsta, sexul, afeciunea i celelalte informaii despre un anume pacient, mrimea sau greutatea
unui obiect, productivitatea unei plante, etc, le numim date despre acel pacient, acel obiect sau acea plant.
Informaiile referitoare la mai muli pacieni sau indivizi sntoi, sau animale de experien, sau plante, sau
alte obiecte pe care le studiem, le vom numi tot date. Cnd ne referim la prelucrarea informaiilor, ca scop
important al statisticii, vom spune prelucrarea datelor. Cnd vorbim despre nregistrarea pe calculator a
acestor informaii vom spune nregistrarea datelor.
Astfel, statistica are ca unul din scopuri, nregistrarea i prelucrarea datelor. Totui, nu orice tip de
nregistrare de date i orice prelucrare, in de obiectul statisticii. nregistrarea evenimentelor cosmice n
astronomie, nregistrarea facturilor n contabilitatea unei firme, nregistrarea poziiei unui mobil n fizic, i
alte nregistrri asemntoare, nu sunt legate de statistic i nu oblig la prelucrari de natur statistic.
Definiie:
Statistica este tiina care se ocup cu descrierea i analiza numeric a fenomenelor de mas,
dezvluind particularitile lor de volum, structur, dinamic, conexiune, precum i
regularitile sau legile care le guverneaz.
Volumul unui fenomen de mas se refer la amploarea lui numeric, la numrul de indivizi cuprini sau
afectai de fenomenul repectiv. Astfel, o afeciune foarte rspndit ca HTA (Hipertensiunea Arterial
Esenial), este un fenomen de un volum mai mare ca o afeciune rar cum ar fi Sindromul Down.
Prin structur a unui fenomen de mas, nelegem modul n care acesta afecteaz diferite categorii de
indivizi, cum ar fi n cazul studierii unei afeciuni rspndite, structura afectrii pe sexe, rase, religii, grupe
de vrst, ocupaie, zone geografice, etc. De asemeni, structura reflect relaiile de legtur ntre mrimile
prin care descriem fenomenul.

1
Biostatistic - Cursul I
De exemplu, n cazul studierii legturii ntre starea social i inteniile de vot, structura presupune i
descrierea diferitelor categorii de indivizi pe sexe, rase, stri sociale, ocupaie, etc, ct i legturile ntre
acestea i intenia de vot, exprimat numeric, n procente, etc.
Prin dinamic a unui fenomen de mas, nelegem modul cum evolueaz acesta n timp. Conexiunea
fenomenelor este indicat de relaiile de legtur i, eventual, de relaiile de dependen ntre ele.
De exemplu, fenomene economice pot influena evoluia incidenei unor afeciuni n cadrul unei populaii.
Anumite tendine de evoluie a incidenei unei maladii, sau de modificare a valorilor normale la pacienii cu
o anumit afeciune, pot cpta caracter de regularitate. Statistica este cea care pune n eviden aceste
regulariti sau legi, care sunt valabile numai la modul general, ca tendin, nu neaprat la fiecare individ n
parte. Tot ca exemplu, dac tim c o anumit fraciune leucocitar este crescut n alergii, nu nseamn
neaprat c fiecare alergic are acea fraciune leucocitar crescut, ci c exist numai o tendin n acest sens.
Definiie:
Biostatistica este tiina care se ocup cu aplicarea metodelor statisticii n tiinele vieii.
Astfel, toate capitolele importante ale statisticii ca: statistica descriptiv, teoria sondajelor, teoria estimaiei,
teoria corelaiei, regresiile, capitole care vor fi studiate sumar i n acest curs, au aplicabilitate i n tiinele
vieii ca: medicina, biologia, psihologia, sau discipline mai nguste ca biochimia, biofizica, stomatologia,
fizioterapia, farmacologia, etc. Metodele cu aplicabilitate n tiinele vieii au fost impulsionate n
dezvoltarea lor chiar de domeniul lor de aplicare. Astfel, capitolul statisticii care se ocup cu studiul i
estimarea supravieuirii, are o aplicabilitate larg n medicin i biologie i dezvoltarea lui a fost influenat
pozitiv de acest fapt. Aceasta deoarece medicina a avut mereu nevoie de metode mai perfecionate, pe care
statistica a fost nevoit s i le pun la dispoziie.
n multe situaii, apar confuzii ntre dou cuvinte care exprim discipline diferite, i anume ntre biostatistic
i statistica medical. Aceasta din urm, este un capitol al celei dinti, i anume:
Definiii:
Statistica medical este tiina care se ocup cu aplicarea metodelor statisticii n medicin.
Biostatistica este tiina care se ocup cu aplicarea metodelor statisticii n toate tiinele vieii,
ca medicin, psihologie, farmacie, agricultur, horticultur, etc.
Medicina modern este de neconceput fr cercetarea medical, iar un segment din ce n ce mai consistent al
acestei cercetri are la baz statistica. Nu se mai poate face cercetare de laborator sau clinic, iar rezultatele
s fie raportate doar prin comparri puerile ntre numrul de cazuri sau procente sau medii. Fr asigurarea
statistic, nici o cercetare nu are valoare. Acele simple comparri ntre valorile mediilor pot duce la
concluzii total greite. Nici o revist tiinific medical serioas, de 30-40 de ani nu mai public rezultate
neprelucrate statistic, diferene de medii ntre loturi, fr deviaii standard i teste de semnificaie (cel puin,
vezi cursul al aselea).
* * *
Introducem cteva noiuni specifice cu care opereaz statistica i cu care vom lucra n cursurile ce urmeaz.
Fiind o tin care nu lucreaz cu fenomene strict deterministe, toate afirmaiile statisticii se refer nu la
evenimente sau obiecte singulare ci sunt deduse prin observarea unei mulimi ct mai cuprinztoare de
obiecte sau fenomene. Nu se pot face generalizri pripite din studierea unui caz sau a ctorva cazuri i este
destul de clar pentru oricine c o generalizare este cu att mai valoroas cu ct au fost observate un numr
mai mare de cazuri. Aici ns apare problema de a face o apreciere corect a numrului de observaii efectiv
realizate, raportat la numrul posibil de observaii.
Dac ne propunem s facem un studiu asupra unei afeciuni foarte rspndite, cum ar fi hipertensiunea
arterial esenial (HTA), concluzii valabile nu se pot trage dect pe baza unui numr de cazuri de cel puin
cteva mii sau zeci de mii, dar n cazul unei maladii rare cum sunt unele din anomaliile cromozomiale de
exemplu, un astfel de numr de cazuri pur i simplu nu poate fi gsit n aria de cercetare considerat, uneori
nici pe ntregul glob. Oricum, n general vorbind, este bine ca, n limita posibilitilor, studiul s se fac pe
un numr ct mai mare de indivizi.


2
Biostatistic - Cursul I
1.1 Noiunile de baz. Cea mai general noiune pe care trebuie s o discutm este cea care se refer la
totalitatea cazurilor, elementelor, obiectelor care au n comun trstura sau proprietatea studiat de noi.
Definiie:
Vom numi populaie statistic o mulime de elemente care au una sau mai multe nsuiri
comune i care fac obiectul unei cercetri statistice.
De obicei, prin populaie statistic, n mod empiric, nelegem o mulime de persoane umane:
persoanele din judeul Dolj care sufer de HTA, sau
persoanele din judeul Dolj de sex feminin care sufer de HTA, sau
persoanele din Romnia care sufer de cancer de colon i care au fost operate, etc.
Cum de cele mai multe ori, loturile studiate trebuie comparate cu loturi de normali, ne vom mai referi i la
populaii ca:
persoanele normale dintr-o arie geografic dat, sau
persoanele de sex feminin din Dolj, sau
copiii normali ntre 2 i 14 ani, etc.
Exemplele de populaii statistice de acest gen pot fi multiplicate practic nelimitat, de fapt fiind necesar s se
considere aproape pentru fiecare nou studiu statistic o populaie specific la care se refer, numit populaie
int.
Pe de alt parte, de obicei n statistic, o populaie nu este o mulime de persoane. De exemplu, n studiile
demografice se iau cteodat ca elemente fundamentale grupuri sociale ca: aezri omeneti sau instituii,
intreprinderi, populaia aezrilor umane din Romnia, populaia colilor dintr-un jude, etc. Avem deci n
acest caz populaii de grupuri socio-umane. Ele nu sunt alctuite din indivizi umani ci din grupuri de indivizi
umani.
Mai mult, populaiile pot s nu aib o legtur direct cu indivizi umani ci mai degrab indirect, i anume se
poate vorbi despre populaii de evenimente (accidentele de circulaie dintr-o arie geografic, accidentele
cardiace pe o perioad anume de timp, etc) sau despre populaii de msurtori (tensiunea arterial a unui
pacient considerat la intervale regulate de timp).
Vom avea deci ca tipuri mai importante de populaii:
Populaii de indivizi umani (normali, afectai de o afeciune, expui la un risc, etc)
Populaii de grupuri socio-umane (localiti, coli, intreprinderi, spitale, etc)
Populaii de evenimente (la oameni, la animale de experien, la celule, etc)
Populaii de msurtori (la oameni, la animale, la plante, la alte obiecte, la celule, la gene, la
mitocondrii, etc).
Deci, cnd vorbim despre o populaie, nu este vorba neaprat despre populaia unei ri sau ora, adic
despre grupuri de oameni.
Indiferent despre ce tip de populaie discutm la un moment dat, unitatea fundamental cu care avem de a
face esteindividul statistic.
Definiie:
Vom numi individ statistic un element al unei populaii statistice indiferent de natura acesteia.
Astfel noiunile de individ uman i de individ statistic nu se suprapun deoarece aa cum rezult din aceast
definiie, individul statistic poate fi:
persoan uman (individ sntos, pacient),
un grup socio-uman (o coal, o localitate, un spital, etc),
un eveniment,
o msurtoare, etc.
Mai mult, nu orice individ uman poate fi i individ statistic ci, pentru aceasta trebuie s fie cuprins ntr-o
populaie statistic. Relativ la indivizii statistici, preocuparea fundamental este studiul anumitor

3
Biostatistic - Cursul I
caracteristici ale acestora, anume acele caracteristici care au legtur cu cea avut n vedere atunci cnd am
considerat populaia statistic.
1.2 Caracteristici, variabile, tipuri de date, scale. Organismul uman, cel mai complex sistem existent
n natur, nu poate fi descris exact nici prin tomuri ntregi de descriere n cuvinte i nici prin numre orict de
multe am folosi. Omul este capabil s descrie numai anumite trsturi sau proprieti ale organismului su.
Trebuie s fim contieni c dei numrul de trsturi ale organismului pe care le studiaz anatomia,
biochimia, biofizica, fiziologia i toate celelalte discipline este enorm, niciodat nu vom fi capabili s
descriem exact organismul uman, cci numrul de trsturi de care am avea nevoie este practic infinit.
Trsturile sau proprietile organismului uman sunt denumite n statistic caracteristici i sunt cuprinse n
categoria general de date, aa cum sunt descrise mai sus.
Definiie:
Numim caracteristic o proprietate comun tuturor indivizilor dintr-o populaie statistic
dat.
Caracteristicile sunt ceea ce n limbajul obinuit nelegem prin atribut, calitate. Atribute ce caracterizeaz
organismul uman i prezint interes medical, sunt extrem de multe.
Cele mai simple sunt cele antropometrice, adic nlime, greutate, circumferina toracelui, circumferina
craniului, culoarea prului, a ochilor, constituia corporal, i multe altele.
Altele, caracterizeaz starea organismului ca fiziologic sau patologic i sunt de obicei obinute cu ajutorul
instrumentelelor sau analizelor de laborator, ns pot fi aprecieri subiective: tensiunea arterial (presiunea
arterial, de fapt), frecvena cardiac, ritmul respirator, glicemia, calcemia, hemoglobina, lipemia,
colesterolemia, bilirubina, fosfataza acid, creatinina, antigenul HBS, prezena albuminei n urin, culoarea
urinei, consistena ficatului, etc.
Din punctul de vedere al statisticii medicale, caracteristicile sunt de dou tipuri fundamentale: cantitative i
calitative.
Caracteristicile cantitative sunt acelea care prin natura lor sunt msurabile, adic pentru care exist
uniti de msur i o convenie de msurare general acceptat. n aceast categorie intr toate
constantele fiziologice, biochimice, biofizice, unele anatomice, care n general pot fi determinate
prin msurtori uzuale sau de laborator: nlime, greutate, vrst, glicemie, calcemie, hemoglobin,
numr eritrocite, for muscular, vitez de reacie, nivel de inteligen (QI), dar i mrimile
referitoare la celule, organite, sinapse, vezicule, membrane, etc. Ele sunt totdeauna exprimate cifric
ntr-un mod precis, obiectiv.
Caracteristicile calitative, sunt cele care nu pot fi msurate prin metode obiective, cantitative, ci se
exprim descriptiv prin termeni calitativi: culoare, form, consisten, aspect, etc. Caracteristicile
calitative nu au o unitate de msur general acceptat i deci nu pot fi exprimate cifric, ca rezultat al
unor msurtori. Ele sunt adesea subiective i de obicei exprimate analogic i nu numeric.
Variabile. Dei sunt unele aspecte care se menin constante la o aceeai specie, i n particular la om, unele
se schimb de la individ la individ, adic sunt variabile. Aadar, atunci cnd indivizii statistici sunt oameni,
caracteristicile care se studiaz sunt de multe ori variabile.
Definiie:
O caracteristic care se schimb de la individ la individ sau la acelai individ n timp sau
ca rspuns la condiiile de mediu, de boal de medicaie, etc, se numete variabil.

Un alt criteriu de clasificare, i cel mai important se refer la simbolurile pe care le folosim pentru a
reprezenta datele experimentale pe care dorim s le nregistrm i care sunt dependente de natura intrinsec a
datelor. Aceasta nseamn c, pentru nregistrarea datelor putem folosi fie numai numere (spunem c
nregistrm date numerice), fie numai simboluri consacrate pe plan internaional sau naional, ori simboluri
convenite local (spunem c nregistrm date nominale, sau date ordinale), fie simboluri amestecate cu
numere (caz n care spunem c nregistrm date alfanumerice). Datele nregistrate ca numere sau prin
simboluri consacrate sau convenite se numesc scalate, n timp ce restul le numim alfanumerice.

4
Biostatistic - Cursul I
Astfel, scala numeric va permite celui care nregistreaz date s scrie numere reale sau ntregi. Scala
ordinal i cea nominal, scale asemntoare, permit nregistrarea dup coduri i prescurtri. De exemplu,
grupa sanguin, stadiul evolutiv al unei afeciuni maligne, tipul de afeciune, tipul de tumor, etc sunt de
obicei standardizate prin convenii internaionale la scar continental sau mondial.
Scala numeric
Datele nregistrate pe scala numeric descriu acele caracteristici ale pacientului care sunt prin excelen
cantitative i se exprim prin numere ntregi sau zecimale. De obicei este stabilit o margine superioar i
inferioar pentru ele (nu putem spune c un pacient are temperatura mai mare ca 44
o
C, de exemplu).
Msurtorile pe scala numeric sunt de aa natur nct o unitate pe scal are aceeai magnitudine pe ntreaga
scal. De exemplu, nregistrarea greutii, presupune c o greutate de 40 kg, este de dou ori mai mic dect
una de 80 kg, iar diferena de 1 kg este aceeai i de la 40 kg la 41 kg, dar i de la 80 kg la 81 kg.
Totui, scalele numerice nu permit totdeauna interpretri comparative. Astfel, este greit s se spun c un
pacient cu hemoglobina Hb=8 este de dou ori mai anemic dect unul cu Hb=16, bazndu-ne pe faptul c
hemoglobina le cel de-al doilea are o valoare dubl. La fel cu glicemia, calcemia, tensiunea, colesterolemia i
aproape toate celelalte analize de laborator exprimate numeric i n general cu caracteristicile cantitative
exprimate pe aceast scal.
Pe scala numeric sunt reprezentate caracteristici cantitative continui i caracteristici cantitative discrete. De
exemplu, numrul de nateri sau numrul de avorturi la o pacient se nregistreaz numeric, discret, adic
din 1 n 1, neavnd sens valori zecimale. Majoritatea analizelor de laborator ns, se nregistreaz numeric,
prin numere zecimale, de obicei cu una sau dou zecimale. n cazul nregistrrii cu zecimale, se spune c se
folosete scala continu.
Scala nominal
Datele nregistrate pe scala nominal descriu o caracteristic sau o variabil pentru nregistrarea creia se pot
folosi un numr finit de simboluri, alese la ntmplare sau prin convenie, care reprezint categoriile posibile,
exhaustiv i mutual exclusiv. De exemplu, pentru grupa sanguin, simbolurile 0, A, B, AB sunt categorii
exhaustive (orice individ intr n exact una din ele) i mutual exclusive (un individ nu poate intra n dou
categorii n acelai timp) i sunt date de tip nominal; Msurtorile nominale constau n asignarea pacienilor
la grupuri sau categorii. Nu este nregistrat nici o informaie cantitativ i nu exist o ordine a categoriilor.
Pe scala nominal se nregistreaz caracteristici calitative. Exemplu: preferine religioase, rasa, sexul, mod de
alimentaie, tip de temperament, culoarea ochilor, a prului, etc.
Pe scala nominal, in nd di iv vi iz zi ii i s su un nt t m mp p r r i i i i n n c c t te ev va a c cl la as se e: :
E Ex xh ha au us st ti iv ve e ( (f fi ie ec ca ar re e i in nd di iv vi id d a ap pa ar r i in ne e u un ne ei i s si in ng gu ur re e c cl la as se e) )
Mutual exclusive (nici un individ nu poate aparine la dou clase, simultan)
Numele claselor sunt simbolice i de obicei sunt fixate de practica medical sau de convenii
internaionale, naionale, locale
D Do oi i i in nd di iv vi iz zi i d di in n a ac ce ee ea a i i c cl la as s s su un nt t e ec ch hi iv va al le en n i i p pe e s sc ca al la a c co on ns si id de er ra at t ( (c ch hi ia ar r d da ac c d di in n a al lt te e p pu un nc ct te e d de e
v ve ed de er re e s su un nt t d di if fe er ri i i i) )
N Nu u a ar re e s se en ns s s s o or rd do on n m m c cl la as se el le e c cr re es sc c t to or r s sa au u d de es sc cr re es sc c t to or r d du up p n ni ic ci i u un n c cr ri it te er ri iu u
D De e e ex xe em mp pl lu u, , t to ot t p pe e o o s sc ca al l n no om mi in na al l e es st te e b bi in ne e s s s se e n nr re eg gi is st tr re ez ze e o oc cu up pa a i ia a, , s st ta ar re ea a c ci iv vi il l , , t ti ip pu ul l d de e a af fe ec c i iu un ne e, ,
t ti ip pu ul l d de e e ed du uc ca a i ie e p pr ri im mi it t , , e et tc c. . P Pe en nt tr ru u v va ar ri ia ab bi il la a o oc cu up pa a i ie e, , u un ne eo or ri i e es st te e s su uf fi ic ci ie en nt t s s s se e a al le ea ag g n nu um ma ai i c c t te ev va a c cl la as se e, ,
c ca ar re e a ar r p pu ut te ea a f fi i i in nt ti it tu ul la at te e: : m mu un nc ci it to or r, , i in nt te el le ec ct tu ua al l, , f fu un nc c i io on na ar r, , e el le ev v, , s st tu ud de en nt t, , p pe en ns si io on na ar r, , f f r r o oc cu up pa a i ie e. . A Av ve em m
a as st tf fe el l 7 7 c cl la as se e. . T Tr re eb bu ui ie e s s n ne e a as si ig gu ur r m m c c f fi ie ec ca ar re e i in nd di iv vi id d d di in n c ce ei i p pe e c ca ar re e i i s st tu ud di ie em m, , a ap pa ar r i in ne e l la a u un na a d di in n a ac ce es st te e
c cl la as se e. . E Ev vi id de en nt t n ni ic ci i u un nu ul l n nu u a ap pa ar r i in ne e l la a d do ou u c cl la as se e n n a ac ce el la a i i t ti im mp p. . n n c ce e p pr ri iv ve e t te e s st ta ar re ea a c ci iv vi il l , , c ce el l m ma ai i s si im mp pl lu u
e ex xe em mp pl lu u d de e a al le eg ge er re e a a c cl la as se el lo or r e es st te e s s l lu u m m d do ou u : : c c s s t to or ri it t i i n ne ec c s s t to or ri it t. . U Un ne eo or ri i, , s se e i ia au u p pa at tr ru u c cl la as se e, ,
c c s s t to or ri it t, , n ne ec c s s t to or ri it t, , d di iv vo or r a at t i i v v d du uv v. . S Se e p po ot t a al le eg ge e i i a al lt te e s se et tu ur ri i d de e c cl la as se e. . i i n n a ac ce es st t c ca az z, , t tr re eb bu ui ie e u ur rm m r ri it t
c ca a f fi ie ec ca ar re e i in nd di iv vi id d s s a ap pa ar r i in n e ex xa ac ct t l la a u un na a d di in n c cl la as se el le e a al le es se e. . N Nu um me el le e c cl la as se el lo or r e es st te e a al le es s d du up p d do or ri in n , , n nu um me el le e
p pu ut t n nd d f fi i i i p pr re es sc cu ur rt ta at te e p pe en nt tr ru u a a e ec co on no om mi is si i t ti im mp p d da ac c t tr re eb bu ui ie e n nr re eg gi is st tr ra a i i u un n n nu um m r r f fo oa ar rt te e m ma ar re e d de e p pa ac ci ie en n i i. .
D De e e ex xe em mp pl lu u, , n n c ca az zu ul l o oc cu up pa a i ii il lo or r, , p pu ut te em m f fo ol lo os si i p pr re es sc cu ur rt t r ri il le e: : m mu un nc c, , i in nt te el l, , f fu un nc c, , e el le ev v, , s st tu ud d, , p pe en ns s, , f f r r . . n n
t to oa at te e c ca az zu ur ri il le e n ns s t tr re eb bu ui ie e a av vu ut t n n v ve ed de er re e s s n nu u a ap pa ar r s si it tu ua a i ii i n n c ca ar re e s se e n nr re eg gi is st tr re ea az z o od da at t c cu u n nu um me e c co om mp pl le et t a al l
c cl la as se ei i, , a al lt t d da at t c cu u n nu um me e s sc cu ur rt t, , c c c ci i a ap pa ar r c co om mp pl li ic ca a i ii i. .


5
Biostatistic - Cursul I
Scala ordinal
Descriu o caracteristic pentru nregistrarea creia se folosesc tot simboluri ce definesc categorii exhaustive
i mutual exclusive, dar care sunt ordonate gradat, de obicei cresctor. De exemplu, stadiul evolutiv n
anumite afeciuni ca cele maligne (stadiul 0, 1, 2, 3 i 4). Deosebirea fa de caracteristicile nominale, dei
pare neimportant, conduce la principii diferite de tratare statistic i de aceea, este important de stabilit dac
o caracteristic o nregistrm ca nominal sau ordinal. Msurtorile pe scala ordinal sunt ordonate. Totui,
intervalele ntre dou clase consecutive nu sunt n mod necesar egale. De exemplu, dac un pacient apreciaz
starea de confort indus de un medicament contra astmului pe o scal de la 0 la 3, diferena ntre 0 i 1 nu
este neaprat egal cu diferena ntre 1 i 2, sau ntre 2 i 3. De altfel nici nu s-ar putea descrie cantitativ
aceste diferene, ele sunt subiective i lsate la latitudinea observatorului care n exemplul de mai sus este
chiar pacientul. Nivelul 0 este ales absolut arbitrar, la fel de bine scala putea fi de la 3 la 6 sau de la -1 la 2.
Totui, este mai intuitiv s se nceap n aceste cazuri de la nivelul 0. Tot astfel, n cazul stadiilor evolutive n
afeciunile maligne stadiile sunt din ce n ce mai grave, dar diferena de gravitate nu este aceeai cnd trecem
de la un stadiu la altul.
Pe scala ordinal, in nd di iv vi iz zi ii i s su un nt t m mp p r r i i i i n n c c t te ev va a c cl la as se e: :
E Ex xh ha au us st ti iv ve e ( (f fi ie ec ca ar re e i in nd di iv vi id d a ap pa ar r i in ne e u un ne ei i s si in ng gu ur re e c cl la as se e) )
M Mu ut tu ua al l e ex xc cl lu us si iv ve e ( (n ni ic ci i u un n i in nd di iv vi id d n nu u p po oa at te e a ap pa ar r i in ne e l la a d do ou u c cl la as se e, , s si im mu ul lt ta an n) )
N Nu um me el le e c cl la as se el lo or r s su un nt t s si im mb bo ol li ic ce e i i d de e o ob bi ic ce ei i s su un nt t f fi ix xa at te e d de e p pr ra ac ct ti ic ca a m me ed di ic ca al l s sa au u c co on nv ve en n i ii i
i in nt te er rn na a i io on na al le e naionale, locale
D Do oi i i in nd di iv vi iz zi i d di in n a ac ce ee ea a i i c cl la as s s su un nt t e ec ch hi iv va al le en n i i p pe e s sc ca al la a c co on ns si id de er ra at t ( (c ch hi ia ar r d da ac c p po ot t f fi i d di if fe er ri i i i d di in n a al lt te e
p pu un nc ct te e d de e v ve ed de er re e) )
C Cl la as se el le e p po ot t f fi i o or rd do on na at te e c cr re es sc c t to or r s sa au u d de es sc cr re es sc c t to or r, , d da ar r d di if fe er re en n e el le e n nt tr re e c cl la as se e n nu u e ex xp pr ri im m c ca an nt ti it t i i, , n nu u
c co on nt te ea az z d de ec c t t o or rd di in ne ea a l lo or r
A se observa c primele patru puncte sunt identice la scala ordinal i respectiv, nominal. Singura diferen
este dat de posibilitatea ordonrii claselor, care la cele ordinale nu este posibil, n timp ce la cele
ordinale este posibil.
Exist o legtur ntre scala de msurare i metodele statistice folosite. De exemplu, este absurd s calculm
media datelor nominale. Folosirea mediei pentru datele ordinale este nc controversat. Pentru calculul
mediei sau a altei statistici ce impune calcule, trebuie s avem date numerice.
1.3 Tabele de frecven. Datele culese i nregistrate pot conine informaii despre diveri parametri care au
fost urmrite fie din necesitatea de a face un studiu anume fie, pur i simplu pentru c urmrirea lor are
importan pentru indivizii la care au fost msurate sau pentru cel care face studiul, adic pentru medic.
Tabelele din care este alctuit o baz de date conin datele nesistematizate, ele urmeaz de obicei o ordine
aleatoare, sau sunt ordonate dup un criteriu cum ar fi cel alfabetic, sau n ordinea codurilor. Un exemplu, la
care ne vom opri ceva mai mult este cel din tabelul 1.1. Este un exemplu de tabel, care pentru simplitate nu
are dact cteva linii, adic nregistrri, i cteva coloane, pe care le vom numi cmpuri, cum se mai spune
n limbajul uzual pentru programarea pe calculator.
Tabelul este o mic parte dintr-un tabel mare n care au fost nregistrai un numr de peste 230 de pacieni cu
afeciuni hepatice grave (ciroz hepatic, cancer hepatic, etc), tratai de-a lungul timpului n clinica de boli
interne a Spitalului de Urgen din Craiova.
nelesul cmpurilor este evident pentru aproape toate (FO=Numrul foii de observaie, Nume, Prenume,
Vrsta, Sex, Mediu, Diagcod.=Cod diagnostic, HAV= Dac pacientul a suferit n trecut de hepatit acut
viral). Pe coloana HAV se observ c au fost nregistrate doar dou posibiliti: da =pacientul a suferit de
HAV n trecut" i nu pentru ceilali. n multe programe de calculator este indicat folosirea lui Y iN n
loc de da i nu (Y=yes, N=no, din limba englez), deoarece aceste cmpuri sunt considerate de unele
programe cmpuri speciale, pe care noi le vom numi cmpuri de tip logic, i sunt tratate prin procedee
speciale. Deci, vom numi cmpuri de tip logic, acele coloane pe care este natural ca datele s fie introduse
folosind Da i Nu.



6
Biostatistic - Cursul I
Tabelul 1.1. Modul de nregistrare a unor date despre pacieni (nume fictive)

De multe ori, numrul de linii al unui tabel cu date brute, adic al unei baze de date, este att de mare, de
ordinul sutelor sau miilor, nct niruirea elementelor unei serii de valori (de exemplu seria vrstelor), este
dificil i lipsit de semnificaie.
Un mod util de clasificare a pacienilor dup vrste este clasificarea pe grupe de vrst de 5 sau 10 ani i
alctuirea unui tabel n care n dreptul fiecrei grupe de vrst s se nscrie numrul de pacieni din grupa
respectiv, n acest fel obinnd de fapt o grupare mai sintetic a datelor. Iat cum arat distribuia pe grupe
de vrst a pacienilor din baza de date de care am vorbit mai sus:
Tabelul 1.2 Tabelul de frecven a vrstelor, pe grupe de vrst de 10 ani,pentru 234 de pacieni.
Nr.
Clasa
Frecvena,
Nr. pacieni
F
i
Frecvena
relativ,
procentul
f
i
F
icc
F
icd
f
icc
f
icd
1
25 - 30 5 2.14% 5 234 2.14% 100.00%
2
30 - 35 6 2.56% 11 229 4.70% 97.86%
3
35 - 40 9 3.85% 20 223 8.55% 95.30%
4
40 - 45 26 11.11% 46 214 19.66% 91.45%
5
45 - 50 30 12.82% 76 188 32.48% 80.34%
6
50 - 55 50 21.37% 126 158 53.85% 67.52%
7
55 - 60 53 22.65% 179 108 76.50% 46.15%
8
60 - 65 32 13.68% 211 55 90.17% 23.50%
9
65 - 70 14 5.98% 225 23 96.15% 9.83%
10
70 - 75 5 2.14% 230 9 98.29% 3.85%
11
75 - 80 4 1.71% 234 4 100.00% 1.71%

Total 234 100%
Se observ c prin mprirea frecvenelor de apariie ale vrstelor la numrul de pacieni, se obin
frecvenele relative care se exprim de obicei n procente.
Frecvenele relative se calculeaz cu formula:
N
F
f
i
i
=

7
Biostatistic - Cursul I
Este clar c prin adunarea frecvenelor absolute, se obine numrul total de indivizi din tabel, n cazul nostru
234:
N F F F
m
= = + + + + + + = + + + 234 4 5 14 ...... 9 6 5 .......
2 1

De asemeni, prin adunarea frecvenelor relative (sau valorilor lor exprimate n procente), se obine 1 (sau
100%):
100 71 , 1 14 , 2 98 , 5 .... 85 , 3 56 , 2 14 , 2 ......
2 1
= + + + + + + = + + +
m
f f f
Pe coloana a cincia a tabelului de frecvene, apar aa-numitele frecvene relative cumulate cresctor (f
icc
).
Frecvena relativ cumulat cresctor, de pe o anumit linie, este suma frecvenelor relative din celulele din
coloana frecvenelor relative, suma fcndu-se de la nceputul tabelului i pn la linia pe care se afl
frecvena pe care o calculm.
Astfel, vom avea pentru frecvene relative cumulate cresctor, formulele:
f
1cc
=f
1
=2,14
f
2cc
=f
1
+f
2
=2,14+2,56=4,70
f
3cc
=f
1
+f
2
+f
3
=2,14+2,56+3,85=8,55, i aa mai departe.
Aceste formule ne ajut s gsim procentul de indivizi care au valoarea din serie sub o limit dat. De
exemplu, n tabelul 1.2, avem 32,48%% din indivizi sub 50 de ani, deoarece n dreptul valorii 50 pe coloana
Vrsta, avem f
icc
=32,48% care se obine prin cumularea tuturor procentelor vrstelor sub 50 de ani, inclusiv
50.
S urmrim i celelalte coloane i s ncercm s le subliniem la fiecare din ele utilitatea. Mai nti s
amintim c F
i
, reprezint frecvenele absolute, sau numrul de indivizi care au vrstele cuprinse n limitele
claselor respective. F
icc
, sunt frecvenele absolute, cumulate cresctor, adic se obin dup formulele:
i icc
F F F F + + + = ....
2 1

De exemplu, F
4cc
= F
1
+ F
2
+ F
3
+ F
4
= 5+6+9+26=46, aa cum se poate vedea n linia a patra a tabelului,
pe coloana a cincia. S remarcm c aceste frecvene cumuleaz frecvenele tuturor claselor, pn la clasa
curent, i deci ele rspund la ntrebri de tipul : ci indivizi mai tineri dect 45 de ani sunt n seria de
vrste? Rspunsul se caut n dreptul clasei 40-45 ani, adic n a patra clas, pe coloana F
icc
: 46.
Frecvenele de tipul F
icd
au o semnificaie analog, cu diferena c se cumuleaz descresctor, la fiecare nou
clas se scade frecvena absolut a clasei precedente, iniial plecndu-se de la numrul total de indivizi din
lot, n acest caz, 234.
Frecvenele relative f
i
, sunt, aa cum am mai precizat, procentele fiecrei clase, lund ntregul lot ca 100%, i
se obin ca raportul ntre frecvenele absolute i numrul total de indivizi din lot, apoi fiind nmulite cu 100
pentru a se obine procente. Frecvenele f
icc
i f
icd
, sunt obinute pe acelai principiu ca i F
icc
i F
icd
, cu
diferena c s-au cumulat cresctor i respectiv descresctor, frecvenele relative i nu cele absolute.
n sfrit, cteva cuvinte despre intervalele care constituie clasele. Dup cum se observ, din cauza faptului
c nu s-au nregistrat vrste dect numere ntregi, clasele au o lungime uor de stabilit n mod natural: 25-30,
30-35, etc. Indivizii de 30 de ani se numr n clasa 30-35 i nu se numr n clasa 25 30.
n cazul variabilelor la care nregistrarea se face cu una sau dou zecimale, se obinuiete ca acest lucru s se
reflecte n modul de alctuire a claselor prin faptul c se ia la dreapta intervalului una sau dou zecimale
egale cu 9: [13 - 13,9]; [14 - 14,9]; etc pentru nregistrarea hemoglobinei, sau intervale care se termin n 99,
sau chiar 999 pentru alte variabile.
Strict matematic, acest mod de lucru nu este foarte corect, dei este foarte practic. Poate s apar un caz n
care ntr-o baz de date s-au prevzut intervalele [13 - 13,9] i [14 - 14,9] i dup un timp ceva mai lung,
aparate mai specializate s dea un rezultat la o analiz de 13,92, care nu este ncadrabil n nici una din clase.
Corect este ca, de exemplu, o clas s fie reprezentat printr-un interval nchis la stnga i deschis la dreapta,
caz n care orice valoare ar apare ea este ncadrabil n exact una din clase.
De exemplu, dac hemoglobina la o serie de valori este cuprins ntre 9,6 i 15,9, clasele din 1 n 1 ar fi: [9 -
10), [10 - 11), [11 - 12), [12 - 13), [13 - 14), [14 - 15), [15 - 16). n acest fel, fiecare valoare din serie va intra

8
Biostatistic - Cursul I
exact n una din clase (intervale). Prima dintre clase, clasa [9 - 10), nu conine i valoarea 10, care este
coninut de clasa urmtoare, i tot aa pentru fiecare clas.
Intervalele trebuie s acopere complet plaja posibil de valori ale variabilei i trebuie alese de aa manier
nct numrul de clase care rezult s nu fie nici prea mare nici prea mic, astfel ca aprecierea modului cum
sunt datele distribuite s fie ct mai uoar. Este recomandabil ca numrul de intervale pentru un astfel de
tabel statistic s fie de la cteva, pentru loturi de cteva zeci de indivizi, pn la cteva zeci, dac lotul este
foarte mare, de mai multe sute sau mii de indivizi.
De obicei, programele de calculator realizeaz aceste tabele dup ce utilizatorul a furnizat lungimea clasei.
Pentru a nu ajunge n situaii cnd un astfel de tabel are un numr total neindicat de clase, de obicei se
calculeaz lungimea aproximativ a unei clase n aa fel nct numrul de clase s fie cel dorit. Acest lucru se
poate realiza dac se caut cea mai mic i cea mai mare valoare din seria de date (notate mai jos cu min i
max), i se ia ca lungime a unei clase, aproximativ rezultatul urmtorului calcul:
L
nr clase
=
max min
.

De exemplu, pentru tabelul de mai sus, cel mai tnr pacient are 26 de ani, iar cel mai vrstnic are 78, deci
pentru a obine 6 clase (numr de clase indicat pentru vrste de aduli), avem L= (78 - 26) / 6 =8,6. Deci este
indicat s se ia clase de 10 ani, prin rotunjire. Dac ns se doresc mai multe clase, s zicem 10, atunci
obinem: L = (78 - 26) / 10 = 5,2 i este indicat s se ia clase din 5 n 5 ani. Prima clas va fi [25,30), iar
urmtoarele: [30, 35), [35, 40),.[75, 80).
Numrul de clase nu este neaprat 10, el se alege de fapt de ctre cel care face calculul, astfel ca s se piard
ct mai puin informaie, dar i numrul de clase s nu fie prea mare cci atunci lum n considerare aspecte
prea nesemnificative.
Ca regul general, este bine s se rein c:
Se pierde cu att mai mult informaie cu ct numrul de clase este mai mic. Nu se recomand tabele
cu 2-4 clase
Un numr prea mare de clase duce la o ascundere a esenialului de ctre aspectele nesemnificative
ntruct cei care nu au experien nu tiu cum s aleag numrul de clase, recomandm:
Pentru cteva zeci de valori, s se aleag 4 - 6 clase
Pentru cteva sute de valori, s se aleag ntre 8 i 12 clase
Pentru cteva mii de valori, s se aleag peste 15 clase
Nu se recomand folosirea a mai mult de 20 30 de clase dect n cazuri speciale, n studii cu multe mii de
cazuri. Nici mai puin de 4 6 clase nu este recomandat s se foloseasc. Nu se recomand folosirea acestor
tabele dac nu avem cel puin cteva zeci de valori. De exemplu, pentru o serie de 15 valori, nu se face un
tabel de frecven.
Alte exemple:
Dac avem de clasificat ntr-un tabel de frecven valorile pentru hemoglobin, iar minimul este 8,13 iar
maximul este 16,23, atunci, pentru a obine 10 clase, vom face calculul:
81 , 0
10
1 , 8
10
13 , 8 23 , 16
.
min max
= =

=
clase nr
L
n acest caz, vom rotunji la 1 i vom lua clasele din 1 n 1, ncepnd de la 8: [8, 9), [9,10), [16,17).
n cazul Imunoglobulinei G, din cei 234 de pacieni din acelai lot ca cel pentru vrste de mai sus, valoarea
minim a fost 112, n timp ce maximul a fost 900. Dac dorim tot 10 clase, atunci calculul este
8 , 88
10
888
10
112 900
.
min max
= =

=
clase nr
L
Vom lua clasele din 100 n 100, ncepnd de la 100: [100,200), [200,300) . [800,900), [900-1000).

9
Biostatistic - Cursul I
Informaia sintetizat ntr-un astfel de tabel este deosebit de util i este de multe ori completat prin
reprezentarea grafic a ei care se face cu ajutorul histogramei. Se poate spune c sintetizarea informaiei
coninut de o serie de valori ntr-un tabel de frecven, este primul pas n studiul datelor brute, adic aa
cum au fost inregistrate.

2. Chestiuni de examen:
1. Stadiul evolutiv al unei maladii maligne este indicat s fie nregistrat prin simbolurile 0, I, II, III,
IV, adic scala folosit este:
A. Alfanumeric
B. Numeric
C. Ordinal
D. Nominal
2. Consistena ficatului este o caracteristic a organismului uman care se nregistreaz:
A. Numeric, adic folosind numere
B. Ordinal, adic folosind simboluri ce urmeaz o gravitate
C. Nominal, adic folosind simboluri care nu au o ordine de gravitate
D. Numeric, adic folosind simboluri ce urmeaz o gravitate
3. Grupa sanguin este o caracteristic ce trebuie nregistrat:
A. Alfanumeric
B. Numeric
C. Ordinal
D. Nominal
4. O populaie statistic poate fi alctuit din:
A. Indivizi umani
B. Evenimente
C. Grupuri socio-umane
D. Msurtori



10