Sunteți pe pagina 1din 94

UNIVERSITATEA DE STAT DE MEDICIN I FARMACIE

NICOLAE TESTEMIANU
COALA DE MANAGEMENT N SNTATE PUBLIC

Larisa SPINEI

Oleg LOZAN

Vladislav BADAN

BIOSTATISTICA

Chiinu 2009

BIOSTATISTICA

CZU: 311.2
S 73

CUPRINS

Aprobat de Consiliul de Experi al Ministerului Sntii Republicii Moldova


din 27.06.08, proces-verbal nr. 6
Autori:
Larisa Spinei, doctor habilitat n medicin, profesor universitar
Lozan Oleg, doctor n medicin, confereniar universitar
Badan Vladislav, lector superior
Recenzeni:
Maria Sagaidac, doctor n matematic, confereniar universitar, Universitatea
de Stat RM
Eco Constantin, doctor habilitat n medicin, profesor universitar, ef catedra Economie, Management i Psihopedagogie USMF
N.Testemianu
Lucrarea dat este elaborat n conformitate cu cerinele didactice actuale i n corespundere cu planul de studii i programa analitic la Biostatistic pentru audieni colii de
Management n Sntate Public.

Editarea manualului Biostatistica a fost posibil datorit suportului financiar


al Fundaiei SOROS-Moldova.
Redactor: Lidia Ciobanu
Machetare computerizat: Natalia Dorogan
Corectori: Nadejda Koporskaia, Tatiana Colin
Larisa Spinei, Oleg Lozan, Vladislav Badan
coala de Management n Sntate Public, 2009
Descrierea CIP a Camerei Naionale a Crii
Spinei, Larisa
Biostatistica / Larisa Spinei, Oleg Lozan, Vladislav Badan; Univ.
de Stat de Medicin i Farmacie Nicolae Testemianu; coala de Management n Sntate Public. Ch. : coala de Management n Sntate
Public, 2009 (.S. F.E.-P. Tipografia Central). - 186 p.
250 ex.
ISBN 978-9975-78-743-7
311.2

ISBN 978-9975-78-743-7

CAPITOLUL I. SCURT ISTORIC. GENERALITI .............................................4


1.1. Apariia i dezvoltarea statisticii ....................................................................4
1.2. Obiectul i metoda statisticii ........................................................................10
CAPITOLUL II. NOIUNI DE BAZ. METODE STATISTICE .............................18
2.1. Definiia, obiectivele, compartimentele ........................................................18
2.2. Teoria probabilitilor ...................................................................................19
2.3. Legea cifrelor mari .......................................................................................20
2.4. Metode de cercetare utilizate n biostatistic ..............................................21
2.5. Noiuni de baz n biostatistic ....................................................................26
2.5.1. Totalitatea statistic ..........................................................................27
2.5.2. Unitatea de observaie .....................................................................30
2.5.3. Indicatori statistici .............................................................................30
2.5.4. Date statistice...................................................................................32
2.6. Gruparea materialului statistic. Seria statistic de variaie.
Indicatorii tendinei centrale. .................................................................................33
2.7. Seriile cronologice .......................................................................................48
2.8. Standardizarea ............................................................................................62
2.9. Corelaia i regresia ....................................................................................66
2.9.1. Corelaia ...........................................................................................66
2.9.2. Regresia ...........................................................................................77
2.10. Analiza statistic a variabilitii ....................................................................80
2.11. Aprecierea veridicitii valorilor mediii i relative .........................................88
2.12. Compararea valorilor absolute sau a distribuiilor de frecven:
testul X2 ..............................................................................................................107
CAPITOLUL III. METODOLOGIA GENERAL A CERCETRII
STATISTICE .............................................................................116
3.1. Colectarea sau observarea materialului statistic .......................................116
3.2. Prelucrarea materialului statistic ...............................................................126
3.3. Eantionarea .............................................................................................132
3.4. Prezentarea materialului statistic ..............................................................145
3.4.1. Prezentarea prin tabele ..................................................................145
3.4.2. Reprezentarea grafic a materialului statistic ................................149
3.5. Analiza i interpretarea materialului statistic .............................................176
BIBLIOGRAFIE ..................................................................................................179

CAPITOLUL

BIOSTATISTICA

SCURT ISTORIC. GENERALITI

1.1. Apariia i dezvoltarea statisticii


Statistica, prin obiectul i metoda sa, face parte din rndul tiinelor
ce studiaz aspectele cantitative ale fenomenelor i proceselor din cadrul naturii, tehnologiei i societii. Ea s-a dezvoltat ca tiin cu obiect
i metod proprii, ntr-un proces istoric ndelungat i s-a difereniat n
funcie de particularitile domeniului studiat.
Pentru a cuprinde coninutul, categoriile i principiile cu care opereaz statistica este necesar a se avea n vedere, n primul rnd, rolul
pe care l are aceast disciplin n procesul cunoaterii societii.
Cunoaterea i transformarea societii nu pot fi realizate dect folosind combinat principiile, metodele i tehnicile tuturor tiinelor care
studiaz fenomenele i procesele ce se manifest n cadrul societii
n scopul descoperirii legilor ce acioneaz n mod obiectiv n diferitele
etape de dezvoltare. n acest sens, n dezvoltarea istoric a tiinelor social-economice exist, pe de o parte, un proces de difereniere
n funcie de particularitile ei de studiu i, pe de alt parte, apariia
unor discipline cu caracter multidisciplinar sau de grani impuse de
multiplele conexiuni din cadrul societii. n cadrul studiilor social-economice, statistica a fost i este folosit ntotdeauna ca un instrument
indispensabil pentru cunoaterea vieii social-economice.
Procesul de conturare a statisticii a fost marcat de mai multe momente semnificative care au asigurat trecerea de la primele nregistrri
izolate la statistica contemporan. Statistica face parte din cadrul disciplinelor care studiaz fenomenele ntr-o viziune sistematic, la nivel
micro- i macroeconomic i, n consecin, ea ine seama de dinamismul structurilor existente i de factorii care acioneaz variabil n timp,
n spaiu i n funcie de modul de organizare social i economic.
Rdcinile istorice ale statisticii moderne sunt:
statistica practic n sensul unor nregistrri sistematice sau izolate, ce pot fi asimilate unor observri statistice utilizate i azi;
statistica descriptiv ca disciplin de nvmnt i de fundamentare a statisticii practice;
aritmetica politic i calculul probabilitilor, ca baz conceptual i ca mod de interpretare a fenomenelor n statistica modern.

Scurt istoric. Generaliti

Forma cea mai veche statistica practic dateaz de peste patru


milenii. Ea a servit unor scopuri fiscale, demografice i administrative.
De exemplu: inventarierea (din doi n doi ani) a aurului i pmntului
n Egipt (2650-2190 .e.n.). Din documentele descoperite rezult c i
chinezii dispuneau nc din mileniile IV i III .e.n. de date cu privire
la numrul populaiei, structura terenurilor i c utilizau diferite tabele
statistice referitor la unele aspecte ale activitii agricole.
Ca tiin statistica s-a dezvoltat n dou direcii. Una dintre ele a
fost statistica descriptiv, aprut n Germania, i care s-a dezvoltat n
paralel cu practica statistic n cadrul universitilor. Numele acestei coli
provine de la faptul c, potrivit concepiei sale, statistica se ocup de
descrierea situaiei geografice, economice i politice a unui stat. Printre
primele descrieri sistematice, folosind statistica descriptiv, se numr
i lucrarea lui Francisco Sansovino (1521-1586). Ca reprezentani de
seam ai acestei coli se mai amintesc: Giovanni Botero (1540-1617);
Hermann Conring (1606-1681), care a elaborat i primul curs de statistic; Gottfried Achenwall (1719-1772), considerat printele statisticii pentru faptul c a dat noii discipline numele de STATISTICA, argumentnd
c etimologic provine de la status n sens de stare.
Trstura caracteristic a statisticii descriptive este faptul c ea se
rezum la descrierea fenomenelor sau a unor pri ale acestora fr
s se ocupe i de cunoaterea regularitilor care se manifestau n
interiorul lor, a legilor care guvernau aceste fenomene. Dar limitarea
ei numai la descrierea fenomenelor fr o analiz cauzal, bazat pe
identificarea factorilor determinani cu aciune variabil asupra lor, a
dus la declinul acestei coli.
n plus, practic, continuitatea folosirii statisticii n cunoaterea fenomenelor sociale a fost asigurat prin instituionalizarea statisticilor
naionale ntr-un cadru oficial organizat (n 1796 n Suedia; n 1797 n
Norvegia; n 1800 n Frana).
Treptat interesul pentru studierea statisticii descriptive a sczut.
Acest declin se datoreaz orientrii cunoaterii tiinifice spre un mod
de cercetare specific tiinelor naturii, fizicii i chimiei, caracterizat prin
descoperirea legilor care guverneaz fenomenele respective, prin folosirea unor procedee bazate pe experimente, ce conduc la formularea
unor concluzii exacte. Astfel a aprut a doua direcie n Anglia, coala
aritmeticii politice, care a reprezentat n acelai timp i un moment im-

BIOSTATISTICA

portant n conturarea statisticii ca tiin. Numele colii provine de la


lucrarea lui William Petty (1623 1687) Aritmetica politic (1690), n
care sunt utilizate o serie de noiuni de baz cu care opereaz i azi
statistica (medie, proporie etc.).
Reprezentanii acestei coli se deosebesc esenial de statistica descriptiv. Prin analogie cu tiinele naturii, aritmetica politic tinde spre
exactitate i n cunoaterea social, obiectivul de baz fiind gsirea
regularitilor ce se produc n manifestrile sociale i economice. Ea
depete faza de descriere i i fundamenteaz concluziile pe un
numr mare de cazuri individuale cu care, prin generalizare, se pot
interpreta tendinele de producere a fenomenelor economico-sociale.
Cu alte cuvinte statistica ncepe s-i contureze etapele procesului su
de cunoatere: nregistrarea empiric a fenomenelor, sistematizarea i
prelucrarea datelor individuale n vederea generalizrii rezultatelor sintetice, pentru ca n final s efectueze analiza i interpretarea statistic
a fenomenelor medicale.
Fondatorul acestei coli este considerat John Graunt (1620 1674)
care, pe baza listelor privind natalitatea i mortalitatea din Londra (ntocmite ncepnd din anul 1600), a formulat n 1662 o serie de regulariti privind micarea natural a populaiei (proporia pe sexe, fertilitatea, mortalitatea etc.).
Pe linia utilizrii, n mai mare msur, a metodelor cantitativ-numerice n studiul fenomenelor economice i sociale se nscriu lucrrile lui
L. A. I. Qutelet (1796 1874), considerat de unii autori ca fondator al
statisticii moderne. El a folosit n cercetrile sale, n domeniul demografiei i criminalitii, calculul probabilitilor i legea numerelor mari, fr
s in seama de particularitile fenomenelor social-economice, de variabilitatea lor n timp i n spaiu. Neinnd seama de tipurile calitative
existente obiectiv n cadrul societii a fost normal s ajung la concluzia c legile care guverneaz aceste fenomene au caracter imuabil.
Absolutiznd i extinznd la societatea omeneasc noiunile cu care se
opereaz n statistic repartiii, frecvene, medii, dispersii etc. el a
ajuns s formuleze aa denumita teorie a omului mediu fr s in
seam c nu pentru orice categorie de fenomene pot fi folosite noiuni
abstracto-convenionale cu care s se sintetizeze bogia manifestrilor
individuale ale fenomenelor studiate. Ceea ce are sens pentru un anu-

Scurt istoric. Generaliti

mit domeniu al statisticii poate s rmn o abstracie pur* fr nici


o reprezentare real pentru un alt domeniu. Dup prerea unor autori
Lsnd la o parte latura sa fabuloas, conceptul de om mediu se cuvine
evocat pentru ideile implicate: repartiie; medie; dispersie; observare de
mas; regularitate; noiuni eseniale n cercetrile statistice.
Pentru statistica din mijlocul secolului ai XVIII-lea i secolul al XIXlea este specific folosirea tot mai frecvent a metodelor matematice
i, n special, a calculului probabilitilor n investigarea i interpretarea
rezultatelor privind fenomenele i procesele din societate, utilizndu-le
ca instrumente de cercetare n producerea fenomenelor, la cunoaterea legilor care le determin i pe aceast baz, la efectuarea de
previziuni tiinifice.
Combinnd metoda inductiv i deductiv, folosind din ce n ce
mai frecvent rezultatele bazate pe experimentri succesive, s-au formulat, pe de o parte, principiile teoriei seleciei i a extinderii rezultatelor acesteia pentru caracterizarea ntregului ansamblu i, pe de
alt parte, necesitatea de a privi fenomenele din cadrul societii ca
interdependente. Ia natere astfel statistica inductiv, la care i-au
adus contribuii importante R. Fisher, G. Yule, K. Pearson, E. Pearson,
P. Cebev, A. Ciuprov, A. Liapunov, A. Marcov i alii.
Paralel cu dezvoltarea pe plan tiinific are loc i o extindere a ariei
de aplicabilitate a statisticii oficiale pentru studierea nu numai a unor
fenomene izolate, ci a ntregului ansamblu, fiind folosit att pentru studierea prezentului i a trecutului, ct i pentru elaborarea unor ipoteze
asupra modului de comportare a acelorai fenomene n viitor. Statistica
folosind metode cantitative studiaz fenomenele n continua lor dezvoltare istoric n condiii date de timp, spaiu, n deplin concordan
cu aspectul calitativ al acestora. De aici se contureaz, cu mai mult
claritate, cele dou aspecte: dezvoltarea statisticii ca activitate practic
de cunoatere nemijlocit a fenomenelor din cadrul societii omeneti,
activitate considerat ca instrument indispensabil procesului de conducere i decizie; statistica ca disciplin tiinific i de nvmnt.
De asemenea, trebuie menionat c n literatura de specialitate, statisticii i se atribuie frecvent i unele sensuri cu coninut mai restrns ca,
* G. Moineagu, I. Negur, A. Urseanu, Statistica, Ed. tiinific i Enciclopedic,
Bucureti, 1976, p. 21.

BIOSTATISTICA

de exemplu: mulimea datelor statistice obinute prin activitatea practic;


metodologia statistic format din totalitatea metodelor de culegere, prelucrare i interpretare a datelor folosite ntr-o cercetare concret; metoda
statistic de cercetare a fenomenelor de mas, indiferent de domeniul n
care ele se produc, ceea ce i confer un aspect de generalitate.
Dezvoltarea statisticii ca activitate practic trebuie urmrit n raport cu transformarea actului de conducere, din activitatea intuitiv n
tiin a conducerii, precum i n interdependen cu progresele nregistrate n domeniul tehnicii de prelucrare a datelor pe plan naional i
internaional.
Evoluia statisticii ca disciplin de nvmnt trebuie urmrit
avnd n vedere dezvoltarea general a tiinei i a creterii rolului su
n procesul dezvoltrii societii omeneti.
Apariia i dezvoltarea tehnicii electronice de calcul a impus regndirea locului i rolului statisticii n procesul de cunoatere i predicie a
fenomenelor att n plan teoretic ct i practic. Aceasta cu att mai mult
cu ct au aprut n vecintatea statisticii o serie de tiine cum sunt
toate metriile, ca: econometrie, biometrie, psihometrie, sociometrie
etc., care aplic sistematic statistica. La aceasta se adaug cibernetica, informatica, managementul, marketingul, cercetrile operaionale i
economiile de ramur. Tuturor acestor discipline, statistica le ofer din
plin serviciile devenind un fel de tiin metodologic, n gen de omnibus al cunoaterii empirice*. Toate aceste discipline care se folosesc
de statistic n procesul de cunoatere au o serie de puncte comune cu
statistica n ceea ce privete obiectul i metodele lor de cercetare, dar
nici una nu este n msur s o suplineasc ntr-o manier satisfctoare pe cealalt. Tocmai acest aspect obliga la precizarea i delimitarea statisticii, ca tiin independent.
-

ARGUMENTE N FAVOAREA CUNOATERII STATISTICE:


suntem n mod curent utilizatori i furnizori de informaie, fie n viaa
particular fie n cea profesional;
suntem adesea decideni i calitatea deciziilor noastre depinde de
o bun informare;

* G. Menges, Grundriss der Statistik, Teii I. Theorie, Westdeutscher Verlag, Kohl


und Opladen, 1968, p. 16.

Scurt istoric. Generaliti

factorii decizionali au nevoie s tie cum s descrie i s prezinte n


modul cel mai potrivit informaiile;
factorii decizionali au nevoie s tie cum s obin previziuni credibile privind variabilele de interes;
factorii decizionali au nevoie s tie cum s mbunteasc desfurarea activitilor de care sunt rspunztori;
factorii decizionali au nevoie s tie cum s trag concluzii despre colectiviti numeroase, doar pe baza informaiilor obinute din
eantioane
suntem adesea interprei i calitatea nelegerii noastre depinde de
o bun cunoatere.
CE NSEAMN O GNDIRE STATISTIC?:
nseamn recunoaterea variaiei n orice proces i fenomen
i mai nseamn c studiind aceast variaie i cauzele ei vom
gsi noi cunotine i vom putea lua decizii mai bune.
Inseamn o nelegere concret, rapid, n context i n corelaie a
realitii economice i sociale.
DE CE TREBUIE S CUNOATEM TEORIA STATISTIC
DAC COMPUTERUL OFER FACILITI N DOMENIU?
CU COMPUTER
UTILIZATOR DE
INFORMAIE

FURNIZOR DE
INFORMAIE
FR COMPUTER

S reinem c fa de statistic, teorie sau practic, ne gsim permanent n una din situaiile de mai jos:
- suntem utilizator de informaie statistic avnd sau nu la ndemn
un computer;
- suntem furnizor de informaie statistic avnd sau nu la ndemn
o reea de calculatoare;

10

BIOSTATISTICA

suntem concomitent utilizator i furnizor de informaie statistic


cci potrivit teoriei sistemelor suntem sistem i subsistem n acelai
timp.
Pentru a fi riguroi i eficieni n oricare din situaiile prezentate mai
sus se impune deopotriv cunoaterea teoriei statistice i a calculatoarelor.

1.2. Obiectul i metoda statisticii


n toate momentele dezvoltrii sale, statistica s-a ocupat cu acele
fenomene i procese care se produceau ntr-un numr mare de cazuri, prezentau n reproducerea lor anumite regulariti i care pot fi
denumite fenomene de mas sau fenomene de tip colectiv. Pentru a
nelege caracterul i particularitile acestor fenomene trebuie pornit
de la natura raporturilor de cauzalitate a acestora. n general, n cadrul
societii, ca i n natur i n tehnologie, fenomenele pot s apar ca
rezultat al unei singure cauze, sau ca rezultat al mai multor cauze care
se manifest izolat sau n interdependen ntre ele. n primul caz, sunt
fenomene univoc determinate i, de regul, se prezint ca fenomene simple, identice ntre ele, denumite i fenomene tipice, n cel de-al
doilea caz, apar ca fenomene multicauzale al cror proces de formare
poate s prezinte grade diferite de complexitate, cu relaii multiple de
interdependen, formnd mpreun un ansamblu a crui dimensiune
i structur pot fi delimitate n timp, n spaiu i organizatoric.
Spre deosebire de fenomenele tipice care apar ca rezultat al unei
singure cauze, fenomenele de mas apar ca rezultat al influenei comune a unui numr mare de cauze i condiii variabile, cu grade i
sensuri diferite de influen, ceea ce face ca ele s se prezinte ca o
mas compact de fenomene atipice, aparent independente ntre ele.
Fenomenele de mas, aparinnd unei forme superioare de micare
a materiei se produc sub aciunea unor factori cu caracter sistematic,
asociai cu cei ntmpltori i ca atare fenomenologia cauzalitii lor
este complex. Astfel n cadrul fenomenelor simple univoc determinate, pe msur ce se produce cauza se produce i efectul, dac condiiile rmn neschimbate. Ele apar deci, ca fenomene deterministe, certe,
ca rezultat al aciunii unor legi ale dinamicii, ce pot fi cunoscute cu
ajutorul metodei experimentale i pentru care legea odat descoperit
poate fi verificat pentru fiecare caz n parte.

Scurt istoric. Generaliti

11

Fenomenele de mas, n general, apar ca o mulime de forme individuale diferite, cu existen distinct, aparent fr nici o legtur de la o
form la alta, dar care analizate comparativ se constat c au o aceeai
esen. Aceasta se explic, n principal, prin faptul c ele sunt generate
de o serie de cauze comune care se manifest, de regula, n condiii
diferite, n consecin, la fenomenele de mas din societate, relaiile de
multicauzalitate direct sau indirect care le determin fac imposibil
cunoaterea legilor care le produc i guverneaz, dac se iau n studiu
izolat doar cteva forme de manifestare a lor, ignornd ansamblul din
care fac parte. Explicaia const n faptul c n practic formele individuale de manifestare difer de la o unitate la alta n funcie de modul n
care se asociaz i se combin factorii sistematici cu cei ntmpltori, cei
eseniali cu cei neeseniali, cei obiectivi cu cei subiectivi, lsnd impresia
c fiecare form individual din cadrul ansamblului se produce la ntmplare, fr s existe o cauzalitate cert. Dar, analizndu-le la nivel de
ansamblu, ele par asemntoare ntre ele, fiind generate de cauze eseniale comune, supunndu-se aceleiai legi de apariie i dezvoltare. La
aceasta trebuie adugat i un alt aspect i anume, relaiile de cauzalitate
dintre fenomenele sociale au caracter dinamic, ca urmare a modificrii
permanente a condiiilor n care se manifest. De aici, se poate trage
concluzia logic c n astfel de cazuri, legea acioneaz att static, cnd
fenomenele de mas sunt circumscrise n aceleai condiii de timp, ct i
dinamic, cnd fenomenele sunt delimitate n spaiu i organizatoric, dar
nregistrate n uniti de timp diferite.
Ca atare, pentru a descoperi legea de apariie a unor astfel de fenomene nu sunt suficiente numai metodele experimentale, ca n cazul
fenomenelor de tip determinist ci i altele, bazate pe o serie de abstractizri succesive, prin care s se rein numai ceea ce este esenial, tipic
n forma lor de manifestare, prin eliminarea aspectelor ntmpltoare
i neeseniale. Aceasta presupune c se iau n studiu toate cazurile
individuale deoarece, spre deosebire de fenomenele care se produc
pe baza legilor dinamicii, care apar ca fenomene identice, fenomenele
de mas avnd cauze comune de apariie dar i unele cauze particulare care difer de la un caz la altul, sunt numai asemntoare ntre
ele. Principala lor proprietate este variabilitatea n timp i n spaiu i
legea de apariie a acestora se manifest ca tendin ce nu poate fi
cunoscut i verificat dect la nivelul ansamblului i nu n fiecare caz

12

BIOSTATISTICA

n parte. Prezena printre factorii determinani i a factorilor aleatori


face ca astfel de fenomene s nu poat fi interpretate dect recurgnd
la principiile teoriei probabilitilor. Ca atare, ele pot fi considerate ca
fiind fenomene de tip nedeterminist sau stochastic. n acelai timp sub
raport statistic, interpretarea aciunii factorilor ntmpltori nu se poate
realiza dect folosind proprietile legii numerelor mari, potrivit crora
variaiile ntmpltoare de la tendina general se compenseaz reciproc dac exist un numr mare de cazuri individuale de aceeai
esen, luate n studiu.
Fenomenele de mas sunt legile statistice specifice legi care se
manifest sub form de tendin, fa de care abaterile ntmpltoare
ntr-un sens sau altul se compenseaz reciproc, n consecin, este necesar ca n cercetrile statistice s se ia toate cazurile individuale sau
un numr suficient de mare, dar reprezentativ pentru ntregul ansamblu, pentru ca ele s poat intra sub aciunea legii numerelor mari.
Sintetiznd cele relatate se poate conchide c o prim particularitate a statisticii economico-sociale const n faptul c: statistica studiaz fenomenele social-economice de mas n cadrul crora acioneaz
legile statistice i care prezint proprietatea de a fi variabile n timp i
spaiu, n literatura de specialitate ele se ntlnesc sub denumirea de
fenomene de mas, fenomene de tip colectiv, fenomene stochastice
sau fenomene atipice.
Studierea fenomenelor sociale cu folosirea mai multor discipline, printre care i statistica, n aceste condiii, este necesar, s se stabileasc
obiectul din care studiaz statistica aceste fenomene de mas, ajungnd
astfel la cea, de-a doua particularitate, i anume: caracterizarea laturii
cantitative a fenomenelor social-economice, stabilindu-le dimensiunea,
dinamica, intensitatea, structura, raporturile de interdependen i celelalte aspecte ce pot fi caracterizate numeric n funcie de locul i timpul n
care s-au produs n strns interdependen cu latura lor calitativ.
Deci, opernd cu fenomene care apar n cadrul societii, statistica
contribuie la procesul de cunoatere cantitativ pornind de la coninutul
calitativ al acestora. Desigur, n analiza statistic accentul cade pe latura
cantitativ, dar cercetarea trebuie s porneasc de la nelegerea trsturilor calitative ale fenomenelor. Abstractizrile i generalizrile realizate
prin intermediul statisticii n vederea evidenierii a ceea ce este specific,
tipic n manifestrile unui fenomen sunt corecte numai n condiiile ne-

Scurt istoric. Generaliti

13

legerii i respectrii integritii calitative a acestuia. Aceste consideraii


privitoare la particularitile statisticii conduc la definirea obiectului su
de studiu: statistica este tiina care studiaz aspectele cantitative ale
determinrilor calitative ale fenomenelor de mas, fenomene care sunt
supuse aciunii legilor statistice ce se manifest n condiii concrete, variabile n timp, spaiu i de organizare socio-economic.
Deci, raiunea de a fi a statisticii sociale i economice const n necesitatea cunoaterii aspectelor cantitative ale fenomenelor de mas
cu larg rspndire n viaa social-economic. Datorit ntinderii, diversitii i variabilitii de manifestare, aspectele eseniale ale acestora
nu pot fi cunoscute dect la nivelul ntregului ansamblu, prin eliminarea
a tot ceea ce este ntmpltor i neesenial n producerea lor. De aici
rezult i modul de efectuare a studiului statistic al fenomenelor, care
trebuie s in seama de faptul c astfel de fenomene colective sunt
generate de legi i cauzaliti ce se manifest sub form de tendin,
valabil pentru ntregul ansamblu. Cu alte cuvinte, metodologia de investigaie statistic a fenomenelor trebuie s porneasc de la trsturile caracteristice acestor fenomene de mas, astfel nct s se realizeze att cunoaterea individual a lor ct i ansamblul i structurile
corespunztoare acestora. Aceste probleme apar numai pentru statisticile care se refer la un anumit domeniu de manifestare concret a
fenomenelor de mas, unde, deci, este obligatoriu pentru statistic s
in seama, n primul rnd, de specificitatea att a ansamblului ct i
a structurilor componente. Aceast precizare trebuie fcut deoarece
n procesul cunoaterii i statistica social i economic folosete i
instrumentele formale furnizate de matematic, fapt ce a fcut uneori
s se afirme c orice statistic este o ramur a matematicii.
Pentru a face o delimitare mai clar se accept, n general, c partea din statistic care poate fi considerat ramur a matematicii este
denumit statistic matematic, iar celor care au un domeniu concret
de investigare s li se ataeze un atribut corespunztor ariei de aplicabilitate.
Deci, de fiecare dat vor apare dou tiine complementare: statistica matematic i statistica domeniului de investigare. Aceste dou tiine ns se difereniaz din multe puncte de vedere, dintre care esenial este acela al metodei de cercetare. Se tie c, de regul, cmpul de
activitate al matematicianului este domeniul obiectelor ideale, ipotetice

14

BIOSTATISTICA

i o mare parte din cunoaterea matematic se realizeaz n mod deductiv, ceea ce nseamn rezolvarea problemelor cunoaterii pornind
de la general la particular. Aceasta nu nseamn c nu se procedeaz
uneori i inductiv. Dar deosebirea const n faptul c statistica care are
ca obiect de studiu un anumit domeniu din natur, tehnologie sau societate, pornete de la particularul obinut prin observarea (nregistrarea) valorilor empirice spre ceea ce este general, valabil pentru ntregul
ansamblu pe cale inductiv. Orice cunoatere tiinific, inclusiv cea
statistic, se realizeaz prin alternana inductiv-deductiv, dar calea
tipic statistic este cea inductiv. Aceste deosebiri apar i mai evident
cnd fenomenele studiate au coninut social-economic.
Considernd societatea omeneasc ca fiind de natur obiectiv ce
se dezvolt pe baza unor legi care pot fi cunoscute i verificate n condiii specifice de timp i spaiu, statisticii, ca principal instrument de cunoatere, i revine o serie de sarcini ce pot fi rezolvate cu ajutorul unor
metode, procedee, tehnici de calcul i interpretare statistic. Totalitatea
operaiilor, tehnicilor, procedeelor i metodelor de investigare statistic
a fenomenelor formeaz metodologia statistic.
Datorit faptului c metoda statistic poate s fie folosit n studiile
concrete efectuate de celelalte tiine, care studiaz dintr-un anumit
unghi ntreaga societate sau numai o parte a acesteia, a fcut ca ea s
fie uneori considerat ca o disciplin metodologic ce poate fi aplicat
de fiecare dat cnd apare necesitatea caracterizrii cantitativ-numerice a fenomenelor i proceselor economice i sociale. De fapt, se i
apreciaz c metoda statistic a devenit un instrument eficient i indispensabil tuturor tiinelor empirice. Aceasta apreciere este nemijlocit
legat de faptul c statistica vine n ntmpinarea particularizrii tot mai
accentuate a tiinei, precum i dorina de cuantificare specific pentru aproape toate aceste tiine. Pentru a putea deveni un instrument
indispensabil cunoaterii actuale a fenomenelor din cadrul diferitelor
domenii particulare este necesar ca ea nsi s se preocupe n permanen de elaborarea i perfecionarea unei metodologii tiinifice,
unitare care s-i confere statutul de disciplin tiinific autonom. Ca
atare, definirea metodei statisticii social-economice trebuie s se fac
potrivit cu natura fenomenelor cercetate i cu scopul cercetrii. Procedeele i metodele se aplic urmnd etapele oricrui proces de cunoatere, conceput ca un proces dialectic. Specificitatea metodologiei sale

Scurt istoric. Generaliti

15

poate fi urmrit i prin folosirea unor noiuni i categorii proprii legate


de obiectul su (colectivitate statistic, unitate statistic, caracteristic statistic) sau de metodologia sa (date statistice, indicator statistic,
indici, ecuaii de estimare, teste de semnificaie etc.). Astfel se ncepe
cu observarea fiecrui caz n parte pentru a cunoate mai nti manifestrile cantitative individuale. Observarea se realizeaz concret, sub
diverse forme, ca: raportri statistice (dri de seam), recensmnturi, anchete etc. n continuare, datele individuale se prelucreaz prin
metode specifice statisticii, n vederea eliminrii abaterilor individuale
din manifestrile cantitative. Astfel se obin indicatori statistici cu grade
diferite de generalizare, n funcie de metodele folosite care pot fi: metoda gruprilor, metoda mediilor, analiza variaional, metoda indicilor,
metoda corelaiei i altele. Pentru aceasta este necesar analiza prealabil a domeniului respectiv, realizat pe ci statistice i nestatistice,
ceea ce confer statisticii caracter interdisciplinar, care se realizeaz n
tot procesul de cunoatere.
Procesul de cunoatere statistic se ncheie cu analiza i interpretarea rezultatelor i cu formularea concluziilor statistice, care obligatoriu trebuie s cuprind variante probabile de apariie a acelorai fenomene n viitor.
n literatura didactic de specialitate, elaborarea principiilor, tehnicilor i metodelor folosite n cadrul culegerii (observrii), prelucrrii
i analizei datelor statistice formeaz coninutul cursului ce poate fi
intitulat: Teoria statisticii, Statistica general sau Statistica teoretic.
Aceast parte a statisticii formeaz fundamentul metodologic pentru
toate disciplinele statistice care studiaz fenomene i procese din diferite ramuri ale statisticii social-economice, avnd acelai obiect i
aceeai metod, difereniindu-se numai n ceea cei privete coninutul
particular al fenomenelor i proceselor specifice fiecare ramuri. Datorit acestui fapt ele apar ca discipline relativ independente, dei au un
caracter unitar prin folosirea acelorai noiuni i metode elaborate de
Teoria statisticii, n cadrul unor faculti economice ea se ntlnete i
sub denumirea de Bazele statisticii social-economice.
Adncirea diviziunii sociale a muncii a impus lrgirea ariei de investigaie statistic, ducnd n consecin la apariia de noi ramuri ale statisticii social-economice: statisticii teritoriale naionale i internaionale,
statistica indicatorilor sociali, statistica mediului nconjurtor i altele.

16

BIOSTATISTICA

n concepia de astzi a tiinei, statistica poate fi considerat ca o


disciplin de grani care, prin metodele sale, asigur cercetrii tiinifice
un caracter interdisciplinar. Apariia unor tiine noi: cibernetica, informatica, teoria sistemelor i altele, nu numai c nu se suprapun ca obiect i
metod statisticii, dar au impulsionat folosirea din ce n ce mai mult a metodelor sale n lrgirea i adncirea cunoaterii fenomenelor de mas, cu
deosebire a celor complexe din cadrul societii. Considerarea societii,
ca un sistem de relaii cantitative i calitative au impus gsirea unor noi
metode de reflectare i analiz numeric a acesteia, modele care nu pot
fi elaborate i aplicate dect dac se dispune de o informaie statistic
corespunztoare, n acelai timp se poate aprecia efectul pozitiv pe care
l-a avut asupra statisticii procesul de modernizare a tiinelor sociale,
apariia unor tiine care se ocup cu studiul societii, sntii populaiei i care influeneaz asupra perfecionrii metodelor sale de investigaie, ca, de exemplu, sociologia, antropologia i altele.
Rezult c aceste relaii ale statisticii cu celelalte tiine trebuie nelese ca un proces de reciprocitate, care are ca rezultat benefic att dezvoltarea tiinelor generale, ct i a celor particulare i care face posibil
ca statistica s se plaseze la grania dintre empiric i logic, dintre particular i general, dintre obiectiv i subiectiv. n plan practic, pentru statistic,
relaiile de interdependen se realizeaz n analiza teoretic ce precede
orice studiu statistic, dar mai ales n etapa final la formularea concluziei
statistice privind fenomenele investigate prin metode statistice.
n concluzie, se poate afirma c statistica se aplic n toate domeniile n care fenomenele se pot exprima cantitativ i prezint proprietatea
de a fi variabile ntre ele ca form concret de manifestare. Astfel de
fenomene, ntlnindu-se n natur, tehnologie i n societate au impus
o difereniere a statisticii att n plan teoretic, ct i practic. Statistica
social i-a dezvoltat o metodologie proprie cu aplicabilitate n toate
compartimentele vieii sociale pornind de la dou premise eseniale:
- studiile sale au ntotdeauna caracter concret, deci trebuie s
porneasc de la specificitatea fenomenelor abordate, ce trebuie
delimitate n timp, spaiu i structura organizatoric, ceea ce
nseamn c ea se bazeaz ntotdeauna pe o cunoatere empiric;
- variabilitatea fenomenelor sociale are, de regul, un grad mult
mai mare de amplitudine fiind rezultatul combinrii a numeroi

Scurt istoric. Generaliti

17

factori, care fac ca n cadrul ansamblelor studiate s apar


structuri variate, ce pot s se modifice esenial n dinamic.
De regul nu exist probe martor cu care s se fac direct verificarea
ipotezelor utilizate, ceea ce presupune c accentul trebuie s cad, n
special, pe analiza logic cantitativ i calitativ. Aceasta nu nseamn,
ns, c statistica social nu poate studia i unilateral unele fenomene
care intereseaz la un moment dat, de exemplu, preurile, consumurile
de materii prime, consumurile energetice, resursele materiale etc. Specificitatea acestor studii const n faptul c i n acest caz, este necesar
s se stabileasc dimensiunea i dinamica fenomenului, factorii care l
influeneaz, implicaiile pe care acest fenomen le are asupra altor fenomene coexistente n spatii diferite sau n dinamic. De aici i necesitatea
ca statistica s studieze static i dinamic fenomenele i s elaboreze
variante de predicii a fenomenelor pentru perioada viitoare.

18

CAPITOLUL

II

BIOSTATISTICA

NOIUNI DE BAZ. METODE STATISTICE

2.1. Definiia, obiectivele, compartimentele


Fondatorul biostatisticii este John Graunt.
STATISTICA este o tiin social, care studiaz partea cantitativ a fenomenelor sociale de mas n legtur strns cu particularitile lor calitative n condiii concrete de spaiu i timp.
Reieind din definiie putem s evideniem dou particulariti ale ei:
nu se ocup cu cazuri individuale ci numai cu fenomenele de
mas;
studiaz fenomenele de mas n condiii concrete de timp i
spaiu.
BIOSTATISTICA este statistica, ce studiaz aspectele, legate de
medicin i ocrotirea sntii.
Bazele teoretice ale biostatisticii sunt:
1) dialectica materiei;
2) teoria general a statisticii;
3) legitile economice;
4) bazele medicinii sau unor ramuri ale ei.
Obiectivele biostatisticii. Biostatistica studiaz:
1. Starea sntii populaiei:
Reproducerea i mortalitatea populaiei;
Morbiditatea i invaliditatea;
Parametrii dezvoltrii fizice.
2. Legtura dintre influena mediului ambiant i factorilor sociali asupra sntii populaiei.
3. Acumularea i analiza datelor referitor la activitatea instituiilor i
cadrelor medicale.
4. Evaluarea eficacitii metodelor de profilaxie i tratament.
5. Planificarea, economia i finanarea ocrotirii sntii.
Pornind de la obiective deosebim urmtoarele compartimente ale
biostatisticii
Statistica sntii populaiei;
Statistica ocrotirii sntii;
Statistica managementului de profilaxie, tratament i altor activiti n medicin.

Noiuni de baz. Metode statistice

19

2.2. Teoria probabilitilor


Teoria probabilitilor este o teorie matematic ce se ocup cu
studiul fenomenelor ntmpltoare ce pot aprea n gruparea unei caracteristici studiate pe baza unui experiment probabilist aleator. Adic,
atunci cnd rezultatele nu pot fi prevzute cu exactitate, dar pot avea o
oarecare frecven mai mult sau mai puin legitim. De exemplu, adresarea fiecrui cetean la serviciul de urgen nu poate fi programat de
nimeni, ns n totalitatea lor integral sau parial aceste adresri pot
fi repartizate cu o anumit legitate n fiece zi, pe ore. Studiind aceast
legitate, putem face prognoze privind adresrile din anumite zile i ore.
Iar acest lucru ne permite s planificm repartiia mijloacelor serviciului
pentru satisfacerea necesitilor populaiei.
Deci, probabilitate se numete acea msur de posibilitate a apariiei unor fenomene ntmpltoare n condiiile concrete date. Probabilitatea, de obicei, se nseamn prin litera P.
Probabilitatea de apariie a unui fenomen poate fi estimat pe dou
ci:
- clasic dac fenomenul se produce n h posibiliti ale n experimente, atunci probabilitatea acestui fenomen va fi h/n;
- frecvena empiric cnd experimentul se repet de mai multe ori
(f), iar fenomenul se produce cu o frecven de acum fixat h
(cum e cazul cu adresrile la serviciul de urgen). Aici probabilitatea apariiei fenomenului va fi h/f.
Probabilitatea apariiei n totalitatea parial a unui fenomen P se
determin prin raportul fenomenelor deja aprute (m) la numrul tuturor cazurilor posibile (n) aceasta e definiia clasic a probabilitii lui
Laplace. Atunci probabilitatea fenomenului P va fi:

Drept contraprobabilitate determinm alternativa probabilitatea


lipsei fenomenului, nsemnat prin litera q.
De aici:

20

BIOSTATISTICA

Aadar, suma probabilitii prezenei fenomenului cu contraprobabilitatea lui este egal cu unitatea, iar n procente cu 100,0%.
Rezultatele de mai sus pot fi exprimate i altfel, c probabilitatea
apariiei fenomenului P se afl n hotarele dintre 0 i 1 sau 0 -100,0%.
Cu ct probabilitatea e mai aproape de 1 sau 100,0% cu att prezena
fenomenului n totalitate e mai real. Aceast teorie argumenteaz legea cifrelor mari.

2.3. Legea cifrelor mari


Legea cifrelor mari (teorema lui P. Cebev) are dou aplicaii
importante pentru determinarea totalitilor selective:
1. Pe msura majorrii numrului cazurilor de observare rezultatele
cercetrii cptate pe baza totalitii selective tind s reproduc
datele totalitii integrale;
2. La atingerea unui anumit numr de cazuri de observare n totalitatea selectiv rezultatele cercetrii vor fi maximal apropiate de cele
posibile pe baza totalitii integrale.
Deci, la un numr suficient de mare de cazuri de observare se manifest acea legitate ce st la baza totalitii integrale i care nu poate
fi observat n cazul unui numr mic de cazuri cercetate.
Pentru o nelegere mai bun a teoriei probabilitii i regulilor legii
cifrelor mari descriem exemplul cu urna lui Galton, n care era introdus
un numr egal de bile negre i albe (cte 500), deci, n proporie de 1:1
sau 50% i 50%. Se scoate cte o bil, se nseamn culoarea i apoi
ea este pus napoi n urn. Operaia se repet de 10, 20, 50 ori i mai
mult. La nceput proporia bilelor albe fa de cele negre era 1:4 sau
20% i 80%. La un numr mai mare de extrageri (100-200-250) proporia se apropie de cea real 0,5/0,5 sau 50% i 50%. Din acest moment
orict s-ar prelungi numrul de extrageri proporia nu se va schimba.
Deci, limita maxim corespunztoare a totalitii selective poate fi calculat cu o oarecare probabilitate.
S presupunem c ponderea fenomenului n totalitatea selectiv
(P1) e mai mic dect cea din totalitatea integral (P). Diferena dintre
aceste mrimi exprim eroarea reprezentativ (m) i se explic prin
faptul c nu toate unitile de observare au fost studiate. Comparnd
aceste ponderi, dintre care una e cptat pe baza unei totaliti selective de un volum mai mare, vedem c valorile lor s-au apropiat. Deci, n

Noiuni de baz. Metode statistice

21

caz de un eantion de volum mai mare probabilitatea de necoinciden


a ponderilor e att de mic c ea poate fi neglijat.
Teoria statistic a demonstrat c n caz de totalitate selectiv mare
(n >30) ponderea fenomenului (P1) difer fa de cea din totalitatea
integral (P) cu probabilitatea de 95% i este egal cu 2 m; cu probabilitatea de 99,7% diferena ponderilor (P1-P) nu va depi 3 m. Cifrele
1, 2, 3 n, cu care se nmulete valoarea erorii (m) poart denumirea
de coeficieni de exactitate sau factori de probabilitate i se nseamn
prin simbolul t. Cu majorarea coeficientului t crete probabilitatea
cu care vom putea spune c diferena ponderilor cptate din ambele
totaliti este situat n intervalul: = tm , unde este eroarea limit
admis pentru studiul dat.
Deci, P = P1
n cazul experimentului cu bilele s-a observat o legitaie, i anume
c la un anumit numr de extrageri se nregistreaz raportul real al
bilelor albe i negre.
Bazndu-se pe legea cifrelor mari i majornd volumul totalitii selective, se poate influena asupra mrimii maxime a erorii, aducnd-o
la valori minime. Pentru a determina numrul de cazuri de observaie
(n) al totalitii trebuie s cunoatem eroarea limit admis () pentru
studiul dat.

2.4. Metode de cercetare utilizate n biostatistic


Metodele de cercetare aplicate n biostatistic nu difer cu mult
de cele folosite n alte domenii, unele din ele au fost chiar mprumutate de la ele (cele matematice, economice). Utilizarea lor se va face
ns innd cont de specificul acesteia. De exemplu, specificul statisticii
sanitare n cadrul studiului sntii publice const nu numai n depistarea fenomenelor legate de ea, ci i a dinamicii lor, n evidenierea
tendinei acestor fenomene, corelaiei lor cu factorii ce le provoac etc.
Cunoaterea acestor lucruri se poate efectua prin intermediul urmtoarelor metode:
1. Metoda observrii const n urmrirea desfurrii unor fenomene pentru a le putea analiza n dinamic, sau prin compararea lor,
ca apoi s se realizeze sinteza caracteristicilor lor eseniale.
Cercetrile efectuate cu folosirea acestei metode n studiul sntii publice sau unor cazuri clinice se realizeaz pe diferite ci:

22

BIOSTATISTICA

a) statistic cnd se acumuleaz informaia sub form de valori


numerice despre schimbrile fenomenului studiat sau activitatea
organelor, instituiilor sanitare i altor servicii pentru sntate. Pe
parcurs, observarea statistic dup volum poate fi efectuat prin:
- cercetarea integral (adic a ntregului volum numeric al totalitii) cnd avem de a face cu un fenomen de apariie rar, cu un
numr mic de cazuri n legtur cu care se cere de luat msuri
urgente, sau cnd ne intereseaz determinarea strii ntregii
populaii prin recensminte;
- cercetarea selectiv fa de cea integral se folosete mai
des i urmrete studiul unui fenomen cu o frecven mai mare
pe baza unei totaliti selective. Dac este nevoie de a studia
aprofundat un aspect, un fenomen rspndit ntr-o localitate,
un grup de populaie, va fi folosit cercetarea monografic, prin
cohort, prin sondaj etc.
b) aprecierea prin expertiz prezint un supliment, cnd fenomenul
general e studiat pe fiecare aspect al lui n particular prin intermediul experilor. De exemplu, dac ne intereseaz morbiditatea
spitalizat, atunci fiecare caz de boal tratat n staionar fie c va
fi paralel studiat n decursul spitalizrii, fie c dup externare pe
baza istoriei de boal. Experii se pronun cu privire la termenele
spitalizrii bolnavului, dat fiind starea lui, apreciaz calitatea investigaiilor, corectitudinea diagnosticului i tratamentului n fiecare
caz concret de patologie. Acelai lucru se poate efectua n cadrul
serviciului de ambulator, de urgen etc. Datele generalizate servesc la cptarea unor coeficieni de corijare a indicilor obinui pe
cale statistic. Expertiza este o metod mai mult calitativ de investigaie, permind elaborarea de msuri concrete de ajustare a
fenomenului studiat.
n funcie de timpul cnd se efectueaz observarea delimitm:
- cercetarea curent (permanent, continu) se utilizeaz
atunci cnd variabilitatea fenomenului studiat se poate schimba
destul de des, iar aceste schimbri importante pot surveni zi de
zi i chiar or de or. Astfel de cercetri se efectueaz de regul
n clinic, mai ales n seciile de reanimare sau n maternitate,
seciile de boli infecioase, unde observarea trebuie s se fac
de cteva ori pe zi sau peste un anumit interval de timp.

Noiuni de baz. Metode statistice

23

cercetarea periodic (la anumite intervale de timp) se utilizeaz atunci cnd fenomenul studiat are o variabilitate mult mai
mic n timp, sau o apariie i evoluie periodic. De exemplu, se
tie c o parte din boli pot da acutizri n anumite perioade ale
anului (boala ulceroas, reumatismul) sau evolueaz n condiii
atmosferice specifice ale anului (gripa, virozele organelor respiratorii, unele boli infecioase etc.). Ca urmare, cercetarea poate
fi efectuat numai pe parcursul acestor perioade de timp sau
la sfritul lor. n alte cazuri se recurge la cercetri periodice
o dat la 5-10 ani. Astfel de cercetare se impune n cazul unui
volum mare al totalitii (structura populaiei dup sex, vrst,
ocupaie, locul de trai, starea civil etc.).
- cercetare la un moment critic atunci cnd se fixeaz data i
chiar ora de nregistrare a fenomenului studiat (recensmntul
populaiei, nregistrarea personalului medico-sanitar etc.).
Dup frecvena observrilor cercetrile pot fi:
- de o singur dat;
- repetate.
2. Metoda epidemiologic sintetizeaz cele evideniate prin metoda observrii i prezint un studiu corelativ al fenomenelor din cadrul
sntii publice cu factorii (cunoscui sau presupui) de risc. Aceast
metod, ca i cea precedent, folosete pe larg o serie de metode
matematice pentru a gsi legitatea schimbrilor variabile, dinamice,
structurii fenomenelor studiate n legtur cu factorii ce le determin
(valorile medii, dispersia, corelaia, regresia etc.).
3. Metoda istoric e strns legat cu primele dou metode fundamentnd studiul sanitar al sntii publice sau al activitii serviciilor
pentru sntate n cadrul dezvoltrii istorice a societii.
Este un fapt dovedit c gradul de dezvoltare a societii, ornduirea
social n trecut i n prezent determin nivelul de trai al populaiei,
calitatea vieii, deci i sntatea ei.
Aici mai des se folosete metoda comparrii aceluiai fenomen
raportat la diferitele categorii de populaie (difereniate dup semne
sex, grupuri sociale, vrst, ocupaii etc.), teritorii (continente, ri,
regiuni, localiti) studiate acum i n trecut.
4. Metoda economic precizeaz starea de sntate public,
determinat de prezena surselor bneti, materiale, economice etc.

24

BIOSTATISTICA

Aceast metod se folosete la aprecierea eficacitii activitii serviciilor pentru sntatea populaiei (din punct de vedere social i economic)
n cadrul medicinii de stat, prin asigurare, precum i celei private.
O varietate a acestei metode e metoda economico-matematic cnd
se utilizeaz n combinaie cu o serie de metode matematice ce ne permit s optimizm aciunile sanitare, reelei sanitare legate de probleme
de sntate a populaiei cu analiza de sistem, de prognozare etc.
5. Metoda experimental urmrete scopul de a elabora i aproba noi forme i metode de organizare a muncii, a asistenei medicale,
aplicarea n practic a experienei naintate, verificarea reciproc a diferitelor proiecte, ipoteze, a noilor metode de diagnosticare i tratament
etc. Specificul acestei metode const n aceea c cercettorul singur i
creeaz obiectul i metoda de cercetare, reproducnd astfel fenomenele sau aspectele ce-l intereseaz n condiii de laborator, iar mai apoi
analiznd totul n detaliu conform scopului stabilit.
Orice experiment nu depinde numai de dorina i nzuina savantului, ci e o problem de ordin social. Rezolvarea lui va cere din partea
acestuia mbinarea mai multor metode de cercetare.
n genere, n orice studiu statistic cu scop de cunoatere nu se
folosete numai o metod izolat de cercetare. Pentru o investigare
multilateral a fenomenului i innd cont de scopul propus cercettorul
trebuie s decid ce metode se impun i n ce etap.
Etapa I este legat direct de metoda de observare epidemiologic,
economic i de acumulare (culegere) a datelor informative. n etapa
a II-a se recurge la o serie de metode statistico-matematice de prelucrare a informaiei acumulate, de asemenea i la metode economice,
economico-matematice.
n etapa a III-a vom folosi i metoda istoric comparnd rezultatele curente ale studiului cu cele ce au fost nregistrate n trecut. Astfel
cercettorul poate s-i ating scopul studiului i s analizeze n ansamblu toate caracteristicile de baz ale fenomenului trgnd concluzii
corecte i elabornd msurile practice necesare.
Metoda observrii dup modalitatea ndeplinirii poate fi: statistic i de
expertiz. Iar dup timpul ndeplinirii: curent (pe parcursul anului), periodic (o dat la doi ani), la un moment critic (la finele anului calendaristic).
Metodele de colectare a datelor pot fi divizate n dou grupe mari:
direct i indirect:

Noiuni de baz. Metode statistice

25

La metoda direct se refer:

Metoda observrii
Anchetare

Interviu

Monitorizare
Cea indirect reprezint extragerea datelor din documentaia medical.
Cel mai des n studiile statistice medicale sunt folosite urmtoarele
metode de colectare a informaiei.
1. Metoda observrii (direct) se utilizeaz de obicei n clinic,
cnd medicul, dup ce precizeaz anamnez bolnavului, face studiul
obiectiv i investigaiile de laborator ale pacientului, nregistreaz n
fi aceste date. Analogic se procedeaz i n policlinic, i la deservirea chemrilor la domiciliu. Dac cercettorul statistic vrea s foloseasc aceast metod, el trebuie s fie prezent alturi de medic i s
nregistreze datele de care are nevoie. Sunt cazuri cnd pe cercettor
l intereseaz nu numai date legate de boal, dar i probleme de ordin
personal i social, ca urmare nregistrarea direct poate fi fcut sub
form de anchet. n acest caz cercettorul trebuie s beneficieze de
ncrederea respondentului.
2. Metoda extragerii informaiei dintr-un formular statistic (indirect) fia medical a bolnavului de staionar, fia medical a bolnavului de ambulator, tichetul statistic de eviden a diagnosticului definitiv
(precizat), epicriz, raport statistic privind numrul de maladii nregistrate
la bolnavii domiciliai n teritoriul de deservire a instituiei curative etc.
Cnd se efectueaz acest lucru se ine cont de programul de culegere
a informaiei, unde trebuia s fie indicat concret care este unitatea de
eviden, caracteristicile ei atributive i cantitative. Datele privind aceste
caracteristici se extrag din documentele enumerate mai sus i se noteaz ntr-un registru special sau n mai multe fie, pe fiecare semn aparte.
Aceast metod se folosete frecvent n studiile statistice i poate fi utilizat de nsui cercettorul sau de persoane special instruite, n acest
caz fiind necesar controlul logic al materialului cules.
3. Metoda de anchetare utilizeaz informaia prin intermediul unor
anchete, anterior pregtite, care includ ntrebri speciale, la care respondenii trebuie s dea rspuns. Aceast metod se folosete n studiile sociologice, dar poate fi aplicat i n orice studiu statistic sanitar

26

BIOSTATISTICA

n mbinare cu alte metode de culegere a informaiei. Este foarte important ca ntrebrile incluse n anchet s fie formulate clar i concret,
n caz contrar respondenii nu vor ti ce s rspund la ele. Totodat
ancheta trebuie s fie anonim, adic s nu cerem de la respondeni s
ne comunice numele, adresa domiciliului .a., deoarece aceasta poate
s-l fac pe cel anchetat s nu rspund n genere la nici o ntrebare.
Anchetele de informare se utilizeaz mai ales n cercetrile strii
de sntate a populaiei i n cercetrile epidemiologice. ntrebrile din
anchet pot fi de tip:
- deschis cnd la ntrebare nu se dau variante de rspuns i respondentul trebuie s le formuleze singur;
- semideschis se dau variante de rspuns, dar se las un rnd
liber pentru expunerea unor opinii personale ale respondentului;
- nchis cnd la ntrebare sunt date 2 i mai multe variante de rspuns, iar respondentului i se propune s aleag unul din ele.
Datele acumulate pot fi analizate prin urmtoarele metode:
Metoda istoric
Metode epidemiologice
Metode economice
Metoda experimental
Calcularea indicatorilor relativi i medii
Metode de corelaie i regresie
Determinarea testului de semnificaie (t) i pragului de semnificaie (p)

2.5. Noiuni de baz n biostatistic


n biostatistic sunt cunoscute urmtoarele noiuni de baz:
totalitatea statistic
unitatea de observare
caracteristic statistic
indicatori statistici
date statistice
2.5.1. Totalitatea (colectivitatea) statistic
Definiia: totalitatea statistica reprezint un numr de elemente
(uniti de observare) omogene, luate mpreun n baza unui factor
comun n anumit perioad de timp i spaiu.

Noiuni de baz. Metode statistice

27

Numrul de uniti de observare determin volumul totalitii supuse studiului i se noteaz prin litera n. Dup volum deosebim dou
tipuri de totaliti statistice:
Totalitatea integral (generala, univers statistic)
Totalitatea selectiv
Totalitatea selectiva are urmtoarele caracteristici de baz:
trebuie sa dein caracteristice de baz de care dispune cea
integral;
trebuie sa dispun de un volum.
Metodele de selectare a totalitii selective:
cercetarea prin sondaj
cercetarea monografic
cercetarea selectiv:
aleatorie
mecanic
tipic.
Cercetarea prin sondaj se bazeaz pe o metodologie precis, unitar, valoarea rezultatelor depinznd de efectuarea ei corect tiinific.
Aceast cercetare nu permite s se trag concluzii generale, valabile
pentru totalitatea integral, fiind mai mult o metod de investigaie preventiv unui studiu de mare volum. De obicei se efectueaz pe baza
unui eantion mic.
Cercetarea monografic e un studiu selectiv n care limitarea volumului eantionului e completat cu o aprofundare a cercetrii caracteristicilor eseniale. Acest tip de eantion poate fi limitat n cazul unui
examen medical clinic cu un scop bine determinat (stabilirea gradului de
rspndire al unei boli sau al unui grup de boli din aceeai clas). Tot astfel de cercetri pot fi aplicate pe un eantion mic dup spaiu, dar majorat
n volum dup timp, adic n dinamic (studiul natalitii, mortalitii pe o
perioad de mai muli ani ntr-o circumscripie rural, dar ntr-o strns
legtur cu factorii social-economici, sanitaro-igienici etc.).
Cercetarea selectiv studiul selectiv reprezentativ pentru totalitatea integral i care poate fi efectuat prin selecia:
- aleatorie (ntmpltoare, randomizat simpl) se efectueaz prin
extrageri din liste n care sunt nregistrate toate cazurile individuale
fr nici o grupare sistemic prealabil. O metod frecvent de selecie aleatorie este tragerea la sori;

28

BIOSTATISTICA

mecanic (sistemic) este o metod superioar celei aleatorii,


deoarece fiecare unitate de observaie are anse egale s fie aleas. Selecia eantionului se face dup modelul de ah sau cazurile
de eviden sunt ordonate n ordine alfabetic sau localitile sunt
aranjate dup hart i se selecteaz fiecare a 4-a, a 6-a ori a 10-a,
n funcie de pasul de numrare. n acest mod se obine o selecie
teritorial uniform. Intervalul se calculeaz astfel ca eantionul s
cuprind de la 5 pn la 10% din totalitatea integral.

De exemplu, 10% atunci:

, fiecare al 10-lea;

etc.

Calea aceasta de selectare, dei rspndit, este anevoioas de


nfptuit. Avantajul const numai n simplitatea selectrii eantionului,
n timp ce exactitatea rezultatelor cercetrii poate avea erori mari, fiindc nu se ine cont de frecvena real de rspndire a fenomenului, de
dispersia lui n spaiu;
- tipic (stratificat) (proporional cu mrimea eantionului) urmrete scopul seleciei unitilor de observaie din grupurile tipice ale universului statistic. Pentru nceput, n cadrul universului
statistic toate unitile de observare se grupeaz dup anumite
caracteristici n grupuri tipice (de exemplu, vrst, sex sau dup
intensitatea frecvenei fenomenului). Din fiecare grup, pe cale
aleatorie sau mecanic, este selectat un anumit numr de uniti
astfel ca raportul dup caracteristici n eantion s fie acelai ca
i n totalitatea integral.
Dac e nevoie s se fac o nou stratificare cu scopul obinerii unui
grup i mai omogen, metoda n cauz se numete tipic stratificat cu
mai multe trepte. Avantajul ei este c fenomenele studiate pot fi mai
uniform reprezentate i deci i eantionul va fi reprezentativ;
- n cuiburi (n serii, n clastere) aici din totalitatea integral se selecteaz nu uniti individuale, ci serii (microzone), localiti care
sunt ulterior examinate n ntregime.
Distribuia datelor n totalitatea selectiv poate fi alternativ (Da/
Nu), simetric (normal) i asimetric.

Noiuni de baz. Metode statistice

29

30

BIOSTATISTICA

2.5.2. Unitatea de observare


Reprezint fiecare element component al colectivitii statistice,
care este purttorul tuturor trsturilor comune ale colectivitii supuse
studiului.
Unitile statistice pot fi simple, care nu mai suport diviziune (persoana) i complexe, rezultate ale organizriii sociale (familia).

Noiuni de baz. Metode statistice

2.5.3. Caracteristica sau variabila statistic


Reprezint trstura, proprietatea, nsuirea comun unitilor de
observaie, reinut n studiul statistic pentru a fi nregistrat i care
variaz ca valoare de la o unitate la alta.
Caracteristicele statistice pot fi clasificate dup cum urmeaz:
n funcie de modul de exprimare:
- caracteristici calitative (nominative), exprimate n cuvinte:
profesie, localitatea de domiciliu, culoarea prului, culoarea
tegumentelor, sexul, starea de nutriie sau de boal, starea la
externare a unui bolnav, etc.;
- caracteristici cantitative (numerice), exprimate n cifre: salariu, vechimea n munc, nlime, greutate, perimetru, tensiune
arterial, puls, temperatur, etc. Sunt caracteristici msurabile.
n funcie de numrul variantelor/valorilor de rspuns pe care
le pot lua:
- caracteristici alternative (binare sau dihotomice), acelea care
pot lua doar dou variante de rspuns: sex (M/F), starea civil
(cstorit/necstorit), familie cu copii sau fr copii, etc;
- caracteristici nealternative cele care pot lua mai multe valori/
variante de rspuns: salariu, profesie, localitate de domiciliu,
starea la externare a unui bolnav, etc.
n funcie de natura variaiei caracteristicilor cantitative:
- caracteristici continue, care pot lua orice valoare din scara lor de
variaie: greutatea unei persoane, nlimea, temperatura, etc.;
- caracteristici discrete sau discontinue, care pot lua numai valori ntregi: numrul de copii pe care i are o familie, numrul
de persoane dintr-o familie, numr de medici, numr de paturi,
numr de vizite, etc.
n funcie de coninutul caracteristicii:
- caracteristici de timp (anul naterii);

31

caracteristici de spaiu (localitatea de domiciliu);


caracteristici atributive, n care variabila reprezint un atribut,
altul dect spaiul ori timpul cele calitative i cantitative.
n funcie de modul de obinere i caracterizare a fenomenului:
caracteristici primare (obinute, de regul, n etapa de colectare a
datelor statistice prin msurare sau numrare);
caracteristici derivate, obinute n procesul prelucrrii datelor statistice.
n funcie de modul de influen asupra fenomenului:
- caracteristici factoriale;
- caracteristici rezultative.

2.5.4. Indicatori statistici


Indicatorul statistic este expresia numeric a unor fenomene, procese, activiti sau categorii economice i sociale, definite n timp, spaiu i structur organizatoric.
Deosebim urmtoarele funcii ale indicatorilor statistici:
funcia de msurare;
funcia de comparare;
funcia de analiz;
funcia de sintez;
funcia de estimare;
funcia de verificare a ipotezelor i de testare a semnificaiei
unor indicatori statistici calculai.
Indicatorii statistici pot fi prezentai prin valori absolute, relative i
medii.
Ctre valorile relative pot fi atribuite rata, raportul i proporia.
Rata ne arat ct de repede evenimentul (nateri, mbolnviri, decese) apare n populaie.
Componentele ratei sunt:
Numrtor: numrul de evenimente observate;
Numitor: populaia n care evenimentele au loc;
Timpul specificat cnd au loc evenimentele;
De obicei un multiplicator transform rata dintr-o fracie incomod sau decimal ntr-un numr ntreg.
Tipurile de rate sunt:
brute;

32

BIOSTATISTICA

speciale (specifice);
standardizate.

Indicatorii de proporie nu pot fi comparai.


Exemplu:
Tabelul 1.
Numrul de cazuri de mbolnviri n funcie de vrst i localitatea (abs., %).

Exemplu: rata brut a mortalitii


Numrul deceselor, indiferent de cauz,
ntr-o populaie, ntr-o perioad specific
Numrul de persoane cu risc de a muri
de-a lungul perioadei

Vrsta
0-14
15-64
65->
Total
0-14
15-64
65->
Total

x 10n
Nord

Exemplu: rata mortalitii din cauze specifice


Numrul de decedai, dintr-o cauz anume
ntr-o populaie, ntr-o perioad specific de timp
Numrul de persoane cu risc de a muri
din acea cauz de-a lungul perioadei

Sud
x 10

Proporia
50%
30%
20%
100%
50%
30%
20%
100%

Tabelul 2.
Numrul de cazuri de mbolnviri n funcie de vrst i localitatea (abs., %).

Nord

Sud

unde: x numrul de paturi, nr. de medici,


y numrul de populaie.
Proporia ne arat ce fraciune a populaiei este afectat. Caracteristicile lor de baz sunt:
coeficientul a 2 numere;
numrtorul este inclus n numitor;
proporia ntotdeauna deviaz ntre 0 i 1 sau ntre 0 i 100%.
Exemplu de proporie:
n anul 2006 n Republica Moldova au fost recunoscui ca invalizi 7695
brbai i 6005 femei. Care este procentul femeilor din numrul total?

Nr. cazuri
10
6
4
20
15
9
6
30

Pentru comparaie pot fi utilizate ratele.


Exemplu:

Exemplu Rata caz-fatalitate (RCF) proporia cazurilor unei condiii specifice fatale ntr-o perioad specific de timp.
Sinonimele pentru rat sunt: frecven, nivel, rspndire, intensitate.
Raportul permite compararea unei populaii cu alta.
Raportul este un numr mprit la altul.
Exemplu: raport dintre brbai i femei, nateri i avorturi, nr. de
medici i asistente medicale. n aceste cazuri nu este necesar o relaie specific ntre numrtor i numitor. Raportul poate fi prezentat
astfel x : y sau

33

Noiuni de baz. Metode statistice

Vrsta
0-14
15-64
65->
Total
0-14
15-64
65->
Total

Nr. cazuri
10
6
4
20
15
9
6
30

Proporia
50%
30%
20%
100%
50%
30%
20%
100%

Nr. populaiei
100
200
100
400
100
200
100
400

Rata
10%
3%
4%
15%
4,5%
6%

Sinonimele indicatorului de proporie sunt cota, ponderea, structura.

2.5.5. Date statistice


Analiza datelor statistice se face n funcie de:
timp;
loc;
persoan.
Caracteristica de timp ne permite s stabilim:
modificri pe termen scurt;
modificri ciclice;
modificri seculare (pe termen lung);
poate fi aranjat n tabele i grafice.

34

BIOSTATISTICA

Prin caracteristica de loc se descrie unitatea geografic. Pentru


prima dat aceast descriere a fost efectuat de ctre John Snow n
an. 1854 cnd n Londra a avut loc erupia de holer.
Caracteristica de persoan ne permite s facem analiza datelor
acumulate dup vrst, sex, etnie, etc.

2.6. Gruparea materialului statistic. Seria statistic de variaie.


Indicatorii tendinei centrale.
Gruparea materialului statistic const n aranjarea unitilor statistice, n funcie de diferitele caracteristici sau variabile, n grupe ct
mai omogene, pentru a le putea scoate ct mai uor n eviden. Gruparea este operaia statistic ce permite trecerea de la aspectele particulare, individuale ale unitilor statistice la aspecte generale, comune
pentru colectivitatea supus studiului.
n funcie de numrul caracteristicilor de grupare se realizeaz
grupri simple, cnd la baza repartizrii st un singur criteriu, i complexe, cnd la baza repartizrii stau dou sau mai multe criterii.
Dup natura caracteristicii gruparea poate fi:
- n timp, cnd repartizarea materialului statistic are la baz anumite
intervale de timp;
- n spaiu, cnd repartizarea materialului se face n raport cu locul
sau teritoriul unde s-a examinat colectivitatea statistic, de exemplu mediu rural i mediu urban.
n funcie de variaia caracteristicii de grupare se realizeaz grupri pe variante sau pe intervale.
Limitele gruprii nu se stabilesc mecanic ci depind de natura fenomenului studiat i scopul cercetrii. n principiu o grupare prea amnunit a materialului statistic duce la o frmiare ce ne mpiedic s
observm ce este caracteristic, esenial. De asemenea dac o caracteristic are prea multe valori vom repartiza materialul statistic pe grupe
de valori. Fiecare grup de valori sau clas are la rndul ei o limit
inferioar, o limit superioar i un centru al grupei egal cu semisuma
celor dou limite.
n cadrul gruprii trebuie s cunoatem exact valorile extreme
maxim i minim ale caracteristicii i trebuie s stabilim intervale de
grup egale, iar limitele claselor s fie distincte pentru a nu crea confuzii cu ocazia repartizrii unitilor de observare.

Noiuni de baz. Metode statistice

35

Prelucrarea materialului statistic nu se oprete la gruparea materialului deoarece datele brute obinute, de cele mai multe ori, nu permit
aprecieri comparative. De aceea materialul statistic este supus n continuare unei prelucrri cu ajutorul metodelor de statistic matematic
n vederea obinerii unor indicatori statistici ca: valori relative, valori
medii, criterii de variaie, corelaie, veridicitate, ce vor permite aprecieri
comparative, corecte i concluzii semnificative.
Urmare gruprii datelor statistice rezult serii statistice.
Seria statistic de variaie este irul de valori numerice ale caracteristicii, ordonate cresctor sau descresctor n funcie de mrimea
acestora.
Seria statistic reprezint corespondena a dou iruri, cel al valorilor variantelor (x) i cel al frecvenelor (f), motiv pentru care se mai
numete i serie de distribuie/serie de frecvene. Suma frecvenelor
variantelor corespunztoare corespunde cu numrul de cazuri cercetate (f = n).
Seriile statistice de variaie pot fi de dou categorii: simple i grupate. Cnd fiecrei valori a caracteristicii i corespunde o singur frecven vorbim de o serie statistic simpl, iar cnd fiecrei valori i corespund mai multe frecvene vorbim de o serie statistic grupat.
Unii autori definesc seria statistic n modul urmtor: simpl de
regul se formeaz n cazul unui numr mic de cazuri cercetate
30 i grupat care se formeaz n cazul unui numr mare de cazuri
cercetate > 30.
Cerinele de baz pentru formarea seriei de variaie:
1. Ordonarea valorilor variantelor;
2. Numrarea frecvenelor fiecrei variante;
3. Determinarea numrului de grupe i valorii intervalului;
4. Gruparea seriei de variaie, utiliznd intervalul cu respectarea continuitii seriei;
5. Reprezentarea grafic a seriei de variaie.
Toate 5 cerine snt obligatorii pentru formarea seriei de variaie
grupate, cerinele 1,2 i 5 pentru formarea seriei de variaie simpl.
Numrul de grupe n serie se determin n dependen de numrul
cazurilor cercetate (Tab.3).

36

BIOSTATISTICA

Tabelul 3
Numrul de grupe n funcie de numrul de cazuri
Numr cazuri

31-45

46-100

101-200

201-500

Numr grupe

6-7

8-10

11-12

13-17

n cazul seriei de variaie n care variantele snt exprimate n intervale de grup, pentru a le putea introduce n calculul statistic stabilim
mijlocul fiecrei grupe, reprezentat printr-o singur valoare, care este
centrul intervalului grupei obinut prin semisuma valorilor variantelor
extreme ale fiecrui interval de grup (Tab.4).
Tabelul 4.
Gruparea seriei statistice n funcie de dini afectai
Grupe de valori ale dinilor
afectai
1-3
4-6
7-9
10-12
13-15
Total

Mijlocul intervalului de grup

Frecvene

2
5
8
11
14

106
252
75
50
25
508

Cele trei proprieti majore ale seriilor de variaie, pe care le putem


analiza folosind indicatorii statistici sunt cele privitoare la tendina central, la variabilitatea i la forma distribuiilor.
O clasificare a indicatorilor tendinei centrale se poate face, n funcie de modul de determinare a lor, n:
- indicatori (mrimi) medii de calcul: media aritmetic, armonic,
cronologic, ptratic, geometric etc.;
- indicatori medii de poziie: modul, mediana.
Indicatorii fundamentali ai tendinei centrale sunt: media aritmetic, modul i mediana, dar n anumite cazuri speciale putem apela i
la alte tipuri de medii.
Mrimile medii sunt mrimi tipice, caracteristice, ce definesc
un fenomen variabil.
n general, n toate cercetrile, dar n special cele care privesc starea de sntate a populaiei, de un interes deosebit este cunoaterea

Noiuni de baz. Metode statistice

37

comparativ a fenomenelor studiate fa de un etalon, mrimea medie.


Fr cunoaterea mrimilor medii, comparaia nu este posibil dect
n mod imperfect: compararea dintre dou sau mai multe fenomene
pentru a constata diferena dintre ele, neputnd conclude dac aceste
fenomene snt sau nu apropiate de o valoare etalon.
Mrimea medie are aceleai dimensiuni concrete cu ale variabilei
a crei repartiie de frecvene o caracterizeaz. Astfel dac variabila
privete nlimea n cm a nou nscutului i mrimea medie va fi redat
n cm.
Dup Yule i Kendall condiiile pe care trebuie s le ndeplineasc
o mrime medie ar fi:
- S fie definit n mod precis, independent de dorina utilizatorului;
- S fie expresia, sinteza tuturor observaiilor nregistrate;
- S posede proprieti simple, evidente, clare chiar i pentru nespecialiti;
- S fie simplu i rapid de calculat;
- S fie puin sensibil la fluctuaiile de selecie;
- S poat fi studiat rapid cu ajutorul calcului algebric.
n general, indicatorii tendinei centrale, calculai ca mrimi medii
realmente nu satisfac toate condiiile prevzute mai sus. Utilizatorul
trebuie ns s fie interesat s cunoasc condiiile nesatisfcute i implicaiile acestora pentru fundamentarea deciziilor.
MEDIA
Media este expresia care sintetizeaz ntr-un singur nivel reprezentativ tot ceea ce este esenial, tipic, comun, obiectiv n apariia, manifestarea i dezvoltarea unui fenomen.
Exemple: durata medie de utilizare a patului pe an; durata medie
de spitalizare a bolnavului la pat; nota medie la examen a unei grupe
de studeni; numrul mediu de vizite la medicul de familie n an la 1
locuitor, care locuiete n teritoriul deservit.
Cnd este o medie reprezentativ?
- Cnd calculul mediei se bazeaz pe folosirea unui numr mare de
cazuri individuale:
Nu putem spune c durata medie de spitalizare a bolnavului la pat
n RM a fost n anul 2006 9,1 zile lund n calcul doar trei spitale.

38

BIOSTATISTICA

Cnd valorile din care se calculeaz media sunt omogene:


Aceeai afirmaie de mai sus poate fi greit, adic media nu este
reprezentativ i n consecin nu este credibil, dac durata de tratament a variat de la 7 zile la 77 zile.
- Cnd se alege forma de medie care corespunde cel mai bine variaiei caracteristicii i volumului de date de care se dispune.
Valorile medii pot fi exprimate prin cifre absolute sau prin indici. De
exemplu, n cazul cunoaterii tensiunii arteriale sistolice sau diastolice
la un grup de populaie, sau n cazul nlimii sau greutii medii la diferite vrste i sexe, valorile medii se exprim n valori absolute (mmHg,
cm, kg). n cazul morbiditii sau mortalitii generale sau specifice pe
vrste sau sexe, cauze de boal, etc., valorile medii se exprim prin
cifre relative (la 1000 sau 100000 de locuitori). Fac excepie cazurile
foarte rare de boal sau deces care se exprim mult mai corect prin
cifra absolut (de exemplu un caz de difterie sau poliomielit).
Ce tipuri de mrimi medii se pot calcula?
- Media aritmetic
- Media armonic
- Media cronologic
- Media ptratic
- Media geometric
Media aritmetic simpl
Media aritmetic simpl este valoarea medie care se obine din
suma valorilor individuale dintr-o colectivitate omogen, divizat la numrul total al cazurilor studiate.
Media aritmetic simpl se utilizeaz pentru a stabili valoarea medie n seriile statistice n care fiecrei valori a variantei i corespunde o
singur frecven.
Formula de calcul:

Noiuni de baz. Metode statistice

39

Exemple de calcul:
Greutatea la natere la un numr de 6 copii de sex masculin este
(n grame): 3000; 2600; 2800; 3100; 3200; 2700.
Aplicnd formula de calcul vom obine media greutii, la natere,
la lotul de 6 copii, de 2900 gr:

Durata de tratament la 8 bolnavi cu aceeai maladie a fost (zile):


10; 12; 15; 18; 20; 22; 24; 27.
Aplicnd formula de calcul vom obine media duratei de tratament
la lotul de 8 bolnavi de 18,5 zile:

Cele expuse anterior, cu privire la valorile medii, se pot vedea din


formula mediei aritmetice simple: nici un copil nou-nscut nu are greutatea medie de 2900 gr.; nici un bolnav nu are durata medie de tratament de 18,5 zile; valorile individuale fiind situate fie sub, fie peste
medie i doar pe ntreg lotul studiat se obine valoarea medie.
Media aritmetic ponderat
Media aritmetic ponderat este valoarea medie care se obine din
suma produsului valorilor dintr-o colectivitate omogen, cu frecvenele
corespunztoare, divizat la numrul total al cazurilor studiate.
Media aritmetic ponderat se utilizeaz n calcularea valorii medii
n cazul n care valorile individuale au frecvene diferite. n acest caz
media aritmetic simpl nu se poate utiliza.
Formula de calcul:

Exemple de calcul:
ntr-un spital, medicii prezint urmtoarea distribuie conform vrstei: 40 persoane de 37 ani; 40 persoane de 38 ani; 10 persoane de 41
ani i 10 persoane de 44 ani.
Aplicnd formula de calcul, vom obine vrsta medie a personalului,
de 38,5 ani:

40

BIOSTATISTICA

41

Noiuni de baz. Metode statistice

Tabelul 5

Tabelul 6

Durata de spitalizare a bolnavului la pat (zile):

nlimea nou-nscuilor de sex masculin (cm)

Zile (x)

10

11

12

13

14

18

21

Bolnavi (f)

12

17

14

Aplicnd formula de calcul, vom obine durata medie de spitalizare


a bolnavului la pat de 14,7 zile:

Din exemple se poate constata c valoarea mediei aritmetice ponderate se situiaz n plus sau n minus de partea unde frecvenele snt
mai mari.
n cazul calculrii mediei aritmetice ponderate n serii statistice n
care valorile variantelor snt mari (de ordinul sutelor, miilor sau zecilor
de mii) i reprezentate de cifre zecimale, iar frecvenele corespunztoare fiecrei variante sunt de asemenea numeroase, operaia devine
deosebit de dificil. n acest caz recurgem la o metod simplificat a
calculrii mediei aritmetice ponderate, i anume metoda momentelor.
Formula de calcul:
= Xo M1
ap
unde:
media aritmetic ponderat
Xo media ipotetic
M1 momentul 1
Momentul 1:

unde:
d deviaiile (abaterile) de la medie
f frecvena
f suma frecvenelor (numrul cazurilor)
Lum ca exemplu seria de variaie a nlimii nou-nscuilor de sex
masculin, expus n tab. 6.

Valorile
variantelor
nlimii n cm
(x)

Frecvenele
(numrul
cazurilor)

Produsul
valorilor cu
frecvenele (xf)

Deviaia
de la medie
(d)

Produsul
deviaiei de la
medie cu frecvenele (df)

46
47
48
49

2
5
13
30

92
235
624
1470

-4
-3
-2
-1

50

89

4450

51
52
53
54
55
56
57

49
40
20
7
3
1
1

2499
2080
1060
378
165
56
57

1
2
3
4
5
6
7

49
80
60
28
15
6
7 +245

Total:

260 = f (n)

13166 = xf

-----

-8
-15
-26
-30 -79

166 = df

Prima coloan cuprinde seria de variaie a valorilor de nlime (x),


iar a doua coloan frecvenele (f) ce corespund fiecreia din valori. Coloana a 3-a corespunde produsului valorilor cu frecvenele respective,
adic produsul datelor corespunztoare din coloana 1 i a 2-a (xf).
Dac adunm coloana a 3-a i mprim la numrul total de cazuri
(f) vom obine media ponderat, egal cu 50,64 cm. Pentru a substitui
acest calcul, care poate deveni destul de dificil n cazul valorilor mari
sau cu zecimale, precum i n cazul frecvenelor mari, recurgem la calculul momentului 1.
Acesta se efectueaz n felul urmtor: alegem, n mod arbitrar, ca
medie ipotetic, una dintre valorile nlimii, i anume valoarea variantei cu cele mai multe frecvene (modulul) n cazul nostru vom selecta
ca medie ipotetic nlimea de 50 cm. n dreptul acestei valori notm,
n coloana a 4-a, zero coresponznd originei i apoi completm coloana, n sus, spre valorile mai mici de nlime, notnd cu minus, iar n jos
notnd cu plus, n progresie aritmetic. Aceast coloan a deviaiei de
la medie, sau mai bine-zis de la origine o notm cu d. n coloana a 5-a

42

BIOSTATISTICA

trecem produsul dintre coloana a 2-a i a 4-a, adic produsul deviaiei


de la medie cu frecvenele corespunztoare (df).
Vom obine n coloana a 5-a, n partea de sus, rezultatele cu semnul algebric minus (), iar n parte de jos sub origine, spre valorile mari
ale seriei de variaie, rezultatele cu semnul algebric plus (+).
Adunm separat cele dou grupe de produse i apoi scdem suma
valorilor cu minus din suma valorilor cu plus, rezultatul mprindu-l la
suma frecvenelor (numrul de cazuri).
nlocuind simbolurile formulei momentului 1 cu datele rezultate din
tab.6 vom obine:

Adunm aceast valoare a momentului 1 cu media ipotetic aleas


n mod arbitrar i vom obine media aritmetic ponderat:
= 50,0 cm + 0,64 = 50,64 cm.
Din tabel se poate constata felul n care utilizarea momentului 1
uureaz calcularea mediei. Astfel, n loc de a nmuli coloana 1 cu
coloana 2, obinnd astfel coloana a 3-a cu cifre mari, care nsumate
trebuie mprite la numrul total de cazuri, vom nmuli doar coloana
a 4-a cu coloana a 2-a. nmulirea se va face cu 4, 3, 2, 1 etc. n loc
de 46, 47, 48, 49 etc. mprirea la numrul total de cazuri este, de
asemenea, uurat prin metoda momentului 1, cci n loc de a mpri
13166 la 260, ca n calculul simplu al mediei aritmetice ponderate, n
cazul momentului 1 mprim 166 la 260.
Ca medie ipotetic se poate alege oricare din valorile variantelor
de nlime, rezultatul final fiind identic, dar pentru a uura ct mai mult
calculul se alege valoarea care are o frecven mai mare.
Astfel dac n exemplul anterior am lua ca medie ipotetic nu 50 cm
ci 51 cm am ajunge la aceeai valoare medie, cu singura diferen c
n acest caz momentul 1 are o valoare negativ, ce trebuie sczut din
media ipotetic (Tab. 7).

43

Noiuni de baz. Metode statistice

Tabelul 7
nlimea nou-nscuilor de sex masculin (cm).
Valorile variantelor
Frecvenele
nlimii n cm (x) (numrul cazurilor)

Deviaia
de la medie (d)

Produsul deviaiei
de la medie cu
frecvenele (df)

46
47
48
49
50

2
5
13
30
89

-5
-4
-3
-2
-1

-10
-20
-39
-60
-89

51

49

0
40
40
21
12
5
6
6 + 124

52
53
54
55
56
57

40
20
7
3
1
1

1
2
3
4
5
6

Total:

260 = f (n)

-----

-218

94 = df

Formula momentului 1 se calculeaz ca i n exemplul anterior:

= 51,0 cm 0,36 = 50,64 cm.


ap
Deci rezultatul este identic n toate mprejurrile, indiferent de media ipotetic aleas.
Pentru uurarea calculului se ia, ns, ca medie ipotetic, totdeauna, valoarea variantei cu cele mai multe frecvene.
Exist cazuri cnd intervalele valorilor seriei nu snt de 1, ci de 2
sau 3 uniti, sau din contra de 0,5 sau 0,3.
n aceste cazuri, nainte de a trece la calculul mediei mediei aritmetice ponderate trebuie s nmulim momentul 1 cu valoarea corespunztoare a intervalului.

44

BIOSTATISTICA

Asupra mediei aritmetice sunt de fcut cteva observaii i de subliniat cteva proprieti:
1) Definiia dat mediei aritmetice este valabil numai dac valorile
individuale nregistrate sunt numerice. Pentru o serie cu valori nenumerice nu se poate calcula media aritmetic;
2) Mrimea mediei aritmetice calculate este unic; o serie nu posed
mai multe medii aritmetice distincte;
3) Mrimea mediei aritmetice poate sau nu s coincid cu vreo valoare individual nregistrat;
4) Media are ntotdeauna valoarea cuprins ntre valoarea minim din
serie (Xmin) i valoarea maxim (Xmax);
5) Suma abaterilor valorilor individuale de la media lor este ntotdeauna egal cu zero (adic distanele fa de centru se balanseaz, se
compenseaz reciproc);
6) Media aritmetic este legat de toate valorile numerice nregistrate
i, n consecin, este sensibil la prezena valorilor aberante.
7) Dac o serie este alctuit din mai multe serii componente, pentru
care s-au calculat medii pariale, atunci media ntregii serii poate fi
calculat ca o medie ponderat din mediile pariale.
Media armonic
Media armonic este o medie cu aplicaie special care se determin ca valoarea invers a mediei aritmetice calculat din inversele
valorilor seriei.
Media armonic simpl

1. Fie valorile: 1, 5, 10. Care este valoarea medie?

Noiuni de baz. Metode statistice

45

2. Trei investiii produc acelai venit. Valorile lor sunt urmtoarele:


5%, 10% i 15% i media de plasare a capitalului pentru toate trei.

Media armonic ponderat

Dac, de exemplu, mortalitatea general din 3 localiti rurale este


de 8,0, 9,0 i 10, iar numrul de locuitori 4000, 4500 i 7000 i nu cunoatem cifrele absolute de decedai, media aritmetic simpl este de
9 n timp ce media armonic, pondernd valorile relative cu populaia
la care se refer, va fi 9,12:

Xi

suma
valorile individuale
inversul valorilor individuale

numrul de valori.
n realitate, media armonic se utilizeaz rar, n special la stabilirea
preurilor medii.
Media cronologic
Media cronologic se calculeaz n cazul unei serii de valori, care
prezint variaii n timp (lunare, anuale).
Formula de calcul

46

BIOSTATISTICA

unde:
X(1, 2, 3, 4, n) mrimea valorilor la nceputul primei perioade i sfritul celor patru perioade;
N numrul de perioade la care ne referim
Exemplu: numrul de gravide n eviden la medicul de familie la
nceput de an a fost 120, iar la sfritul celor patru trimestre 130, 144,
152, 100. Conform mediei aritmetice simple, ar fi fost 129 gravide, n
timp ce media cronologic este de 134, conform formulei:

Media ptratic
Este tot o medie de calcul cu aplicaii speciale i reprezint valoarea care, nlocuind termenii seriei, nu modific suma ptratelor lor.
Se folosete cnd fenonenul supus cercetrii nregistreaz modificri
aproximativ n progresie geometric.
Media ptratic simpl:

Media ptratic ponderat:

Modulul
Este mrimea medie care corespunde valorii cu cele mai multe
frecvene (n seriile de variaie simple). Calculul se efectuiaz deci simplu, lund valoarea cu frecven maxim drept valoare medie. Rapiditatea cu care se stabilete modulul este singurul avantaj, deoarece el
nu prezint un etalon precis al valorii medii dect n cazul distribuiilor
normale (simetrice) de frecvene.
Modulul nu se determin n funcie de toate mrimile valorilor variantelor, ci de una singur, cea cu frecven maxim (n repartiiile

47

Noiuni de baz. Metode statistice

unimodale). Totui el exprim mrimea cu cea mai mare pondere, deci


caracteristica determinant.
n cazul seriilor de variaie grupate modulul se calculeaz dup formula:

unde:
XMo limita inferioar a intervalului modal;
h mrimea intervalului modal (cu frecvena cea mai mare);
1 diferena dintre frecvena intervalului modal i a intervalului precedent;
2 diferena dintre frecvena intervalului modal i a intervalului urmtor;
Se consider urmtoarea distribuie (Tab.8).
Tabelul 8
Distribuia persoanelor n funcie de salariu
Salariu
400-600
600-800
800-1000
1000-1200
1200-1400

Persoane
5
10
15
30
20

Intervalul modal este (1.000 1.200)

n cazul distribuiilor de frecvene moderat asimetrice exist urmtoarele relaii matematice aproximative ntre modul, median i medie
aritmetic:
Mo = 3( Me)
Mo = 3Me 2
Mo Me = 2(Me )
n cazul distribuiei simetrice de frecvene cele trei valori medii se
suprapun:
X = Me = Mo

48

BIOSTATISTICA

Observaii:
1) Pe graficul repartiiei statistice valoarea modal corespunde punctului n care graficul i atinge maximul;
2) Are avantajul principal fa de medie i cuantile c se determin
rapid si are o semnificaie simpl;
3) Exist n practic serii cu distribuii multimodale. n astfel de situaii
se determin mai multe valori modale;
Mediana (cuantila de ordinul 2)
Ca definiie, mediana, n serii statistice simple, este valoarea acelei
variante care mparte n dou jumti egale numrul variantelor, aezate n ordine crescnd sau descrescnd. n cazul unui numr impar
de variante, mediana va corespunde exact valorii de la mijlocul seriei.
n seriile cu numr par de variante mediana va corespunde mediei aritmetice simple a celor dou valori de la mijlocul seriei.
Exemplu de calcul:
nlimea la natere la un numr de 5 copii a fost: 47, 48, 49, 51,
52 cm. Mediana, coresponznd valorii de la mijlocul seriei va fi 49 cm.
n cazul unei serii de 6 valori, cum ar fi: 47, 48, 49, 51, 52, 53 cm,
mediana va fi 50cm (49 + 51/2).
n serii statistice grupate, formula de calcul a medianei este mai
complicat, valoarea medianei aflndu-se n interiorul intervalului valoric, n care se gsete valoarea frecvenei ce mparte seria n dou
jumti egale.
Formula de calcul:

Unde:
xMe limita inferioar a intervalului median;
f frecvenele valorilor variantelor;
fcm frecvenele cumulate pn la intervalul median;
h mrimea intervalului median;
fMe frecvena intervalului median;

Noiuni de baz. Metode statistice

49

Cum se stabilete intervalul median?


Pe irul frecvenelor cumulate cresctor, intervalul care corespunde
primei frecvene cumulate mai mare dect este intervalul
median.
Cuantilele sunt indicatorii care descriu anumite poziii particulare
din cadrul seriilor de distribuie. Conceptul de cuantil indic o divizare
a distribuiei observaiilor ntr-un numr oarecare de pri. Frecvent se
utilizeaz urmtoarele cuantile:
- mediana sau cuantila de ordin 2 (r = 2);
- cuartilele sau cuantilele de ordinul 4 (r = 4);
- decilele sau cuantilele de ordinul 10 (r = 10);
- centilele sau cuantilele de ordinul 100 (r = 100).
Cuantilele de ordin superior se calculeaz n cadrul distribuiilor cu
numr mare de grupe sau clase de valori individuale.

2.7. Seriile cronologice


Un obiectiv important al medicinii i ocrotirii sntii este studierea
sntii publice, analiza informaiei privind caracterul i volumul activitii
instituiilor medico-sanitare sub aspectul modificrilor lor dinamice. Studierea acestor modificri este deosebit de important pentru prognozarea
i planificarea msurilor cu caracter organizaional, curativ-profilactic etc.
Pentru a analiza modificrile dinamice a fenomenelor medico-sociale este necesar de a forma serii cronologice (dinamice), a cunoate
metodele de ajustare i analiz a lor.
Seria cronologic (serie de timp sau serie dinamic):
- este seria format din valori omogene comparabile, care caracterizeaz modificrile unui anumit fenomen ntr-o perioad de timp.
- vizeaz msurarea creterilor sau descreterilor de nivel n evoluia
unui fenomen.
- fiecare valoare numeric a seriei se numete nivel.
- nivelurile seriei cronologice pot fi prezentate prin valori absolute,
relative i medii.
Seriile cronologice se disting printr-o serie de particulariti, trsturi specifice ei, ntre care menionm:
a) variabilitatea termenilor SCR ntre valorile individuale care
compun seria cronologic exist diferene de mrime explicate prin

50

BIOSTATISTICA

aciunea comun a factorilor eseniali i ntmpltori. Gradul de variabilitate a termenilor seriei cronologice depinde de fora cu care factorii
aleatori produc abateri, dar i de tendina de variaie impus de factorii
cu aciune sistematic.
b) omogenitatea termenilor unei SCR seriile cronologice sunt
omogene deoarece termenii seriei au n comun categoria economic
sau social pe care o reprezint n momente sau intervale succesive
de timp. Omogenitatea valorilor seriei este dat de faptul c acestea
sunt supuse aciunii sistematice a acelorai factori eseniali, iar termenii seriei cronologice sunt obinui prin aceeai metodologie de calcul i
folosesc aceeai unitate de msur.
c) periodicitatea termenilor unei SCR o caracteristic specific
seriilor cronologice. Aceast trstur exprim continuitatea datelor din
punct de vedere al variaiei timpului. Termenii seriei reprezint valori
ale unui fenomen dinamic, nregistrate la momente sau intervale de
timp de regul egale, astfel nct s se asigure continuitatea seriei. n
funcie de scopul concret al analizei efectuate, de natura fenomenului
nregistrat i de posibilitile de obinere a datelor, unitile de timp pot
fi mai mici sau mai mari: minut, or, zi, sptmn, decad, lun, trimestru, semestru, an, deceniu, secol.
d) interdependena n timp a termenilor unei SCR este determinat de modalitatea de construire a acestora prin nregistrarea nivelurilor succesive ale unui fenomen pentru aceeai unitate statistic precizat. Din aceast cauz, orice termen al seriei depinde de nivelurile
precedente i influeneaz mrimile urmtoare ale termenilor seriei.
Avnd n vedere aceste particulariti ale seriilor cronologice, analiza lor trebuie precedat de verificarea comparabilitii valorilor individuale nregistrate pentru fenomenul analizat. Pentru a asigura comparabilitatea termenilor seriei cronologice este necesar ca componena
seriei s fie identic pentru ntreaga perioad de timp, valorile seriei s
fie exprimate n aceleai uniti de msur, iar intervalele de timp ntre
valori s fie egale.
Tipuri de serii cronologice:
1. n funcie de modul de definire a timpului deosebim SCR de moment i SCR de interval.
Seriile cronologice de momente:
- sunt formate din mrimi care se refer la anumite momente de
timp (sfritul sau nceputul anului, trimestrului, lunii etc.).

51

Noiuni de baz. Metode statistice

fiecare valoare individual caracterizeaz numeric nivelul la


care a ajuns fenomenul analizat ntr-un moment dat.
De exemplu: numrul de gravide aflate sub supraveghere la nceputul anului; numrul de nscui vii la sfritul fiecrui trimestru; numrul populaiei la o anumit dat, numrul copiilor bolnavi aflai n
eviden la finele anului (Tab.9).
Tabelul 9
Numr copii bolnavi aflai n eviden la finele anului, RM

2001

2002

2003

2004

2005

2006

155204

157257

155036

128595

147247

143146

Observaie:
nu permit cumularea valorilor termenilor, deoarece acestea reflect, n mod repetat, elementele care coexist n momente
diferite de timp.

Exemplu: numrul salariailor unui spital nregistrat la sfritul fiecrei luni se regsete n numrul salariailor nregistrat la sfritul
anului.
Cnd intervalele dintre dou momente succesive au lungime egal,
atunci vom avea o SCR de momente cu intervale egale ntre momente,
iar atunci cnd intervalele dintre dou momente vecine au lungime neegal avem o SCR de momente, cu intervale neegale ntre momente.
Serii cronologice de intervale:
- sunt formate din mrimi care caracterizeaz fenomenul ntr-un
interval de timp (zi, sptmn, lun, trimestru, an etc.);
- fiecare valoare individual reprezint rezultatul unui proces care
se desfoar pe un interval de timp.
De exemplu: dinamica anual a numrului de medici; evoluia lunar a numrului de cazuri mbolnvire IRVA, dinamica anual a natalitii
(Tab.10).
Tabelul 10
Numr copii nscui vii, mun. Chiinu, aa. 2002-2006.
2002

2003

2004

2005

2006

6924

7143

8296

8364

8626

52

BIOSTATISTICA

Noiuni de baz. Metode statistice

53

Observaie:
permit nsumarea valorilor, obinndu-se astfel un indicator totalizator pentru ntreaga perioad de analiz.

Exemplu: prin nsumarea numrului de internri zilnice se obine


cifra de internri lunar;
Alegerea perioadei de timp pentru seria cronologic de interval
este determinat ntr-o oarecare msur de variabilitatea fenomenului.
Cu ct mai lent se modific fenomenul n timp, cu att mai mari pot fi
perioadele de supraveghere.
2. n funcie de modul de exprimare a termenilor seriei deosebim serii
cronologice formate din valori absolute, relative sau medii.
Seriile cronologice formate din valori absolute reprezint situaia cea mai frecvent ntlnit. Fiecare termen al seriei este n acest caz
o mrime absolut exprimat n uniti concrete de msur. De exemplu: numr de populaie, numr de paturi, numr de medici, numr de
nou-nscui, numr de decedai, numr de nateri, numr avorturi, nr.
anomalii fetale, depistate ecografic, cheltuielile anuale n IMSP etc.
Seriile cronologice formate din valori relative. Termenii acestor serii pot fi reprezentai prin rate, proporii i raport. De exemplu:
natalitatea, mortalitatea, morbiditatea, invaliditatea primar, asigurarea
populaiei cu medici, paturi, ponderea populaiei n vrst de peste 55
de ani. Baza de raportare trebuie s fie ntotdeauna precizat.
Seriile cronologice formate din valori medii. De exemplu: numrul mediu de paturi, durata medie de spitalizare, durata medie de
utilizare a patului pe an, salariul mediu al medicilor.
3. n funcie de numrul termenilor seriei deosebim serii cronologice de lungime mic, medie, mare.
Reprezentri grafice ale seriilor cronologice
a) CRONOGRAMA (historiograma) este, aa cum i arat i numele, reprezentarea grafic tipic, specific a SCR. Ea se traseaz
ntr-un sistem de axe rectangulare, de obicei n cadranul nti al
acestuia. Pe cele dou axe se vor reprezenta: timpul pe abscis
(se marcheaz momentele sau intervalele), iar termenii SCR pe
ordonat (Fig.1).

Fig.1. Numrul de avorturi la femeile n vrst pn la 15 ani n RM, aa.2001-2006 (abs.)

b) DIAGRAMA PRIN COLOANE n care timpul se reprezint pe


abscis, iar termenii SCR pe ordonat (Fig.2).

Fig.2. Numrul de medici n Republica Moldova, aa. 2002-2006 (abs.)

54

BIOSTATISTICA

c) DIAGRAMA PRIN BENZI este recomandat a se folosi atunci


cnd se reprezint (simultan) termenii unor SCR, termeni care constituie nite indicatori strns legai ntre ei.
d) DIAGRAME POLARE (numite i diagrame radiale sau diagrame n
spiral) se construiesc cu ajutorul reelelor radiale i se utilizeaz n
special n reprezentarea SCR afectate de fluctuaii sezoniere.

Fig.3. Numrul cazuri IRVA n localitatea N pe parcursul a. 2006

Indicatorii seriilor cronologice


Pentru caracterizarea unei SCR, se calculeaz, pe baza termenilor
acesteia, un sistem de indicatori statistici, analitici i sintetici care, dup
modul de calcul i exprimare, pot fi structurai astfel:
a) indicatori absolui;
b) indicatori relativi;
c) indicatori medii.
Atunci cnd compararea se face cu primul termen al seriei (y1) vom
vorbi de indicatori cu baz fix, iar atunci cnd compararea unui termen
(yt) se face cu termenul imediat anterior (yt-1), vom vorbi de indicatori cu
baz n lan (mobil).

Noiuni de baz. Metode statistice

55

Indicatori absolui
Indicatorii absolui ai unei serii cronologice de intervale exprim nivelul, volumul agregat i modificrile (n mrime absolut) fenomenului
analizat n perioade diferite de timp. Indicatorii absolui se exprim n
unitatea de msur a caracteristicii analizate (n uniti fizice, valorice,
procente etc.).
1) Valorile individuale absolute ale caracteristicii redau nivelul fenomenului analizat n fiecare interval de timp.
2) Volumul agregat (nivelul totalizat) reprezint suma termenilor seriei
cronologice de intervale.
3) Modificarea absolut (sporul sau scderea absolut) , reflect
creterea sau descreterea absolut (n uniti concrete de msur) a valorilor individuale ale fenomenului analizat, de la o perioad
de timp la alta. Se calculeaz ca diferen ntre doi termeni ai seriei.
n funcie de perioada aleas ca baz de comparaie (constant
sau variabil), exist dou forme ale acestui indicator:
- modificarea absolut cu baz fix reprezint distana (diferena)
fiecrui termen al seriei fa de o perioad fix de referin.
- modificarea absolut cu baz mobil se calculeaz ca diferen
ntre doi termeni succesivi ai seriei cronologice.
Se exprim n unitile de msur ale caracteristicii. Valorile pozitive ale acestor indicatori semnific sporuri (creteri, fa de perioada
aleas ca baz de comparaie), iar valorile negative scderi (deficit).
n cazul modificrii absolute cu baz fix este important alegerea
unei baze de comparaie convenabile, reprezentative pentru fenomenul
dat i care s nu fie influenat de variaii conjuncturale majore. Frecvent, se alege ca baz de comparaie primul termen al seriei (nceputul
perioadei de timp analizate) sau ultimul termen al perioadei anterioare.
Indicatori relativi
1) Indicele de dinamic (indice de modificare, ritm de cretere sau de
scdere) I. Este indicele care arat de cte ori (de ct la sut) s-a
modificat mrimea unui fenomen n timp. Se calculeaz prin raportarea termenului comparat la termenul baz de comparaie.
- indicele cu baz fix se calculeaz ca raportul simplu sau procentual al nivelului curent la nivelul ales baz de comparaie
(nivelul iniial).
- indicele cu baz mobil se calculeaz ca raportul simplu sau
procentual al nivelului curent la nivelul precedent.

56

BIOSTATISTICA

Se exprim n uniti sau procente. Valori mai mari de 1 sau 100%


ale acestui indicator arat creteri fa de perioada baz de comparaie. Valorile sub 1 sau 100% semnific scdere, reducere.
2) Ritmul de dinamic (ritmul sporului) R. Arat cu ct s-a modificat procentual (a crescut sau a sczut) mrimea fenomenului ntro anumit perioad de timp fa de o perioad de referin fix
sau mobil. Se determin scznd 100% din indicele de dinamic
corespunztor (cu baz fix sau mobil). Poate fi calculat i prin
urmtoarele modaliti:
- cu baz fix se calculeaz ca raportul procentual al sporului absolut cu baz fix la nivelul ales baz de comparaie (nivelul iniial).
- cu baz mobil se calculeaz ca raportul procentual al sporului
absolut cu baz mobil la nivelul precedent.
3) Valoarea absolut a unui procent din ritmul de dinamic (de spor)
A. Arat mrimea absolut a modificrii ce revine pe un procent din
ritmul dinamicii sau exprim cte uniti de msur revin unui procent din ritmul dinamicii. Se calculeaz sub forma unui raport ntre
modificarea absolut i ritmul modificrii i se exprim n unitatea
de msur a caracteristicii.
Variante de calcul:
- cu baz fix se calculeaz ca raportul modificrii absolute cu
baz fix la ritmul dinamicii cu baz fix. Are aceeai valoare
pentru toat perioada analizat.
- cu baz mobil se calculeaz ca raportul modificrii absolute cu
baz mobil la ritmul dinamicii cu baz mobil.
Indicatori medii
1) Nivelul mediu, calculat ca medie a valorilor seriei. Calculul se justific numai dac nivelurile seriei sunt omogene.
- pentru o serie cronologic de intervale nivelul mediu se afl calculnd media aritmetic simpl a valorilor seriei.
- pentru o serie cronologic de momente nivelul mediu se afl
calculnd media cronologic simpl pentru momente egal distanate:

Noiuni de baz. Metode statistice

57

ponderat pentru momente inegal distanate:

2) Modificarea medie absolut este media aritmetic simpl a modificrilor absolute cu baz mobil yn y1/n-1. Indicatorul arat cu
ct crete/scade fenomenul n medie (n valoare absolut) de la o
perioad de timp la alta.
Calcularea acestui indicator are sens atunci cnd modificrile
absolute cu baz n lan nu difer prea mult ca mrime. Modificarea
medie absolut poart numele de spor mediu, dac este calculat pentru un fenomen cu tendin de cretere. n caz contrar vorbim despre
scdere medie.
3) Indicele mediu de dinamic se calculeaz ca medie geometric
simpl a indicilor de dinamic cu baz mobil. Arat de cte ori s-a
modificat (a crescut sau a sczut) n medie fenomenul analizat pe
ntreaga perioad luat n calcul. Valoarea rezultat din calcul este
semnificativ ndeosebi pentru fenomenele care evolueaz n progresie geometric (indicii cu baz mobil au valori apropiate ntre
ele). Valori mai mari de 100% ale acestui indicator arat tendina
de cretere a fenomenului analizat. Valori mai mici de 100% corespund unei scderi pe ansamblul perioadei considerate.
4) Ritmul mediu de dinamic arat cu cte procente se modific n
medie fenomenul pe ntreaga perioad analizat.
Ultimii doi indicatori nu sunt reprezentativi pentru seriile cronologice
cu un numr mare de termeni i cu oscilaii mari.
Ajustarea seriilor cronologice
Specific seriilor cronologice este variabilitatea mare a termenilor.
Aceste variaii sunt produse de factori eseniali i ntmpltori. Aciunea factorilor eseniali determin tendina major de evoluie n timp
amrimilor nregistrate de fenomenul analizat. Aceast tendin (trend)
interfereaz cu cauzele neeseniale, ntmpltoare, efectul obinut fiind
valorile reale ale fenomenului.
Scopul ajustrii seriilor cronologice l reprezint evidenierea factorilor eseniali, cu aciune sistematic, care urmresc o legitate matematic de evoluie.

58

BIOSTATISTICA

Ajustarea este operaia de nlocuire a termenilor reali ai seriei


cronologice cu termeni teoretici care exprim o anumit legitate
matematic de evoluie a fenomenului considerat.
Pentru seriile cronologice, aceast legitate de evoluie se realizeaz n funcie de timp. ntruct abaterea termenilor reali de la cei teoretici
calculai este efectul cauzelor neeseniale, ntmpltoare, prin ajustare
se evideniaz mai bine tendina de evoluie n timp a fenomenului.
Exist mai multe procedee de ajustare:
- ajustarea prin metoda grafic;
- ajustarea prin metoda mediilor mobile;
- ajustarea prin metoda modificrii medii absolute;
- ajustarea prin metoda indicelui mediu de dinamic;
- ajustarea prin metode analitice.
Primele patru procedee formeaz grupul metodelor mecanice de
ajustare.
1) Metoda grafic de ajustare const n reprezentarea grafic a seriei
(cronograma), pe axa 0x (abscisa) fiind trecute momentele sau intervalele succesive de timp, iar pe axa 0y (ordonata) nscriindu-se
valorile numerice ale termenilor seriei. Se construiete pe acelai
grafic o dreapt sau curb care s uneasc cele dou puncte extreme ale seriei cronologice astfel nct s prezinte abateri minime
fa de poziia valorilor reale de pe grafic. Forma curbei astfel trasate indic legitatea matematic, forma de evoluie a fenomenului,
dup o dreapt sau o funcie curbilinie.
Metoda este simpl i rapid, dar exist pericolul interpretrii
subiective a graficului.
Metoda grafic precede obligatoriu aplicarea metodelor analitice de ajustare.
2) Metoda mediilor mobile const n nlocuirea termenilor reali ai SCR
cu valori teoretice, numite medii mobile (medii glisante sau alunectoare). Mediile mobile se calculeaz ca medii aritmetice pariale
dintr-un anumit numr de termeni succesivi ai seriei. Acest numr
depinde de periodicitatea oscilaiilor i este ales astfel nct fiecare
medie s cuprind toi termenii la care se manifest o oscilaie complet. Aceasta poate fi evideniat cu ajutorul reprezentrii grafice,
observnd mrimea distanei medii dintre punctele de inflexiune ale
graficului.

59

Noiuni de baz. Metode statistice

Mediile mobile asigur compensarea abaterilor, a oscilaiilor periodice. Noua serie obinut prin ajustare are o variaie lin, continu,
evideniind tendina de evoluie a fenomenului (trendul), independent
de aciunea factorilor sezonieri.
Mediile mobile pot fi calculate dintr-un numr impar sau par de
termeni. Dac media mobil se calculeaz dintr-un numr impar (de
exemplu k = 3) de termeni, schema de calcul este urmtoarea: MM1 =
y1 + y2 + y3 : 3; MM2 = y2 + y3 + y4 : 3; MM3 = y3 + y4 + y5 : 3; MMn-2 = yn-2
+ yn-1 + yn : 3;
Numrul de medii mobile obinut este mai mic dect numrul de
termeni reali ai seriei. Primul i ultimul termen real nu vor avea corespondent o valoare ajustat, adic o medie mobil.
Pentru cazul general, prin aceast metod se pierd k-1 termeni ai
seriei (la nceputul i la sfritul irului), acesta fiind principalul dezavantaj al metodei.
Exemplu pentru k=3 (Tab.11).
Tabelul 11
Avorturi la vrsta pn la 15 ani, RM, aa.1995 2002
Anii
Termenul
Nr.avorturi
Media mobil

1995
y1
115
----

1996
y2
75
79

1997
y3
47
57

1998
y4
49
51

1999
y5
57
46

2000
yn-2
33
40

2001
yn-1
30
32

2002
yn
33
----

Dac mediile mobile se calculeaz din numr par de termeni, calculul se realizeaz n dou faze:
- se obin medii mobile provizorii, care se plaseaz ntre termenii
seriei reale;
- se determin medii mobile definitive (centrate) din cte dou
medii mobile provizorii succesive care se plaseaz n dreptul
termenilor reali (pe care i nlocuiesc).
i n acest caz, numrul de medii mobile obinute este mai mic
dect numrul de termeni reali ai seriei. Numrul termenilor reali care
se pierd este n acest caz k. n prima faz se pierd k 1 termeni, iar
n a doua faz un termen. Prima medie mobil centrat se va plasa n
dreptul celui de-al k + 2 : 2 -lea termen al seriei.
Pierderea de informaie produs de termenii lips afecteaz concluziile analizei, n special n cazul unui numr redus de observaii.

60

BIOSTATISTICA

Exemplu pentru k=4 (Tab.12).


Tabelul 12
Avorturi la vrsta pn la 15 ani, RM, aa.1995 2002
y1
Anii
Nr. avorturi
Medii mobile pariale
Medii mobile centrate

y2

y3

y4

y5

y6

y7

y8

1995 1996 1997 1998 1999 2000 2001 2002


115
75
47
49
57
33
30
33
71,5 57 46,5 42,3 38,3
----64
52
44
40
-----

3) Ajustarea prin metoda modificrii medii absolute.


Aceast metod este indicat atunci cnd seria cronologic prezint tendina de cretere sub forma unei progresii aritmetice, situaie
evideniat prin valorile relativ apropiate ale modificrilor absolute cu
baz mobil.
Termenii ajustai se determin cu relaia:
Yi = y1 + ti
unde: Yi valorile ajustate, care nlocuiesc valorile reale;
y1 primul termen al seriei cronologice reale (sau un alt termen luat ca
baz de ajustare);
sporul mediu (modificarea absolut medie);
ti variaia timpului: t1 = 0, t2 = 1, t3 = 2, ..., tn = n-1 dac se ia ca baz
primul termen al seriei.
Primul termen ajustat este egal cu primul termen al seriei reale iar
ultimul termen ajustat este egal cu ultima valoare a seriei reale. Metoda
nseamn netezirea evoluiei fenomenului dup a linie dreapt, care
unete primul i ultimul termen observat al seriei cronologice.
Exemplu: = 17 (Tab.13).
Tabelul 13
Cazuri de narcomanie n localitatea N,aa. t (reale i ajustate)
y1
Anii
Prevalena narcomanie, real
Prevalena narcomanie, ajustat

y2

y3

y4

y5

y6

t0

t1

t2

t3

t4

t5

122
122

140
139

168
156

176
173

192
190

206
206

4) Ajustarea pe baza indicelui mediu de dinamic


Aceast metod este recomandabil n situaiile n care seria cronologic are forma unei progresii geometrice. n acest caz indicii de
dinamic cu baz mobil au valori relativ apropiate.

Noiuni de baz. Metode statistice

61

Primul i ultimul termen ajustat sunt egali cu termenii corespunztori din seria real.
Metoda modificrii absolute medii i metoda indicelui mediu de dinamic sunt simple i rapide, dar nu iau n calcul toate valorile absolute
ale termenilor seriei.
5) Ajustarea prin metode analitice
Metodele analitice de estimare a tendinei se bazeaz pe folosirea
funciilor matematice. Alegerea funciei de ajustare se face pe baza
analizei graficului i a indicatorilor seriei cronologice. Situaiile cele mai
frecvent ntlnite sunt:
- fenomenul evolueaz dup o funcie liniar atunci cnd graficul
arat o tendin de cretere absolut constant i modificrile
cu baz mobil au valori apropiate;
- fenomenul evolueaz dup o funcie exponenial atunci cnd
graficul arat o tendin de cretere relativ constant i se obin valori apropiate ale indicilor cu baz n lan;
- fenomenul evolueaz dup o parabol atunci cnd graficul are
punct de maxim sau de minim iar diferenele dintre modificrile
succesive cu baz mobil (numite modificri cu baz n lan de
ordinul doi) au valori apropiate; frecvent, pe grafic, se evideniaz numai fragmente de parabol.
Dup ce se alege forma cea mai potrivit pentru funcia de ajustare,
se determin parametrii prin intermediul metodei celor mai mici ptrate.
Aceast metod pornete de la condiia minimizrii ptratelor abaterilor valorilor ajustate (Yi) de la valorile reale (yi).
EXTRAPOLAREA
Un obiectiv important al analizei seriilor cronologice l reprezint
estimarea evoluiei probabile n viitor a fenomenului analizat. Extrapolarea reprezint o prelungire a seriei cronologice n viitor, pe baza
trendului observat din analiza perioadei anterioare. Mrimile obinute
prin extrapolare sunt valori probabile, orientative. Nu se poate face o
predicie exact a viitorului din mai multe motive:
- pe lng trendul pe baza cruia se face previziunea acioneaz
i factori aleatori, ntmpltori, care influeneaz nivelul real al
fenomenului analizat;
- factorii de influen evideniai prin analiza seriei cronologice i
pot modifica aciunea n viitor;

62

BIOSTATISTICA

exist anumite limite (minime sau maxime) n evoluia fenomenelor. Aceste restricii impun o analiz critic, calitativ a rezultatelor obinute prin extrapolare.
Metodele de extrapolare sunt similare celor utilizate pentru estimarea trendului. Diferena const n perioada de timp implicat n calcule.
Astfel, dac analiza seriei cronologice a relevat o tendin de cretere constant, extrapolarea se poate face prin metoda modificrii
absolute medii.
Atunci cnd evoluia seriei cronologice tinde ctre o exponenial,
extrapolarea se poate face pe baza indicelui mediu de dinamic
Atunci cnd evoluia fenomenului a fost analizat cu ajutorul metodelor analitice i s-a constatat c reflect o anumit funcie matematic, extrapolarea se poate face utiliznd forma funciei de ajustare.
Atunci cnd n evoluia fenomenului considerat s-a constatat o variaie sezonier, valorile extrapolate vor cuprinde i aceast tendin,
prin nsumarea componentei sezoniere (n cazul modelului aditiv) sau
prin nmulire (pentru modelul multiplicativ).
Exemplu:
Tabelul 14
Evoluia numrului de avorturi la vrsta pn la 15 ani, RM, aa. 1991-2003
Anul

1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003

Numr
avorturi
58
72
76
81
115
75
47
48
56
32
30
33
16

Modificare
absolut

Ritm dinamic

Indice
dinamic

Val.absolut
1% ritm
dinamic

fix

mobil

fix

mobil

fix

mobil

fix

mobil

0
14
18
23
57
17
-11
-10
-2
-26
-28
-25
-42

14
4
5
34
-40
-28
1
8
-24
-2
3
-17

100
24
31
40
98
29
-19
-17
-3
-45
-48
-43
-72

24
6
7
42
-35
-37
2
17
-43
-6
10
-52

100
124
131
140
198
129
81
83
97
55
52
57
28

124
106
107
142
65
63
102
117
57
94
110
48

0
0,58
0,58
0,58
0,58
0,59
0,58
0,59
0,66
0,58
0,58
0,58
0,58

0,58
0,66
0,71
0,81
1,14
0,75
0,5
0,47
0,55
0,33
0,3
0,29

Noiuni de baz. Metode statistice

63

2.8. Standardizarea
Importan deosebit pentru asigurarea comparabilitii datelor statistice au metodele de standardizare a valorilor relative i medii.
Regula de baz a statisticii compar comparabilul presupune
compararea indicatorilor obinui n totaliti statistice omogene. ns
sunt frecvente cazurile cnd trebuie de comparat indicatori, asupra mrimii crora a influenat neomogenitatea totalitilor studiate.
n multe investigaii socio-medicale, precum i clinice, este exclus posibilitatea de a opera cu colectiviti omogene, productoare de
fenomene care se cer comparate. Mai frecvent aceasta se refer la
compararea indicatorilor sntii populaei (natalitate, mortalitate general, morbiditate) n ri, regiuni, raioane, orae cu structur diferit
a populaiei pe vrst, sex; compararea activitii instituiilor medicosanitare cu structur diferit a contingentelor de bolnavi.
Exemplul 1.
- Pentru a compara letalitatea n dou spitale i a face concluzie
privitor la cauzele diferenei acestor indicatori este necesar mai
nti s analizm dac bolnavii n aceste spitale au fost omogeni
nozologic. Evident, indicatorul letalitii va fi mai mare n spitalul
unde au fost internai mai muli bolnavi cu forme grave ale maladiei. Structura neomogen a contingentelor de bolnavi dup starea
sntii, vrst, sex i alte caractere face imposibil concluzia
corect privind cauzele diferenei mrimii indicatorilor letalitii n
aceste spitale.
Exemplul 2.
- Se compar indicii mortalitii generale n dou raioane. Calculul
simplu arat c n raionul A nivelul mortalitii generale este 10,
iar n raionul B 8,1. ns, pn a formula concluzia final referitor la factorii care au influenat diferena dintre indicatori, trebuie analizate totalitile comparate. Se acord atenie structurii
pe vrste a populaiei din raioanele corespunztoare, din motivul
c structura populaiei pe vrste incontestabil influeneaz indicatorul mortalitii generale. Cu ct sunt mai multe persoane vrstnice, cu att mai mare poate fi nivelul mortalitii. n cazul nostru,
n raionul A, ponderea persoanelor vrsta crora a depit 60 de
ani este de 30%, iar n raionul B 16%. Prin urmare, n raioanele
comparate structura populaiei pe vrste este diferit i, n acest

Calculele efectuate, pentru o mai bun intuivitate, se vor prezenta


n form de tabel (Tab.15)

200
700
100
1000

12
21
5
38

4,0

3,8

valorile
ateptate

30
6
4
40

letalitatea

600
300
100
1000

valorile
ateptate

Terapie
Chirurgie
Boli infecioase
Total

Spitalul B

letalitatea

Secia

Spitalul A
Standardul
800
1000
200
2000

5,0
2,0
4,0
4,0

40
20
8
68

6,0
3,0
5,0
3,8

48
30
10
88

Indicatorii
standardizai

Cea mai frecvent utilizat este metoda direct de standardizare.


n cazul utilizrii acestei metode drept standard este structura populaiei, care se consider c este identic n ambele totaliti comparate.
Esena metodei este n eliminarea factorilor ce influeneaz mrimea
indicatorilor obinui.
Etapele metodei directe de standardizare:
1. Calculul indicatorilor intensivi (rata) sau medii speciali (pentru fiecare grup pe sexe, vrst, durata de spitalizare, termenul de
internare etc.) i generali pentru fiecare totalitate.
2. Selectarea i calculul standardului.
3. Calculul valorilor ateptate pentru fiecare grup de standard
4. Calculul indicatorilor standardizai
5. Compararea totalitilor dup indicatorii intensivi sau medii generali
i indicatorii standardizai. Concluzii.

Spitalul B
decedai

Exist trei metode de standardizare:


- metoda direct.
- metoda indirect;
- metoda tangenial

Spitalul A

bolnavi

Standardizare metod de calcul a indicatorilor standardizai


(ipotetici), care substituie valorile relative sau medii care sunt incomparabile din cauza neomogenitii structurale a totalitilor
comparate.

Tabelul 15
Repartizarea bolnavilor i decedailor conform profilului seciei n spitalele A i B
(datele sunt convenionale)
decedai

caz, indicatorii mortalitii generale (10 i 8,1) nu pot fi comparai n form brut.
Pentru a compara indicatorii menionai se va utiliza metoda de
standardizare.

65

Noiuni de baz. Metode statistice

bolnavi

BIOSTATISTICA

Letalitatea
%

64

3,4

4,4

Exemplu:
Etapa I Calculul indicilor intensivi. Determinm rata decedailor,
n dependen de profilul seciei, n ambele spitale. Spitalul A,
secia terapie (30/600)x100; secia chirurgie (6/300)x100;
boli infecioase (4/100)x100. Analogic se fac calculele i
pentru spitalul B. Ulterior determinm indicatorul general al
letalitii pentru spitalul A (40/1000)x100 i pentru spitalul B
(38/1000)x100.
Etapa II Selectarea i calculul standardului. Drept standard este
considerat acea componen a totalitilor, care reflect toate
particularitile totalitilor comparate.
!!!Standard poate fi: componena unei totaliti comparate; suma totalitilor comparate; semisuma totalitilor comparate; o valoare empiric.
n exemplul dat drept standard pe secii a fost luat numrul de bolnavi din seciile respective a fiecrui spital (coloana 1+coloana3), iar
standard general suma bolnavilor din ambele spitale (1000+1000).
Etapa III Calculul valorilor ateptate pentru fiecare grup de
standard. Calculul se face n modul urmtor: n spitalul A, secia terapie, au decedat 5% bolnavi. Ci decedai vor fi la 800 de
bolnavi nivelul letalitii va fi acelai?

66

BIOSTATISTICA

5% 100
x% 800
x = (5x800)/100
Astfel, 40 este numrul ateptat de decedai n secia terapie la
800 de bolnavi. Analogic se fac calculele pentru seciile chirurgie i boli
infecioase a spitalului A i seciile spitalului B.
Etapa IV Calculul indicatorilor standardizai. Indicatorul standardizat este raportul procentual al sumei valorilor ateptate din
fiecare totalitate la standardul general.
Spitalul A (68/2000)x100 = 3,4%
Spitalul B (88/2000)x100 = 4,4%
Etapa V Compararea indicatorilor (Tab.16).
Tabelul 16
Compararea indicatorilor intensive i standardizai
Indicatori
Intensivi
Standardizai

Spitalul A
4,0
3,4

Spitalul B
3,8
4,4

Comparare
A>B
A<B

Concluzii:
1. Compararea indicatorilor standardizai, calculai pentru spitalele A
i B, ne permite s facem concluzia urmtoare: dac profilul seciei
n spitalele A i B ar fi fost identic, letalitatea n spitalul A ar fi fost
mai mic dect n spitalul B.
2. Compararea indicatorilor intensivi a oferit rezultate inverse, din motivul c mrimea acestor indicatori a fost influenat de profilul seciei.
Metoda tangenial de standardizare se utilizeaz n cazurile cnd
n totalitile comparate lipsesc date privind bolnavii, decedaii etc. Drept
standard este luat un indicator cunoscut: exemplu indicatorii mortalitii
generale, mortalitii pe vrste, letalitii etc. din literatura de specialitate,
statistic oficial i cu acesta sunt comparai indicatorii primari.
Metoda indirect de standardizare se utilizeaz n cazurile cnd
indicatorii necesari pentru comparare i analiz lipsesc. Acestea sunt
reconstruii n mod invers, spre exemplu n baza datelor despre mortalitate, morbiditate, letalitate, care trebuie redai ct mai obiectiv n
corespundere cu informaia cunoscut despre numrul i structura populaiei.

Noiuni de baz. Metode statistice

67

!!! Indicatorii standardizai sunt convenionali (ipotetici) i nu


ofer informaie despre mrimea real a fenomenului studiat.
Fr indicatorii intensivi sau valorile medii nu sunt valabili.
Avantajul acestor indicatori este faptul c permit de a elimina influena asupra mrimii indicatorilor intensivi sau valorilor medii a neomogenitii structurale a totalitilor comparate i ofer rspuns la ntrebarea Care era s fie mrimea fenomenului studiat dac totalitile
comparate ar fi fost identice.

2.9. Corelaia i regresia


2.9.1. Corelaia
n medicin i biologie, ca de altfel n toate domeniile de activitate, exist o interdependen ntre fenomene. Apariia i evoluia
unui fenomen este n strns legtur cu o serie de alte fenomene
sau factori care intervin n determinarea sau favorizarea acestuia.
Corelaia este o metod care ne permite s cunoatem fenomenele
din natur i societate sub raportul interferenei lor, a conexiunilor n
care se gsesc.
n statistic, pentru studierea legturilor multiple ce au loc ntre diferite fenomene, se folosete noiunea de funcie f, care const n faptul
c fiecrei valori a variabilei independente (X), numit argument, i corespunde valoarea altei variabile numit funcie (Y).
n general, deosebim dou tipuri de corelaii: corelaii funcionale
sau matematice i corelaii statistice sau stohastice (ntmpltoare).
Corelaiile funcionale sunt perfecte, rigide, exprimnd legtura de
la cauz la efect ntre fenomene. Asemenea corelaii sunt studiate n
cadrul tiinelor exacte, unde avnd de-a face cu fenomene simple,
legtura de la cauz la efect se evideniaz mai uor i se exprim sub
form de lege. n cazul corelaiei funcionale unei valori determinate a
unei variabile independente X (argument) i corespunde strict o valoare
a variabilei dependente Y (funcie).
Corelaiile statistice sunt mai puin perfecte, se evideniaz mai
greu, exprimnd legtura de dependen care exist ntre fenomene.
n cazul corelaiei statistice fiecrei valori numerice a variabilei X corespund nu una ci mai multe valori a variabilei Y, adic o totalitate statistic
a acestei valori, care se grupeaz n jurul mediei x.

68

BIOSTATISTICA

Legtura de corelaie dup form poate fi linear (rectilinie) sau


nelinear (curbilinie), iar dup sens direct (pozitiv) i invers (negativ).
n cazul corelaiei lineare schimbrilor uniforme a valorilor medii a
unei variabile, au loc schimbri egale a altei variabile. Pentru corelaia
nelinear schimbrilor uniforme a unei valori i corespund valori medii a
altei variabile, care poart caracter de cretere ori de micorare. Aprecierea legturilor de corelaie lineare se realizeaz cu ajutorul coeficientului
de corelaie rxy, iar celor nelineare cu raportul de corelaie (eta).
Corelaii directe se stabilesc ntre fenomene care evolueaz n acelai sens, n aceeai direcie. Crete unul, crete i cel cu care are
legtur de dependen; sau scade un fenomen, scade i cel cu care
coreleaz. Spre exemplu, mrirea nlimii copiilor determin mrirea
greutii lor. Corelaiile inverse se stabilesc ntre fenomene care evolueaz n sens opus. Crete un fenomen i scade cel cu care are o
legtur de dependen; sau scade un fenomen i crete cel cu care
se coreleaz. Spre exemplu, cu ct e mai mare vrsta copiilor, cu att
e mai mic mortalitatea lor.
Corelaiile statistice directe presupun evoluia n acelai sens a fenomenelor ce se coreleaz, dar nu cu aceeai unitate de msur. Spre
exemplu, crete nivelul de trai al populaiei unei colectiviti de dou
ori, crete i rezistena organismului la mbolnviri dar nu n aceeai
msur, pentru c n afar de nivelul de trai, receptivitatea organismului la mbolnviri este determinat i de ali factori (biologici, climatici,
geografici etc.). Corelaiile statisitice inverse presupun creterea unui
fenomen i scderea celui cu care se coreleaz, dar nu n aceeai msur. Spre exemplu, dac ntr-o colectivitate am efectuat un numr dublu de vaccinri anti-pertussis, numrul copiilor ce vor contracta boala,
n anul urmtor, va fi cu siguran mai sczut, dar nu va fi de dou ori
mai mic dect n anul premergtor.
Corelaiile statistice, spre deosebire de cele funcionale, pot fi numai vremelnice i ntr-un singur sens. Aa spre exemplu, ntre nlime
i vrst exist o legtur de dependen direct numai pn la vrsta
de 18-20 de ani. Dup aceast vrst, nlimea rmne nemodificat
sau eventual ctre btrnee scade. Sau alt exemplu: nivelul de trai
influeneaz nivelul mortalitii infantile, dar aceasta din urm nu poate
influena nivelul de trai.

69

Noiuni de baz. Metode statistice

CALCULAREA COEFICIENTULUI DE CORELAIE


Legtura de dependen dintre dou sau mai multe fenomene, sensul i intensitatea acesteia, se stabilesc cu ajutorul coeficientului de
corelaie linear (simpl sau multipl) al lui Bravais-Pearson.
n seriile statistice simple, cnd n<30, coeficientul de corelaie se
obine raportnd suma produselor dintre abaterile de la media aritmetic a valorilor frecvenelor primului fenomen i abaterile de la media
aritmetic a valorilor frecvenelor celui de al doilea fenomen, la rdcina ptrat din produsul realizat ntre suma ptratelor abaterilor de
la media aritmetic a valorilor frecvenelor primului fenomen i suma
ptratelor abaterilor de la media aritmetic a valorilor frecvenelor celui
de al doilea fenomen, cu care se coreleaz.
Formula de calcul:

n care:
rxy
= coeficientul de corelaie;
dxdy = suma produselor dintre abaterile de la media aritmetic a valorilor frecvenelor celor dou fenomene (x i y) ce se coreleaz;
dx2 = suma ptratelor abaterilor de la media aritmetic a valorilor
frecvenelor fenomenului x;
dy2 = suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor fenomenului y. Exemplu: (Tab.17, Tab.18).
Tabelul 17
Timpul trecut din momentul accesului de pancreatit acut (x) i
numrul complicaiilor postoperatorii (y)
Nr.
1
2
3
4
5
6
Total

Timpul
Numr
x
complicaii, y
6
3
8
5
12
7
19
10
20
13
24
16
54
89
9
14,8

dX

dY

d2 X

-6
-4
-2
1
4
7

-8,8
-6,8
-2,8
4,2
5,2
9,2

36
16
4
1
16
49
122

d 2Y
77,4
46,2
7,8
17,6
27
84,6
260,6
178,3

d Xd Y
52,8
27,2
5,6
4,2
20,8
64,4
175
rXY = 0,98

70

BIOSTATISTICA

Tabelul 18
Nivelul de asigurare cu medici stomatologi (x) i ponderea copiilor sanai
n cadrul a 5 raioane (y)
Nr.
1
2
3
4
5
Total

Asigurare
medici, x
2,3
3,2
3,4
3,6
3,9
16,4
3,3

Copii
sanai, y
65,7
91,7
88,0
91,4
90,3
427,1
85,4

dX

dY

d2 X

-1
-0,1
0,2
0,3
0,6

-19,7
6,3
2,6
6,0
4,9

1
0,01
0,04
0,09
0,36
1,5

d 2Y
388,1
39,7
6,8
36
24,0
494,6
27,2

d Xd Y
19,7
-0,63
0,52
1,8
2,94
24,3
rXY= 0,89

n seriile statistice grupate coeficientul de corelaie se obine raportnd suma produselor dintre abaterile valorilor variantelor de la media
ponderat a celor dou fenomene ce se coreleaz i frecvenele perechi de valori ale variantelor la rdcina ptrat din suma produselor
dintre ptratele abaterilor valorilor variantelor de la media ponderat
i frecvenele corespunztoare fiecrei variante a primului fenomen,
nmulit cu suma produselor dintre ptratele abaterilor valorilor variantelor de la media ponderat i frecvenele corespunztoare fiecrei
variante a celui de al doilea fenomen, cu care se coreleaz.
Formula de calcul:

n care:
rxy
= coeficientul de corelaie;

= semnul nsumrii;
dxdyfxy = produsul dintre abaterile de la media ponderat a variantelor
celor dou fenomene ce se coreleaz i frecvenele perechi
corespunztoare variantelor fenomenelor x i y;
dx2fx = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului x i numrul de frecvene corespunztoare fiecrei variante;
dy2fy = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului y i numrul de frecvene corespunztoare fiecrei variante.

Noiuni de baz. Metode statistice

71

INTERPRETAREA COEFICIENTULUI DE CORELAIE


Coeficientul de corelaie poate fi cuprins ntre minus unu, zero i
plus unu. Cnd valoarea coeficientului de corelaie se apropie de +1,
nseamn c ntre cele dou fenomene ce se coreleaz exist o legtur foarte puternic. Semnul + al coeficientului de corelaie denot
c legtura de dependen dintre fenomene este direct. Deci ambele
fenomene evolueaz n acelai sens, n aceeai direcie. Cnd valoarea coeficientului de corelaie se apropie de 1, nseamn c ntre cele
dou fenomene exist o legtur foarte puternic, dar invers, n sens
opus: crete un fenomen, scade cel cu care se coreleaz.
n medicin, ntlnim de obicei valori ale coeficientului de corelaie
intermediare valorilor 1 i +1. Pentru interpretarea intensitii legturii
de dependen dintre fenomene e utilizeaz urmtoarele CRITERII:
valoarea coeficientului de corelaie cuprins ntre 1 denot o
corelaie foarte puternic ntre fenomene;
valoarea coeficientului de corelaie cuprins ntre 0,99 i 0,70
denot o corelaie puternic;
valoarea coeficientului de corelaie cuprins ntre 0,69 i 0,30
denot o corelaie medie ntre fenomene;
valoarea coeficientului de corelaie cuprins ntre 0,0 i 0,29
exprim existena unei corelaii slabe ntre fenomene;
valoarea coeficientului de corelaie 0 denot c legtura dintre
fenomene n mod practic o considerm inexistent. Cele dou
fenomene evolueaz deci independent unul de altul.
Coeficientul de corelaie ntre fenomene poate fi corect interpretat
dac se ine seama de urmtoarele ASPECTE:
ntre fenomenele ce se coreleaz s existe, n mod logic, o legtur;
cele dou fenomene s fie cercetate pe eantioane omogene;
alegerea sau selecionarea frecvenei eantioanelor s se fac
la ntmplare.
EROAREA COEFICIENTULUI DE CORELAIE LINEAR
Coeficientul de corelaie, ce exprim legtura de dependen dintre
dou fenomene, se obine de obicei pe eantioane i nu pe univers.
Valorile acestuia difer mai mult sau mai puin fa de valoarea coeficientului de corelaie pe care am fi obinut-o studiind fenomenele pe
ntreaga populaie.

72

BIOSTATISTICA

Pentru a ne convinge de fidelitatea coeficientului de corelaie, n interpretarea legturii dintre fenomene obinute pe eantioane, ne servim
de eroarea coeficientului de corelaie, care se noteaz cu mr.
Formula de calcul pentru n < 30:

n cazul cnd 30 < n < 100 se utilizeaz formula:

pentru n > 100:

n care:
mr = eroarea coeficientului de corelaie;
r2xy = ptratul valorii coeficientului de corelaie, obinut pe eantioane;
1 = valoarea absolut a coeficientului de corelaie, obinut pe univers,
pe ntreaga populaie;
n = numrul variantelor perechi ale fenomenelor ce se coreleaz.
Dac n < 30 sau valoarea coeficientului de corelaie nu este mare,
trebuie de decis ct de real este legtura dintre fenomenele ce se coreleaz. n general, dac valoarea coeficientului de corelaie obinut pe
eantioane este mai mare dect triplul erorii sale, nseamn c acesta
a fost obinut pe eantioane reprezentative, este deci real i ne putem
bizui pe el n interpretarea legturii de dependen ntre fenomene.
Dac (rXY/mr) < 3 legtura dintre fenomene rmne nedeterminat i se
consider c valoarea coeficientului de corelaie, care difer de zero, a
fost obinut ntmpltor.
Raportul dintre coeficientul de corelaie i eroarea lui se numete
criteriu de exactitate al coeficientului de corelaie tr. Criteriul n cauz
se stabilete cu ajutorul tabelului valorilor criteriului t. Dac treal > ttabel,
coeficientul de corelaie se consider semnificativ.

Noiuni de baz. Metode statistice

73

CORELOGRAMA
Existena sau inexistena unei corelaii ntre fenomene se poate
evidenia aproximativ fr prea multe calcule, cu ajutorul reprezentrilor grafice. n acest caz, folosim un grafic cu dou scri, ordonat i abscis, pe care nscriem valorile variantelor celor dou fenomene x i y.
n reeaua graficului este reprezentat prin cte un punct fiecare
frecven la nivelul valorii variantei corespunztoare fenomenului x de
pe abscis i la nlimea valorii variantei corespunztoare fenomenului y de pe ordonat. Se realizeaz astfel norul de puncte. n funcie
dispoziia acestui nor de puncte putem aprecia, aproximativ, existena
sau absena corelaiei dintre fenomene, precum i sensul i intensitatea aproximativ a acesteia. Dac norul de puncte se va dispune
fuziform, oblic de jos n sus i de la stnga la dreapta, ntre cele dou
fenomene exist o corelaie direct. Crete un fenomen, crete i cel
de al doilea, cu care se coreleaz, sau ambele fenomene scad, evolund n aceeai direcie. Intensitatea legturii corelative dintre cele dou
fenomene se apreciaz, aproximativ, dup unghiul pe care dreapta ce
trece prin mijlocul norului de puncte l realizeaz cu abscisa. Cu ct
acest unghi ascuit este mai mare, avnd tendina s se apropie de
450, cu att corelaia dintre fenomene este mai puternic. Cu ct unghiul format de aceast dreapt i abscis este mai mic, dreapta oblic
avnd tendina s se apropie de orizontal, cu att corelaie dintre fenomene va fi mai slab.
Dac norul de puncte se dispune fuziform, oblic de sus n jos i
de la stnga la dreapta, ntre cele dou fenomene exist o corelaie
invers. Intensitatea acestei corelaii inverse se apreciaz dup mrimea unghiului ascuit pe care dreapta ce trece prin mijlocul norului de
puncte l formeaz cu abscisa, n partea opus ordonatei.
Dac punctele se dispun pe toat reeaua grafic, neavnd nici o
tendin de a se grupa, nseamn c ntre fenomene nu exist nici o
legtur de dependen, fenomenele evolund independent unul fa
de cellalt. n cazul acesta, dreapta care trece prin mijlocul punctelor
este paralel fie cu ordonata, fie cu abscisa.

74

BIOSTATISTICA

CORELAIA MULTIPL
Se stabilete ntre mai mult de dou fenomene, care au legtur
de dependen ntre ele. n asemenea situaii, existena legturii de
dependen ntre fenomene, sensul i intensitatea acestei legturi, se
stabilesc cu ajutorul coeficientului de corelaie linear multipl.
Spre exemplu, dac dorim s evideniem legtura de dependen
ntre nlimea (fenomen x), greutatea (fenomen y) i vrsta (fenomen
z) copiilor sau legtura de dependen ntre incidena dinilor cariai
(fenomen x), dinilor cu parodontopatii marginale (fenomen y) i dinilor
abseni (fenomen z) ne folosim de urmtoarea formul:

rxyz
rxy
ryz
rxz

n care:
= coeficientul de corelaie linear multipl ntre cele trei fenomene;
= coeficientul de corelaie linear simpl ntre fenomenele x i y;
= coeficientul de corelaie linear simpl ntre fenomenele y i z;
= coeficientul de corelaie linear simpl ntre fenomenele x i z;

Coeficientul de corelaie linear multipl are valori mai mari


dect valorile coeficienilor de corelaie linear simpl luai n parte i totdeauna semn pozitiv. Interpretarea intensitii corelaiei
multiple ine seama de aceleai criterii enunate la interpretarea
coeficientului de corelaie linear simpl.
CORELAIA RANGURILOR (SPEARMAN)
n cazul n care dorim s stabilim legtura de dependen ntre fenomene cercetate pe eantioane mici (n < 30), deci pe un numr redus
de frecvene, utilizm coeficientul de corelaie al rangurilor, propus de
Spearman (1904). Acest coeficient se noteaz cu litera greac (ro) i
se determin dup formula propus de Spearman:

1=
=

n care:
valoarea absolut a coeficientului de corelaie;
coeficientul de corelaie Spearman;

75

Noiuni de baz. Metode statistice

6 = valoare constant;
d2 = suma ptratelor diferenelor dintre rangurile primului ir de variante i rangurile celui de al doilea ir de variante, cu care se
coreleaz;
n = numrul variantelor perechi variantelor ce se coreleaz.
Coeficientul de corelaie al rangurilor poate avea valori cuprinse ntre 1 0- +1. El exprim o legtur perfect cnd are valoarea +1.
n aceast situaie, rangurile au valori egale, iar diferena ntre ranguri
este egal cu 0.
n general, cu ct numrul rangurilor cu aceeai valoare, n cele
dou clasamente, este mai mare, cu att suma ptratelor diferenelor ntre ranguri este mai mic, iar valoarea coeficientului de corelaie
Spearman va fi mai mare.
Exemplu (Tab.19, Tab.20).
Tabelul 19
Timpul trecut din momentul accesului de pancreatit acut (x) i
numrul complicaiilor postoperatorii (y)
Nr.

Timpul,
x

Numr
complicaii,
y

Rangul x

Rangul y

d2

1
2
3
4
5
6

3
5
7
10
13
16

6
8
12
19
20
24

1
2
3
4
5
6

1
2
3
4
5
6

0
0
0
0
0
0

0
0
0
0
0
0

54

89

Total

0
=1

76

BIOSTATISTICA

Tabelul 20
Legtura de corelaie ntre copiii cu deficien mintal (la 100 mii copii) i
invaliditatea copiilor (la 100 mii copii)
Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Total

ara

Armenia
Tadjikistan
Azerbaidjan
Turkmenistan
Georgia
Krgzstan
Uzbekistan
Kazahstan
Bielarusi
Ucraina
Rusia
Moldova
Estonia
Lituania
Letonia

Defici- Invalidien
tatea Rangul Rangul
mintal copiilor
x
y
x
y
120
138
167
198
245
318
342
455
538
625
795
1018
1110
1021
1127

33
27
38
30
43
28
30
29
36
48
38
44
47
57
33

1
2
3
4
5
6
7
8
9
10
11
12
14
13
15

6,5
1
9,5
4,5
11
2
4,5
3
8
14
9,5
12
13
15
6,5

-5,5
1
-6,5
-0,5
-6
4
2,5
5
1
-4
1,5
0
1
-2
8,5

30,25
1
42,25
0,25
36
16
6,25
25
1
16
2,25
0
1
4
72,25

=-24,5
=+24,5

=253,5

= 0,55

COEFICIENTUL DE ASOCIERE
n domeniul medicinei trebuie n multe cazuri de a stabili legtura
nu numai ntre indicatori cantitativi, ci i ntre cei calitativi, care au caracter alternativ prezena fenomenului lipsa fenomenului). n asemenea cazuri se utilizeaz tabelul de asociere format din patru cmpuri
(2x2), care exprim legtura de dependen ntre fenomenele cu caracter alternativ.
Legtura de corelaie se determin prin intermediul coeficientului
de asociere, utiliznd formula urmtoare:

unde: a, b, c, d corespund valorilor situate n cele patru cmpuri.

77

Noiuni de baz. Metode statistice

Exemplu: (Tab. 21).


Tabelul 21
Vaccinarea contra unei maladii i morbiditatea populaiei n oraul A
Vaccinai

S-au mbolnvit
40
a

Nevaccinai

250
c

TOTAL

290
a+c

Sntoi
5900
b
9620
d
15520
b+d

TOTAL
5940
a+b
9870
c+d
15810
a+b+c+d

Concluzie: ntre vaccinare i morbiditate este legtur invers,


astfel cu ct mai multe persoane sunt vaccinate, cu att mai puine
cazuri de mbolnvire se nregistreaz.
Exemplu de legtur de corelaie nelinear.
A fost efectuat analiza activitii a 21 de medici pentru a determina dac exist legtur ntre calificarea medicului i costul analizelor
necesare pentru diagnostic.*
Comisia special a evaluat calificarea fiecrui medic. Ulterior medicii
au primit ranguri de la 1 (cel mai calificat) pn la 21 (cel mai necalificat).
Costul mediu al analizelor necesare pentru fiecare medic n primele
3 zile de aflare a bolnavului n clinic a primit n mod analogic rangul de
la 1 (cel mai mic) pn la 21 (cel mai mare).
Perechile de ranguri pentru fiecare medic sunt prezentate n fig.4.
Coeficientul Spearman = -0,13. Valoarea absolut a coeficientului
este mai mic dect cea critic chiar pentru pragul de semnificaie 0,05,
ceea ce denot lipsa semnificaiei statistice pentru valoarea obinut.
Exist sau nu legtur ntre calificarea medicului i costul analizelor
necesare pentru stabilirea diagnosticului?
Exist, ns legtur nelinear. Analiznd atent repartiia din fig. 4,
vom observa c cel mai mic cost mediu al analizelor se nregistreaz
* S.A. Schroeder, A. Schliftman, T.E. Piemine. Variation among physicians in use
of laboratory tests: relation to quality of care. Med. Care, 12: 709-713, 1974

78

BIOSTATISTICA

la cei mai calificai i la cei mai necalificai medici. Costurile cele mai
nalte sunt la medicii de calificare medie.

79

Noiuni de baz. Metode statistice

sau

n care:
Rgxy = coeficientul de regresie a lui x n funcie de y. El exprim, cantitativ, cu ct crete sau scade fenomenul x cnd y crete sau
scade cu o unitate de msur;
Rgyx = coeficientul de regresie a lui y n funcie de x. El exprim, cantitativ, cu ct crete sau scade fenomenul y cnd x crete sau
scade cu o unitate de msur;
rxy = coeficientul de corelaie liniar Bravais-Pearson;
x =
deviaia standard a fenomenului x;
y =
deviaia standard a fenomenului y.
Exemplu: (Tab. 22).
Fig.4. Calificarea medicilor i costul analizelor

2.9.2. Regresia
Termenul de regresie a fost introdus de F. Galton, care a observat
c nlimea descendenilor regreseaz ctre nlimea prinilor.
Coeficientul de corelaie ne d indicaii asupra sensului i intensitii legturii de dependen dintre fenomene, fr a putea preciza, sub
aspect cantitativ, cu ct crete sau scade un fenomen cnd cel cu care
se coreleaz crete sau scade cu o anumit cantitate.
Regresia, noiune strns legat de noiunea de corelaie, completeaz corelaia i prin intermediul coeficientului de regresie, stabilete
cu ct crete sau descrete sub aspect cantitativ, un fenomen, cnd cel
cu care se coreleaz crete sau descrete cu o unitate de msur.
Regresia poate fi simpl i multipl; liniar i neliniar. Ca i corelaia, regresia poate fi direct, cnd fenomenele evolueaz n acelai sens
(crete x, crete y sau scade x scade i y), sau indirect, cnd fenomenul
evolueaz n sens opus (crete x scade y sau scade x crete y).
Formula coeficientului de regresie este:

Tabelul 22
nalimea i greutatea copiilor de vrst Z (n=22)
nlimea
x

Frecvene
fx

Greutatea
y

Frecvene
fy

130
132
135
136
137

3
5
7
4
3

29
30
31
32
33
34
35
36

3
4
3
4
4
2
1
1

Repartizarea a 22 de copii conform nlimii (x) i greutii (y) a oferit urmtoarele date: nlimea medie 134 cm; greutatea medie 31,8
kg; abaterea standard pentru nlime (x) 2,37; abaterea standard
pentru greutate (y) 1,97; coeficientul de corelaie 0,82.
Cu ct se va modifica greutatea corpului la copiii n cauz, dac
nlimea acestora va crete cu 1 cm?
Substituind datele n formula coeficientului de regresie, obinem:

80

BIOSTATISTICA

Noiuni de baz. Metode statistice

81

Concluzie: Creterea nlimii medii la copiii studiai cu 1cm va


avea drept urmare creterea greutii lor cu 0,68 kg.
Utiliznd coeficientul de regresie se poate afla mrimea fenomenului y (n cazul analizat anterior greutatea), fr a recurge la msurarea acestuia, utiliznd n acest scop numai fenomenul x (greutatea). Se
folosete urmtoarea ecuaie a regresiei:
y = + Rgyx (x )
n care:
y greutatea cercetat;
x mrimea cunoscut a nlimii;
Rgyx coeficientul de regresie al nlimii n raport cu greutatea;
greutatea medie a colectivitii cercetate;
nlimea medie a colectivitii cercetate.
n cazul dat nlimea medie 134 cm; greutatea medie 31,8 kg;
Rgyx 0,68. Se cere de aflat care va fi greutatea copiilor care au nlimea de 135cm.
nlocuim datele n formul, obinem:
y = + Rgyx (x ) = 31,8+0,68(135-134) = 31,8+0,681 =32,5 kg
Astfel, nlimii de 135 cm i corespunde greutatea de 32,5 kg.
Scara regresiei: n domeniul cercetrilor somatometrice a copiilor i
adolescenilor este foarte important metoda de estimare a indicatorilor
nlimii, greutii corpului, perimetrului toracic etc. Valorile individuale
ale acestor valori difer uneori destul de evident. La persoanele care au
aceeai nlime greutatea corpului poate varia n limite destul de mari.
Mrimea diversitilor individuale a acestor caracteristici este redat de abaterea standard a regresiei Rg, care este calculat cu
ajutorul formulei urmtoare:

2.10. Analiza statistic a variabilitii


Caracterizarea unei colectiviti statistice prin indicatorii tendinei
centrale ne ajut s depistm ceea ce este comun, esenial n manifestarea unui fenomen. Orice colectivitate are o anumit organizare
intern, definit prin felul n care valorile individuale se mprtie sau se
concentreaz n jurul valorii centrale. Astfel se poate ntmpla ca dou
colectiviti analizate dup aceeai variabil s fie diferite prin tendina
central (Fig. 5a), prin dispersie (Fig. 5b) sau prin amndou (Fig. 5c).
n felul acesta o valoare central poate fi credibil, o alta nu. Din acest
motiv se impune ca analiza prin indicatorii tendinei centrale s fie completat cu indicatori ai variaiei i ai formei de distribuie.

Rg = y (1 r2 )

De exemplu seriile:
{2, 2, 2, 10, 18, 18, 18}
{9, 9, 9, 9, 10, 11, 11, 11, 11}
au aceeai medie i median dar dispersie diferit. Acest fapt este
evideniat de abaterile nregistrate fa de medie (10) sau median (10).
Seria a doua este mai omogen (nregistreaz o variabilitate mai mic
a valorilor individuale), iar valorile sale tipice sunt mai reprezentative.
Calculul i analiza indicatorilor variaiei valorilor individuale fa de
medie ofer posibilitatea de rezolvare a unor probleme de cunoatere
statistic. Dintre acestea se disting:

Cu ct va fi mai mic valoarea abaterii standard a regresiei, cu att


mai mici vor fi limitele de variaie a valorilor individuale fa de media lor.
n exemplul anterior, conform datelor obinute, valoarea abaterii
standard a regresiei va fi:

Rg = y (1 r2 ) = 1,97(10,822) = 1,970,33 = 0,65 kg/cm


Cunoscnd valoarea coeficientului de regresie, folosind ecuaia regresiei i abaterea standard a regresiei se poate de format scara regresiei.

Fig.5: a) Distribuii cu tendin central diferit; b) Distribuii cu variabilitate diferit;


c) Distribuii cu tendin central i variabilitate diferite.

n statistic prin noiunea general de variabilitate se au n vedere abaterile msurabile ale valorilor individuale fa de o valoare central (tipic).

82

BIOSTATISTICA

1) analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendinei centrale i verificarea reprezentativitii acestora;
2) compararea n timp i (sau) spaii a mai multor serii de distribuie
dup caracteristici independente i (sau) interdependente;
3) selectarea obiectiv a factorilor semnificativi de influen dup care
se structureaz unitile unei colectiviti statistice;
4) separarea aciunii factorilor eseniali de factorii ntmpltori;
5) concentrarea valorilor individuale ale caracteristicilor i deplasarea
acestora fa de valorile tipice;
6) aplicarea diferitelor teste ale statisticii matematice.
Indicatorii variaiei utilizai n analizele statistice sun clasificai dup
mai multe criterii:
- dup numrul variantelor luate n calcul exist indicatori simpli
i indicatori sintetici;
- dup modul de sistematizare a datelor primare exist indicatori
ai variaiei calculai pentru serii de distribuie unidimensionale i
indicatori calculai pentru serii multidimensionale;
- dup modul de calcul i exprimare exist indicatori ai variaiei
calculai ca mrimi absolute i ca mrimi relative.
Indicatori simpli:
- amplitudinea variaiei;
- abaterea valorilor individuale de la medie;
- abaterea intercuantilic.
Indicatori sintetici:
- dispersia;
- abaterea medie ptratic;
- coeficientul de variaie;
Amplitudinea variaiei (A)
- Se mai numete cmp de variaie sau amplitudine absolut.
- Se determin prin diferena dintre cea mai mare i cea mai mic
valoare individual nregistrat.
A = xmax xmin
Exemplu: Un grup de bolnavi nregistreaz urmtoarele durate de
tratament n zile:
8, 7, 9, 8, 9, 9, 10, 11, 12, 11, 10, 10, 9, 9, 7, 8, 10,10,11,10
Amplitudinea variaiei pentru durata tratamentului: 12 7 = 5 zile.

83

Noiuni de baz. Metode statistice

Amplitudinea relativ (A%) este raportul procentual dintre amplitudinea absolut i media aritmetic a valorilor analizate.

n exemplul de mai sus A% = (5/9)100 = 55,5%


Observaii referitor la amplitudine:
1) Se exprim n unitatea de msur a caracteristicii studiate sau n
procente n cazul amplitudinei relative;
2) Amplitudinea nu ine seama de toate valorile, ci numai de cele extreme, care adeseori sunt aberante;
3) Este sensibil la valorile aberante, se consider un indicator mai
puin relevant nepermind cunoaterea structurii interne de variaie. De exemplu, urmtoarele trei serii vizualizate au aceeai amplitudine, dar prezint variaii diferite:
Xmin

Xmax

Xmin

Xmax

Xmin

Xmax

Aceasta nseamn c amplitudinea variaiei este un indicator destul


de rezonabil numai dac valorile individuale ale seriei sunt repartizate
n mod uniform;
4) n cazul seriei de distribuie pe intervale valorice calculul amplitudinii este lipsit de sens;
5) Amplitudinea se utilizeaz frecvent la alegerea numrului de intervale de grupare a datelor i la stabilirea mrimii intervalelor.
Abaterea valorilor individuale de la medie (di).
Exprim cu cte uniti de msur sau de cte ori (sau ct la sut)
valoarea caracteristicii individuale a colectivitii se abate de la mrimea unui indicator al tendinei centrale.
- n forma absolut:
- n forma relativ:

84

BIOSTATISTICA

Exemplu: considernd aceleai date din exemplul anterior, bolnavul care s-a tratat 12 zile se abate de la media grupei cu 3 zile ceea ce
reperezint 33,3% din medie iar pacientul care s-a tratat 7 zile se abate
de la media semigrupei cu 2 zile ceea ce reprezint 22,2% din medie.
Cu ct obinem mai multe abateri relative mari n analiza unui volum de date (ctre 100% sau peste acest nivel) cu att colectivitatea
este mai eterogen.
Observaii:
1) valorile individuale se compar cu valoarea lor medie, dar la fel de
bine poate fi utilizat pentru comparare oricare alt indicator al tendinei centrale (de ex. mediana);
2) n seriile de distribuie pe intervale valorice pentru calculul abaterilor individuale se iau n considerare centrele de interval;
3) Abaterea valorilor individuale nu poate da informaii dect la nivelul
fiecrei variante pierznd imaginea mprtierii pe ansamblul distribuiei.
4) n analizele statistice se urmresc n mod deosebit abaterile maxime pozitive (d+max) i abaterile maxime negative (d-max) calculate n
cifre absolute i relative astfel:
d+max = xmax sau d+max% = ( d+max/ ) 100
d-max = xmax sau d-max% = ( d-max/ ) 100
Abaterea intercuantilic
Se calculeaz ca diferen ntre cuantila superioar i cuantila inferioar de acelai ordin. Astfel pentru r = 4 Q3 Q1 conine 50% din
numrul observaiilor; pentru r = 10 D9 D1 conine 80% din numrul
observaiilor (Fig.6).

Fig.6. Abaterea Q3 Q1 n distribuia normal

Noiuni de baz. Metode statistice

85

Observaii:
1) Acest indicator se exprim n unitatea de msur a caracteristicii;
2) Calculul abaterii intercuantilice, spre deosebire de cel al amplitudinii, prezint avantajul c evit valorile individuale extreme sau
aberante. Prin calculul acestui indicator se pierd informaii dar are
ctig de cauz omogenitatea.
3) Ca i amplitudinea, abaterea intercuantilic nu poate fi utilizat n
calcule algebrice.
Dispersia (2)
Se calculeaz ca media aritmetic a patratelor abaterilor valorilor
individuale de la tendina central (uzual de la medie).
Pentru o serie simpl formula dispersiei este:

Pentru o serie de distribuie pe frecvene formula dispersiei este:

Observaii:
1) Se mai numete varian sau moment centrat de ordin doi;
2) Este indicatorul care msoar variaia total a unei caracteristici studiate datorat att cauzelor eseniale ct i celor ntmpltoare;
3) Este un indicator cu valoare teoretic, util n verificri de ipoteze
statistice, o mrime abstract folosit ca baz de calcul pentru abaterea medie ptratic;
4) Nu are form concret de exprimare;
5) Cu ct valorile individuale ale caracteristicii sunt mai apropiate ntre
ele, cu att mrimea dispersiei este mai mic. La limit, dac toate
valorile individuale sunt egale ntre ele, dispersia este nul;
6) Dispersia, ca i media valorilor individuale, este sensibil la prezena valorilor extreme, aberante.
Abaterea medie ptratic ()
Este calculat ca o medie ptratic din abaterile valorilor individuale de la media lor.

86

BIOSTATISTICA

n seriile statistice simple:

n seriile de distribuie pe frecvene:

Menionm, c n cazul n care numrul de frecvene este mai mic


de 120, numitorul formulelor deviaiei standard devine n-1.
Deviaia standard este cel mai util i mai important indicator de dispersie. Ea pune n eviden intervalul valoric, n jurul mediei, n care
s-au distribuit valorile individuale ale fenomenului studiat. O deviaie
standard cu valoare mic, pune n eviden strns o distribuie strns a valorilor frecvenelor fenomenului cercetat n jurul mediei, deci
evideniaz un eantion omogen. O valoare mare a deviaiei standard
pune n eviden o dispersie mare a valorilor individuale n jurul mediei,
dovedind c eantionul este neomogen i ca atare rezultatele obinute
pe un aa eantion nu pot fi generalizarte.
n general, cu ct deviaia standard are valori mai mari, cu att
media caracterizeaz mai puin fenomenul cercetat. Deviaia standard
are o valoare semnificativ atunci cnd eantionul pe care am lucrat are
o distribuie normal, adic distribuia se face conform curbei Gauss
Laplace (Fig. 7).

Fig.7. Curba Gauss Laplace.

Noiuni de baz. Metode statistice

87

n cadrul unei asemenea distribuii, n mod normal, ntre valoarea


mediei i cea a deviaiei standard se distribuie 68,26% din totalul valorilor unei colectiviti statistice; ntre medie i dou valori ale sigmei se
distribuie 95,45% din valori, iar ntre medie i trei valori ale sigmei sunt
cuprinse 99,73% din valori.
De obicei, n practica, datorit variabilitii mari a fenomenelor biologice, se consider ca normale valorile cuprinse n intervalul determinat de X 2. n cercetrile experimentale, care necesit o exactitate
mai mare, intervalul n care considerm ca normale valorile frecvenelor fenomenului cercetat este mai mare, determinat de X 3.
Observaii:
1) Se mai numete abatere standard, deviaie standard, abatere
tip, standard deviation;
2) Este un indicator important n analiza variaiei, se folosete la estimarea erorilor de selecie; stabilirea eantionului; n calcule de
corelaie;
3) Se utilizeaz pentru elaborarea standardelor de dezvoltare fizic,
pentru delimitarea strilor normale de cele patologice;
4) Exprim cu ct se abate n medie fiecare valoare individual de la
media valorilor evideniind influena abaterilor mari;
5) Se calculeaz ca o medie ptratic simpl sau ponderat a ptratelor abaterilor valorilor individuale de la media lor;
6) Se exprim n unitatea de msur n care se exprim i caracteristica.
Coeficientul de variaie (Cv)
Pe lng multiplele utilizri practice, deviaia standard are i un
mare neajuns. Datorit faptului c deviaia standard este exprimat n
uniti de msur diferite, specifice fenomenelor pe care le cercetm,
ea nu poate fi utilizat n aprecierea comparativ a dou sau mai multe
eantioane, sub aspectul omogenitii, care se exprim n uniti de
msur diferite.
Spre exemplu, dac am msurat nlimea i greutatea unui lot de
30 de elevi i am gsit pentru nlime o medie de 145 cm cu o deviaie
standard de 5 cm, iar pentru greutate am gsit o medie de 35 de kg
cu o deviaie de 3 kg, pe baza valorilor deviaiei standard, exprimate
n centimetri i kilograme, nu putem aprecia sub ce aspect, al nlimii

88

BIOSTATISTICA

sau al greutii, lotul de elevi este mai omogen, mai uniform dezvoltat.
n aceast situaie se recurge la coeficientul de variaie, care nu
este altceva dect deviaia standard exprimat procentual.
Ca definiie, coeficientul de variaie este rapotul procentual dintre
valoarea deviaiei standard i media aritmetic.
Formula de calcul:

Coeficientul de variaie arat ct la sut din medie reprezint deviaia standard. Astfel, exprimnd procentual pe , scpm de influena
unitii de msur, putnd compara ntre ele, sub aspectul omogenitii, cte eantioane dorim.
n exemplul anterior, coeficientul de variaie pentru nlime este:
Cv = (5cm/145cm) 100 = 3,4%
Pentru greutate coeficientul este:
Cv = (3kg/35kg) 100 = 8,6%
Din datele obinute rezult, c lotul de copii este mai omogen dezvoltat sub aspectul nlimii, i nu sub aspectul greutii, cum eram tentai s apreciem pe baza valorilor deviaiei standard.
Cu ct valoarea procentual a coeficientului de variaie este mai
mic, cu att eantionul cercetat este mai omogen.
n general, se consider c un coeficient de variaie cu valori sub
10% indic o variaie mic, deci o omogenitate care ne permite s
generalizm rezultatele, dac i din punct de vedere numeric eantionul este corespunztor. Un coeficient de variaie cu valori cuprinse
ntre 10% i 20% indic o variaie medie. Eantionul este mai puin
omogen ca n primul caz, dar totui permite generalizarea rezultatelor
obinute, cu o anumit probabilitate de a grei.
Valorile peste 20% ale coeficientului de variaie indic o variaie
mare, o lips aproape total de omogenitate, fapt ce contraindic generalizarea rezultatelor obinute pe un asemenea eantion.
De menionat c aceste limite ale coeficientului de variaie, ce ne
permit s apreciem omogenitatea sau lipsa de omogenitate a eantionului, trebuie s reprezinte valorile duble ale acestuia, n cazul cercetrilor clinice, i valorilor triple, n cazul cercetrilor experimentale, aa
cum am vzut i la deviaia standard.

Noiuni de baz. Metode statistice

89

n exemplul anterior, valoarea dubl a coeficientului de variaie pentru nlime este de 6,8 i pentru greutate 17,2 din valorile mediilor
respective.
Variabile standardizate
1) Variabila [z = d/] se numete variabil standardizat sau abatere
normat.
2) Unitatea de msur a abaterii normate se numete unitate standard sau valoare standard.
3) Exprim poziia unitii statistice ntr-o distribuie dat att fa de
medie ct i fa de dispersie.
4) Cu ajutorul acestei variabile se pot compara mrimi ce provin din
distribuii diferite.
2.11. Aprecierea veridicitii valorilor medii i relative
Constantele (medii sau de dispersie) obinute de noi pe eantioane
se numesc statistici i valorile lor sunt mai mult sau mai puin apropiate de valorile constantelor colectivitilor generale (parametrii) n
funcie de gradul de reprezentativitate (calitativ i cantitativ) al eantioanelor, ns niciodat nu sunt identice.
Cu ajutorul acestor constante de eantion, a statisticilor, se estimeaz constantele colectivitilor generale, parametrii. Estimatul
rezultat pe baza constantelor de eantionare este aleator. Ca atare
valorile exacte ale parametrilor colectivitii generale rmn necunoscute, n schimb se poate preciza un interval valoric n care se va situa
media colectivitii generale (MA = media absolut), n jurul creia, n
acel interval valoric se vor distribui mediile de eantion, cu o anumit
probabilitate.
Dac dintr-o colectivitate general extragem mai multe eantioane,
valorile medii ale acestor eantioane vor fi foarte apropiate de valoarea
mediei absolute, distribuia acestora, n jurul mediei absolute, fcnduse conform aceleiai curbe Gauss-Laplace.
Eroarea standard sau eroarea medie a mediilor
Constanta care ne permite s stabilim intervalul valoric n care
se gsete media absolut i n jurul creia se distribuie valorile
medii de eantion, cu o anumit probabilitate, se numete eroare

90

BIOSTATISTICA

standard (ES) sau eroare medie a valorilor medii de eantion fa de


media universului.
Formula de calcul:

n care:
ESM =eroarea standard;
= abaterea standard;
n = numrul frecvenelor.
n situaia n care numrul de frecvne al eantionmului este mai
mic sau egal cu 120, atunci se raporteaz la numrul de frecvene -1
i formula devine:

n care:
ESM = eroarea standard;
= abaterea standard;
n = numrul frecvenelor
Exemplul 1.
La 120 persoane a fost determinat tensiunea arterial sistolic. n
baza valorilor individuale s-a stabilit c M = 140,5 mm Hg i = 6,25.
Exemplul 2.
n baza controlului medical la 508 persoane au fost stabilite afeciuni
dentare. n medie au fost afectai cte 5,84 dini, = 3,16.
n primul nostru exemplu, eroarea standard va fi:

n cel de al doilea exemplu al nostru, eroarea standard va fi:

Noiuni de baz. Metode statistice

91

Valoarea erorii standard, adugat sau sczut din valoarea mediei eantionului, ne permite s obinem limitele intervalului n care se
gsete valoarea mediei absolute i n jurul ei distribuite mediile eantioanelor, cu o anumit probabilitate.
Intervalul de siguran
Intervalul valoric, determinat cu ajutorul erorii standard, n care
se estimeaz a se afla media absolut, se numete interval de siguran sau de ncredere statistic, n acest interval de siguran, determinat
de media eantionului plus/minus eroarea standard, media absolut se
va gsi ntr-o proporie de 68,26%, deci probabilitatea ca media absolut
s se gseasc n interiorul acestui interval este de 68,26%.
M-ES>I<(M+ES)=68,26%
P-ES>I<(P+ES)
n primul nostru exemplu, media ponderat fiind 140,5 mm Hg, intervalul de siguran va fi 140,5 0,57, deci va fi cuprins ntre 139,93 i
141,07 mm Hg. n cel de al doilea exemplu al nostru, media ponderat
fiind de 5,84 dini iar eroarea standard 0,14, intervalul de siguran va
fi 5,84 0,14, deci cuprins ntre 5,70 i 5,98.
2ES
3ES
Pragul de semnificaie
Contraprobabilitatea sau probabilitatea ca mediile de eantion
s depeasc limitele maxim i minim intervalului de siguran, situndu-se n afara lor, se numete prag de semnificaie, n
cazul n care intervalul de siguran este determinat de M ES, atunci
contraprobabilitatea (pragul de semnificaie) se obine scznd din 100
valoarea probabilitii, deci:
q = 100 68,26% = 31,74%
n exemplul nostru media ponderat fiind de 5,84 dini afectai, intervalul de siguran va fi: 5,84 0,14, deci va fi cuprins ntre 5,70 -5,98.
Dac vrem ca valoarea contraprobabilitii, a posibilitii de a grei,
s fie mai mic, atunci trebuie s mrim intervalul de siguran. Acest
interval se mrete adugnd i scznd din valoarea mediei de dou
ori valoarea erorii standard.
M 2.ES = 5,84 + 2.0,14 = 5,84 0,28

92

BIOSTATISTICA

Intervalul de siguran va fi cuprins deci ntre limitele de 5,56 i


6,12. n acest interval, ceva mai mare, valoarea mediei absolute se
va gsi cu o probabilitate mai mare dect n primul caz, de 95,45%,
iar posibilitatea de a se situa n afara acestui interval de siguran se
reduce la 4,55% (100% 95,45% = 4,55%). Dac vrem s reducem i
mai mult probabilitatea de a grei, atunci mrim intervalul de siguran,
adugnd i scznd din valoarea mediei de trei ori valoarea erorii
standard. Intervalul de siguran va fi:
M 3.ES = 5.84 3.0.14 = 5.84 0,42
Intervalul de siguran n acest caz va fi cuprins ntre 5,42 i 6,26.
n acest interval de siguran, mult mai mare, media absolut se va
gsi cu o probabilitate de 99,73%, iar pragul de semnificaie va fi de
0,27% (100% 99,73% = 0,27%).
Rezult c intervalul de siguran nu are limite fixe ci ele se modific n funcie de dorina cu care vrem s asigurm rezultatele noastre,
n cazul n care acceptm un prag de semnificaie mai mare, deci o
probabilitate mai mare de a grei, atunci intervalul de siguran este
mai mic. Cu ct vrem s lucrm mai precis, deci s greim mai puin,
cu att intervalul de siguran crete.
Testul de semnificaie
Mrimea intervalului de siguran depinde de faptul dac n jurul
mediei lum o singur dat, de dou sau de trei ori valoarea erorii
standard. Multiplul erorii standard (1, 2 sau 3), care determin mrimea intervalului de siguran, se numete test de semnificaie i se
noteaz cu litera t. Ca atare, la o probabilitate de 68,26% i un prag
de semnificaie de 31,74% valoarea lui t=1; la 95,45% probabilitate
i 4,55% prag de semnificaie, valoarea lui t=2; la o probabilitate de
99,73% i un prag de semnificaie de 0,27% valoarea lui t=3. n mod
obinuit, noi nu garantm rezultatele sau concluziile, obinute pe eantion, cu probabilitatea cu care acestea se gsesc n interiorul intervalului de siguran i cu contraprobabilitatea, cu probabilitatea de a grei,
deci cu pragul de semnificaie.
n medicin i biologie pragurile de semnificaie de 31,74%, de
4,55% i de 0,27%, corespunznd valorilor lui t de 1,2 sau 3, nu se
prea folosesc, n schimb, rezultatele se garanteaz cu pragurile de
semnificaie de 0,05 (5%), 0,01 (1%) i 0,001 (0,1%). Pe baz de cal-

Noiuni de baz. Metode statistice

93

cule s-a stabilit c pentru aceste praguri de semnificaie valorile corespunztoare ale lui t sunt de 1,96, 2,58 i 3,29. Ca atare, la pragul de
semnificaie de 5%, valoarea lui t va fi 1,96, iar intervalul de siguran
va fi: M 1.96.ES. La 1% prag de semnificaie valoarea lui t va fi de
2,58, iar mrimea intervalului de siguran va fi dat de M 2,58.ES.
La 0,1% prag de semnificaie valoarea lui t va fi de 3,29, iar intervalul
de siguran va fi dat de M: 3,29.ES.
Aceste valori ale lui t rmn nemodificate n situaia n care lucrm
pe eantioane al cror numr de frecvene este mai mare de 120. n
situaia n care lucrm pe eantioane cu un numr de frecvene mai mic
de 120, atunci valoarea testului de semnificaie se modific i se ia din
tabelul testului t, pe care o gsim n crile de statistic.
Acest tabel (Tab.23) are 4 coloane: prima coloan pentru gradul de
libertate iar celelalte trei corespund celor trei praguri de semnificaie:
5%, 1%, 0,1%. Prin grad de libertate nelegem numrul de frecvene
ale eantionului (sub 120)-1; deci GL = n-1.
Tabelul 23
Tabelul testului t
Grad de libertate
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Ce t trebuie utilizat la un prag de semnificaie


(0,05)=5%
(0,01)=1%
(0,001)=0,1%
12,706
63,657
4,303
9,925
31,598
3,182
5,841
12,941
2,776
4,604
8,610
2,571
4,032
6,859
2,447
3,707
5,959
2,365
3,499
5,405
2,306
3,355
5,041
2,262
3,250
4,781
2,228
3,169
4,587
2,201
3,106
4,437
2,179
3,055
4,218
2,160
2,977
4,140
2,145
2,977
4,140
2,131
2,947
4,073
2,120
2,921
4,015
2,110
2,898
3,965

94

BIOSTATISTICA

Continuare Tab. 23
Grad de libertate
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
50
60
70
80
90
100
120
peste

Ce t trebuie utilizat la un prag de semnificaie


(0,05)=5%
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,030
2,021
2,008
2,000
1,994
1,989
1,986
1,982
1,980
1,960

(0,01)=1%
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,724
2,704
2,678
2,660
2,648
2,638
2,631
2,625
2,617
2,580

(0,001)=0,1%
3,922
3,883
3,850
3,819
3,792
3,767
3,745
3,725
3,707
3,690
3,674
3,659
3,646
3,591
3,551
3,496
3,460
3,435
3,416
3,402
3,390
3,373
3,290

n cazul n care rezultatele cercetrilor noastre sunt exprimate procentual, deci avem o probabilitate i o contraprobabilitate de eantion,
pentru a estima intervalul n care se gsete probabilitatea colectivitii
generale sau probabilitatea populaiei ne folosim tot de valoarea erorii
standard. Intervalul valoric n care se gsete probabilitatea fundamental sau a colectivitii generale se obine adunnd sau scznd din
probabilitatea eantionului sau eantioanelor valoarea erorii standard.
n aceast situaie eroarea standard ES este egal cu rdcina ptrat din produsul dintre probabilitatea i contraprobabilitatea eantionului, raportat la numrul frecvenelor acestuia, n cazul cnd numrul

95

Noiuni de baz. Metode statistice

frecvenelor eantionului este mai mic de 120, acest produs se raporteaz la numrul frecvenelor minus unu.
Formula erorii standard va fi deci:
sau

n 120

n care:
ES = eroarea standard;
Pe = probabilitatea eantionului;
qe = contraprobabilitatea eantionului;
n = numrul de frecvene ale eantionului.
Eroarea standard procentual
Eroarea standard n cazul valorilor medii este exprimat n uniti
de msur diferite, ca i deviaia standard. Ea nu poate servi deci la
compararea a dou sau mai multe eantioane, sub aspectul omogenitii, n asemenea situaii se calculeaz eroarea standard procentual,
pentru a scpa de influena unitii diferite de msur.

n care:
ES% = eroarea standard procentual;
M = media aritmetic sau ponderat.
n general, se consider c o eroare standard procentual cu valori
sub 1% este acceptabil, n jurul lui 2% dubioas i peste 3% inacceptabil, evideniind un eantion neomogen, deci necorespunztor pentru
a lucra pe el i a generaliza rezultatele.
n primul nostru exemplu, ES% va fi:

deci corespunztoare.
n cel de al doilea exemplu al nostru, ES% va fi:

deci necorespunztoare.

96

BIOSTATISTICA

Eroarea maxim admis sau eroarea limit este eroarea pe


care o acceptm anticipat n alegerea eantionului, n funcie de
natura cercetrii, de precizia cu care vrem s garantm rezultatele i de volumul sau mrimea eantionului. Ea reprezint deci
intervalul de siguran n care se va ncadra media universului, cu o
probabilitate dat.
Eroarea maxim admis se noteaz cu litera greceasc delta (A) i
se obine nmulind valoarea testului de semnificaie cu valoarea erorii
standard.
Formula de calcul:
x=tES
n care:
x = eroarea maxim admis;
t = testul de semnificaie;
ES = eroarea standard.
n primul nostru exemplu, admind un prag de semnificaie de 5%,
x=1,96x0,57=1,11.
n cel de al doilea exemplu al nostru, admind un prag de semnificaie de 5%, x=1,96x0,14=0,27.
Pornind ns de la formula erorii standard:

observm c valoarea acesteia este direct proporional cu valoarea lui sigma i invers proporional cu rdcina ptrat din numrul
frecvenelor. Aceasta nseamn c urmrind o scdere a erorii standard de n ori, numrul de frecvene va trebui s creasc de n2 ori.
De exemplu, dac am efectuat o cercetare pe 100 de cazuri clinice
i am stabilit o =0,40, eroarea standard va fi:

Pentru a reduce eroarea standard de dou ori, de la 0,04 la 0,02,


numrul de frecvene trebuie s creasc de 22 ori, deci de la 100 la
400 cazuri. Dac vrem s reducem de 4 ori valoarea erorii standard,
numrul frecvenelor eantionului trebuie s creasc de 42 ori, deci de
la 100 la 1600 cazuri,

Noiuni de baz. Metode statistice

97

n general valoarea erorii maxime admise nu trebuie s fie mai


mare de 1, atunci cnd lucrm cu valori absolute, sau de 1%, atunci
cnd lucrm cu valori procentuale.
Pornind de la formula x = t ES, putem stabili volumul sau mrimea eantionului pe care, efectund lucrarea sau cercetarea noastr,
s putem asigura rezultatele cu un prag de semnificaie de 0,05 (5%),
0,01 (1%) sau 0,001 (0,1%). Cum procedm? nlocuim eroarea standard cu formula din care o obinem, n cazul valorilor medii i n cazul
valorilor procentuale; formula devine:
sau
Trecnd pe n de partea cealalt a egalitii, vom avea:
sau
de unde:
sau
Din aceste formule de obinere a mrimii eantionului cunoatem:
valoarea lui t, ntruct aceasta va fi 1,96, 2,58 sau 3,29, n funcie de
pragul de semnificaie cu care dorim s garantm rezultatele (5%, 1%
sau 0,1%); valoarea erorii limit, creia i atribuim anticipat valorile dorite n funcie de precizia cu care vrem s lucrm (0-1 sau 0-1%).
Ce nu cunoatem, atunci cnd ne propunem s stabilim volumul
sau mrimea eantionului, este valoarea lui sigma. Valoarea lui sigma o lum fie din literatura de specialitate, dac exist cercetri fcute anterior de ali cercettori n domeniul n care vrem s lucrm
noi, fie o stabilim efectund cercetarea pe un eantion pilot alctuit
dintr-un numr restrns de cazuri (nu mai puin de 5) i valoarea lui
sigma, astfel obinut, se introduce n formula de calcul a mrimii
eantionului.
n primul nostru exemplu, admind o eroare limit de 0,5, dorind s
garantm rezultatele cu un prag de semnificaie de 5% (deci t = 1,96)
i avnd o valoare a lui sigma egal cu 6,25, mrimea eantionului ar
trebui s fie:

98

BIOSTATISTICA

n = 24,52 = 600,25 cazuri.


Deci, pentru a putea generaliza media valorilor TA (140,5 mm Hg)
cu un prag de semnificaie de 5% i un delta de 0,5, era necesar s
examinm 600 persoane, nu 120 cte au fost examinate.
n cel de al doilea exemplu al nostru, admind o eroare limit de
0,3, dorind s garantm rezultatele cu un prag de semnificaie de 5%
(deci t = 1,96) i avnd o valoare a lui sigma egal cu 3,16, mrimea
eantionului ar trebui s fie:

n = 20,62 = 424,36, respectiv 425 persoane.


Deci, pentru a putea generaliza media dinilor afectai (5,84) cu un
prag de semnificaie de 5% i un delta de 0,3, era suficient s examinm, din punct de vedere stomatologic, numai 425 persoane, nu 508
cte au fost examinate.
Dac la aceleai valori ale lui delta i ale lui sigma am fi dorit s
garantm rezultatele noastre cu un prag de semnificaie de 1%, n loc
de 5%, atunci mrimea eantionului trebuia s fie:
n primul exemplu

n = 32,252 = 1040 cazuri.


n al doilea exemplu:

n 27,22 = 739,81, deci 740 de persoane.


Dac am fi dorit ca pragul de semnificaie s fie 0,1% (t=3,29), pstrnd celelalte valori constante, atunci numrul de persoane examinate
ar fi trebuit s fie:
n primul exemplu:

Noiuni de baz. Metode statistice

99

de unde:
n = 41,122 = 1691 persoane.
n al doilea exemplu

de unde:
n = 34,62 = 1197,16 deci 1198 de persoane.
Din aceste exemple putem conchide c numrul de frecvene ce
alctuiesc eantionul depinde pe de o parte de valoarea pragului de
semnificaie i de valoarea erorii limit, iar pe de alt parte de valoarea
lui sigma. Cu ct pragul de semnificaie i eroarea limit vor avea valori
mai mari, cu att numrul de frecvene va putea fi mai restrns i fcnd cercetarea pe un astfel de eantion putem generaliza rezultatele
cu o posibilitate mai mare de a grei (p=5% i delta = 1). Cu ct pragul
de semnificaie i eroarea limit vor avea valori mai mici (p=0,1% i delta = 0,01) cu att numrul de frecvene va trebui s fie mai mare pentru
ca lucrnd pe un astfel de eantion s putem garanta rezultatele cu o
precizie mai mare (deci cu o posibilitate de a grei foarte mic).
La aceleai valori ale pragului de semnificaie i ale erorii limit,
eantionul va fi cu att mai mare, mai numeros, cu ct sigma va avea
valori mai mari i cu ct sigma va fi mai mic, ca valoare, cu att numrul
de frecvene va putea fi mai restrns.
n cazul n care efectum un studiu longitudinal al morbiditii stomatologice, deci eantionul ales trebuie urmrit o perioad mai ndelungat de timp (cinci, zece ani), atunci pentru a ne asigura c numrul
de frecvene nu va deveni insuficient (prin plecarea din localitate sau
prin deces a unor persoane), la numrul de frecvene stabilit prin calcul
adugm nc 10%. Spre exemplu dac am stabilit c pentru eantionul nostru sunt suficiente 425 persoane i acest eantion vrem s-l
reexaminm la intervale de 2 ani, timp de zece ani, la numrul de 425
mai adugm 42-43 persoane (10%) i eantionul nostru va trebui s
fie de 468 persoane, n cazul cnd rezultatele cercetrii sunt exprimate
procentual, atunci pentru stabilirea mrimii eantionului se folosete
formula:

100

BIOSTATISTICA

Exemplul 1. ntr-un studiu longitudinal (prospectiv) al persoanelor,


pe o perioad ndelungat de timp (5-10 ani), pentru a ne asigura c
numrul de frecvene nu va diminua prin plecarea sau decesul unor
persoane, la numrul de frecvene stabilit iniial adugm 10%; dac
numrul de cazuri stabilit iniial a fost de 600, adugnd 10% vom avea
nevoie de 660 cazuri.
Exemplul 2. Dac ne propunem s generalizm incidena de 98%
a afeciunilor stomatologice, cu un prag de semnificaie de 5% i o
eroare maxim de 1%, stabilit pe un lot de populaie, atunci volumul
eantionului va fi:

persoane
Formulele de mai sus, folosite pentru determinarea volumului eantionului, sunt valabile pentru situaia n care extragem mai multe eantioane
din colectivitatea general sau nu cunoatem mrimea acesteia. Atunci
cnd extragem un singur eantion, cum se ntmpl de obicei, i cunoatem mrimea colectivitii generale, formulele de obinere a lui n devin:
sau

n care: N = mrimea colectivitii generale.


Pentru a stabili dac dou sau mai multe rezultate obinute pe
eantioane sau dac rezultatele obinute pe eantioane i cele obinute pe colectivitatea general sunt asemntoare sau, din contr, difer
semnificativ ntre ele. ne folosim de comparaia statistic.
Compararea statistic
Am vzut c n medicin i biologie efectum cercetri pe eantion
i rezultatele obinute le extrapolm la nivelul colectivitii generale,
acestea fiind valabile ca i cnd am fi efectuat cercetarea pe ntreaga colectivitate. Rezultatele obinute pe eantion difer ns de la un
eantion la altul, fiind cu att mai reprezentative cu ct eantionul este
mai omogen i mai bine reprezentat numeric.
Pentru a stabili dac dou sau mai multe rezultate obinute pe
eantioane sau dac rezultatele obinute pe eantioane i cele obinu-

101

Noiuni de baz. Metode statistice

te pe colectivitatea general sunt asemntoare sau, din contr, difer


semnificativ ntre ele, ne folosim de comparaia statistic.
Compararea mediei unei colectiviti generale cu media unui
eantion prin criteriul diferenei l erorii diferenei
Cnd dispunem de o medie a colectivitii generale cu care comparm o medie de eantion, se procedeaz la stabilirea diferenei ntre
cele dou medii scznd valoarea cea mai mic din cea mai mare.
Se calculeaz dup aceea valoarea erorii standard pentru eantion. Cum se face interpretarea ? Dac diferena ntre cele dou medii
absolut i de eantion este mai mare dect valoarea dubl sau
tripl a erorii standard, atunci diferena este semnificativ statistic.
D >2(3) x ES diferen semnificativ din punct de vedere statistic
sau
D> U x ES U coeficient tabelar n funcie de riscul ; a crui valori
se vor citi n Tab. 24:
Tabelul 24
Limitele de semnificaie a distribuiei U

0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08

U
2 576
2.326
2,170
2.054
1,950
1,881
1,812
1,751

0,09
0,001
0,0001
0,00001
0,000001
0,0000001
0,00000001
0,000000001

U
1,695
3,29053
3.89059
4,41717
4,89164
5.32672
5,73073
6,10941

Acest lucru nseamn c din colectivitatea din care am extras eantionul exist anumii factori (de mediu fizic, de alimentaie, de munc,
etc.) care au determinat aceast diferen de valori.
Dac din contr, diferena ntre media universului i media eantionului este mai mic dect valoarea dubl sau tripl a erorii standard,
atunci diferena ntre cele dou medii este nesemnificativ din punct
de vedere statistic, este ntmpltoare i se datorete faptului c am
efectuat cercetarea pe un numr limitat de frecvene.

102

BIOSTATISTICA

n aceast situaie nu trebuie s cutm, cu orice pre, o justificare


pentru diferena existent cci mrind numrul de frecvene al eantionului aceast diferen dispare.
D < 2 (3)ES diferena nesemnificativ din punct de vedere statistic.
Exemplul 3. Dac am examinat din punct de vedere al valorilor TA
sistolice populaia adult a unei colectiviti generale i am obinut o
medie a TA (=147,5 mm Hg), iar pe un eantion de 120 de persoane
am obinut o medie M = 140,5 mm Hg i o eroare standard (ES) de
0,57 mm Hg, stabilind diferena dintre cele dou medii obinem:
D=-M=147,5-140.5=7 mm Hg
D>2(3)ES sau D>UxES
D=7mmHg>Ux0,57, iar pentru =5% vom citi n tabelul distribuiei
U valoarea de 1,98. Deci 7>1,98x0,57 deci diferena dintre cele dou
medii, a colectivitii generale i a eantionului este semnificativ statistic pentru un risc =5%. Dac diferena dintre cele dou medii ar fi
fost mai mic dect UxES atunci diferena ar fi fost nesemnificativ
statistic i media eantionului s-ar fi ncadrat n limitele admisibile de
variabilitate fa de media colectivitii generale, deci s-ar fi situat n interiorul intervalului de siguran, n acest caz diferena dintre cele dou
medii s-ar fi datorat unui numr prea mic de cazuri examinate n cadrul
eantionului i nu unor condiii de mediu diferite, existente n cele dou
colectiviti.
Exemplul 4. Dac examinndu-se din punct de vedere stomatologic populaia unui jude (colectivitatea general), s-a obinut o medie
(Ma) egal cu 7,50 dini afectai, iar noi pe eantionul nostru am gsit o
medie de 5,84 dini afectai i o eroare standard de 0,14 dini afectai,
stabilind diferena ntre cele doua medii obinem:
D = M sau D = Ma Me; D = 7,50 5,84 = 1,66
D (1,66) > 2 x 0,14 (3 x 0,14), deci diferena ntre cele dou medii
este semnificativ din punct de vedere statistic.
Dar dac media pe ntreaga colectivitate ar fi fost de 6,2 dini afectai i media eantionului nostru de 5,84 dini afectai, eroarea standard
avnd aceeai valoare de 0,14, atunci:
D = 6,10 5,84=0,26:
D = 0,26 dini afectai
D (0,26) < (2 x 0,14) i dect (3 x 0,14), dei diferena ar fi fost nesemnificativ din punct de vedere statistic.

Noiuni de baz. Metode statistice

103

Compararea mediilor a dou eantioane diferite (testul Student)


Cnd cele dou medii care se compar sunt medii de eantion,
stabilim diferena dintre cele dou medii:
D = Me1 Me2. Calculm apoi eroarea diferenei (D) dintre cele
dou valori medii:
n care: D = eroarea diferenei
ES21 = eroarea standard a eantionului unu la ptrat
ES22 = eroarea standard doi la ptrat.
Interpretarea se face astfel: dac diferena ntre cele dou medii de
eantion este mai mare dect valoarea dubl sau tripl a erorii diferenei atunci diferena ntre medii este semnificativ din punct de vedere
statistic, deci cele dou eantioane luate n studiu, nu aparin aceleiai
colectiviti generale. Unul din eantioane a avut deci condiii diferite de
cellalt. Ca atare n cadrul discutrii rezultatelor trebuie s stabilim care
au fost acele condiii care au fcut ca rezultatele s difere semnificativ.
Dac, din contr, diferena dintre cele dou medii de eantion este
mai mic dect valoarea dubl sau tripl a erorii diferenei, atunci diferena este nesemnificativ din punct de vedere statistic, este ntmpltoare i se datorete diferenei de eantionaj. Ca atare nu trebuie s
cutm neaprat o explicaie a acestei diferene.
Exemplul 1. Pe dou eantioane extrase din dou colectiviti diferite s-au msurat valorile TA sistolice i am gsit pentru primul eantion
alctuit din 120 persoane o medie M1 =140,5 mm Hg i o eroare standard egal cu ES1=0,57 mm Hg iar pentru al doilea eantion alctuit
dintr-un numr de 160 de persoane am gsit o medie a TA sistolice
M2=154,5 mm Hg i o eroare standard ES2=1,2. Stabilind diferena dintre medii obinem:
|M1-M2|=|140,5-154,5| = 14 mm Hg, iar
Diferena dintre cele dou medii de eantion fiind egal cu 14, iar
eroarea diferenei nmulit cu 1,96+2 care pentru un risc (coeficient
tabelar) de 5% i
D=14 mm Hg > 1,96 D nseamn c diferena este semnificativ
din punct de vedere statistic. Dac diferena dintre cele dou medii a

104

BIOSTATISTICA

Noiuni de baz. Metode statistice

105

celor dou eantioane ar fi fost mai mic dect valoarea 1,96-D atunci
diferena ar fi fost nesemnificativ statistic, ambele eantioane provenind din colectiviti cu condiii asemntoare.
Exemplul 2. Pe dou eantioane, extrase din dou colectiviti limitrofe, deci cu condiii asemntoare (aceiai factori de mediu fizic,
acelai mediu de alimentaie, aceleai condiii de munc, acelai nivel
cultural-sanitar etc.), se stabilete media dinilor abseni i se gsete
c la primul eantion, de 250 persoane (e1) media (Me1) este de 5,5
dini abseni, cu o eroare standard de 0,7 iar la al doilea eantion
(e2), de 200 de persoane, media Me2 a dinilor abseni este de 6,2 iar
eroarea standard de 0,2. Diferena ntre medii este:
D = Me2 Me1
D = 6,2 5,5 = 0,7 dini abseni.

Dac din contr, diferena dintre cele dou probabiliti este mai
mic dect valoarea dubl sau tripl a erorii standard, atunci diferena
este nesemnificativ, este ntmpltoare i se datorete diferenei de
eantionaj.
Exemplul 1. La 278362 nscui vii n anul Z n ara S proporia
bieilor a fost 51,4% iar a fetelor de 43,5% eroarea standard a colectivitii generale:

Pe un eantion de 16901 nscui vii n anul Z n ara F proporia


bieilor a fost de 51,2% iar a fetelor 48,8%.

dini abseni.
Diferena dintre medii (0,7) fiind mai mic dect valoarea diferenei
(D = 0,72) nseamn c ntre cele dou medii nu exist o diferen
semnificativ din punct de vedere statistic.
Compararea a dou valori calitative prin criteriul diferenei i
erorii diferenei (procentuale)
Cnd avem de comparat o probabilitate a colectivitii generale cu
o probabilitate de eantion, pentru a stabili semnificaia sau lipsa de
semnificaie a diferenei dintre aceste probabiliti, procedm n felul
urmtor:
Stabilim diferena ntre cele dou probabiliti (probabilitatea n colectivitatea general i probabilitatea eantionului). Calculm apoi valoarea erorii standard pentru eantion, conform formulei:

Diferena ntre cele dou probabiliti D=P-p=51,4%-51,2%=0,2%


iar ES n eantionul nostru este 0,14% diferena D=0,2% este mai
mic dect U-ES=1,960,14 deci probabilitatea bieilor este aceeai
n eantion ca i n colectivitatea general, diferena fiind nesemnificativ statistic. De fapt pe glob diferena ntre cele dou sexe este aproximativ egal.
Exemplul 2. Dac pe populaia unui jude s-a stabilit c probabilitatea parodontopatiei pariale este de 60% iar pe un eantion de 350 de
locuitori s-a stabilit c parodontopatia parial este prezent la 80% din
populaie, atunci diferena este:
D = 80%-60%;
D = 20%
Eroarea standard pentru eantion va fi:

Interpretarea se face astfel: dac diferena dintre cele dou probabiliti este mai mare dect valoarea dubl sau tripl (U), a erorii
standard, atunci diferena este semnificativ i trebuie s stabilim cror
factori se datoreaz.
D > U sau
D > 2 (3)ES, atunci diferena este semnificativ statistic.

D (20%) > 2 x 2,13% (3 x 2,13%) = diferena este semnificativ din


punct de vedere statistic,
ntre cele dou probabiliti exist o diferen semnificativ din
punct de vedere statistic, asigurnd aceasta afirmaie cu un prag de
semnificaie de 5%, respectiv 1%.
Cnd avem de comparat dou probabiliti obinute pe 2 eantioane, procedm n felul urmtor:

106

BIOSTATISTICA

Stabilim diferena dintre cele dou probabiliti de eantion:


D = Pe1 Pe2
Calculm dup aceea eroarea diferenei dintre cele dou probabiliti, dup formula:

Dac diferena dintre cele dou probabiliti de eantion este mai


mare dect valoarea dubl sau tripl a erorii diferenei, atunci diferena
este semnificativ din punct de vedere statistic.
D > 2 (3) D = diferen semnificativ statistic.
Dac din contr, diferena dintre probabilitile de eantion este mai
mic dect valoarea dubl sau tripl a erorii diferenei, atunci diferena
este nesemnificativ din punct de vedere statistic, este ntmpltoare
i se datorete diferenei de eantionaj.
D < 2 (3)D = diferen nesemnificativ din punct de vedere statistic.
Compararea a dou valori medii sau alternative prin criteriul
testului student
Semnificaia sau lipsa de semnificaie a dou valori medii sau procentuale, obinute pe eantioane, se poate stabili i pe o alt cale i
anume pe calea testului Student.
Atunci cnd, n cadrul eantionrii, am discutat i am definit testul
t am spus c testul t este multiplul erorii standard i c cu ajutorul lui
stabilim mrimea intervalului de siguran. Acest test t a crui valoare
n cazul n care lucrm pe eantioane cu un numr mai mic de 120
frecvene o lum din tabela testului t, se numete t tabelar. Dar valoarea lui t o mai putem obine i prin calcul dup formula:

Acest t obinut raportnd valoarea diferenei la eroarea sa, se numete t calculat.


n cazul n care dorim s apreciem semnificaia sau lipsa de semnificaie a diferenei dintre dou valori medii sau dou probabiliti, obinute pe eantioane, procedm n felul urmtor: calculm valoarea lui t,
raportnd diferena dintre cele dou medii la eroarea sa.

Noiuni de baz. Metode statistice

107

n care:
t = testul de semnificaie
D = diferena dintre valorile medii sau procentuale
D = eroarea diferenei.
Stabilim apoi valoarea lui t tabelar n felul urmtor: dac numrul
frecvenelor celor dou eantioane depete suma de 120 atunci valoarea lui t tabelar o cunoatem ca fiind 1,96 pentru un p = 0,05 (5%);
2,58 pentru un p = 0,01 (1%) sau 3,29 pentru un p = 0,001 (0,1%).
Dac numrul nsumat de frecvene al celor dou eantioane ce
se compar este mai mic de 120 de frecvene, atunci valoarea lui t
tabelar o citim n tabela testului t n gradul de libertate dat de numrul
nsumat de frecvene minus 2.
Interpretarea se face n felul urmtor: dac valoarea lui t calculat
este mai mare dect valoarea lui t tabelar atunci diferena ntre cele
dou valori medii sau ntre cele dou probabiliti este semnificativ din
punct de vedere statistic.
t calculat > t tabelar = diferena semnificativ statistic. Dac
din contra, valoarea lui t calculat este mai mic dect valoarea lui t
tabelar, atunci diferena dintre cele dou medii sau dintre cele dou
probabiliti este nesemnificativ din punct de vedere statistic.
t calculat < t tabelar = diferen nesemnificativ. Pentru exemplificare i verificare, n acelai timp, vom lua aceleai exemple pe care
le-am apreciat, sub aspectul semnificaiei diferenei i cu ajutorul erorii
diferenei.
n cazul comparrii a dou medii obinute pe eantioane diferena
ntre medii a fost de 0,7 dini abseni iar eroarea diferenei a fost de
0,72 dini abseni atestnd o diferen nesemnificativ ntre medii,
ncercnd s stabilim semnificaia sau lipsa de semnificaie pe calea
testului t, obinem urmtoarele rezultate:

108

BIOSTATISTICA

t tabelar, n cazul exemplului nostru datorit faptului c numrul


de frecvene este mult mai mare dect 120, are valori constante (1,96;
2,58; 3,29).
t calculat avnd o valoare mult mai mic (0,09) dect valoarea lui t
tabelar (1,96; 2,58; 3,29) testeaz, aa dup cum am artat, o diferen
nesemnificativ din punct de vedere statistic ntre cele dou medii de
eantion.
n cazul comparrii a dou valori procentuale, de eantion cu
ajutorul testului t stabilim valoarea lui t calculat i valoarea lui t
tabelar.
Spre exemplu, s-a examinat un eantion de 84 de elevi i s-a stabilit c frecvena cariei dentare este de 90%, iar examinarea unui alt
eantion de 60 de elevi, extrase dintr-o alt colectivitate colar, a evideniat prezena cariei dentare doar la 60% dintre acetia. Spre a stabili dac diferena dintre cele dou probabiliti este semnificativ din
punct de vedere statistic sau nu, stabilim mai nti diferena dintre cele
dou probabiliti:
D = Pe1 Pe2 n care;
D = diferena
Pe1 = probabilitatea primului eantion
Pe2 = probabilitatea celui de al doilea eantion
D = 90% 60%=30%
Diferena este egal cu 30%, calculm apoi eroarea diferenei conform formulei:

Diferena dintre cele dou probabiliti (30%) fiind mai mare dect
triplul erorii diferenei (3*6,40%=19,20%) este semnificativ din punct
de vedere statistic un prag de semnificaie sub 1%.
D (30%) > D(19,20%) = diferen semnificativ statistic pentru un
p<0,01.
Folosind metoda testului t evideniem aceeai semnificaie a diferenei:

Noiuni de baz. Metode statistice

109

ttabelar=1,96; 2,58; 3,29 n funcie de pragul de semnificaie.


Interpretarea t calculat (4,68) fiind mai mare dect oricare din
valorile lui t tabelar evideniaz aceeai diferen semnificativ ntre
cele dou probabiliti de eantion.
2.12. Compararea valorilor absolute sau a distribuiilor de
frecven: testul X2
Cnd avem de comparat ntre ele valori absolute sau distribuii de
frecvene, folosim testul X2 (chi ptrat) al lui Pearson. Testul X2 se
obine nsumnd rapoartele dintre ptratul diferenelor stabilite ntre
frecvenele colectivitii generale (frecvenele teoretice) i frecvenele
observate i frecvenele colectivitii generale.
Formula de calcul:

n care:
X2 = testul de comparaie sau de concordan chi ptrat;
FT = frecvenele universului sau frecvenele teoretice obinute prin
calcul;
FO = frecvenele observate sau frecvenele eantionului nostru.
n situaia n care avem o distribuie a colectivitii generale pe care
o comparm cu distribuia unui eantion, atunci introducem datele
respective n formul i calculm valoarea lui X2, n situaia n care nu
avem datele colectivitii generale, distribuia frecvenelor teoretice o
obinem prin calcul de aici denumirea de frecvene teoretice aa
cum vom vedea ulterior.
Valoarea lui X2, obinut pe baza formulei de mai sus, se numete
valoarea lui X2 calculat. Pentru a putea stabili dac ntre distribuia
colectivitii generale i cea a eantionului observat de noi este sau
nu o diferen semnificativ din punct de vedere statistic, avem nevoie
ca i n cazul comparaiei cu ajutorul testului t de valoarea lui X2
tabelar. Aceast valoare o lum din tabelul testului X2 (Tab. 25), care
este asemntoare cu tabelul Testului t.

110

BIOSTATISTICA

Tabelul 25
Tabelul testului X2
Grad de
libertate
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100

(0,05) = 5%
3,8
5,9
7,8
9,4
11.1
12.6
14,1
15,5
16,9
18,3
197
21.0
22,4
23.7
?50
26,3
27,6
28,9
30,1
31,4
23,7
33,9
35,2
36,4
37.7
38,9
40,1
41,3
42,6
43,8
55,8
67,5
79,1
90,5
101,9
113,1
124,3

Prag de semnificaie
(0,01) = 1%
6,6
9,2
11,3
13,3
15,1
18,5
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34.8
36,2
37,6
38,9
40,3
41,6
43,6
44,3
45,6
47.0
48.3
49,6
50,9
63,7
76.2
88,4
100,4
112,3
124,1
135,8

(0,001) = 0,1%
10,8
13,8
16,3
18,5
20,5
22,5
24,3
26,1
27,9
29,6
31,3
32,9
34.5
36,1
37,7
39,3
40,8
42,3
43,8
45,3
46,8
48,3
49,7
51,2
52,6
54.1
55,5
56,9
58,3
59,7
73,4
86,7
99,6
112,3
124,8
137.2
149,4

Noiuni de baz. Metode statistice

111

Valoarea lui X2 tabelar se citete n tabelul testului X2 innd seama


de gradul de libertate i de pragul de semnificaie cu care vrem s garantm semnificaia sau lipsa de semnificaie dintre cele dou distribuii
de frecvene. Prin grad de libertate n tabelul testului X2 nelegem produsul dintre numrul rndurilor tabelului (n care am introdus distribuiile de frecven) minus 1 i numrul coloanelor acestui tabel minus 1.
GL=(NrR-1)-(NrC-1)
Exemplul 1. Examinnd ntreaga populaie adult a unei colectiviti de 1337 locuitori sub aspectul valorilor tensiunii arteriale sistolice i a unui eantion de 120 de persoane am obinut urmtoarele
distribuii de frecvene pe grupe de valori ale tensiunii arteriale sistolice (Tab. 26).
Tabelul 26
Distribuii de frecvene pe grupe de valori ale tensiunii arteriale sistolice
xi=variabila TA sistolic
127,5
132,5
137,5
142,5
147,5
152,5
157,5

f0= frecvene observate


6
17
31
42
17
5
2
=120

ft=frecvene teoretice
180
210
290
320
230
65
42
=1337

Lsnd la o parte prima coloan a valorilor variabilei tensiunii arteriale sistolice i primul rnd cu denumirea coloanelor, tabelul nostru
conine 7 rnduri i dou coloane, deci valoarea lui X2 tabelar o vom
citi din tabelul X2 la gradul de libertate: GL = (nr. de rnduri 1) x (nr.
de coloane 1)=(7-1) x (2-1 )=6. Valoarea tabelar a lui X2 pentru GL =
6 i un risc = 5% este de 12,6. Pentru un risc = 1% este de 18,5 i
pentru un risc = 1 este de 22,5. 91 % X2 calculat se obine:

112

BIOSTATISTICA

Deci valoarea lui X2 calculat (1108,8) este mult mai mare dect
valorile gsite n tabelul X2 pentru oricare din cele trei riscuri asumate
(5%, 1%, 0,1%), deci diferena ntre cele dou distribuii de frecvene
teoretice i observate este semnificativ din punct de vedere statistic,
denotnd c n cadrul eantionului exist condiii diferite (factori de mediu, alimentari, de munc etc.) care au determinat aceast diferen,
fa de cele din colectivitatea general. Dac valoarea lui X2 calculat ar
fi fost mai mic dect valoarea lui X2 tabelar atunci diferena ntre cele
dou distribuii de frecvene ar fi fost nesemnificativ din punct de vedere statistic, eantionul provenind din aceeai colectivitate general,
reflectnd condiiile acesteia.
Exemplul 2. Dac am stabilit c pe teritoriul unui spital populaia
adult (39.620 locuitori) se distribuie n raport cu dinii extrai ca n
tabelul alturat (coloana FT), iar examinarea unui eantion de 5.500
persoane adulte evideniaz distribuia din coloana FO, atunci tabelul
nostru lsnd la o parte prima coloan, coloana variantelor, i primul
rnd, cu denumirea coloanelor, are 6 rnduri i 2 coloane, deci valoarea lui X2 tabelar o vom citi din tabelul testului X2 la gradul de libertate
5 (Tab. 27).
Tabelul 27
Determinarea gradelor de libertate.
Nr. dini
abseni

Nr. pers.
cot. gen.

Nr. pers.
eantion

X
1
2
3
4
5
6

FT
2850
5250
10320
15810
3860
1530

FO
860
920
1130
1620
650
320

GL = (6-1) (2-1) = 5
La acest grad de libertate, valoarea lui X2 tabelar va fi de: 11,1 pentru pragul de semnificaie 0,05 (5%); 15,1 pentru pragul de semnificaie
0,01 (1%); i 20,5 pentru pragul de semnificaie 0,001 (0,1%).
Valoarea lui X2 calculat o obinem prin calcul. Introducnd datele n
formula lui X2 calculat, avem:

113

Noiuni de baz. Metode statistice

Deci X2 calculat are o valoare de 29503.


Interpretarea diferenei dintre cele dou distribuii de frecvene (a
colectivitii generale i a eantionului nostru) se face comparnd cele
dou valori ale lui X2 (obinute prin calcul i din tabele), ca i n cazul
testului t. Dac valoarea lui X2 calculat este mai mare dect a lui X2
tabelar, atunci ntre cele dou distribuii de frecvene este o diferen
semnificativ din punct de vedere statistic. Dac, din contr, valoarea
lui X2 calculat este mai mic dect valoarea lui X2 tabelar, diferena
ntre distribuii este nesemnificativ, n exemplul nostru X2 calculat,
avnd valoarea de 38116, adic mai mare dect a lui X2 tabelar, testeaz o diferen semnificativ din punct de vedere statistic ntre cele
dou distribuii de frecvene.
n situaia n care nu cunoatem distribuia colectivitii generale,
stabilim prin calcul valorile frecvenelor teoretice.
Exemplul 3. ntr-o secie de oncologie au fost internai cu diagnostic de cancer pulmonar un numr de 78 de bolnavi. Dintre acetia 69
erau brbai i 9 femei. Din cei 69 brbai bolnavi de cancer pulmonar
39 erau fumtori iar 30 nefumtori. Dintre cele 9 femei cu cancer pulmonar 6 erau fumtoare i 3 nefumtoare. Pentru a stabili dac ntre
bolnavii fumtori i nefumtori cu cancer bronhopulmonar exist diferene semnificative din punct de vedere statistic sau nu, vom introduce
datele n Tab. 28.
Tabelul 28
Numrul de bolnavii fumtori i nefumtori cu cancer bronhopulmonar
Cancer
pulmonar
Brbai
Femei
Total

Fumtori
FO
FT
39=a
39,8=A
6= b
5,2=B
45=a+b
45=A+B

Nefumtori
FO
FT
30=c
29,2=C
3=d
3,8=D
33=c+d
33=C+D

Total
69=a+c
9=b+d
78=a+b+c+d=n

Admind de la nceput c ntre fumtori i nefumtori nu exist


diferene statistice, deci admind ipoteza nul (H0), pe baza unei re-

114

BIOSTATISTICA

guli de trei simple, pornind de la valorile frecvenelor observate se pot


stabilii valorile frecvenelor teoretice astfel:
Dac la 78 bolnavi
avem 45 fumtori
la 69 bolnavi...
avem x fumtori

n mod asemntor vom obine prin calcul i celelalte valori (B, C,


D), pe care le vom introduce n tabel corespunztor frecvenelor teoretice. Dispunnd n acest fel att de valorile frecvenelor observate ct i
de frecvenele teoretice putem prin formula menionat anterior:

se obine valoarea lui X2 calculat astfel:

deci X2 calculat =0,33.


Pentru a vedea dac diferena dintre brbaii i femeile fumtoare
sau ntre brbaii i femeile nefumtoare este sau nu o diferen semnificativ din punct de vedere statistic comparm valorile XC2=0,33 cu
valoarea Xt2 din tabele care pentru un risc =5% este de 3,8, pentru
=1% este 6,6, iar pentru =0,1% este 10,8. n exemplul nostru X2
calculat este mai mic dect X2 tabelar pentru oricare din riscurile de
mai sus asumate, deci diferena este nesemnificativ statistic. Dac X2
calculat ar fi fost mai mare dect X2 tabelar atunci diferena ar fi fost
semnificativ statistic, ceea ce ar fi demonstrat c sexul joac un rol
important n cancerul bronhopulmonar.
Exemplul 4. Examinnd din punct de vedere stomatologic un eantion de 810 elevi (470 biei i 340 fete) dintr-o colectivitate colar, am
constatat urmtoarele:
=> dintre cei 470 biei examinai 250 prezentau carii dentare, iar
220 erau fr carii;
=> la fete 180 prezentau carii dentare iar 160 erau fr carii.

115

Noiuni de baz. Metode statistice

Vrem s tim dac ntre bieii cu carii i fetele cu carii exist o


diferen semnificativ din punct de vedere statistic sau nu. Cu alte
cuvinte, vrem s vedem dac aceast afeciune, caria dentar, are o
predispoziie legat de sex sau din contr sexul nu are nici o influen
n determinarea cariei dentare.
Pentru a putea calcula valoarea lui X2 avem nevoie de frecvenele
teoretice. Cum le obinem? Introducem datele cunoscute, deci frecvenele observate, ntr-un tabel quadruplu (un tabel cu dou intrri i cu
ieiri: cu 2 rnduri i 2 coloane) (Tab. 29).
Tabelul 29
Numrul de elevi cu carie i far carie n funcie de sex
LOTUL DE
ELEVI
Biei
Fete
TOTAL

ELEVI CU CARII
FO
FT
250
249,50
180
480,50
430
430

ELEVI FR CARII
FO
FT
220
220,50
160
159,50
380
380

TOTAL
ELEVI
470
340
810

Frecvenele teoretice le obinem prin calcul. Considerm c ntre


incidena cariei dentare la biei i la fete nu exist nici un fel de deosebire. Acceptm, deci, de la nceput, principiul ipotezei nule i universul
nostru este reprezentat de numrul total al frecvenelor. Cu ajutorul regulii de trei simple obinem frecvenele teoretice, fcnd raionamentul:
dac la cei 810 elevi examinai corespund 430 elevi cu carii, dintre cei
470 biei examinai ci vor avea carii?
X = 470430:810= 249,50
Deci, frecvenele teoretice pentru bieii cu carii, 249,50, le introducem n csua corespunztoare a tabelului.
Dac la cei 810 elevi au fost gsii 380 fr carii, la cei 470 biei
ci vor fi fr carii?
X = 470380:810 = 220,50
Acelai raionament l facem i pentru obinerea frecvenelor teoretice ale fetelor cu i fr carii:
X = 340430:810 = 180,50
deci frecvenele teoretice ale fetelor cu carii, 180,50, le introducem
n csua corespunztoare a tabelului.
X = 340380: 810= 159,50
deci frecvenele teoretice ale fetelor fr carii le introducem n csua corespunztoare a tabelului nostru.

116

BIOSTATISTICA

Avnd acum frecvenele teoretice i pe cele observate, le introducem n formula lui X2 i obinem valoarea lui X2 calculat:

deci X2 calculat = 0, 0049. X2 tabelar, avnd n vedere c datele


noastre le-am nscris ntr-un tabel cu dou rnduri i cu dou coloane,
l vom citi din tabelul testului X2 la gradul de libertate 1 i va avea valoarea: 3,84 pentru pragul de semnificaie de 0,05 (5%); 6,63 pentru pragul
de semnificaie de 0,01 (1%); i 10,80 pentru pragul de semnificaie de
0,001 (0,1%). X2 calculat avnd o valoare mult mai mic (0,0049) dect
valoarea Iui X2 tabelar (3,84; 5,64; 10,80) testeaz lipsa de semnificaie
a diferenei dintre frecvena cariei dentare la biei i la fete.
Cu alte cuvinte, caria dentar este la fel de frecvent att la biei
ct i la fete, deci nu are o predispoziie de sex.
Calea de obinere a lui x2 calculat
Situaia n care frecvenele teoretice trebuie s le obinem prin calcul
este anevoioas, presupunnd calcule laborioase, n aceast situaie
putem folosi o alt formul, mai simpl, n activitatea practic i anume:

Aceast formul rezult din desfacerea binomului lui Newton (a+b)n.


Exemplul 5. Bolnavii de cancer pulmonar fumtori i nefumtori
(Tab.30).
Tabelul 30.
Numrul de bolnavii fumtori i nefumtori cu cancer bronhopulmonar
Cancer pulmonar
Brbai
Femei
Total

Fumtori
39=a
6=c
45=a+c=n3

Legend:
a=brbai fumtori
b=brbai nefumtori
c=femei fumtoare
d=femei nefumtoare
a+b+c+d-N numrul total de cazuri

Nefumtori
30= b
3=d
33=b+d=n

Total
69=a+b=n,
9=c+d=n2
78-a+b+c+d=N

117

Noiuni de baz. Metode statistice

Aplicnd formula simplificat obinem:

X2 pentru un risc =5% i pentru GL=(numrul de rnduri-1) x (numr de coloane 1)=(2-1) x (2-1)=1 are valoarea de 3,8. Valoarea
calculat este mai mic dect valoarea tabelar deci diferena este
nesemnificativ ceea ce testeaz aceeai lips de semnificaie ntre
brbaii i femeile fumtoare sau brbaii i femeile nefumtoare.
Exemplul 6. S vedem dac exist diferene semnificative ntre
rezultatele tratamentului cu streptomicin i penicilin la dou loturi de
copii sub un an suferind de bronhopneumonie acut, am urmrit un
numr de 20 de copii pentru fiecare lot. Rezultatele obinute au fost
introduse n Tab. 31.
Tabelul 31
Rezultatele tratamentului bolnavilor cu bronhopneumonie
Bolnavi bronhopneumonie
Tratament penicilin
Tratament streptomicin
Total

Vindecai
a=14
c=16
a+c-n3=30

Complicaii
b=6
d=4
b+d=n4=10

Total
a+b=n1=20
c+d=n2=20
a+b+c+d=N=40

Xt2=3,8 pentru =5%


Rezult c valoarea XC2<Xt2 ceea ce nseamn c rezultatele ntre
cele dou tratamente (penicilin i streptomicin) folosite n tratamentul bronhopneumoniei nu difer semnificativ la cele dou loturi de copii
bolnavi.

118

BIOSTATISTICA

CAPITOLUL METODOLOGIA GENERAL A CERCETRII


III
STATISTICE

Dezvoltarea istoric a statisticii, complexitatea obiectului su de


cercetare, multitudinea proceselor i fenomenelor social-economice i
culturale pe care le studiaz au determinat apariia procesului de difereniere pe ramuri a statisticii: statistica economic, statistica demografic, statistica medical, statistica industrial etc.
Indiferent de domeniul de activitate, totalitatea operaiunilor folosite n cercetarea statistic poart denumirea de metodologia cercetrii statistice. n cadrul metodologiei statistice, diferitele operaiuni se
succed ntr-o ordine bine stabilit, reprezentnd n desfurarea lor
cronologic etapele cercetrii statistice ce trebuie respectate n
cercetrile ntreprinse n toate domeniile de activitate.
Uneori, pentru elucidarea unor mecanisme sau precizarea aciunii sau rolului anumitor substane n organism, ntreprindem cercetri
experimentale pe animale de laborator, a cror rezultate ncercm s
le transpunem la om. Nu trebuie s uitm ns nicicnd c rezultatele
obinute pe animale nu sunt superpozabile cu cele nregistrate la om.
Astzi dezvoltarea impetuoas a tiinelor, n mod deosebit a celor
tehnice, este indisolubil legat de utilizarea unor metode noi, complexe
i precise, de evaluare i cuantificare a diferitelor aspecte calitative,
obinute pn de curnd prin vechile metode descriptive, mai puin precise i exacte.
Aceste cteva aspecte generale justific i impun cunoaterea i
aplicarea metodei statistice n general, a statisticii matematice ndeosebi, alturi de celelalte metode de investigaie, n cercetrile clinice,
de laborator, ca i n cele menite s contribuie la cunoaterea i aprecierea strii de sntate a populaiei.
Etapele principale ale cercetrii statistice sunt: adunarea sau observarea, prelucrarea, prezentarea i analiza materialului statistic.

3.1. Adunarea sau observarea materialului statistic


Este operaia care ne permite s obinem datele necesare efecturii unei cercetri statistice. Termenul de ADUNAREA se utilizeaz
atunci cnd datele necesare efecturii lucrrii statistice le lum din evidene primare aflate la nivelul unitilor sanitare, ca rezultat al activitii
personalului acestor uniti.

Metodologia general a cercetrii statistice

119

Exemplul 1. Dac ne propunem s stabilim incidena hipertensiunii


arteriale ntr-o secie de spital, extragem fiele medicale ale bolnavilor
din staionar, care prezint valori ale TA peste limitele normale (140/90
mm Hg) din secia de boli interne. Aceste date le supunem ulterior operaiei de prelucrare a materialului statistic.
Exemplul 2. Dac ne propunem s facem un studiu privind boala
parodontal, atunci datele necesare efecturii studiului le extragem din
registrele sau fiele de consultaie ale bolnavilor examinai la nivelul
unitilor stomatologice dintr-un anumit teritoriu.
Termenul de observare se utilizeaz atunci cnd materialul necesar efecturii lucrrii l obinem ca rezultat nemijlocit al muncii proprii.
Exemplul 3. n cadrul stabilirii incidenei TA la populaia dintr-un
teritoriu, examinm o parte (lot) din colectivitatea respectiv, prin examen clinic i de laborator, consemnnd n mijloacele de nregistrare
valorile tensionale obinute de noi pentru fiecare persoan examinat.
Exemplul 4. Dac ne propunem s efectum o cercetare din care
s reias rolul fluorului din apa potabil asupra cariei dentare, n cazul
observrii materialului statistic, lum un lot de animale crora le administrm ap cu fluor n diferite concentraii, o anumit perioad de timp
i consemnm n protocoalele de lucru, ntocmite n acest scop, toate
modificrile ce survin la animalele din lotul de cercetare, comparativ cu
un lot martor.
Adunarea sau observarea materialului statistic constituie operaiunea de baz ntr-o cercetare statistic, deoarece corectitudinea i valabilitatea rezultatelor depind n cea mai mare msur de modul n care
se efectueaz aceasta. Ca atare adunarea materialului se va face cu
mare atenie, n mod obiectiv, fr a ncerca s denaturm datele, pe
baza unor idei preconcepute. S nu se uite niciodat c n cercetarea
tiinific un nu categoric este mai valoros dect un da ndoielnic.
Buna reuit a etapei de adunare a materialului statistic depinde n
egal msur i de uniformitatea metodelor i mijloacelor de lucru. ntruct cercetrile statistice incumb un volum mare de munc, n efectuarea acestora sunt angrenate mai multe persoane. Pentru realizarea
uniformitii n munca de adunare a materialului se folosesc metode
i mijloace de lucru judicios ntocmite, iar personalul care particip la
operaia de adunare a materialului este bine i amnunit instruit asupra coninutului mijloacelor de nregistrare.

120

BIOSTATISTICA

Operaiunea de adunare sau observare a materialului statistic cuprinde urmtoarele subetape:


Subetapa datelor preliminare sau a datelor pregtitoare n care,
nainte de efectuarea propriu-zis a operaiei de adunare a materialului
statistic, se stabilesc i se precizeaz unele noiuni absolut necesare
bunei desfurri a operaiei propriu-zise.
Stabilirea scopului i obiectului lucrrii
n aceast subetap se precizeaz scopul n care se efectueaz
lucrarea statistic i obiectul acesteia.
Exemplul 5. n cazul cercetrii incidenei hipertensiunii arteriale
scopul incidenei este acela de a cunoate care sunt factorii biologici,
de mediu, sociali-economici i comportamentali care au determinat o
inciden crescut a bolii hipertensive, n vederea eliminrii sau diminurii acestora, iar obiectul lucrrii statistice este persoana creia i
s-au determinat valorile TA.
Exemplul 6. n cazul cercetrii experimentale: rolul fluorului n
protejarea organismului mpotriva cariei dentare, scopul urmrit este
acela de a cunoate n ce msur fluorul, administrat n anumite concentraii, n apa de but, exercit asupra organismului un rol protector
mpotriva cariei dentare, iar obiectul lucrrii l constituie caria dentar.
Este necesar s stabilim n cadrul datelor pregtitoare scopul i
obiectul lucrrii, ntruct coninutul mijloacelor de observare a materialului este impus de aceste dou noiuni.
Delimitarea cercetrii
Dup ce s-a stabilit scopul i obiectul cercetrii statistice se trece la
delimitarea cercetrii. Aceast delimitare se face n:
timp, stabilindu-se, n funcie de natura problemei cercetate, perioada de timp n care ne propunem s adunm sau s observm
materialul necesar efecturii lucrrii. Din acest punct de vedere
trebuie precizat c sunt cercetri care se fac pe baza materialului obinut la un moment dat, pe baza unei singure examinri iar
altele necesit perioade mai lungi sau mai scurte de timp. Spre
exemplu starea de morbiditate prin HTA i respectiv prin afeciuni
stomatologice se poate cunoate pe baza unei singure examinri
a populaiei dintr-o colectivitate, fr a necesita o urmrire n timp
a acesteia.

Metodologia general a cercetrii statistice

121

Ea e similar cu un instantaneu fotografic care exprim ce se petrece la un moment dat n snul populaiei din punct de vedere stomatologic, sau al valorilor tensiunii arteriale.
n cazul urmririi n dinamic a TA la populaia unei localiti, examinarea populaiei din aceast colectivitate se face la anumite intervale
de timp, pentru a stabili dac msurile preconizate pentru combaterea
HTA sunt eficiente sau nu.
n cazul exemplului cu administrarea fluorului, n diferite concentraii,
n apa potabil, lotul de populaie examinat iniial trebuie urmrit i examinat, comparativ cu un lot martor, la diferite intervale de timp, pentru a stabili dac fluorul exercit sau nu un rol protector mpotriva cariei dentare;
spaiu; cu care ocazie se stabilete teritoriul pe care ne propunem
s efectum cercetarea. Acest teritoriu poate s fie restrns (o clas, o coal, o ntreprindere) sau mai extins (o circumscripie, o
comun, teritoriul deservit de un anumit spital unificat etc.), n funcie de natura problemei pe care o cercetm i de scopul i obiectul
cercetrii. Cnd cercetarea se extinde pe un teritoriu mai mare,
atunci se respect de obicei mprirea administrativ a teritoriului:
sat, comun, raion etc. Starea de morbiditate prin HTA se poate
stabili fie la populaia unei colectiviti restrnse (ntreprindere, sat,
comun) fie la populaia ntregului raion. Starea de morbiditate prin
afeciuni stomatologice se poate stabili spre exemplu, fie la populaia colar de o anumit vrst sau la toat populaia colectivitii, pe ani de vrst sau pe grupe de vrst;
volum, urmrind s stabilim mrimea colectivitii pe care o vom
lua n studiu, sub raport cantitativ, deci numrul de uniti statistice
ce urmeaz a fi cercetate.
Cercetrile statistice se fac fie pe totalul unitilor statistice cuprinse
ntr-o populaie i atunci se spune c s-a lucrat pe univers, colectivitate statistic general, fie pe un numr limitat de uniti statistice din
cadrul populaiei i atunci se spune c s-a lucrat pe eantion. Cele
mai veridice concluzii se obin atunci cnd cercetarea a cuprins totalitatea unitilor statistice ce compun o mulime, o colectivitate. Asemenea
cercetri ns se efectueaz foarte rar ntruct sunt foarte costisitoare
necesitnd sume mari de bani, sunt greu de organizat, datorit numrului mare de personal, de aparatur, reactivi i necesit timp ndelungat. Uneori nici nu este necesar s efectum cercetri pe univers

122

BIOSTATISTICA

ntruct statistica matematic ne ofer criterii exacte pentru stabilirea


numeric a colectivitii ce urmeaz a fi cercetat, pentru ca concluziile
obinute n urma cercetrii s poat fi generalizate ca i cnd am fi lucrat pe univers sau pe colectivitatea statistic general.
Stabilirea unitii statistice
Stabilirea unitii statistice adic a prii componente a mulimii
sau colectivitii expus cercetrii. Este necesar s stabilim unitatea
statistic cu care lucrm pentru c nu totdeauna aceasta este distinct,
iar uneori ea e impus de natura cercetrii i scopul urmrit.
Exemplul 1. Dac dorim s stabilim incidena HTA ntr-o colectivitate atunci fiecare persoan examinat care prezint valori crescute
ale TA constituie o unitate statistic. Ea reprezint un caz nou de mbolnvire. Prin caz nou de mbolnvire nelegem orice mbolnvire din
momentul depistrii sau lurii n eviden pn n momentul vindecrii
sau decesului. Cazul nou de mbolnvire nu se confund nici cu persoana bolnav nici cu consultaia, pentru c una i aceeai persoan
poate prezenta mai multe mbolnviri noi ntr-o anumit perioad de
timp i pentru aceeai mbolnvire persoana respectiv se poate prezenta de mai multe ori la consultaie.
n cazul recensmntului de populaie unitatea statistic este persoana recenzat cu caracteristicile: vrst, sex, naionalitate, profesiune etc. Alte exemple de uniti statistice sunt: familia, cstoria, nscutul viu, gravida, instituia medical etc.
Exemplul 2. Dac iniiem o cercetare n scopul cunoaterii morbiditii stomatologice pe afeciuni, atunci fiecare afeciune nou constituie o
unitate statistic i o folosim n calculul morbiditii. Prin afeciune nou
sau caz nou de mbolnvire nelegem n cazul nostru, orice afeciune
stomatologic din momentul depistrii pn n momentul vindecrii. Deci
pentru a stabili care este morbiditatea stomatologic prin caria dentar,
ntr-o anumit colectivitate, nregistrm toate cariile dentare noi, depistate la populaia examinat, pe care le etichetm ca uniti statistice i nu
persoana care prezint caria dentar constituie unitatea statistic, n cazul stabilirii morbiditii pe contingente, prin afeciuni stomatologice, unitatea statistic o constituie persoana care cu ocazia examinrii prezint
afeciuni stomatologice, n calcularea morbiditii generale nu persoana
bolnav constituie unitatea statistic, ci cazul nou de mbolnvire.

Metodologia general a cercetrii statistice

123

Aceeai persoan poate prezenta, n decurs de un an, mai multe


mbolnviri noi. Fiecare dintre aceste mbolnviri constituie uniti statistice distincte. De asemenea pentru fiecare mbolnvire nou, care
poate dura uneori o perioad mai lung de timp, persoana bolnav se
poate prezenta de mai multe ori la medic, fr ca aceste consultaii s
fie etichetate ca mbolnviri noi i deci ca uniti statistice distincte.
Stabilirea programului adunrii sau observrii materialului
statistic
Dup ce am fcut delimitarea lucrrii statistice n timp, spaiu i
volum, este necesar s stabilim caracteristicile fiecrei uniti statistice
cercetate.
Prin caracteristic (variabil) se nelege trstura sau nsuirea
proprie fiecrei uniti statistice.
Exemplul 1. n cazul cercetrii morbiditii prin HTA ntr-o colectivitate se pot lua n considerare urmtoarele caracteristici (variabile):
vrsta, sexul, localitatea de domiciliu, profesia, factorii de risc etc.
Exemplul 2. n cazul cercetrii morbiditii stomatologice ntr-o anume colectivitate, se vor lua n considerare urmtoarele caracteristici: cazul nou de boal, vrsta, sexul, localitatea de domiciliu, natura mbolnvirii noi, profesia etc. Caracteristicile sau variabilele pot fi de tip cantitativ
exprimate n uniti de msur ca: nlime, greutate, talie, perimetru toracic, n cazul dezvoltrii fizice, glicemie, TA, temperatur, puls; i de tip
calitativ cnd exprim o calitate ce nu poate fi msurat prin uniti de
msur, de exemplu: sexul, culoarea tegumentelor, starea la externare
a unor bolnavi (care poate fi vindecat, ameliorat, agravat). Aceste caracteristici calitative sau cantitative trebuie exprimate clar i precis, nct
persoanele care particip la operaia de adunare a materialului statistic
s nu fie puse n situaia de a le da o interpretare subiectiv sau greit.
A stabili caracteristicile unitilor statistice, ce vor fi adunate sau observate n cadrul efecturii lucrrii, nseamn a stabili programul operaiei de adunare a materialului statistic.
Planul observrii sau adunrii materialului statistic
Dup ce programul de adunare a materialului statistic a fost stabilit se trece la elaborarea planului de adunare a materialului statistic.
Planul adunrii materialului statistic cuprinde date privitoare la meto-

124

BIOSTATISTICA

dologia adunrii materialului i date privitoare la organizarea adunrii


materialului statistic.
Datele metodologice ale adunrii materialului statistic se refer la
datele pe care le-am discutat mai nainte i anume: stabilirea scopului
i obiectul lucrrii sau cercetrii, delimitarea n timp, spaiu i volum a
cercetrii, stabilirea unitii statistice, elaborarea programului adunrii
materialului.
Datele organizatorice ale planului se refer la problemele privitoare
la documentarea n tema luat n studiu, la ntocmirea sau procurarea
formularelor de nregistrare, la alegerea i instruirea personalului ce va
participa la adunarea materialului statistic etc.
Planul cercetrii este deci mai cuprinztor dect programul adunrii
materialului, el incluznd i planul prelucrrii, al prezentrii i analizei
materialului, n concordan cu ipoteza de lucru de la care am pornit.
Subetapa stabilirii metodelor de adunare sau nregistrare
a materialului statistic
Metodele folosite pentru nregistrarea materialului statistic depind
de faptul dac ne-am propus n cadrul datelor pregtitoare s lucrm pe univers sau pe eantion reprezentativ. Din acest punct de
vedere metodele de nregistrare se mpart n dou grupe mari:
Metode de nregistrare total
Dac ne-am propus s lucrm pe univers deci pe ntreaga colectivitate, atunci metodele de nregistrare vor fi totale nregistrnd toate
unitile statistice ce compun o colectivitate iar dac ne-am propus
s lucrm pe eantion, deci numai pe o parte din colectivitate, atunci
metodele folosite pentru nregistrarea materialului vor fi metode pariale. Metodele de nregistrare total pot fi la rndul lor:
Totale continue, cnd unitile statistice se nregistreaz n totalitate dar n msura n care fenomenul are loc. Spre exemplu dac ne
propunem s facem un studiu asupra fenomenului de natalitate i mortalitate, ntr-un anumit teritoriu sau ntr-o anumit colectivitate, atunci
se nregistreaz toi nscuii vii sau toate decesele din teritoriul sau
colectivitatea respectiv ns pe msur ce ele se produc. Aceste nregistrri sunt limitate n spaiu dar nu n timp.
Totale periodice, cnd nregistrarea unitilor statistice dintr-o colectivitate sau dintr-un teritoriu se face n totalitate dar numai la anumite

Metodologia general a cercetrii statistice

125

intervale de timp. Aceste nregistrri sunt limitate att n timp ct i n


spaiu. Ele redau aspecte statistice, la un moment dat, ale fenomenului studiat, spre deosebire de nregistrrile totale continue care redau
dinamica fenomenului. Un exemplu de nregistrare total periodic o
constituie recensmintele de populaie, care de obicei se efectueaz la
intervale de 10 ani i cuprind populaia ntregii ri. Dei metoda de nregistrare total continu este superioar celei totale periodice, datorit
volumului mare de munc, costului ridicat, necesitnd un mare numr
de personal specializat, ea se aplic numai n situaii aparte.
Metode de nregistrare parial
Le utilizm atunci cnd ne propunem s efectum cercetarea pe o
parte din colectivitate, pe eantion. Lucrm pe o parte din colectivitate
folosind metode de nregistrare parial, atunci cnd fie c nu cunoatem colectivitatea general, deci nu o putem aborda, fie c volumul de
munc este prea mare i necesit fonduri mari, timp ndelungat, personal numeros, baz material bogat i putem obine aceleai rezultate,
aceleai concluzii, lucrnd numai pe o parte din unitile statistice ce
compun colectivitatea.
Printre metodele de nregistrare parial amintim:
Estimaia este o metod de nregistrare parial care, pe baza
unor sondaje fcute n snul colectivitii generale, luat n studiu, ncearc s caracterizeze, s trag concluzii de ordin general valabil
pentru ntreaga colectivitate.
Exemplul 1. Pentru a cunoate morbiditatea prin HTA ntr-o colectivitate se examineaz prin extragere aleatorie un numr limitat de
cazuri (din toate grupele de vrst, de ambele sexe, de diferite profesii)
reprezentnd un eantion din populaia general, iar rezultatele obinute se vor putea generaliza, estima, n colectivitatea general.
Exemplul 2. Pentru a cunoate starea de morbiditate prin afeciuni
stomatologice la elevii dintr-o colectivitate colar, se examineaz din
punct de vedere stomatologic, prin sondaj, un numr de elevi din fiecare clas a colii respective, iar rezultatele obinute n urma prelucrrii
datelor, investigaiilor de specialitate, sunt generalizate, ca i cnd studiul sau examinarea s-ar fi extins asupra tuturor elevilor din respectiva
colectivitate colar.
De menionat este faptul c eantionul pe care s-a lucrat a trebuit
s fie reprezentativ att sub aspect cantitativ, ct i sub aspect ca-

126

BIOSTATISTICA

litativ, adic al celorlalte atribute ca: sex, grup de vrst, condiii de


alimentaie, de locuin etc. Estimaia, pe baza unor sondaje mai mult
sau mai puin numeroase fcute n colectivitate, aproximeaz frecvena
unor fenomene n snul colectivitii fr a avea pretenia de exactitate
(ea introduce ntotdeauna un risc i o eroare maxim admis). Cu ct
numrul de investigai din eantion este mai mic cu att rezultatele sunt
mai imprecise i cu ct numrul de cazuri din eantion este mai mare,
rezultatele sunt mai exacte.
Metoda eantionului sau selecia este metoda de nregistrare
parial care, pe baza examinrii unei pri reprezentative din punct de
vedere cantitativ (numr cazuri) i calitativ (atribute) din unitile statistice ce compun colectivitatea general, urmrete s caracterizeze ntreaga colectivitate din care a fost extras eantionul. Sub aspect cantitativ eantionul va fi determinat pe baza unor formule matematice ce vor fi
prezentate la capitolul eantionaj, iar sub aspect calitativ variabilele vor
fi stabilite n funcie de natura fenomenelor pe care le cercetm.
Exemplul 1. Pentru a stabili incidena HTA ntr-o colectivitate vom
examina un numr limitat de cazuri, n ceea ce privete TA i diferitele
atribute sau variabile: sex, vrst, domiciliu, profesie, urmrindu-se o
stratificare a acestor cazuri n eantion asemntoare cu stratificarea
din populaia general.
Exemplul 2. Dac ne propunem s cunoatem starea de morbiditate prin afeciuni stomatologice la populaia infantil dintr-un raion, nu
vom proceda la examinarea activ de specialitate a ntregii populaii
infantile, ci vom seleciona colectiviti reprezentative din raion (din mediul urban, din mediul industrial, din mediul rural, cu diferite forme de
relief, cu nivel social-economic diferit, cu obiceiuri culinare specifice, cu
nivel sanitar diferit, de vrste diferite etc.) pe care, examinndu-le din
punct de vedere stomatologic, vom putea stabili aspectele de morbiditate ce caracterizeaz ntreaga populaie infantil din raion.
n anumite situaii, dictate de specificul bolii cercetate, cu afinitate
sau predilecie pentru anumite grupe de vrst, vom lua n studiu numai acele vrste la care maladia respectiv este mai frecvent. Spre
exemplu, dac ne propunem s cunoatem morbiditatea prin afeciuni
parodontale ntr-o colectivitate, eantionul pe care vom lucra nu va cuprinde populaia de toate vrstele ci cu precdere vrstele de 35-40
ani, ntruct incidena mbolnvirilor prin afeciuni parodontale e mai

Metodologia general a cercetrii statistice

127

crescut la aceste vrste, n asemenea situaie spunem c am examinat i nregistrat partea de baz a colectivitii. La fel procedm n
cazul cercetrii morbiditii prin afeciuni cardio-vasculare etc.
Monografia este o metod de nregistrare parial utilizat pentru
studiul unei singure colectiviti (localitate, circumscripie, ntreprindere, coal) sau a unui singur fenomen (demografic, de morbiditate). Ea
urmrete s cunoasc aspectele caracteristice ale colectivitii sau
fenomenului respectiv, fr a le putea generaliza n populaia general.
Fiind o metod descriptiv, monografia se mulumete doar s sesizeze aspectele caracteristice ale colectivitii sau fenomenului fr s le
poat explica.
De exemplu, monografia unei localiti descrie: problemele demografice, nivelul de trai, ocupaia populaiei, nivelul cultural, obiceiurile
culinare ale populaiei, starea de sntate cu evidenierea problemelor
de morbiditate i mortalitate, factorii de risc din colectivitate etc. Ea nu
poate s explice relaia dintre aceste caracteristici ale populaiei din
localitatea respectiv.
Ancheta este o metod de investigaie parial a materialului statistic pe formulare adecvate problemei cercetate, n formularele de anchet
datele se nscriu fie de anchetator, i atunci vorbim de anchet direct,
fie de ctre persoana anchetat, i atunci vorbim de anchet indirect, n
cazul anchetei indirecte exactitatea rspunsurilor depinde de nivelul de
pregtire a celor anchetai. Ancheta de obicei succede monografiei, ncercnd s aprofundeze unele aspecte sesizate de monografie. Fiind o
metod de profunzime, ancheta se limiteaz la colectiviti mai restrnse
(secia unei ntreprinderi, clasa unei coli etc.). n cazul n care ancheta
stabilete rolul negativ al unor factori negativi din colectivitatea respectiv, ea se ncheie cu propuneri de remediere a acestora.
Exemplul 1. Dac n colectivitatea n care s-a ntocmit monografia
a rezultat c HTA este frecvent n snul colectivitii, atunci personalul
medical, fcnd un studiu pe eantion, stabilete cauzele sau factorii
de risc (alimentaie, solicitri la locul de munc, consum de alcool etc.)
i propune msuri concrete care s duc la eliminarea acestora i la
scderea incidenei HTA n colectivitatea respectiv.
Exemplul 2. Dac monografia a scos n relief faptul c populaia
prezint o dantur deficitar, atunci ancheta respectiv caut s stabileasc pe un eantion cauzele acesteia i se ncheie cu recomandarea

128

BIOSTATISTICA

unor msuri concrete privind modul de alimentaie, condiiile de igien


buco-dentar etc.
Mijloace de nregistrare
Adunarea i nregistrarea materialului statistic se face pe anumite formulare statistice numite mijloace de nregistrare. Coninutul mijloacelor de nregistrare trebuie s fie clar, concis i s cuprind toate
caracteristicile unitilor statistice de care avem nevoie n lucrarea pe
care o efectum. Deci coninutul mijloacelor de nregistrare difer de la
o lucrare la alta. El este dictat de scopul i obiectul lucrrii, unitatea statistic aleas i se stabilete odat cu elaborarea programului lucrrii.
Aceste mijloace de nregistrare pot fi:
Certificatele sunt formulare ce servesc pentru nscrierea unei singure uniti statistice, o singur dat. De exemplu: certificatul de natere, buletinul de identitate, certificatul de deces etc.
Fiele servesc la nregistrarea unei singure uniti statistice dar nu
o singur dat ci de mai multe ori, pe perioade de timp mai ndelungate. De exemplu: fia copilului de 0-18 ani, fi de consultaie a adultului,
fi de consultaie stomatologic, fia gravidei sau foaia de observaie
clinic n spitale.
Listele sunt mijloace de nregistrare ce servesc pentru mai multe
uniti statistice. Sunt sinonime cu tabelele. Ele nscriu unitile statistice pe cte un rnd al listei, iar diferitele caracteristici sau variabile ale
unitilor statistice se nscriu o singur dat, n coloane. De exemplu
dac ne propunem s examinm activ din punct de vedere al strii
de sntate elevii dintr-o clas, folosim pentru nscrierea rezultatelor
o list n care se nscriu pe rnduri, nominal, toi elevii examinai, iar
n partea dreapt a fiecrui nume, n coloane, diferite variabile: sex,
vrst, afeciune etc.
Registrele sunt mijloace de nregistrare ce cuprind mai multe liste
de acelai fel. De exemplu registrul de consultaii medicale, de vaccinri, de eviden a gravidelor etc.

3.2. Prelucrarea materialului statistic


Datele adunate sau observate se refer de cele mai multe ori la
fiecare unitate statistic n parte. Pentru a putea caracteriza ns colectivitatea luat n cercetare este necesar s supunem aceste date unei

Metodologia general a cercetrii statistice

129

operaii de prelucrare care const n aranjarea, verificarea, codificarea,


sortarea i gruparea acestora n aa fel nct s permit o prezentare
clar a materialului statistic.
Dup locul n care se efectueaz prelucrarea deosebim:
prelucrarea descentralizat care are loc la nivelul unitilor sanitare
care au efectuat adunarea materialului statistic, iar dup aceea datele prelucrate sunt naintate forurilor superioare interesate n centralizarea datelor provenite de la unitile teritoriale;
prelucrarea centralizat are loc la nivelul forurilor superioare care
iniiaz cercetarea, pe baza formularelor de nregistrare a materialului trimise de unitile teritoriale. Prelucrarea centralizat se face
la nivelul Centrului Naional de Management n Sntate. Acest
mod de prelucrare are avantajul c se execut de ctre specialiti
reuind o mai bun calitate a rezultatelor lucrrii.
Etapa de prelucrare a materialului statistic cunoate mai multe subetape:
Verificarea materialului statistic poate fi:
Verificare cantitativ, care stabilete dac toate formularele de nregistrare sunt completate i dac s-a rspuns la toate rubricile corespunztoare caracteristicilor unitilor statistice prevzute n planul cercetrii. De exemplu dac ne propunem s cercetm morbiditatea ntr-o
colectivitate colar, datele obinute n urma examinrii de specialitate
a elevilor le vom nscrie n fiele de consultaie ntocmite n acest sens.
Fiele astfel completate pentru fiecare elev n parte sunt supuse unei
verificri cantitative care stabilete dac s-au nscris datele la toate caracteristicile elevilor examinai: vrst, sex, domiciliu, afeciuni medicale
(HTA, infecii acute ale cilor respiratorii, boli diareice acute, otite), afeciuni stomatologice (carii dentare, pulpite, gangrene, extracii). Formularele care nu cuprind datele necesare la toate rubricile prevzute sunt
nlturate, neputnd fi supuse operaiei de prelucrare propriu-zis.
Verificarea calitativ urmrete s stabileasc dac datele nscrise n diferitele rubrici sunt exacte. Ea poate fi:
logic cnd urmrete s stabileasc dac nu exist nepotriviri ntre vrst i diagnostic, ntre sex i diagnostic etc. Se ntmpl uneori
ca diagnosticul unui bolnav de sex masculin (ex. Cancer de prostat)
s fie trecut din greeal pe formularul unei femei. Exist programe
speciale de verificare logic a acestor neconcordane pe calculator.

130

BIOSTATISTICA

cifric atunci cnd urmrete s stabileasc dac datele nregistrate corespund realitii. Spre exemplu, pe baza anului naterii se
poate calcula caracteristica de vrst a individului n anul n curs i
verifica astfel concordana acestor date.
Codificarea materialului statistic
Codificarea nu este altceva dect notarea prin cifre (numeric) sau
litere (alfabetic), a diferitelor caracteristici ale unitilor statistice, n
scopul uurrii prelucrrii i interpretrii rezultatelor obinute. Codificarea se folosete de obicei n cadrul lucrrilor de amploare, care cuprind
un numr mare de uniti statistice. Spre exemplu n cadrul cercetrii
morbiditii din teritoriul unui spital se pot codifica cu litere localitile,
iar diagnosticele de boal se codific numeric conform clasificrii i codificrii cauzelor de boal i deces revizia a-X-a OMS pe 999 cauze
de mbolnvire. De exemplu, infarctul miocardic acut are codul 459,
pneumonia viral are codul 506, caria dentar are codul 544 etc.
Sortarea materialului statistic const n repartizarea unitilor
statistice dup caracteristici individuale. Sortarea poate fi fcut manual sau cu ajutorul calculatoarelor electronice, mai ales n lucrrile
mari cnd sunt nscrise mai multe caracteristici ale unitilor statistice
sub forma unor chestionare, sortarea acestor caracteristici fcndu-se
automat cu ajutorul calculatorului.
Centralizarea datelor statistice urmeaz sortrii sau repartizrii
unitilor statistice pe diferite caracteristici. Ea const n nsumarea caracteristicilor statistice i a unitilor statistice. Aceasta se poate face
sub forma unor tabele care s cuprind rubrica total. Centralizarea
poate fi simpl cnd la baza nsumrii st un singur criteriu (ex. centralizarea cazurilor noi de boal dintr-un teritoriu) sau grupat cnd la
baza nsumrii unitilor statistice stau mai multe criterii (ex. centralizarea mbolnvirilor pe sexe, grupe de vrst, cauze de boal etc.).
Gruparea materialului statistic const n aranjarea unitilor statistice, n funcie de diferitele caracteristici sau variabile, n grupe ct
mai omogene, pentru a le putea scoate ct mai uor n eviden. Gruparea este operaia statistic ce permite trecerea de la aspectele particulare, individuale ale unitilor statistice la aspecte generale, comune,
eseniale ale materialului cercetat.
Aa, spre exemplu, dac ne propunem s cercetm morbiditatea
prin HTA sau afeciuni stomatologice ntr-o colectivitate organizat

131

Metodologia general a cercetrii statistice

(coal, instituie), datele obinute n urma examinrii difer de la o


unitate statistic la alta sub aspectul vrstei, sexului, profesiei, strii de
sntate sau boal etc., neputndu-ne permite observarea a ceea ce
este general, comun, caracteristic ntregii colectiviti.
Repartizarea datelor pe diferite variabile: grup de vrst, sex, profesie, stare de sntate sau boal, mod de alimentare permite, n cadrul
gruprii, observarea a ceea ce este general, esenial, oferindu-ne posibilitatea s ntrevedem concluziile ce se degaj n urma studiului efectuat.
Criteriile sau caracteristicile de grupare a materialului statistic depind de scopul urmrit prin cercetarea ntreprins. Este ceea ce afirma
Claude Bernard: Cnd nu tim ceea ce cutm, nu vedem ceea ce
am gsit.
Spre exemplu dac nu cunoatem rolul suprasolicitrii nervoase n
boala hipertensiv i nu stabilim acest criteriu n gruparea bolnavilor,
sau dac nu cunoatem rolul sursei de ap potabil n influenarea
morbiditii n afeciuni stomatologice i nu grupm materialul statistic
i dup acest criteriu, putem trece pe lng o concluzie esenial fr
a o putea sesiza.
Gruparea poate fi simpl cnd la baza repartizrii materialului statistic st un singur criteriu.
Exemplul 1. Gruparea pe sexe a bolnavilor cu HTA (Tab. 32).
Tabelul 32
Numrul de bolnavi cu HTA n funcie de sex
Sex
M
F
TOTAL

Nr. bolnavi cu HTA


30
20
50

Exemplul 2. Repartizarea bolnavilor cu afeciuni stomatologice pe


cauze de boal (Tab.33).
Tabelul 33
Numrul de bolnavi cu afeciuni stomatologice pe cauze de boal
Nr. crt.
1.
2.
3.
4.

Afeciunea
Caria dentar
Pulpit
Gangren
Parodontopatii
TOTAL

Nr. mbolnviri
60
15
8
26
109

132

BIOSTATISTICA

Gruparea poate fi complex cnd la baza repartizrii materialului


statistic stau dou sau mai multe criterii.
Exemplul 3. Distribuia pe sexe i grupe de vrst a bolnavilor cu
HA, n colectivitatea X anul Y(Tab.34).
Tabelul 34
Repartizarea bolnavilor cu HTA n funcie de sex i grupe de vrst
Sex

M
F

0-15
2
3

Grupa de vrst
16-49
8
7

50-90
20
10

Total
30
20
50

Exemplul 4. Distribuia pe cauze i sexe a afeciunilor stomatologice n colectivitatea X anul Y (Tab.35).


Tabelul 35
Repartizarea bolnavilor cu afeciuni stomatologice n funcie de sex
n localitatea X, anul Y
Nr. crt.
1.
2.
3.
4.
5.

Afeciunea
Total
Carie dentar
Pulpit
Gangren
Parodontopatii

Numr mbolnviri pe sexe


Total
M
100
45
60
25
25
17
8
6
16
6

F
55
35
8
2
10

Dup natura caracteristicii gruparea poate fi:


n timp, cnd repartizarea materialului statistic are la baz anumite
intervale de timp, de exemplu pe semestre (semestrul l, semestrul
II) sau pe trimestre etc.
n spaiu, cnd repartizarea materialului statistic se face n raport
cu locul sau teritoriul unde s-a examinat populaia, de exemplu mediu rural i mediu urban.
Limitele gruprii nu se stabilesc mecanic ci depind de natura fenomenului cercetat i scopul lucrrii, n principiu o grupare prea amnunit a materialului statistic duce la o frmiare ce ne mpiedic s
observm ce este caracteristic, esenial. De asemenea dac o caracteristic are prea multe valori vom repartiza materialul statistic pe grupe
de valori care se vor numi intervale de clas. De exemplu, ar fi inutil

133

Metodologia general a cercetrii statistice

cercetarea mortalitii pe ani de vrst, de la 1 la 80 de ani, ntruct


mortalitatea nu difer de la un an de vrst la altul. Dar este important
gruparea deceselor pe grupe de vrst de cte 5 ani sau de cte 10
ani, ntruct fenomenul cercetat mortalitatea general permite unele
interpretri i concluzii n raport cu aceste grupe de vrst.
Fiecare grup de valori sau clas are la rndul ei o limit inferioar, o limit superioar i un centru al clasei egal cu semisuma celor
dou limite.
Exemplul 5. Distribuia pe grupe de valori ale TA a bolnavilor cu
HTA n colectivitatea X anul Y (Tab.36).
Tabelul 36
Repartizarea bolnavilor cu HTA pe grupe de valori ale TA n colectivitatea X anul Y
Nr. crt.
1.
2.
3.

Grupe de valori
TA
160-169,9
170-179,9
180-189,9
TOTAL

Centrul clasei

Frecvena

165
175
185

18
22
10
50

Exemplul 6. Distribuia pe grupe de vrst a bolnavilor cu afeciuni


stomatologice n colectivitatea X anul Y (Tab.37).
Tabelul 37
Repartizarea bolnavilor cu afeciuni stomatologice pe grupe de
vrst n colectivitatea X anul Y
Nr. crt.
1.
2.
3.
4.

Grupe de vrst
0-19
20-39
40-59
60-80
TOTAL

Centrul clasei
10
30
50
70

Frecvena
79
38
42
64
223

De menionat c n cadrul gruprii trebuie s cunoatem exact valorile extreme maxim i minim ale caracteristicii i trebuie s
stabilim intervale de clas egale iar limitele intervalelor sau claselor s
fie distincte pentru a nu crea confuzii cu ocazia repartizrii materialului statistic. De exemplu, dac dorim s distribuim elevii unei clase pe
grupe de nlimi vom stabili nlimea maxim i minim a elevilor din
clasa respectiv iar n interiorul intervalului respectiv vom delimita, la

134

BIOSTATISTICA

intervale egale, grupe de valori ale nlimii. Cel mai scund elev, avnd
nlimea de 150 cm i cel mai nalt de 170 cm, n interiorul acestor
valori extreme vom stabili grupe de valori ale nlimii din 5 n 5 cm,
limitele grupelor de nlime fiind i ele distincte.
Exemplul 7. Distribuia pe grupe de nlimi a elevilor din clasa X
n anul Y (Tab.38).
Tabelul 38
Repartizarea elevilor pe grupe de nlimi din clasa X n anul Y
Nr.crt.
1.
2.
3.
4.

Grupe de nlime cm
150-154,9
155-159,9
160-164,9
165-169,9
TOTAL

Numr elevi
4
12
18
9
43

Elaborarea indicatorilor
Gruparea de obicei cuprinde cifre brute, valori absolute, care rareori pot fi interpretate ca atare. De aceea materialul statistic este supus
n continuare unei prelucrri cu ajutorul metodelor de statistic matematic n vederea obinerii unor indicatori statistici ca: mrimi medii,
mrimi relative, indici etc., ce vor permite aprecieri comparative, corecte i concluzii semnificative.

3.3. Eantionarea
Prin eantionare (eantionaj) nelegem totalitatea tehnicilor i procedeelor statistice cu ajutorul crora se poate caracteriza o colectivitate
(N) studiind o parte a acesteia. Se va studia un numr limitat de cazuri
(n), care vor fi extrase aleator, ntmpltor, din ntreaga colectivitate.
Elementele efectiv studiate constituie eantionul sau mostra;
populaia din care provine eantionul poart numele de colectivitate
general sau univers, baz de sondaj. Elementele individuale extrase din colectivitatea general, la care se studiaz caracteristicile sau
nsuirile, i care compun eantionul, se numesc uniti de selecie.
Scopul unui astfel de studiu pe eantion este de a nu studia ntreaga colectivitate general, ci o copie de dimensiuni mai mici a acesteia, iar caracteristicile obinute pe eantion s poat fi extrapolate cu o
anumit probabilitate asupra populaiei generale. Aceast probabilitate
(P) poate fi de 90%, 95%, 99%, dar niciodat de 100%, deci presupune

Metodologia general a cercetrii statistice

135

asumarea unui risc ( = 100-P) n efectuarea studiului, n biologie se lucreaz de obicei cu o probabilitate de 95%, deci cu un risc de 5%.
Dou condiii trebuie asigurate n vederea unui studiu pe un eantion: reprezentativitatea eantionului i precizia studiului.
Reprezentativitatea
Este asigurat de alegerea aleatoare, ntmpltoare, a unitilor
de selecie din baza de sondaj (univers), astfel nct fiecare din elementele colectivitii generale (univers) s aib aceeai ans de a fi
cuprinse n eantion. Prin aceast alegere aleatoare se va reproduce
populaia general la nivel de eantion cu anumite erori. Aceste erori
se numesc erori aleatoare i ele pot fi msurate i controlate de
cercettor. Nerespectarea acestei condiii de extragere ntmpltoare
a unitilor de selecie din baza de sondaj, din colectivitatea general,
duce la apariia unui alt tip de erori, i anume erori sistematice (biais), care sunt imposibil de determinat de ctre cercettor. De exemplu: un studiu experimental pentru verificarea unui nou medicament,
efectuat pe persoane care se prezint voluntar, va introduce astfel de
erori sistematice, pentru c acestea sunt persoane cu structuri psihice
modificate sau sufer de boala pentru care se testeaz medicamentul,
deci nu vor putea reprezenta trsturile colectivitii generale. De asemenea, un studiu efectuat asupra morbiditii printr-o afeciune ntr-o
secie clinic a unui spital nu poate reproduce structura morbiditii la
nivelul unui raion sau al rii. Deci ele nu pot constitui eantioane reprezentative pentru teritoriul respectiv.
Precizia
Se refer la volumul eantionului. Aceasta presupune determinarea
unui numr (n) minim de cazuri necesare pentru constituirea eantionului. Pentru determinarea acestuia, s presupunem c pornim de la o
colectivitate general, baz de sondaj, univers, care are un volum de
N cazuri i este caracterizat de indicatorul central (media ) i de dispersie (deviaie standard x). Din aceast populaie general extragem
aleator un eantion de volum n1 i care va putea fi caracterizat de media
, i abaterea standard 1. Din populaia general pot fi extrase i un
al doilea eantion, de volum n2 i caracterizat de media
i abaterea
standard 2; al treilea eantion, de volum n3 i caracterizat prin media

136

BIOSTATISTICA

i abaterea standard 3; .a.m.d. Mediile eantioanelor ( , ,


, ...) extrase din populaia general se vor comporta ca nite variabile
aleatoare i se vor distribui n stnga i n dreapta mediei populaiei
generale. Comparnd media primului eantion , cu media populaiei
generale , se observ c ntre acestea exist o anumit diferen sau
eroare, care poart numele de eroare maxim admis i se noteaz cu
x. Se poate scrie deci relaia:
= x
unde:
= media populaiei generale:
= media eantionului l;
x = eroarea maxim admis.
Aceasta eroare maxim admis (x) depinde de:
un coeficient de probabilitate t, n funcie de riscul existent n
studiu (exemplu: 5%) sau probabilitatea (P = 1-) cu care vom garanta rezultatele (P = 95% pentru = 5%);
abaterea standard n populaia general (x);
numrul de cazuri coninut n eantioane (n).
Deci:

Introducnd n formula anterioar, se poate scrie:

Aceasta presupune, de altfel, c pentru un risc cu care proiectm sondajul, media populaiei generale se va situa ntr-un anumit
interval, numit interval de ncredere.
Numrul minim de cazuri necesar unui studiu pentru a nregistra o
eroare inferioar sau cel mult egal celei standard se va calcula conform uneia dintre formulele urmtoare:
pentru caracteristici cantitative:

Metodologia general a cercetrii statistice

137

pentru caracteristici calitative:

De exemplu, pentru studiul unei afeciuni, boli, n populaie, P poate


fi reprezentat de prevalen (%) bolii n populaia general.
Dac n colectivitatea noastr, pe care am efectuat studiul, probabilitatea hipertensiunii arteriale a fost de 17%, dorind ca aceast probabilitate s o generalizm la un risc de =5% i x=0,8%, atunci numrul
de persoane ce vor trebui examinate va fi:

Sau, dac ne propunem s generalizm incidena de 98% a afeciunilor stomatologice, cu un prag de semnificaie de 5% i o eroare
maxim de 1%, stabilit pe un lot de populaie, atunci volumul eantionului va fi:

Formulele de calcul al volumului eantionului, de mai sus, se refer


la selecia simpl cu repetiie, deci n care, dup extragere, fiecare unitate este reintrodus n colectivitatea general.
Pentru selecia simpl fr repetiie se folosete formula:

Pentru selecia cu stratificare se folosete formula:

n care N = mrimea colectivitii generale.


Pentru a caracteriza fenomenele biologice sau medicale, sub aspectul legitilor care stau la baza producerii sau influenrii lor, din
motivele amintite, nu facem cercetri sau observaii pe univers, adic

138

BIOSTATISTICA

pe ntreaga populaie, pe colectivitatea general, ci pe pri reprezentative din colectivitate, din populaie, pe eantioane.
Aprecierea reprezentativitii eantionului sub aspect calitativ, sub
aspectul omogenitii deci, am vzut c se face cu ajutorul deviaiei
standard, respectiv al coeficientului de variaie. Aprecierea reprezentativitii eantionului sub aspect cantitativ, sub aspectul numrului de
frecvene sau de uniti statistice, pe care fcnd cercetarea s putem
generaliza rezultatele, se face cu ajutorul unor formule matematice pe
care le vom prezenta n continuare.
Alegerea prii din populaie sau din colectivitatea general reprezentativ din punct de vedere calitativ i cantitativ pe care fcnd
observaia sau efectund cercetarea s putem ajunge la rezultate sau
concluzii similare cu cele obinute pe ntreaga colectivitate, se numete
eantionare.
METODE DE EANTIONARE
Alegerea frecvenelor sau unitilor statistice care alctuiesc eantionul trebuie fcut de aa manier, nct aceasta s ofere anse egale de selecionare tuturor unitilor, prile componente ale colectivitii
generale s fie proporional reprezentate, iar eantionul analog cu
ntregul s reflecte toate caracteristicile, atributele i aspectele colectivitii generale (populaiei).
Alegerea poate fi:
- ntmpltoare cnd alegerea unitilor statistice se efectueaz prin
tragere la sori. n asemenea selecii trebuie asigurate anse egale
fiecrei uniti a colectivitii generale de a fi selecionate.
- Mecanic atunci cnd selecia unitilor statistice se face respectnd un anumit criteriu. Spre exemplu, de pe o anumit list n care
unitile statistice ale colectivitii au fost nscrise ntr-o anumit ordine (alfabetic, vrst, localitate etc.), se aleg unitile statistice
ale eantionului din 5 n 5 sau din 10 n 10 uniti:
- Stratificat atunci cnd extragerea unitilor statistice se face pe
grupe omogene (straturi) ce reflect ntocmai structura pe aceleai
grupe ale colectivitii generale. Spre exemplu, dac colectivitatea
general este reprezentat de 65% aduli, 25% copii i 10% btrni, atunci i eantionul ales din colectivitatea general s aib
proporional aceeai structur pe grupe de vrst a populaiei.

Metodologia general a cercetrii statistice

139

Tipuri de eantionare
n funcie de natura schemelor de eantionaj abordate putem s clasificm eantionajele n eantionaje aleatoare i nealeatoare sau empirice.
Din categoria eantionajelor aleatoare fac parte:
- eantionaje simple (elementare)
- eantionaje stratificate
- eantionaje n grupuri
- eantionaje n trepte (faze)
- eantionaje multifazice.
n ceea ce privete eantionajul simplu (elementar), procedeul
const n extragerea la sori a unitilor care vor compune eantionul
(n general identice cu unitile de selecie din populaie) din baza de
sondaj; procedeul presupune deci existena bazei de sondaj, adic o
list sau un fiier din care se extrag, ntr-o manier aleatorie, unitile
de selecie. Baza de sondaj poate fi o list a tuturor nscuilor vii, a
femeilor nsrcinate din ar sau dintr-un anumit teritoriu, o list a tuturor persoanelor spitalizate, o list a tuturor raioanelor, a comunelor, a
familiilor dintr-un teritoriu etc.
Eantionajul stratificat se utilizeaz cnd n interiorul populaiei de
referin unitile statistice se gsesc plasate pe categorii. Fiecare categorie este omogen din punct de vedere al coninutului intern, dar categoriile difer ntre ele. Aa este cazul populaiilor clasate dup caracteristicile vrst, mediu de provenien, diagnostic al bolnavilor externai,
clasai pe secii sau grupuri de boli etc. Se adopt n acest caz o selecie
proporional cu volumul stratului sau cu volumul optim cnd din unele
straturi mai puin reprezentate se ia un numr sporit de uniti.
Dac unitile statistice se gsesc plasate n grupuri asemntoare,
fiecare grup n parte avnd ns o compoziie eterogen (cazul familiei,
gospodriei, dispensarului medical etc.) se consider ca unitate de selecie grupul (familia, respectiv gospodria) i nu individul, nregistrarea
ulterioar a eantionului beneficiind de un plus de operativitate i precizie, comparativ cu selecia simpl a unitilor individuale.
Eantionajul n grupuri este un procedeu folosit cnd lipsete
baza de sondaj iar constituirea ei este dificil i foarte costisitoare i n
sfrit cnd dispersia teritorial a populaiei de investigat este exagerat. Se pornete de la faptul c populaia de studiat poate fi imaginar
ca fiind constituit din uniti de selecie ierarhizate.

140

BIOSTATISTICA

De exemplu nscuii vii sau gravidele aparin la familii, acestea


aparin la o colectivitate care poate fi definit (cartier, comun) care la
rndul lor aparin la orae sau raioane n cadrul unei ri.
Eantionajul n trepte, este un procedeu n care unitile de selecie sunt ierarhizate ca n cadrul eantionajului n grupuri, diferena
constnd n faptul c n timp ce n cadrul cuiburilor se realizeaz o
singur extragere aleatorie, n eantionajul n trepte se efectueaz mai
multe trageri la sori.
Astfel, n exemplu, ara-raioane-comune-familie-noi nscui, urmtoarele extrageri sunt posibile: sondajul de gradul l raioane, rezultnd raioane selecionate, sondajul de gradul II comune, rezultnd
comune selecionate la prima extragere, sondajul de gradul III familii,
rezultnd familii selectate din comunele alese n selecia n treapta a
II-a. Familiile selectate constituie o baz de sondaj, din care se va face
o nou selecie, faza a IV-a, aceasta fiind eantionul de investigat efectiv. Este recomandabil a se evita realizarea unui numr prea mare de
extrageri pentru ca n eantionajul cu mai multe faze, fiecare operaie
de extragere antreneaz o eroare de eantionaj. n exemplul descris
mai sus, se observ c mai multe baze de sondaj sunt necesare pentru
fiecare faz dar se evit necesitatea existenei unei liste a tuturor unitilor de observare pentru ara ntreag, de exemplu.
Eantionajul multifazic este un procedeu care combin metodele
anterior prezentate. El const n formarea unui eantion primar pentru
a obine informaii cu caracter general urmat de constituirea unuia sau
mai multor eantioane din eantionul primar pentru a obine informaii
suplimentare, mai specifice. Exist i alte metode empirice de eantionaj, mai mult sau mai puin utilizate, care au unele faciliti demne de
avut n vedere, dar avnd o valoare tiinific mai redus, vor fi numai
menionate. Este vorba de:
metoda cotelor prin care se cere fiecrui investigator numrul i
caracteristicile persoanelor care trebuie s fie intervievate
metoda eantioanelor fixe prin care se colecteaz periodic o
serie de date din acelai eantion
metoda eantioanelor tipice unde se consider, de exemplu, c
o localitate este reprezentativ pentru situaia zonei.
Determinarea efectivelor unui eantion
Tehnicile de determinare a efectivelor eantioanelor pot fi complicate n cadrul unor tipuri de eantionaj. n aceste situaii se poate recurge

Metodologia general a cercetrii statistice

141

la 2 soluii. Prima const n utilizarea din plin a echipei de informaticieni


mpreun cu tehnica de calcul din dotare, iar cea de-a doua se adreseaz la o serie de tabele prefabricate care dau pentru diferite tipuri de
eantionaj, mrimea eantionului de studiu deja calculat, din literatura
de specialitate.
Dac baza de sondaj exist sau poate fi constituit i dispunerea
unitilor de observare n baz este ntmpltoare exist 3 modaliti
de alegere aleatorie:
procedeul tragerii la sori cu/far restituire
procedeul tabelelor de nr. ntmpltoare
procedeul pasului mecanic.
n condiiile prezentate mai sus i n funcie de tipul caracteristicii
cel mai puin dispersat (ct mai omogen), volumul minim al eantionului poate fi calculat prin formulele prezentate n Tab.39.
Tabelul 39.
Calculul volumului eantionului
Nr.
Tip de
crt. eantionaj
1.

Simplu cu
repetiie

2.

Simplu
fr
repetiie

3.

Stratif.
proporional

4.

Stratif.
cu volum
optim

Volumul eantionului
Caract. cantitativ*
Caract. calitativ

_________________________________

* Dac sunt necesare eantioanele de volume mai mari de 30 uniti de observare, n locul coeficientului tay, se folosete U pentru care:
U0,05= 1,96; U0,01= 2,57; U0,001=3,29

142

BIOSTATISTICA

Notaiile din tabelul 39 au semnificaiile urmtoare:


n = volumul eantionului
N = volumul populaiei de referin
N1 = volumul stratului j; l j k
Sx (j) = abaterea standard a caracteristicii n populaie, respectiv n
stratul j; l j k
p (pj) = proporia caracteristicii
x (p) = eroarea maxim limit acceptat
t = coeficient ce caracterizeaz distribuia lui Student, pentru riscul
dat i = grade de libertate.
Aplicarea formulelor de determinare a volumului eantionului din
tabelul nr. 39, necesit unele judeci i anume: se pornete de la dorina oricrui investigator ca volumul eantionului s fie optim nelegnd prin aceasta c acest volum s nu fie nici prea mare, nici prea
mic. Se tie c:
un eantion prea voluminos are, n general, o precizie bun,
dar poate fi foarte costisitor sub aspect financiar, al timpului, al
personalului etc.
un eantion de volum prea mic este mai eficient sub aspect
economic dar poate conduce la rezultate cu o precizie mic, pe
care nu le putem accepta; de aici n orice problem de calcul al
volumului eantionului este nevoie de un compromis.
Analiznd prima formul din tabelul 39, corespunztoare unui eantionaj simplu cu repetiie, se vede c dimensionarea volumului eantionului depinde de variabilitatea caracteristicii studiate (exprimat prin
varianta Sx2), de precizia dorit (exprimat prin mrimea intervalului
de ncredere x) ct i prin riscul acceptat n estimare (exprimat prin
valoarea coeficientului t).
n ceea ce privete variabilitatea, aceasta nu poate fi influenat
pentru c ine de natura nsi a fenomenului biologic studiat; privind
riscul acceptat n estimare () n orice studiu din domeniul biologicului
sau al cercetrii medicale se ia invariabil =0,05 i atunci pentru dimensionarea optim a volumului eantionului (realizarea compromisului) s-au adus unele modificri, acceptate n practic, privind eroarea maxim ca msur a preciziei estimrii parametrilor din populaie
prin parametrii corespunztori din eantion.

143

Metodologia general a cercetrii statistice

Prezentm n continuare n Tab.40 diferite variante obinute pentru


valori ale erorii maxime, meninnd constante att variabilitatea fenomenului ct i probabilitatea (riscul ) de garantare a afirmaiilor.
Tabelul 40
Dimensionarea volumului eantionului n funcie de eroarea acceptat
Nr. crt.
1.
2.
3.
4.
5.
6.

Eroarea maxim
(P)
0,05
0,06
0,07
0,08
0,09
0,10

p2=p(1-p)

Risc ()

Volumul eantionului

0,4x0,6
0,4x0,6
0,4x0,6
0,4x0,6
0,4x0,6
0,4x0,6

0,05
0,05
0,05
0,05
0,05
0,05

369
256
188
144
114
92

Datele din Tab. 40 se refer la o caracteristic de tip calitativ, de


genul bolnav-sntos, alimentat, corespunztor-nealimentat, masculin-feminin etc.
Dup cum a fost menionat, cnd baza de sondaj nu exist i populaia este organizat n uniti ierarhizate, pentru evaluarea volumului
eantionului pot fi folosite o serie de tabele din literatura de specialitate
care prezint numrul minim de grupuri ce trebuie selectate n funcie
de diverse proporii ateptate i de volumul populaiei de referin.
Exemplificm n Tab. 41 evaluarea numrului de grupuri necesare,
pentru o eroare maxim ateptat de 0,05; calculele fiind datorate lui
W. Lutz, 1982. (Calculele sunt efectuate pe baza formulei corespunztoare unui eantionaj simplu cu repetiie).
Exemplul l. Eantion pentru populaie.
Se dorete realizarea unui eantion de populaie reprezentativ la
nivel naional, necesar pentru efectuarea aceluiai studiu privind opiniile n legtur cu serviciile sanitare din Moldova n rndul beneficiarilor
de servicii de sntate.
Pentru realizarea acestui obiectiv pot fi parcurse urmtoarele etape:
- aa cum s-a menionat i n cadrul eantionajului pentru medici,
teritoriul rii a fost mprit n 3 zone considerate tipice din punct de
vedere geografic i al tradiiilor de existen ale populaiei;
- din aceste zone pot fi alese, prin tragere la sori, 9 raioane plus
municipiul Chiinu;

144

BIOSTATISTICA

se va adopta ca fraciune de eantionaj, valoarea de 5 0/0000 ceea ce


a condus la un efectiv total minim al eantionului de 1200 persoane; acest efectiv poate fi confirmat printr-un calcul de determinare
a volumului eantionului pentru o precizie de 3% i o probabilitate
de lucru de 95% (=0,05);
eantionul total poate fi distribuit la nivelul celor 9 raioane revenind
n medie pentru fiecare raion selectat n jur de 120 persoane; pentru municipiul Chiinu se va lua un numr mai mare de persoane;
la nivelul fiecrui raion se va avea n vedere distribuia aproximativ
egal a populaiei n mediul urban i rural; aceasta nseamn c
din totalitatea strzilor i/sau comunelor trebuie selectate strzile i
comunele care vor intra n eantion;
pentru obinerea celor aproximativ 60 de persoane din mediul urban
i 60 din mediul rural, la nivelul fiecrui raion selectat, sunt suficiente selectarea a 3 strzi i 3 comune, iar din fiecare strad/comun
selectat vor fi alese la ntmplare prin metoda pasului mecanic sau
prin folosirea unui tabel cu numere ntmpltoare, cate 10 familii;
din familiile selectate, att din mediul urban ct i rural, operatorul
de interviu va consemna datele din fia de anchet pentru toate
persoanele sau numai pentru persoanele adulte;
prin nsumarea datelor se obine eantionul pentru copii, aduli,
vrstnici, pe medii, la nivelul fiecrui raion iar n final eantionul la
nivel naional.

Dac aceste inconveniente nu ntotdeauna sunt prezentate, se pot


imagina i alte scheme de selecie adecvate n care principiul aleatorului se poate mbina cu principiul seleciei dirijate sau al metodei cotelor
cu unele avantaje practice, demne de luat n seam.

145

Metodologia general a cercetrii statistice

Tabelul 41
Volumul eantionului pentru sondaj n grupuri*
Nr. total
de grupe 0,05
formate
400
26
400
25
300
25
250
24
200
24
150
23
100
22
90
21
80
20
70
20
60
19
50
18
40
16
35
15
30
14
25
13
20
12
15
10
10
8

0,1

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

24
24
23
23
23
22
20
20
19
19
18
17
16
15
14
13
12
10
8

23
22
22
22
21
21
19
19
18
18
17
16
15
14
13
12
11
9
7

21
21
21
20
20
19
18
18
17
17
16
15
14
14
13
12
11
9
7

20
19
19
19
19
18
17
17
16
16
15
15
14
13
12
11
10
9
7

18
18
18
17
17
17
16
16
15
15
14
14
13
12
12
11
10
9
7

17
17
16
16
16
16
15
15
14
14
14
13
12
12
11
10
10
9
7

15
15
15
15
15
14
14
14
13
13
13
12
12
11
11
10
9
8
7

14
14
14
14
13
13
13
12
12
12
12
11
11
10
10
9
9
8
6

13
13
12
12
12
12
12
11
11
11
11
10
10
10
9
9
8
7
6

Deci, colectivitile dinamice sunt formate din fluxuri de evenimente.


Pentru o nelegere clar a relaiei dintre colectivitile statice i cele
dinamice trebuie subliniat faptul c n ambele cazuri exist o mulime
de elemente variabile; n cazul colectivitilor statice timpul i forma organizatoric sunt constante, iar n cazul celor dinamice, spaiul i forma
organizatoric sunt constante.
Unitile statistice reprezint elementele constitutive ale colectivitilor. Ca i colectivitile, unitile pot fi separate n statice i dinamice,
n cazul celor statice unitile compun efectivul (de persoane, de bolnavi etc.). n cazul unitilor din colectivitile dinamice, unitile aparin
aceleiai structuri organizatorice, dar n condiii diferite de timp.
* Dup W. Lutz Sampling: how to select people hauseholds places to study community health, I.E.A., 1982.

146

BIOSTATISTICA

Unitile statistice pot fi simple i complexe. Cele simple sunt elementele constitutive ale colectivitii (persoana, bolnavul etc.), iar cele
complexe sunt rezultatul organizrii sociale i economice a colectivitii
(familia, echipa, secia, anul de studiu etc.). Unitile statistice sunt uniti independente care pot fi studiate separat, pe subcolectiviti sau pe
ntreaga colectivitate.
Unitile colectivitii pentru care se culeg date n procesul cunoaterii se deosebesc de unitile de raportare, ce pot fi, de exemplu, instituii i altele, care potrivit legislaiei n vigoare informeaz sistematic
asupra activitii unitilor aflate n structura lor organizatoric. Unitile
sunt purttoare ale unor trsturi variabile n timp i spaiu.
Caracteristicile statistice, denumite i variabile statistice, reprezint
criteriile pe baza crora se caracterizeaz unitile colectivitii. Aceste
criterii pot fi nsuiri sau trsturi ale unitilor care definesc i delimiteaz ntre ele unitile colectivitii i care urmeaz s fie nregistrate.
Formele concrete de manifestare ale caracteristicilor la nivelul fiecrei
uniti a colectivitii se numesc variante sau valori.
Caracteristicile statistice se difereniaz dup mai multe criterii.
Dup coninutul lor pot fi: de timp, de spaiu i atributive.
Caracteristicile de timp arat apartenena unitilor la un moment
sau o perioad de timp.
Caracteristicile de spaiu arat situarea n teritoriu a unitii. Se exprim prin cuvinte pe baza unui nomenclator al unitilor teritoriale.
Toate celelalte sunt caracteristici atributive i servesc pentru definirea fenomenelor studiate.
Dup modul de exprimare, ele se separ n: caracteristici calitative
(exprimate prin cuvinte) i caracteristici cantitative (exprimate numeric), de exemplu, profesia i vrsta.
Dup natura variaiei, cele numerice se mpart n caracteristici cu
variaie continu i cu variaie discontinu sau discret. Cele cu variaie continu, de exemplu, vrsta, care poate lua orice valoare ntr-un
interval dat i numrul de copii, ca variabil discret ce dimensioneaz
familiile i care nu poate lua dect valori strict determinate n intervalul
de valori nregistrate la un moment dat. De reinut c, n statisticile
practice toate variabilele numerice se nregistreaz ca variabile discrete, de exemplu, vrsta n ani mplinii.
Dup modul de manifestare la nivelul unitilor simple pot fi alternative manifestarea direct sau opus ei, de exemplu, urban-rural i

Metodologia general a cercetrii statistice

147

nealternative cu variante distincte numerice sau calitative, de exemplu, salariile i profesia.


Dup modul de obinere i folosire a datelor pot fi primare obinute n procesul de culegere a datelor i cu care se caracterizeaz nivelul
de dezvoltare atins de unitile simple i complexe i caracteristici derivate obinute prin aplicarea unui model de calcul.
Datele statistice sunt caracterizri numerice ale unitilor, grupelor
i colectivitii, obinute din observare i prelucrare. n statistic, datele
sunt ntotdeauna mrimi concrete, caracterizate printr-o parte noional care definete coninutul calitativ, valoarea numeric i elementele
de cuantificare (de timp, de spaiu etc.).
Mesajul datelor l reprezint informaia. Datele ce caracterizeaz
un fenomen sau proces economic sau social ce se repet cu regularitate se numesc indicatori statistici.
Indicatorii statistici reprezint expresia numeric a unei determinri
calitative obiective, obinut n urma efecturii unei cercetri statistice
raportat la condiii specifice de timp, spaiu i organizatorice.
Indicatorul statistic exprim de regul, numeric, o categorie economic, medical etc.
Exprimarea numeric a unei categorii presupune folosirea mai multor indicatori, fiecare punnd n eviden anumite aspecte eseniale ale
acesteia.

3.4. Prezentarea materialului statistic


Prezentarea materialul statistic se poate face cu ajutorul tabelelor
i cu ajutorul reprezentrilor grafice.
3.4.1. Prezentarea prin tabele
Prezentarea prin tabele constituie o metod comod, sintetic i
sistematic:
comod, pentru c rezultatele cercetrii sunt redate sub forma
unor date cifrice, permind observarea cu uurin a aspectelor
principale ale problemei cercetate;
sintetic, pentru c datele cifrice redau aspectele eseniale ale fenomenului studiat;
sistematic, pentru c ntre diferitele date cantitative sau calitative
prezentate n tabel, exist o nlnuire logic uurnd nelegerea lor.

148

BIOSTATISTICA

Pentru ca un tabel s corespund cerinelor, el trebuie s ndeplineasc urmtoarele cerine:


S aib un titlu care, printr-o fraz clar, s redea coninutul tabelului, locul i perioada de timp la care se refer, ca i modul n care
au fost obinute datele. Datele titlului tabelului trebuie s rspund la 4
ntrebri: ce, unde, cnd, cum? Ce cuprinde tabelul, unde s-a efectuat
cercetarea, cnd s-a efectuat cercetarea i cum au fost obinute datele
la ntrebarea cum se rspunde de obicei printr-un asterix sub macheta tabelului.
Exemplul 1. Distribuia pe sexe i grupe de valori ale HTA a bolnavilor cu HTA din localitatea X n anul Y (Tab. 42).
Tabelul 42
Repartizarea pe sexe i grupe de valori ale TA a bolnavilor cu HTA
din localitatea X n anul Y
Nr.
crt.
1.
2.
3.

Sex
Total
F.
M.

Total
50
32
18

160-169,9
28
20
8

Grupe de valori TA
170-179,9
180-189,9
15
7
8
4
7
3

200-209,9
...
-

Exemplul 2. Distribuia pe cauze, grupe de vrst i sex a mbolnvirilor stomatologice a elevilor liceului X anul Y (Tab.43).
Tabelul 43
Repartizarea pe cauze, grupe de vrst i sex a mbolnvirilor stomatologice
a elevilor liceului X anul Y
Numr elevi
Nr.
crt.
1.
2.
3.
4.

Afeciunea

Caria simpl
Pulpit
Gangrena
Extracii
Total

Total
118
15
4
18
155

Grupe de
vrst
Sexul
M
F
54
64
7
8
3
1
10
8
74
81

15-16

17-18

19-20

Sexul
M
F
20
24
3
4
1
5
2
28
31

Sexul
M
F
18
21
3
2
2
1
3
24
26

Sexul
M
F
16
10
1
2
1
4
3
22
24

Rndurile i coloanele tabelului trebuie s fie logic aezate i s


fie notate corespunztor coninutului acestora. Spre exemplu, n tabelul 43 grupele de vrst ca i grupele de afeciuni sunt aezate ntr-o

Metodologia general a cercetrii statistice

149

ordine logic: crescnd la grupele de vrst i n ordinea gravitii (de


la caria simpl la extracii), n cazul grupelor de afeciuni.
Totalurile n tabelele statistice se nscriu de obicei n primul rnd i
n prima coloan, n tabelele matematice totalurile se nscriu n ultimul
rnd i n ultima coloan, n statistic ns avem uneori situaii n care
tabelele sunt extinse depind dimensiunile att n lungime ct i n
lime. Dac am nscrie totalurile n ultimul rnd i n ultima coloan a
tabelului am putea observa mai greu cror caracteristici le corespund
aceste totaluri.
Atunci cnd nu dispunem de datele necesare pentru a le nscrie n
csuele tabelului se trage o linie orizontal, semn al inexistenei datelor respective, iar atunci cnd nu cunoatem datele necesare nscrierii
ntr-o csu a tabelului, dei ele exist, acest lucru se exprim prin
cteva puncte succesive.
TIPURILE DE TABELE STATISTICE
Exist n general o mare diversitate de tabele statistice, de la cele
mai simple, care au la baz un singur criteriu de clasificare, pn la
cele mai complexe, avnd la baz mai multe caracteristici, depinznd
att de natura materialului cercetat ct i de ingeniozitatea celui care le
ntocmete. Este recomandabil ns s nu uitm lucrul cel mai important i anume faptul c tabelul trebuie s redea cu uurin esenialul.
n scop didactic am mprit tabelele n 3 tipuri:
tabele pentru clasificare dichotomic;
tabele pentru distribuia de frecvene;
tabele de corelaie.
Tabelele pentru clasificarea dichotomic le utilizm n situaia n
care cercetm fenomene care se caracterizeaz prin nsuiri sau caracteristici diametral opuse, excluzndu-se unul pe altul. A dichotomiza, n limba greac, nseamn a divide, a mpri n dou. Spre exemplu, populaia unei colectiviti, distribuit sau repartizat pe sexe, se
mparte n dou pri: de sex masculin i de sex feminin; dup starea
de sntate populaia poate fi sntoas sau bolnav; dup mediu se
poate mpri n populaie rural i urban; dup reacia la tuberculin
(IDR) poate fi pozitiv sau negativ la tuberculin etc.
Exemplul 1. Distribuia elevilor din colectivitatea X n anul Y pe sexe,
locul de domiciliu i prezena sau absena cariei dentare (Tab. 44).

150

BIOSTATISTICA

Tabelul 44
Distribuia elevilor pe sexe, locul de domiciliu i prezena sau absena cariei dentare
din colectivitatea X n anul Y
TOTAL

Sex

Domiciliu
R

200

100

150

50

300

500
F

200

Carii dentare
P
A
P
A
P
A
P
A

150
50
60
40
100
50
30
20

n cazul utilizrii unei astfel de prezentri nu trebuie s admitem


mai mult de dou, maxim trei dichotomizri, ntruct prin supraaglomerare ele devin confuze, greu de urmrit i interpretat.
Tabele pentru distribuia de frecvene le utilizm atunci cnd dorim s prezentm n tabele rezultatele gruprii dup anumite criterii.
Tabele de corelaie le folosim pentru evidenierea corelaiei dintre
dou fenomene ntre care n mod logic exist o legtur de dependen. Aceste tabele se caracterizeaz prin aceea c au dou variabile:
una determinant (factorial) i cealalt determinat (rezultant), n
cazul tabelului de corelaie valorile nscrise n csuele tabelului corespund n acelai timp unei anumite grupe de valori a primului fenomen
determinant i unei anumite grupe de valori a celui de-al doilea fenomen determinat de primul. Ca atare cele dou variabile ale tabelului de
corelaie trebuie s fie mprite ntr-un numr egal de grupe de valori
pentru ca ele s se coreleze perechi.
Exemplul 2. ncercnd s stabilim dac ntre vrsta bolnavilor hipertensivi i valorile TA exist sau nu o legtur de dependen, utilizm un astfel de tabel de corelaie n care una din variabile (factorial)
este reprezentat de grupa de vrst, iar cealalt (determinat sau
rezultant) este reprezentat de grupele de valori ale TA (Tab. 45).

151

Metodologia general a cercetrii statistice

Tabelul 45
Distribuia bolnavilor hipertensivi n raport cu grupa de vrst i valorile TA
Grupe de vrst
40-44
45-47
50-54
55-59

Valori TA
170-179,9
180-189,9

160-169,9
5

190-199,9

10
15
20

Se observ o legtur strns ntre creterea valorilor TA i naintarea n vrst, legtur care va fi msurat printr-un coeficient de
corelaie, care va fi studiat la capitolul respectiv.
Exemplul 3. Dac dorim s stabilim ntr-o colectivitate dac ntre
vrst i parodontopatie exist o legtur de dependen sau nu, utilizm un astfel de tabel de corelaie n care una din variabile (factorial)
este reprezentat de grupele de vrst, iar cealalt variabil (determinat sau rezultant) este reprezentat de valori sau frecvene ale
dinilor afectai (Tab. 46).
Tabelul 46
Corelaia ntre grupele de vrst i numrul de dini afectai
Grupa de vrst
40-44
45-49
50-54
55-59
60-64
65-69

1-3
2

4-6

Nr. dini cu parodontit


7-9
10-12
13-15

16-19

3
8
12
25
50

Distribuia frecvenelor n raport cu grupele de vrst i numrul de


dini afectai de parodontopatie reliefeaz faptul c ntre cele dou fenomene exist o legtur strns i direct de dependent ntruct pe
msura naintrii n vrst numrul dinilor afectai este mai mare.
3.4.2. Reprezentarea grafic a materialului statistic
Tabelele, dei redau foarte exact aspecte cantitative ale unui fenomen cercetat, fiind n acelai timp sintetice i sistematice, necesit
totui o anumit pregtire de specialitate pentru a putea fi urmrite i

152

BIOSTATISTICA

nelese. Ca atare ele pot fi utilizate n lucrri de cercetare tiinific


prezentate sub form de articole n reviste de specialitate care se adreseaz unui public cu pregtire corespunztoare. Ele redau mai mult
aspecte statice ale fenomenului cercetat, ncrcarea tabelelor cu date
referitoare la perioade lungi de timp ngreuneaz urmrirea i nelegerea acestora.
Graficele, dei mai puin exacte dect tabelele, au o arie de utilizare
mai larg ntruct sunt mai intuitive, putnd fi urmrite i nelese mai
uor de ctre un public mai larg.
Componentele principale ale unui grafic
Graficul este de fapt o hart care vorbete direct ochiului i este
foarte eficient n crearea unei imagini n mintea receptorului. Construirea unui grafic nseamn att tiin ct i art; nseamn cunoaterea
graficelor de baz, modalitatea de realizare din punct de vedere tehnic
i mai ales cum se combin elementele de baz pentru a crea o hart
corespunztoare; alegerea tipului de reprezentare grafic pentru situaii
dificile, complexe ale evoluiei fenomenelor nseamn de fapt art. Persoana care realizeaz graficul i asum o responsabilitate mare pentru
c un grafic corect conduce la informare corect iar un grafic gndit i
construit incorect conduce la dezinformare (Anders Wallgren, Britt Wallgre, Rolf Persson, 1990). Atunci cnd un grafic este privit, ochiul trebuie
s nregistreze imediat caracteristicile principale precum i unele detalii;
pentru aceasta persoana care construiete graficul trebuie s realizeze
un echilibru ntre detaliu i ansamblu. Un grafic stimuleaz receptorul s
fac conexiuni i s observe imediat modelele care pot aprea n evoluia unui fenomen.
Rolul graficului:
- s orienteze utilizatorul n selectarea informaiilor importante
din raportul statistic (gateway)
- s dezvolte idei ulterioare i s le explice
- s ncurajeze utilizatorul s priveasc n profunzime problema
prezentat n raportul statistic
- s ncurajeze compararea i analiza informaiilor
Graficele sunt construite cu ajutorul unor elemente simple cum ar
fi linii, arii, text etc. Toate aceste elemente simple trebuie combinate
astfel nct graficul rezultat s aib sens i s poat fi citit cu uurin.

Metodologia general a cercetrii statistice

153

Persoana care are responsabilitatea reprezentrii grafice trebuie


s-i pun urmtoarea ntrebare:
Care este tipul de grafic potrivit pentru reprezentarea grafic a
datelor statistice?
Alegerea depinde n primul rnd de problema pe care dorim s
o punem n eviden prin reprezentarea grafic.
Nu exist o regul care s stabileasc o coresponden ntre un
anumit tip de relaie ntre variabile i un anumit tip de grafic.
Trebuie luai n considerare diferii factori pentru fiecare situaie
n parte.
Avem de ales uneori ntre:
grafice corespunztoare i necorespunztoare unei anumite situaii sau,
ntre mai multe tipuri de grafice potrivite aceleiai situaii
Trebuie s decidem n primul rnd ce dorim s punem n eviden cu ajutorul acelui grafic: evoluia n timp, variaiile, etc.
Trebuie subliniate principalele caracteristici ale datelor i s inem cont de limitele impuse de acestea. Caracteristicile importante n acest context sunt:
structura datelor
tipul variabilelor
caracteristicile msurtorilor.
Principalele componente ale unui grafic sunt( fig. 8, fig. 9):
1. suprafaa de reprezentare (chart area)
2. suprafaa graficului mrginit de axe i cadran (plot area)
3. aria graficului
4. legenda graficului
5. reeaua de axe liniile orizontale i verticale (gridlines)
6. etichetele corespunztoare axelor

154

BIOSTATISTICA

Fig. 8. Componentele principale ale unui grafic

Metodologia general a cercetrii statistice

155

Suprafaa de reprezentare este mai mare dect cea a graficului. Include graficul i textul corespunztor acestuia astfel nct s constituie
o unitate coerent.
Suprafaa de reprezentare include:
- titlul graficului (hrii)
- axa vertical Y
- eticheta atribuit axei Y
- valoarea maxim
- valorile scalei
- marcajul care indic limita dintre valorile scalei (tick)
- valoare minim
- axa orizontal X
- eticheta atribuit axei X
- suprafaa ncadrat
- curbe, coloane etc.
- legenda
- sursa
Suprafaa graficului este suprafaa ocupat de grafic fr titlu,
valorile scalei etc. Suprafaa trebuie s fie suficient de mare pentru
a obine un grafic vizibil. Graficele care conin multe detalii necesit
o suprafa mai mare. Proporiile suprafeei sunt determinate pn la
un anumit punct de date o serie cronologic mare se reprezint de
obicei ntr-un dreptunghi. Ca regul, formatul orizontal este mult mai
potrivit i o alegere bun este dat de proporia 1:1,6.

Fig. 9. Rata mortalitii populaiei pe medii n localitatea X pe anii 1990-1999.

Suprafaa de reprezentare este o suprafa imaginar ce conine ntregul grafic incluznd titlul i textele explicative. n mod normal
suprafaa de reprezentare nu este marcat n nici un fel, cu excepia
cazului n care fundalului i se atribuie o alt culoare.

Uneori irul 1:1,2 1:2,2 este dat ca reper pentru a stabili raportul
dintre cele dou laturi ale dreptunghiului format de axa vertical i cea
orizontal.

156

BIOSTATISTICA

Aria graficului
Aria graficului este o arie imaginar care conine desenul propriuzis (coloane, benzi, curbe etc.). Poate fi colorat ntr-o nuan deschis
pentru a pune mai bine n eviden coninutul graficului.
Reeaua de axe orizontale i verticale.
n unele cri este denumit reea ajuttoare de reprezentare grafic pentru a nu fi confundat cu reeaua rectangular format din sistemul coordonatelor carteziane.
Reeaua de axe permite citirea graficului cu mai mult uurin i
se pot aprecia cu aproximaie valorile. Axele orizontale se utilizeaz n
cazul reprezentrii prin dreptunghiuri verticale, n timp ce axele verticale se utilizeaz n cazul reprezentrii prin dreptunghiuri orizontale. n
ambele cazuri este mult mai uor de apreciat lungimea dreptunghiurilor. n diagramele n care reprezentarea este prin curbe se recomand
utilizarea ambelor reele de axe.
Reeaua de axe nu trebuie s fie obstructiv i nu trebuie s distrag atenia de la datele reprezentate. Axele trebuie s fie ct mai
subiri. Dac fundalul este colorat atunci culoarea alb pentru axe este
o alegere potrivit.
Textul
Toate informaiile necesare nelegerii graficului trebuie incluse n
suprafaa de reprezentare astfel nct aceasta s fie dominat de grafic
i nu de text. Textul trebuie s cuprind strictul necesar.
Titlul i alte texte
Titlul trebuie s descrie ntr-o form concis coninutul graficului.
Din titlu trebuie s reias foarte clar:
- grupul descris (femei ntre 25-29 ani)
- variabilele implicate (cauza decesului)
- anul la care se refer datele 2005
- tipul de date reprezentate (valori absolute, procente).
Titlul trebuie:
- s fie uor de citit
- s nceap cu informaia cea mai important
Este recomandat ca titlul s apar deasupra graficului pentru a respecta o ordine natural n citirea lui. Alinierea titlului cu textul corespunztor axei Y confer unitate graficului i paginii de text n care este
inserat acesta.

Metodologia general a cercetrii statistice

157

Centrarea titlului poate fi utilizat atunci cnd graficul este prezentat


pe foile destinate retroproiectorului. Titlul poate fi scris cu alte caractere
dect cele folosite pentru text.
Legenda i etichetele trebuie scrise cu caractere mai mici dect
cele folosite pentru titlu.
Sursa
Pentru fiecare grafic se menioneaz sursa de provenien a datelor, sursa trebuie precizat sub grafic iar cuvntul surs este recomandat s fie scris cu litere italice.
Orice text trebuie scris pe orizontal indiferent dac se refer la axa
vertical sau la curba reprezentat grafic.
Axe, scale, marcaje
Axele sunt reprezentate prin linii drepte. Nu exist motive pentru
utilizarea sgeilor. Pentru axa Y textul se plaseaz deasupra axei.
Pentru axa X textul se plaseaz n partea dreapt sub ax. n cazul
seriilor cronologice nu este necesar ca anii s fie nsoii de cuvntul anul. Valoarea minim a axei Y este ntotdeauna 0. Valoarea
maxim este aleas astfel nct s existe un mic spaiu ntre grafic i
valoarea maxim a scalei. n cazul n care avem mai multe grafice unul
lng altul trebuie pstrat aceeai scal. n acest fel comparaiile pot
fi realizate n mod direct.
Pentru a ajuta citirea graficului axele sunt marcate la intervale egale, iar marcajele sunt nsoite de valorile corespunztoare. Pentru a
evita ncrcarea graficului, o parte din valorile scalei pot fi omise pstrndu-se marcajele.
n general o singur ax vertical i o singur ax orizontal sunt
suficiente. n cazul seriilor cronologice foarte lungi, scala din stnga
poate fi repetat n partea dreapt.
Valorile scalei sunt alese astfel nct s se refere la un sistem numeric natural. Practica standard prevede ca dimensiunea intervalului
pe scal s fie 1, 2,..., 5, sau alternativ 10, 20,..., 50 etc.; pentru numere
zecimale se folosete 0.1, 0.2,..., 0.5. Scalele construite de tipul 30, 60,
90 se citesc mai greu. Excepie fac scalele care reprezint procente. n
acest caz valorile scalei 25, 50,75% sunt naturale. O alt excepie este
atunci cnd valorile scalei sunt importante prin ele nsele, de exemplu
grupele de vrst. Este recomandat s nu se reprezinte pe scal valorizri; se recomand folosirea categoriilor mii astfel, nct pe ax s se
poat scrie 100, 200 etc., n loc de 100000, 200000.

158

BIOSTATISTICA

Legenda
Aceleai principii se aplic att pentru arii ct i pentru curbe. Trebuie specificat ce reprezint fiecare arie sau curb.
n cazul ariilor, legenda poate fi scris direct pe aria respectiv sau
n afara ei n partea dreapt. Reprezentarea ariilor n legend trebuie
fcut n aceeai direcie cu reprezentarea din grafic, de la stnga la
dreapta sau de sus n jos.
Pentru dreptunghiurile verticale sau orizontale grupate, trebuie s
explicm ce reprezint fiecare grup n parte. Legenda trebuie poziionat n suprafaa grafic, sub grafic, sau lateral n partea dreapt a
graficului (varianta a, varianta b, varianta c).
Pentru barele verticale grupate, legenda poate fi aezat orizontal
n suprafaa grafic, dedesubtul ei sau n partea dreapt.
n cazul dreptunghiurilor orizontale, legenda este poziionat vertical fie n suprafaa grafic fie n afara ei, fie n partea dreapt.

Metodologia general a cercetrii statistice

159

Haurri/ culori
Pentru a putea face comparaii cu uurin se recomand respectarea unor principii elementare n utilizarea culorilor i haurrilor.

Se recomand folosirea a cel mult 4 sau 5 tipuri de haurri.

n cazul curbelor, trebuie specificat n mod clar ce reprezint fiecare


curb. Legenda poate fi poziionat astfel:
- sub suprafaa grafic sau n partea dreapt a ei n cazul n
care avem reprezentat un numr mare de curbe, pentru a nu
ncrca graficul (varianta a);
- deasupra lor atunci cnd sunt vizibil distincte i nu se intersecteaz (varianta b);
- n afara suprafeei grafice, n partea dreapt cnd sunt apropiate sau se intersecteaz (varianta c).

Se recomand accentuarea gradat a intensitii haurilor pornind


de la partea superioar a graficului ctre partea inferioar.

160

BIOSTATISTICA

Nuanele trebuie s se disting cu uurin. Trebuie aranjate de la


nuana cea mai deschis ctre cea mai nchis. Pot fi completate cu
alb, iar n cazuri excepionale cu negru.
Haurarea ariilor
Liniile trebuie nclinate n aceeai direcie.
Trebuie evitate
- liniile verticale, deoarece creeaz un efect de lungire a coloanelor/benzilor
- liniile orizontale, deoarece creeaz un efect de micorare a
acestora.
Cnd avem mai multe categorii, modelele trebuie s se diferenieze
n mod vizibil. Dac exist o ordine ntre categorii, haurrile trebuie s
arate acest lucru.
Culorile:
- trebuie aplicate cu economie culorile puternice ndeprteaz
mesajul graficului, iar costurile de editare sunt ridicate;
- este recomandat folosirea unei singure culori discrete i eventual a diferitelor nuane ale acesteia.
Tipuri de linii
Reprezentarea grafic a unei singure serii cronologice se realizeaz printr-o curb continu de culoare neagr. Curba trebuie s fie suficient de groas pentru a nu se confunda cu reeaua de axe dar nu

Metodologia general a cercetrii statistice

161

foarte groas. Ca dimensiuni potrivite se recomand 0,5 mm pentru


curb i 0,1 mm pentru reeaua de axe.
Pentru reprezentarea n acelai grafic a mai multor curbe trebuie s
folosim tipuri diferite de linii pentru a le putea distinge. Teoretic exist
un numr mare de combinaii de linii i puncte; Practic este dificil de
folosit mai mult de 4-5 (varianta a, varianta b). De asemenea, putem folosi curbe de dimensiuni diferite. Cea mai subire trebuie s fie diferit
de reeaua de axe, iar cea mai groas nu trebuie s fie prea groas.
n cazul n care curbele nu se intersecteaz i sunt vizibil distincte
se poate folosi un singur model. n cazul n care curbele se intersecteaz este necesar utilizarea mai multor modele astfel nct utilizatorul
s nu fie obligat s stabileasc ce poriuni aparin aceleiai curbe pe
baza intuiiei.

Simbolurile
Seriile cronologice sunt alctuite din observaii unite prin linii. Uneori observaiile corespunztoare fiecrei perioade (lun, an) pot fi marcate prin simboluri.

Simbolurile au un rol important n cartograme. n aceste cazuri trebuie s fie simple cercuri sau ptrate, n general figuri geometrice
simple de dimensiuni relativ mici.
Tehnicile de baz n construirea unui grafic
Elementul de baz de la care se pornete n construirea unui grafic
este sistemul de coordonate (sistem de referin). Sistemul de coor-

162

BIOSTATISTICA

donate uzual const n linii aezate n unghi drept i numite sistem de


coordonate cartezian. Sistemul de coordonate din figura 10 este bidimensional dar, ideea poate fi generalizat pentru trei sau mai multe axe
(dimensiuni). n mod tradiional dreapta vertical este numit ordonat
(sau axa Y) i dreapta orizontal este numit abscis (axa X). Acest
sistem de coordonate mparte planul n patru cadrane. Originea sau
punctul 0 este punctul unde se intersecteaz axele i ncepe scala
numeric. Valorile din partea superioar a axei Y sunt pozitive, n timp
ce valorile din partea inferioar sunt negative. Valorile din partea stng a axei X sunt negative iar valorile din partea dreapt sunt pozitive.
n general, statistica folosete pentru reprezentarea grafic a informaiilor cadranul unul i foarte rar cadranul unu mpreun cu cadranul
patru. De exemplu majoritatea indicatorilor sociali sunt pe o scal pozitiv, ceea ce determin utilizarea mai frecvent a cadranului unu, celelalte cadrane fiind prin convenie omise. Fiecrui punct A din cadran i
se asociaz perechea de valori (x, y).
Intersecia celor dou axe indic nivelul fenomenului ntr-o anumit
perioad a evoluiei sale.

Fig.10. Sistemul de coordonate cartezian.

Metodologia general a cercetrii statistice

163

Din punct de vedere al tehnicii de construire graficele pot fi grupate


n mod neconvenional n dou tipuri de grafice:
1. Grafice fundamentale, de baz (histograma, poligonul, ogiva,
diagrama linear)
2. Grafice speciale (diagrama prin coloane, piramida populaiei/vrstelor, graficele de structur care utilizeaz cercul (pie
chart), hri statistice, cartograme cu diferite simboluri, grafice
semilogaritmice etc.)
1. Grafice fundamentale
Seriile de variaie pot fi reprezentate prin urmtoarele tipuri de diagrame de distribuie: histograma, poligonul, ogiva i diagrama liniar,
printre aceste tipuri se vor descrie histograma i diagrama linear care
sunt frecvent utilizate n cercetarea din domeniul sntii.
Histograma
Histograma este o reprezentare grafic, prin dreptunghiuri alturate, a distribuiei frecvenelor sau procentelor. Ea se utilizeaz cnd
autorul graficului dorete s arate frecvena pentru o variabil continu
(de exemplu vrsta). Histograma poate descrie i distribuia procentual. Frecvena cazurilor (sau procentajul) pentru fiecare categorie este
reprezentat de un dreptunghi. Aria dreptunghiului este proporional
cu frecvena cazurilor din categoria respectiv.
Aria dreptunghiului = Baza nlimea
Scala categoriilor variabilei este reprezentat pe axa X prin distane egale. Scala frecvenelor este reprezentat pe axa Y prin distane
egale corespunztoare frecvenelor egale. Axa Y ncepe ntotdeauna
din punctul 0 pentru a evita problemele ce ar putea s apar n compararea bazelor. Axa X ncepe ns din orice punct convenabil (inferior)
de pe ax. Obiectivul este acela de a obine o figur cu aria total egal
cu frecvena total N (sau procentul total 100%).
Exemplul 1. n Tab. 46 sunt prezentate datele necesare pentru
construirea unei histograme.

164

BIOSTATISTICA

Tabelul 46
Frecvena n cadrul fiecrei categorii a persoanelor investigate (%)
Ani de
colarizare
4 ani
5 ani
6 ani
7 ani
8 ani

Distribuia
frecvenelor
21
53
69
47
33
N = 223

Frecvena n cadrul fiecrei categorii


a persoanelor investigate (%)
9,4
23,8
30,9
21,1
14,8
100,0%

Histograma utilizeaz valori absolute sau relative.


Tehnica este aceeai, dar pe axa Y sunt reprezentate valori absolute
sau relative n funcie de situaie. Pe axa X este reprezentat variabila
pe care o msurm (intervalul de clas), iar pe axa Y este reprezentat
frecvena pentru fiecare interval de clas; nlimea dreptunghiului este
proporional cu numrul de persoane din categoria respectiv.

vrsta

Fig.11. Histograma.

Unele variaii ale histogramei de baz sunt folosite pentru a reflecta anumite caracteristici ale datelor. Spre exemplu, dac variabila este
nominal dreptunghiurile din histogram pot fi separate astfel nct s
vizualizeze separat i distinct categoriile. De obicei acest grafic mai este
numit i diagrama prin coloane iar dreptunghiurile au limile egale.

Metodologia general a cercetrii statistice

165

Pentru variabilele ordinale, unde nu sunt definite distane egale


dreptunghiurile pot avea spaii ntre ele pentru a evidenia acest lucru
(n particular dac variabila este discret i mai puin n cazul n care
este continu). n acest caz, histograma poate fi de tip scar i d
impresia de ordonare a categoriilor (marcajul este n interiorul fiecrei
coloane). Pentru variabilele ordinale exist tradiia de a lua o lime
standard, dei distanele nu sunt definite. Acest lucru duce la evitarea
distorsiunilor aparente ce pot s apar datorit variaiei limilor.
Histograma este potrivit n cazul variabilelor de tip interval de variaie, discrete. Dac variabilele sunt de tip continuu exist alte tipuri
de grafice mai potrivite (exemplu, poligonul frecvenelor).
Poligonul frecvenelor
Poligonul frecvenelor sau al procentelor este o figur nchis ce
unete punctele dintre centrele de interval i frecvenele lor. Este o
alternativ la histogram.
O alt modalitate de reprezentare grafic este distribuia cumulativ a frecvenelor sau procentelor. Acest tip de grafic arat frecvena,
respectiv procentele cazurilor situate sub marginea superioar a fiecrei clase succesive.
Diagrama liniar (cronogram sau historiogram)
Reprezint forma specific pentru reprezentarea seriilor dinamice,
cronologice. Este utilizat pentru descrierea evoluiei n timp a unui
fenomen (natalitate, fertilitate, mortalitate etc.).
Diagrama liniar prezint valoarea anumitor variabile dependente
(reprezentate pe axa Y) pentru fiecare categorie a variabilei independente (reprezentate pe axa X). Punctele de pe grafic sunt unite printr-o
linie dreapt, iar figura nu este nchis cu axa X. Aria de sub curb nu
are un neles particular aa cum se ntmpl n cazul histogramei sau
a poligonului.
n acest tip de grafic ochiul urmrete uor curba de evoluie i
sesizeaz imediat modificrile care s-au produs n timp n evoluia fenomenului observat. Este frecvent utilizat n monitorizarea strii de
sntate a unei comuniti (natalitate, mortalitate, morbiditate).
Fig. 12 este un exemplu de diagram liniar. Variabila independent este timpul reprezentat pe axa X iar variabila dependent este rata
(reprezentat pe axa Y).

166

BIOSTATISTICA

Acest tip de grafic este util atunci cnd una dintre variabile (de pe
axa X) este continu, este deci, variabil de tip interval (exemplu vrsta
i timpul).
Se poate folosi i o diagram prin coloane n cazul n care variabilele de pe axa X sunt nominale sau ordinale. n acest caz barele verticale
sunt mai indicate pentru comparri. Pentru seriile cronologice urmrirea vizual a coloanelor n scopul observrii evoluiei este mai dificil.
n diagrama linear curbele pentru seriile cronologice sunt mult mai
uor de urmrit i n acelai timp ofer o descriere (un desen) a evoluiei n timp a fenomenului observat.

Metodologia general a cercetrii statistice

167

2. Grafice speciale
Diagrama prin coloane
Este cea mai simpl form de grafic. Acest tip de diagram este
utilizat atunci cnd se urmrete:
- reprezentarea mai multor fenomene n acelai loc i n acelai
timp, sau
- acelai fenomen n mai multe locuri dar n acelai timp (ex. rata
de mortalitate general pe raioane n anul 2006).
Diagrama prin coloane este uor de reprezentat grafic i uor de
citit. Se utilizeaz atunci cnd dorim s reprezentm valori distincte ale
variabilelor variabile calitative sau discrete. Pentru ilustrarea acestui
lucru coloanele sunt separate de spaii.
Sunt utilizate pentru reprezentarea grafic a frecvenelor absolute
sau a frecvenelor relative, a sumelor sau a mediilor.
Pe axa X sunt reprezentate variabilele, n timp ce pe axa Y sunt
reprezentate frecvenele.
Utilizarea procentelor permite mult mai bine compararea mulimilor
de date de dimensiuni diferite.
Coloanele trebuie s fie mai late dect spaiile dintre ele, iar spaiile
trebuie s fie bine definite, astfel nct graficul de tip coloan s nu
poat fi confundat cu o histogram (varianta a este corect)

Fig 12. Incidena prin maladiile tractului gastrointestinal n Republica Moldova,


1997-2006 (la 10000 locuitori).

Atenie
- Axa Y trebuie s fie din lungimea axei X (sau de aceeai lungime).
- ntotdeauna axele frecvenelor sau ale procentelor ncep de la
punctul 0 sau de la origine. Axele scorurilor pot ncepe de la
orice scor convenabil pentru a obine o diagram clar.
- Fii siguri c diferenele numerice egale sunt reprezentate prin
distane fizice egale pe toate scalele.
- Etichetarea corect a graficului includerea scalelor, sursa datelor, titlul explicativ, note explicative, etc. Evitai confuziile: nu
reprezentai mai multe grafice diferite utiliznd aceleai sistem
de axe.

Reeaua de axe este util pentru comparaii i pentru citirea aproximativ a valorilor. Dac axele reelei sunt n numr prea mare graficul
este greu de citit, iar dac sunt n numr prea mic prezena lor nu se
justific (varianta e i varianta f).
Din punct de vedere al orientrii barele pot fi:
- verticale
- orizontale

168

BIOSTATISTICA

varianta d

varianta e

varianta f

Diagrama prin bare orizontale


n acest tip de grafic, pe axa X sunt reprezentate frecvenele, n
timp ce pe axa Y sunt reprezentate variabilele. Barele orizontale sunt
preferate n locul barelor verticale n dou situaii:
- variabilele au iruri lungi de caractere (de exemplu bolile aparatului digestiv) varianta a
- numr mare de valori a variabilei (de exemplu sunt trecute 30
de raioane) varianta b
Pentru un numr mare de valori ale variabilei nu este suficient spaiu pe axa X pentru a reprezenta dreptunghiurile cu valorile corespunztoare.

Problemele de reprezentare a dreptunghiurilor ncep de la 6-8 valori ale variabilei.


Criuleni

Sngerei

Metodologia general a cercetrii statistice

169

Pentru a pune n eviden coninutul graficului se vor respecta cteva principii.


Ordonarea barelor
- ordonarea adecvat a valorilor variabilei ofer un grafic mai
bun
- pentru o variabil calitativ exist o libertate n ordonarea
valorilor sale
- aranjarea valorilor n ordinea descresctoare a frecvenelor
creeaz un interes mai mare
- neordonarea valorilor confer o imagine haotic
Gruparea barelor este recomandat n dou situaii:
- pentru a descrie simultan dou sau mai multe categorii
- diferite categorii sunt reprezentate n acelai sistem de axe.
Pentru diferenierea categoriilor se folosesc haurri sau
culori diferite i se ataeaz graficului o legend.
Se recomand s nu se reprezinte mai mult de dou-trei categorii, un
numr mai mare va face dificil nelegerea graficului (de exemplu: masculin, feminin; urban, rural; salariat, patron, lucrtor pe cont propriu).
Dac exist un numr mai mare de categorii se vor folosi mai multe
grafice cu coloane obinuite.
Coloanele grupate sunt reprezentate fie pe vertical fie pe orizontal. Cele dou grafice produc efecte diferite, chiar dac aria are aceeai
dimensiune n ambele cazuri.
n cazul coloanelor orizontale, axa procentelor este lung, astfel
nct diferenele dintre valori pot fi observate mai clar.
O alternativ la coloanele grupate o reprezint coloanele suprapuse parial (overlapping bars).
Avantajul n acest caz este dat de economisirea spaiului, iar reprezentarea grafic devine mai interesant.
Exist totui riscul ca suprapunerea s fac graficul greu de neles
sau s conduc la nenelegeri (varianta b) Se recomand n cazul n
care:
- toate valorile unei categorii sunt mai mici dect valorile celeilalte categorii (varianta a)
- exist posibilitatea de a reprezenta categoria cu valori mai mici
n fa cu o culoare mai deschis (varianta a)

170

BIOSTATISTICA

O alternativ de grupare a coloanelor o reprezint coloanele aranjate sub form de piramid, stivuite (stacked charts). Este cunoscut sub denumirea de diagram de structur prin dreptunghiuri (Fig. 13).
Dreptunghiurile sunt reprezentate unul deasupra celuilalt. n acest caz,
suprafaa dreptunghiului care reprezint ntreaga colectivitate (100%)
este divizat n pri proporionale cu ponderea specific a fiecrei
componente care alctuiete ntregul. Se recomand un numr relativ
mic de componente (variabile).
Pentru valoarea fiecrei variabile, nlimea coloanei corespunde
cu frecvena total a categoriei respective. Cu precizie, poate fi citit
numai dimensiunea categoriei de la baz; celelalte categorii pot fi apreciate cu aproximaie.
Haurrile sau culorile diferite indic divizarea totalului n categoriile componente.
Coloane suprapuse vs. coloane stivuite
- ambele reprezint situaii similare
- alegerea se limiteaz la ceea ce dorim s subliniem cel mai
mult
- n cazul coloanelor suprapuse este uor s compari ntre ele
categorii diferite dar mai dificil s nelegi ce se ntmpl la nivelul ntregii categorii
- n cazul coloanelor stivuite ansamblul este vizibil, n timp ce
dimensiunea fiecrei categorii este secundar.
Aceeai informaie poate fi reprezentat din dou puncte de vedere
utiliznd dou tipuri de grafice.

Metodologia general a cercetrii statistice

171

Fig.13. Ponderea fluxurilor de migraie n migraia total.

Fig. 14. Frecvena fluxurilor de migraie n migraia total.

Exemplul 2: (Fig. 13 i Fig. 14).


n reprezentarea din Fig. 13 se observ c ponderea fluxului de
migraie rural-urban a fost de trei ori mai mare n 1990 dect n 1998.
Ponderea fiecrei categorii este comparat cu ntregul.

172

BIOSTATISTICA

n Fig. 14 se observ distribuia fluxului de migraie pe diverse categorii.


Diagrama de structur care utilizeaz ca reprezentare cercul (pie
chart)
Aceasta este tipic pentru reprezentarea distribuiei procentelor n
cazul variabilelor calitative i constituie o alternativ la diagrama prin
coloane (Fig. 15). Acest tip de grafic permite s se stabileasc n ce
raport se gsesc grupele din cadrul colectivitii fa de colectivitatea n
ansamblul ei (proporia bolilor aparatului digestiv din totalul bolilor).

Fig. 15. Structura deceselor pe cauze medicale n Republica Moldova, 2006 (%).

Caracteristicile acestei diagrame sunt:


- totalul ariei reprezint 100% iar 1% corespunde la 3,6 grade;
- n aria cercului se scriu procentele i nu gradele;
- diagrama se citete n sensul acelor de ceasornic ncepnd cu
punctul care poate fi asociat orei 12;
- cercul nu trebuie s aib mai mult de 5-6 sectoare;
- culorile trebuie s fie atribuite ncepnd cu cea mai nchis pn
la cea mai deschis;
- cum aceast diagram ofer o vedere de ansamblu, ultima categorie trebuie s fie altele i culoarea sau haurrile nu trebuie s fie dominante.

Metodologia general a cercetrii statistice

173

Dac dorim s comparm mai multe grupuri de date folosind aceast diagrama, atunci vom construi o diagram pentru fiecare grup n
parte. Aria fiecrui cerc va fi proporional cu dimensiunea grupului. n
acest fel putem compara att dimensiunile grupurilor ct i distribuiile
procentuale din cadrul fiecrui grup simultan.
Diagrama prin benzi
Diagrama prin benzi reprezint o alternativ a histogramei. n acest
tip de grafic dreptunghiurile sunt foarte nguste i capt aspectul de
benzi. Benzile sunt orizontale. Se poate alege ntre numere i procente. Sunt dou modaliti de reprezentare a procentelor:
- procentele pot fi procente din total brbai i separat procente
din total femei
- procente din totalul populaiei
Un exemplu de diagram prin benzi este piramida vrstelor (population pyramid) Piramida vrstelor descrie populaia unei ri sau
regiuni pe sexe i grupe de vrst. Const din dou histograme orizontale, una pentru brbai i una pentru femei. Histogramele sunt aezate
n oglind pentru a se face compararea ntre sexe, n populaia unei
ri/regiuni. Pe axa orizontal putem reprezenta att valori absolute ct
i procente.
Lungimea benzilor este proporional cu valorile reprezentate iar
limea lor este aceeai pentru toate benzile.
Tehnica este utilizat i n alte situaii, de exemplu:
- pentru a reprezenta proporia de fumtori n diferite grupuri de
vrst la brbai i respectiv la femei
- status marital etc.
Hri statistice
Hrile statistice ocup un loc special n reprezentarea variaiilor
spaiale (geografice) a diverselor fenomene sau probleme sociale de
sntate. Dintre acestea, n sistemul de sntate sunt frecvent utilizate cartogramele, care reprezint o combinare dintre grafic i hart
(Fig. 16).
Cartogramele exprim distribuia nivelelor unui fenomen ntr-o arie
geografic (ar, raioane, regiuni). Diferenele dintre proporii, rate, medii etc., sunt puse uor n eviden prin colorarea/haurarea diferit a
ariilor geografice. Permite compararea valorilor dintre diferitele zone n
acelai timp; compararea pune n eviden att zonele cu valorile cele

174

BIOSTATISTICA

mai ridicate, ct i zonele cu valorile cele mai sczute. Se obine o vizualizare spaial a informaiilor despre fenomenul observat (fertilitate,
mortalitate etc.)

Fig. 16. Clasificarea raioanelor dup nivelul infirmitii motorii cerebrale, anul X().

n tehnica de construire a unei cartograme paii importani sunt:


- se grupeaz pe intervale de mrime valorile fenomenului observat;

Metodologia general a cercetrii statistice

175

se stabilete un cod de culori sau haurri prin care vor fi exprimate valorile corespunztoare fiecrui interval de mrime;
- se coloreaz sau se haureaz fiecare zon conform grupului
de valori din care face parte;
- n legend se va explica codul utilizat.
n domeniul sntii publice s-a dezvoltat, n ultimii ani, conceptul
de HEGIS (Health Environment Geographic Information System) care
are la baz GIS (Geographic Information Systems).
Aranjarea graficelor n raportul statistic
n procesul de elaborare a raportului statistic, obiectivele autorului
au un rol major. Aceleai date pot fi reprezentate n moduri diferite conform mesajului pe care autorul dorete s-l transmit.
Exemplul 3. Mai jos este prezentat acelai indicator rata de inciden prin ciroz hepatic din dou perspective diferite conform
inteniilor autorului.
n varianta a, scopul este de a prezenta evoluia ratei de inciden
pe o anumit perioad relevant de timp, 5 ani. n varianta b, mesajul
este complet diferit i corespunde unui alt scop compararea ratei de
inciden pe 5 ani. Deoarece este vorba de o serie temporal mesajul transmis de aceste date se refer la evoluie. Diferena se poate
observa n modul n care sunt organizate graficele i din explicaiile
prezentate n text.
n varianta a, evoluia este subliniat de reprezentarea anilor pe
axa orizontal. Acesta este modul obinuit de reprezentare a datelor
temporale. De asemenea pentru a evidenia evoluia, anii sunt sortai
n ordine cresctoare. Textul asociat descrie evoluia n ansamblu i
subliniaz neregularitile remarcabile.
n varianta b, inteniile autorului sunt complet diferite, (obiectivul
este compararea).
Pentru comparaii sunt necesare schimbri structurale. n varianta
b anii sunt reprezentai pe axa vertical eliminnd impresia de evoluie.
Aceast schimbare este important pentru perceperea graficului, deoarece eliminnd diferenele false, mesajul devine mai clar.

176

BIOSTATISTICA

Varianta a: un singur obiectiv evoluia

Ani

Varianta b: un singur obiectiv compararea

Fig. 17. Rata de inciden prin ciroz hepatic n Republica Moldova, 2000-2004
(la 100 mii locuitori).

Metodologia general a cercetrii statistice

177

Interpretare:
Varianta a Tendina incidenei este de cretere din 2000 pn n
2004, observndu-se un nivel mai sczut n 2000 i 2002.
Varianta b n perioada 2000-2004 nivelul cel mai sczut al ratei
de inciden prin ciroz hepatic s-a nregistrat n 2000 iar cel mai ridicat n 2004.
n varianta b anii sunt tratai ca variabile nominale n loc de variabile
ordinale i astfel, sortate n ordine cresctoare dup valorile variabilelor. Aceast reordonare are dou efecte pozitive: pe de o parte, distruge imaginea evoluiei, deoarece anii nu sunt prezentai n succesiune i
pe de alt parte, permite o mai bun comparare a valorilor.
La rndul lui textul asociat este diferit de cel din varianta a n locul
descrierii modului n care are loc evoluia ratei de inciden, se menioneaz numai anii cei mai buni i cei mai slabi. Aceast diferen este
important pentru autor, mai ales atunci cnd dorete s transmit mai
multe mesaje.
Exist situaii n care dou obiective pot fi combinate pentru a fi reprezentate grafic. n acest caz reprezentarea grafic ine cont n primul
rnd de obiectivul principal.
O prezentare grafic greit are consecine mai grave dect inexistena ei.
Anders Wallgren
Lista de verificare (Check-list)
nainte de a ncepe construirea graficului
Care este grupul int?
Care este rolul graficului?
Ce tip de grafic trebuie ales?
Cum trebuie prezentat graficul?
Ct de mare trebuie s fie graficul?
Este reprezentarea grafic cea mai bun alegere de prezentare a
informaiilor?
Dup ce construirea graficului a fost finalizat
Este graficul uor de citit?
Poate fi graficul interpretabil (interpretat greit)?
Sunt potrivite forma i mrimea graficului?
Este integrat graficul corect n text ?
Se recomand testarea graficului: se solicit unei persoane care
are caracteristicile grupului int citirea i interpretarea graficului. For-

178

BIOSTATISTICA

mulai ntrebri despre grafic astfel nct s nelegei cum este el perceput de persoana aleas.

3.5. Analiza i interpretarea materialului statistic


Datele statistice, obinute n cadrul operaiei de adunare i prelucrare a materialului statistic, necesare efecturii unei lucrri tiinifice,
sunt de obicei date brute sau mrimi absolute. Operaia de prelucrare
continu cu unele operaii de finee n care datele brute sunt transformate n mrimi relative sau mrimi medii.
Sub aceast form de indicatori statistici, deci raportate la aceeai baz, datele obinute pot fi supuse unor operaii de comparare,
corelare, abstractizare i generalizare, ceea ce ne permite o interpretare ct mai realist a materialului cercetat. Dup ce materialul
statistic a fost prelucrat i datele obinute sub form de valori absolute, relative sau medii, au fost prezentate n tabele sau grafice, urmeaz etapa de analiz i interpretare a materialului statistic. Aceast operaie const dintr-o serie de aprecieri, comparaii i corelaii a
rezultatelor obinute.
Aprecierea tendinelor n timp
Valorile nregistrate de noi n raport cu timpul (an, semestru, trimestru, luni) pot fi mai mari sau mai mici, pozitive sau negative, n funcie
de modificarea unor factori care pot contribui la determinarea sau influenarea evoluiei fenomenului cercetat, ntr-un sens sau altul.
Folosind aceste aprecieri comparative putem sesiza rolul pozitiv
sau negativ pe care factorii respectivi (factori de risc sau de protecie)
l-au exercitat asupra fenomenului cercetat.
Exemplul 1. Cercetnd morbiditatea prin HTA ntr-o colectivitate
i determinnd anumite valori ale acesteia, pentru a vedea n ce msur recomandrile fcute pentru eliminarea factorilor de risc au fost
eficiente, comparm valorile gsite de noi n momentul examinrii cu
valorile morbiditii prin HTA n aceeai colectivitate cu 5 sau 10 ani n
urm. Dac valorile gsite de noi ale morbiditii (sub raportul indicelui
de inciden sau prevalen) sunt mai reduse dect cele nregistrate cu
5 sau 10 ani n urm, deci s-au redus de la o prevalen de 18% spre
exemplu la o valoarea a indicelui de prevalen de 12%, nseamn c
msurile recomandate, n timp, pentru reducerea factorilor de risc (alimentari, efort fizic, stres) au fost eficiente.

Metodologia general a cercetrii statistice

179

Exemplul 2. Cercetnd morbiditatea prin afeciuni stomatologice


ntr-o colectivitate industrial care lucreaz n mediu cu vapori de mercur, trebuie s comparm valorile morbiditii stomatologice gsite de
noi n momentul examinrii cu valorile pe care aceast morbiditate le-a
nregistrat cu 5 sau 10 ani n urm i cu condiiile de munc existente
n perioada respectiv de timp.
Aprecierea tendinelor fenomenelor n spaiu
Rezultatele obinute n cercetarea noastr trebuie apreciate apoi
comparativ cu rezultatele pe care ali cercettori le-au obinut n colectiviti spaial diferite cu condiii de munc i de trai similare sau
diferite. Aprecierea rezultatelor obinute de noi n raport cu rezultatele
nregistrate n colectiviti diferite n care exist factori de risc mai numeroi, ne permite s reliefm rolul factorilor de risc n determinarea
sau influenarea acestei patologii.
Spre exemplu dac n colectivitatea A examinat de noi, valorile
prevalenei prin HTA sunt de 12% iar n colectivitatea B, cu condiii
similare cu cele ale colectivitii A, nregistrm valori ale prevalenei
de 18% nseamn c munca de prevenire i combatere a unor factori
de risc existeni n colectivitatea B las de dorit. Dac exist condiii
geografice, social-economice, comportamentale diferite, iar asistena medical este de aceeai calitate, diferena valoric poate fi pus
pe seama unor factori de risc insuficient cunoscui i stpnii, n felul
acesta putem sesiza i evalua rolul pe care unii factori climatici, socialeconomici, culturali, igienico-sanitari, de asisten medical etc. l exercit n determinarea sau influenarea strii de sntate a populaiei.
Corelarea rezultatelor obinute cu factorii de risc care sunt n msur s influeneze fenomenul cercetat. Asemenea factori pot fi factori
naturali ai mediului fizic extern (clima, altitudinea, condiii hidrologice,
microclimat, ap, aer etc.) factori biologici, factori social-economici (locuin, alimentaie, obiceiuri, mentaliti, condiii de munc etc.). n urma
operaiei de corelare se poate stabili msura n care unul dintre factorii
de risc influeneaz, ntr-o mai mare sau mai mic msur, starea de
morbiditate printr-o anumit afeciune i totodat se poate face o ierarhizare a acestora stabilindu-se i ordinea de influenare a acestora.
Dup ce am efectuat, n cadrul operaiei de analiz i interpretare,
aprecieri, comparaii i corelaii ale rezultatelor obinute n raport cu
complexul de factori de mediu extern, socio-economici, biologici, ce ar

180

181

BIOSTATISTICA

fi putut contribui la determinarea sau influenarea, ntr-un sens sau altul


a fenomenului cercetat, se trece la formularea de concluzii.
Exemplul 3. Dac n colectivitatea A factorul de risc pentru HTA
nu influeneaz semnificativ valorile TA, iar n colectivitatea B valorile
crescute ale TA se coreleaz cu o solicitare nervoas de lung durat
i cu o alimentaie neraional se impune o schimbare a ritmului de
lucru n ntreprinderea respectiv i corectarea modului de alimentaie
ale angajailor
Exemplul 4. Dac morbiditatea prin stomatit mercurial a crescut
fa de valorile anilor trecui, fiind mai mare dect morbiditatea unor
colectiviti cu condiii asemntoare, rezult c au existat deficiene n
supravegherea strii de sntate a colectivitii respective.
Lucrarea se ncheie cu capitolul propuneri.
ntruct orice lucrare cu caracter aplicativ, pe care o efectum, urmrete un scop practic, este firesc ca ea s se ncheie cu acest capitol de propuneri, n cadrul acestui capitol propunerile elaborate trebuie
s fie ct mai concrete, s fie uor aplicabile, viznd totodat i cile
de rezolvare a problemelor.
Exemplul 5. n cazul frecvenei crescute a bolii hipertensive n colectivitatea B se vor face propuneri de modificare a proceselor tehnologice cu automatizarea unor operaii solicitante, se vor indica micropauze la anumite intervale de timp, se va institui un program de educaie
pentru sntate n vederea instituirii unui regim alimentar raional etc.
Exemplul 6. Pentru reducerea cazurilor de stomatit mercurial se
vor lua msuri cu caracter tehnic, menite s limiteze concentraia vaporilor de mercur n aerul atmosferic, la locul de munc, se vor indica msuri de depistare activ prin consultaii periodice active, de tratament
prompt i eficient al cazurilor recent depistate, de educaie sanitar a
muncitorilor expui, cu accent pe msurile de igien individual, bucodentar etc.

BIBLIOGRAFIE
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.

16.
17.

Albert, J. M., Yun, H. (2001). Statistical advances in AIDS therapy trials.


Statistical Methods in Medical Research 10:85100.
Andersen, P. K., Klein, J. P., Knudsen, K. M., Tabanera y Palacios, R.
(1997). Estimation of variance in Coxs regression model with shared
gamma frailties. Biometrics 53:14751484.
Babiker, A. G., Cuzick, J. (1994). A simple frailty model for family studies
with covariates. Statistics in Medicine 13:16791692.
Bailar JC III. The promise and problems of meta-analysis. New England
Journal of Medicine 337:559-560,1997.
Bjorling, L. E., Hodges, J. S. (1997). Rule-based ranking schemes for
antiretroviral trials. Statistics in Medicine 16:11751191.
Bloom BS, et al. A reappraisal of hepatitis B virus vaccination strategies
using cost-effectiveness analysis. Annals of Internal Medicine 118:298306,1993.
Borzak S, Kidker PM. Discordance between metaanalyses and large-scale randomized controlled trials: examples from the management of acute
myocardial infarction. Annals of Internal Medicine 123:873-877,1995.
Buyse, M., Molenberghs, G. (1998). Criteria for the validation of surrogate
end-points in randomized experiments. Biometrics 54:10141029.
Carr, A., Samaras, K., Thorisdottir, A., Kaufmann, G. R., Chisholm, D. J.,
Carsenten, B. (1996). Regression models for interval censored survival
data: application to HIV infection in Danish homosexual men. Statistics in
Medicine 15:21772189.
Clayton, D., Cuzick, J. (1985). Multivariate generalizations of the proportional hazards model. Journal of the Royal Statistical Society A 148:82117.
Clemens JD, et al. The BCG controversy: a methodological and statistical
reappraisal. Journal of the American Medical Association 249:2362-2369,
1983.
Daniels,M. J., Hughes,M. D. (1997). Meta analysis for the evaluation of
potential surrogate markers. Statistics in Medicine 16:19651982.
DeGruttola, V., Fleming, T. R., Lin, D. Y., Coombs, R. (1997). Validating
surrogate markers are we being naive? Journal of Infectious Diseases
175:237246.
Delta Coordinating Committee (1996). Delta: a randomised double-blind
controlled trial comparing combinations of zidovudine plus didanosine
or zalcitabine with zidovudine alone in HIV-infected individuals. Lancet
348:283291.
Delta Coordinating Committee and Virology Group (1999). An evaluation
of HIV RNA and CD4 cell count as surrogates for clinical outcome. AIDS
13: 565573.
DeMasi, R. A., Babiker, A. G. (1998). Nonparametric estimation of the
proportion of treatment effect explained by a surrogate marker. Presented
at the 1998 ENAR conference, April 1, 1998.

182

BIOSTATISTICA

18. Dempster, A. P., Laird, N.M., Rubin, D. R. (1977). Maximum likelihood


from incomplete data via the EM algorithm. Journal of the Royal Statistical
Society B 39:138.
19. Efron, B. (1988). Logistic regression, survival analysis and the Kaplan Meier
curve. Journal of the American Statistical Association 83:414425.
20. Ellenberg, S. S., Finkelstein, D. M., Schoenfeld, D. A. (1992). Statistical
issues arising in AIDS clinical trials (with discussion). Journal of the American Statistical Association 87:562583.
21. Fieller, E. C. (1940). The biological standardisation of insulin. Journal of
the Royal Statistical Society 7:S1S15.
22. Finkelstein, D. M., Schoenfeld, D. A., Stamenovic, E. (1997). Analysis of
multivariate failure time data from an AIDS clinical trial. Statistics in Medicine 16:951961.
23. Finkelstein, D. M. (1986). A proportional hazards model for interval-censored failure time data. Biometrics 42:845854.
24. Foulkes, M. A. (1998). Advances in HIV/AIDS statistical methodology over
the past decade. Statistics in Medicine 17:125.
25. Freedman, L. S., Graubard, B. I., Schatzkin, A. (1992). Statistical validation of intermediate endpoints for chronic diseases. Statistics in Medicine
11:167178.
26. Gehan, E. A. (1965). A generalized two-sampleWilcoxon test for doubly
censored data. Biometrika 52:620653.
27. Hughes, M. D. (2000). Analysis and design issues for studies using censored biomarker measurements with an example of viral load measurements in HIV clinical trials. Statistics in Medicine 19:31713191.
28. Jekel IF, et al. Influence of the prevalence of infection on tuberculin skin
testing programs. Public Health Reports 84:883-886,1969.
29. Journot, V., Chene, G., Joly, P., Saves, M., Jacqmin-Gadda, H., Molina,
J.-M., Salamon, R., the ALBI Study Group (2001). Viral load as a primary
outcome in Human Immunodeficiency Virus trials: a review of statistical
analysis methods. Controlled Clinical Trials 22:639658.
30. Kay, R. (1984). Multistate survival analysis: An application in breast cancer. Methods of Information in Medicine 23:157162.
31. Klein, J. P., Moeschberger, M. L. (1997). Survival analysis: techniques for
censored and truncated data. New York: Springer-Verlag.
32. Klein, J. P. (1992). Semiparametric estimation of random effects using the
Cox model based on the EM algorithm. Biometrics 48:795806.
33. Kulinskaya E.V., Satarov G.A. Testing the Hypotesis about the Quality
of Classification in the Data-Analysis System Clams // Statistical
Data Analysis. Abstracts f International Conference. Sofia, 1990.
34. Munink M, et al. Decision Making in Health and Medicine: Integrating Evidence and Values. Cambridge: Cambridge University Press, 2001.
35. Murean P. Manual de metode matematice n analiza strii de sntte.
Bucureti, 1989, 574 pag.

BIBLIOGRAFIE

183

36. Newcombe, R. G. (1988). Explanatory and pragmatic estimates of the


treatment effect when deviations from allocated treatment occur. Statistics
in Medicine 7:11791186.
37. OBrien, P. C. (1984). Procedures for comparing samples with multiple
endpoints. Biometrics 40:10791087.
38. Pickles, A., Crouchley, R. (1995). A comparison of frailty models for multivariate survival data. Statistics in Medicine 14:14471461.
39. Prentice, R. L., Williams, B. J., Peterson, A. V. (1981). On the regression
analysis of multivariate failure time data. Biometrika 68:373379.
40. Raab, G. M., Parpia, T. (2001). Random effects models for HIV marker
data: Practical approaches with currently available software. Statistical
Methods in Medical Research 10:101116.
41. Robins, J. M., Greenland, S. (1994). Adjusting for differential rates of prophylaxis therapy for PCP in high-dose versus low-dose AZT treatment
arms in an AIDS randomized trial. Journal of the American Statistical Association 89:737749.
42. Smith, P. J., Thompson, T. J., Jereb, J. A. (1997). A model for interval-censored tuberculosis outbreak data. Statistics in Medicine 16:485496.
43. Sonnenberg FA, Beck JR. Markov models in medical decision making: a
practical guide. Medical Decision Making 13:322-338,1993.
44. Sun, J. (1997). Regression analysis of interval-censored failure time data.
Statistics in Medicine 16:497504.
45. Survival Analysis: State of the Art. Boston: Kluwer Academic Publishers,
pp. 99120.
46. Thall, P. F., Cheng, S. C. (1999). Treatment comparisons based on twodimensional safety and efficacy alternatives in oncology. Biometrics
55:746753.
47. Touloumi, G., Pocock, S. J., Babiker, A. G., Darbyshire, J. H. (1999). Estimation and comparison of rates of change in longitudinal studies with
informative drop-outs. Statistics in Medicine 18:12151233.
48. Touloumi, G., Pocock, S. J., Babiker, A. G., Darbyshire, J. H. (2002). Impact of missing data due to selective drop-outs in cohort studies and clinical trials. Epidemiology 13:347355.
49. Tubert-Bitter, P., Bloch, D. A., Raynauld, J. P. (1995). Comparing the bivariate effects of toxicity and efficacy of treatments. Statistics in Medicine
14:11291141.
50. Volberding, P. A., Lagakos, S. W., Koch, M. A., Pettinelli, C. B., et al.
(1990).
51. Walker, A. S., Babiker, A. G., Darbyshire, J. H. (2000). Analysis of multivariate failure-time data from HIV clinical trials. Controlled Clinical Trials
21:7593.
52. Walker, A. S. (1999).The analysis of multivariate failure time data with application to multiple endpoints in trials in HIV infection. Unpublished PhD
thesis, University College, London.

184

BIOSTATISTICA

53. Wang, S. T., Klein, J. P., Moeschberger, M. L. (1995). Semi-parametric estimation of covariate effects using the positive stable frailty model. Applied
Stochastic Models and Data Analysis 11:121133.
54. Wei, L. J., Glidden, D. V. (1997). An overview of statistical methods for multiple failure time data in clinical trials. Statistics in Medicine 16:833839.
55. Wei, L. J., Lin, D. Y., Weissfeld, L. (1989). Regression analysis of multivariate incomplete failure time data by modelling marginal distributions.
Journal of the American Statistical Association 84:10651073.
56. Weinstein MC, Fineberg HV. Clinical Decision Analysis. Philadelphia: Saunders, 1980.
57. White, I. R., Babiker, A. G., Walker, A. S., Darbyshire, J. H. (1999). Randomization-based methods for correcting for treatment changes: examples
from the Concorde trial. Statistics in Medicine 18:26172634.
58. .., .., .. . .: , 1974.
59. .
.: , 1985.
60. .., B.., .., .., A..
, //, 1977. .
17. ,7.
61. ..; H.. .
.: , 1983.
62. .. . : , 1985.
63. .., ... ... .., ... ..
-3 //. 1977. .17. 6, 7.
64. .., . .. . . .: , 1984.
65. .., .
. .: , 1976.
66. E..
CLAMS IBM // .
. . . .:
, 1980.
67. ., .. CLAMS IM PC //.
. Te. . : , 1990.
68. .., .., ..
// . 1976. 3.

BIBLIOGRAFIE

185

69. .. , . .: , 1982.
70. A.. . : - , 1982.
71. A.. //[2].
72. A.. //.
. . .: , 1985.
73. A.. //. 1 . , , . . 1.
.: , . , 1988.
74. A.. // . .8. .: , 1982.
75. .., .. // I . -
- (8- 1985 ., ). : , 1986.
76. .. , - //
1984 . . . .: , 1986.
77. ..
//-
- . .: , 1987.
78. .. // . .: , 1983.
79. ..
// . .
, 1985. .: , 1987.
80. .. // . .: , 1980.
81. ..
// . .: , 1983.
82. .. - // . . , 1985. .: , 1987.
83. .. - . .:
, 1979.

186

BIOSTATISTICA

84. .., .. // . .:
, 1977.
85. .. // . 1982. 7.
86. .. // . .: , 1982.
87. .. //
. : . . -, 1991.
88. ..
// . .: , 1977.
89. H.., .., .. //. .

) . Te. . , 1977.
90. .B. //[2].
91. . . .
. .: , 1987.
92. .. . : , 1986.
93. .. -
//
. .: , 1984.
94. .. .
. .: , 1979.
95. .., .. . .: ,
1982.
96. A.M. - //
. .:
, 1980.

S-ar putea să vă placă și