Sunteți pe pagina 1din 55

CAPITOLUL I

PRINCIPII ŞI METODE ALE CERCETĂRII ŞTIINŢIFICE ŞI PRACTICII


BAZATE PE DOVEZI ÎN SĂNĂTATEA PUBLICĂ ŞI MANAGEMENTUL
SERVICIILOR PENTRU SĂNĂTATE.

I.1. Procesul de cunoaştere. Principii ale metodei ştiinţifice.

Achiziţionarea de cunoştinţe (procesul de cunoaştere) se poate


realiza pe mai multe căi, literatura de specialitate definind următoarele:
1. prin tradiţie şi cultură.
2. calea autoritară (cunoştinţele religioase);
3. modalitatea intuitivă (orice cunoaştere se bazează pe categorii
logice şi nu empirice);
4. modalitate ştiinţifică (mod deliberat şi sistematic de a produce
cunoştinţe).

În înţelegerea, explicarea şi realizarea procesului de cunoaştere,


de-a lungul evoluţiei societăţii umane s-au dezvoltat mai multe culturi:
1. cultura filozofică, pentru care raţiunea serveşte la distincţia
dintre adevăr şi neadevăr;
2. cultura ştiinţifică (după sec XVI), pentru care obiectivitatea
serveşte la distingerea adevărului.
3. cultura tehnică (sec. XIX), în care rigoarea face distincţie între
adevăr şi fals.

Caracteristicile esenţiale care deosebeşte metoda de cercetare


ştiinţifică de celelalte metode prezentate sunt următoarele:
1. modalitate deliberată.
2. rigoarea.
3. modalitate sistematică.
4. metodologie.
5. cultura tehnică.

Rigoarea.
Reprezintă metodele şi procedeele prin care cercetătorul
pretinde a folosi un limbaj ştiinţific.
Acest tip de limbaj permite comunicarea între cercetători.
Comunicarea este reprezentată de posibilitatea de prezentare a
rezultatelor în vederea dezbaterii critice a acestora.

Rigoarea se poate adapta la cele două paradigme prin prisma


cărora se poate aborda cercetarea:

9
1. Paradigma (abordarea) pozitivistă, care afirmă că realitatea
este ceva exterior cercetătorului, pe care acesta trebuie să o descrie
(descopere) cu ajutorul unor legi naturale.
2. Paradigma (abordarea) constructivă, care afirmă că nu există
o singură realitate ci mai multe reprezentări ale realităţii.

Modalitate sistematică.

Modalitatea sistematică presupune definirea clară şi respectarea


procedurilor propuse şi folosite.

Metodologia.

În practica cercetării ştiinţifice sunt recunoscute două tipuri de


metodologii:
1. Metoda inductivă, reprezintă procesul prin care se pleacă de
la fapte specifice pentru a se ajunge la legea generală

2. Metoda ipotetico-deductivă, este procesul prin care se


pleacă de la un raţionament general pentru a se ajunge la cazuri
specifice. Are la bază ipoteza.
Ipoteza este o propoziţie modificabilă, provizorie, temporală.

Referitor la cea de-a doua metodă, C. Popper în lucrarea “Logica


ştiinţifică” prezintă două concepte valoroase:
 “falsificaţionismul” care are drept scop final respingerea ipotezei
chiar dacă la ea s-a ajuns pe baza unui raţionament final;
 ”paradoxul adevărului” care afirmă că este imposibil să dovedeşti
că ceva este adevărat, dar este posibil să respingi ceva
considerat iniţial ca adevărat.
Concluzia este că apropierea de adevăr se face în mod
asimptomatic.

Structura (arhitectura) cercetării.

Etapele care trebuie respectaţi în procesul cercetării ştiinţifice


1. definirea populaţiei de cercetat.
2. definirea caracteristicilor şi variabilelor care vor fi
supuse observării şi colectării datelor.
3. analiza datelor.
4. stabilirea eşantionului şi a resurselor.
5. pertinenţa cercetării.
6. respectarea regulilor etice.

10
Tipuri de cercetare.

1. Studii descriptive.
2. Studii explicative.

La fiecare dintre aceste tipuri generale se aplică criterii specifice


de rigurozitate:
1. Pentru studiile descriptive rigoarea este dată de:
 calitatea observaţiilor (funcţie de fiabilitate /
validitate)
 calităţile populaţiei şi a eşantionului
2. Pentru studiile explicative rigoarea este dată de :
 validitatea internă (cuprinde şi validitatea
măsurătorilor);
 validitatea concluziilor statistice [eroarea de tip I
(a) şi de tip II(b)];
 validitatea externă (puterea de generalizare)

Pertinenţa cercetării
Sunt criterii care asigură caracterul ştiinţific al studiilor,
cercetărilor.

1. Criterii care asigură caracterul ştiinţific al cercetării:


1. studii de cunoaştere;
2. posibilitatea de inovare teoretică într-un anumit domeniu de
cercetare;
3. posibilitatea unei cercetări ştiinţifice de a soluţiona
contradicţiile din rezultatele anterioare;
4. potenţialul de generalizare;

2. Criterii care nu asigură caracterul pertinent al cercetării.


1. curiozitatea;
2. utilitatea socială;
3. confirmabilitatea;
4. promovarea personală şi conformitatea;
5. costul.

11
I.2. Elementele procesului de cercetare ştiinţifică.

Etapele care trebuie respectate în procesul cercetării ştiinţifice:

1. definirea populaţiei de cercetat.


2. definirea caracteristicilor şi variabilelor care vor fi supuse
observării şi colectării datelor.
3. observarea, măsurarea înregistrarea şi centralizarea
caracteristicilor.
4. analiza datelor.
5. stabilirea eşantionului şi a resurselor.
6. pertinenţa cercetării.
7. respectarea regulilor etice.

Pregătirea unei cercetări este esenţială şi inevitabilă fiind


ansamblul de metode şi tehnici utilizate pentru a concepe traiectul de
cercetare, înainte de începe culegerea datelor şi analiza lor şi se
materializează sub forma unui document cunoscut ca protocolul sau
devizul cercetării.

Protocolul de cercetare.
Orice cercetare are la bază un protocol, deviz (document) care
se realizează în trei etape:

1) Conceptualizarea problemei de cercetare;


2) Alegerea unei strategii a cercetării în problemă;
3) Planificarea operaţională a cercetării.

Protocolul de cercetare are dublu rol :


a) clarificarea şi organizarea ideilor şi de transformare a ideii în
plan;
b) convingerea finanţatorilor de importanţa proiectului în
vederea sale.

1.Definirea problemei de cercetare are drept scop să releve


pertinenţa şi importanţa cercetării.
Această definire se realizează practic descriind:
- obiectivul general;
- definirea domeniului ţintă;
- importanţa subiectului;
- formularea de probleme;
- specificarea nivelului la care se găseşte cercetarea ştiinţifică
în domeniu;
- indicarea principalilor beneficiari ai rezultatelor.
Din punct de vedere al ţintelor sunt recunoscute trei categorii:
12
 cercetarea stării de sănătate;
 cercetarea asupra intervenţiilor;
 cercetarea evaluativă.

2. Stadiul actual al cunoştinţelor în domeniu, subliniază


modul în care problema de cercetat se înscrie în câmpul cunoaşterii
asupra temei şi modul în care aceste cunoştinţe susţin problema şi
ipoteza de cercetare.

Acest studiu va cuprinde prezentarea datelor asupra


problemei studiate, asupra variabilelor luate în studiu şi asupra
pertinenţei metodologiei de cercetare.
Modelul teoretic şi ipotezele sau problemele de cercetare; se
urmăreşte elaborarea unui model teoretic iar la problema cercetării
concomitente cu elaborarea de întrebări pentru care ă se caute
răspunsul.

3. Alegerea unei strategii de cercetare, presupune a alege


metode de cercetare care s-ar adapta cel mai bine pentru a verifica
ipoteza sau pentru a răspunde la întrebări, şi care ar genera validitatea
optimă cercetării în ansamblu.
Această alegere presupune existenţa unei metodologii de
cercetare, evidenţierea erorilor care pot afecta validitatea intimă sau
validitatea externă a studiului.

Tipuri de cercetare :

1) cercetarea experimentală:
- provocată;
- invocată.
2) cercetare sintetică;
3) cercetarea de dezvoltare;
4) cercetarea de similare.

3.1. Cercetarea experimentală este tipul de cercetare în care


cercetătorii acţionează de o manieră intenţionată asupra unei variabile
independente (factor de risc sau protecţie) observând sau măsurând
efectul asupra unei variabile dependente.

Există două categorii de cercetări experimentale:

a) experimentul provocat, în care cercetătorul are o mare libertate


de manevrare variabilei independente, stabilind când, cui şi în ce
doză să administreze factorul de risc / protecţia.

b) experimentul invocat, caz în care cercetătorul nu poate


manevra variabila independentă şi utilizează variaţiile naturale
13
ale factorilor de risc, măsurând efectul ei asupra expuşilor de o
manieră similară experimentul provocat.

Tipuri de experimente invocate :


- comparative ex – post;
- studii seriate;
- studii corelaţionale;
- meta-analiza.

3.2. Cerecetarea sintetică (sistemică) observă si măsoară


ansamblul relaţiilor dintre intervenţia simultană a mai multor variabile
dependente pentru a explica şi prevedea fenomenele complexe .

a) Este cunoscut şi ca studiu “ de caz “, cercetarea în care se


analizează “interiorul “ unei situaţii.
Se disting 4 grade :
- caz unic ( analiză holistică )
- caz unic cu nivele de analiză multiple
- caz multiplu cu un singur nivel de analiză
- cazuri multiple cu niveluri multiple de analiză.

b) Cercetarea sintetică comparativă – cercetătorul lucrează pe


un număr mare de unităţi de analiză. Puterea acestui tip de studiu este
dependent direct proporţional cu numărul unităţilor de analiză. Este
necesar ca numărul unităţilor de analiză să fie cu cel puţin 10 unităţi
decât numărul de atribute (caracteristici) studiate (gradele de libertate ale
studiului).

3.3. Cercetarea de dezvoltare. Este o tehnică care urmăreşte


să utilizeze de o manieră sistematică cunoştinţelor existente, pentru a
pune la punct un nou tip de intervenţie, de a ameliora una deja existentă
sau pentru a avea un instrument de măsură (ex. Măsurarea unei anumite
stări sufleteşti).

3.4. Cercetarea de simulare – nu realizează observaţiile


plecând de la o ipoteză, ci studiază comportamentul unui sistem pe o
anumită perioadă de timp, într-o manieră mai mult sau mai puţin
cuantificabilă (măsurabilă) manevrând asupra parametrilor (valorilor)
variabilelor.

Calitatea strategiei de cercetarea este apreciată prin două


criterii, validitatea internă şi validitatea externă a metodei de cercetare.

Nivelul validităţii interne este asigurat de caracteristicile


proiectului care trebuie să dea un cât mai înalt grad de certitudine, pentru
ca relaţiile observate între variabila independentă şi variabila dependentă

14
nu poate fi explicată cu ajutorul altor factori sau variabile în afara celor
care au fost prinse în proiectul de cercetare.
Validitatea externă a unei corectări depinde de puterea (nivelul)
de generalizare, adică de a obţine prin aceeaşi metodă, aceleaşi
rezultate şi în alte populaţii, în alt context şi în altă perioadă.
Tipuri de erori care pot genera scăderea nivelului de validitate.
Pentru validitatea externă:
1. erori datorate unui control imperfect a factorilor legaţi de
timp (ex. istorice);
2. erori generate de selecţia grupului martor;
3. erori generate de măsurarea efectelor;
Pentru validitatea externă:
1. erori induse de reactivitatea subiectului la situaţia
experimentală;
2. erori generate de un control inadecvat al intervenţiei;
3. erori generate de selectarea necorespunzătoare a
subiecţilor.

Detalii suplimentare vor fi oferite la capitolul despre anchetele


epidemiologice.

Planificarea operaţională
1. Definirea şi caracterizarea populaţiei de studiu prin definirea
subiecţilor care alcătuiesc populaţia ţintă şi modul de
selecţionare a subiecţilor care vor intra în studiu, adică modul
în care se constituie eşantionul.
2. Definirea variabilelor şi colectarea datelor. Este etapa în care
se definesc exact variabilele care sunt supuse observării,
măsurării şi înregistrării precizând şi tipul acestor date.
Nu trebuie omis să se precizeze calitatea instrumentelor de
măsură.

4. Analiza datelor.
Are ca scop definirea metodelor prin care se realizează analiza
informaţiilor funcţie de natura lor.
Pentru date calitative:
 pregătirea şi descrierea materialului brut,
 reducerea datelor,
 alegerea şi aplicarea unei metode de analiză,
 analiza transversală.
Pentru date cantitative:
 analiza descriptivă,
 inferenţa statistică.

15
În ultima etapă se stabileşte planul de resurse şi de finanţare
necesar.
Cercetătorul trebuie să stabilească toate caracteristicile de mai
sus înainte de începerea efectuării observaţiilor. Omisiunile de procedură
generează în cel mai bun caz distorsiuni în analiza şi evaluarea datelor.

16
I.3. Procesul de măsurare.

Prin procesul de măsurare se înţelege cuantificarea (atribuirea


de nume sau categorii) unor obiecte, lucruri sau situaţii care trebuie să fie
făcută după reguli prestabilite (standardizat), atribuindu-se fiecărei unităţi
de observaţie o singură categorie. Se realizează o relaţie între un obiect
şi o categorie prin care unui obiect i se acordă un corespondent valoric
(numeric) pe baza principiului izomorfismului conform căreia:
y = f(x)
Procesul de măsurare permite transformarea conceptelor în
variabile şi are două etape:

1. conceptualizarea, constă în traducerea conceptelor în variabile


şi indicatori;
2. operaţionalizarea, constă în dezvoltarea procedurilor rezultate
din cunoaşterea empirică.

Se recunoaşte că există un mit al cantităţii conform căruia o bună


măsură ar fi cea cantitativă.
Procesul de măsurare are la bază existenţa unui instrument de
măsurare, care reprezintă un mijloc şi nu un fapt, existând pericolul ca
utilizarea instrumentului să devină un scop, astfel încât cercetarea să fie
condusă de existenţa unui instrument iar legea să fie dictată de
instrument.
Măsura este un instrument care standardizează şi permite
realizarea de echivalenţe între obiecte de provenienţă diferită.

Funcţiile procesului de măsurare:


1. prin măsură se pot realiza echivalenţe, pe baza
distincţiilor subtile şi a descrierilor precise în cadrul unui
proces standardizat; asigură precizia în observaţie;
2. permite reducerea ambiguităţilor în realizarea
clasificărilor şi elaborarea de legi mai precise;
3. permite utilizarea unor instrumente matematice în
explicarea fenomenelor (traducerea operaţională a
fenomenelor) şi testarea acestuia

Măsurarea poate fi:


a. fundamentală, când se
măsoară intrinsec conceptul şi rezultă direct din
caracteristica respectivă (masa, talia);
a. derivată, care rezultă din utilizarea unor legi care unesc
până la un punct măsurile fundamentale (densitatea)

Tipuri de măsurare:
 unidimensionale, este exprimat printr-un singur cuvânt
(idee) şi exprimă direct un indicator care poate fi:
17
i. direct (intrinsec);
ii. indirect (indicator proxi).
 multidimensional, şi care presupune creearea indicilor
prin gruparea mai multor indicatori.

Posibilitatea realizării unei măsurători este dată de:

 modul în care lucrul a fost conceptualizat;

 de ceea ce se cunoaşte la momentul respectiv despre


fenomenul studiat;

 abilitatea şi ingeniozitatea dovedită în procesul de


măsurare; nici un obiect nu poate fi măsurabil decât în
măsura în care ne permite ingeniozitatea cercetătorului.

Validitatea unui instrument de măsurare (sau a unui test).

Validitatea „desemnează utilitatea ştiinţifică a unui


instrument de măsurare” (Nunnally, 1994) şi permite să apreciem în ce
grad măsurăm ceea ce ne-am propus să măsurăm printr-o anumită
metodă.

Validitatea exprimă capacitatea unui test (investigaţii, probe) de


a identifica corect ceea ce este pus să identifice, adică proporţia cu care
rezultatele obţinute prin aplicarea testului sunt confirmate prin procedee
diagnostice mai riguroase.

Valoarea unui test (inclusiv a unui întreg studiu ştiinţific) se


apreciază pe baza validităţii interne şi a validităţii externe a acestuia.

Validitatea internă reprezintă capacitatea unui test de a


identifica corect persoanele bolnave şi depinde de:
- sensibilitate, specificitate, valoarea predictivă pozitivă şi valoarea
predictivă negativă;
- eficienţă testului (include costurile administrării şi prelucrării
datelor brute obţinute prin aplicarea testului).
-
Validitatea externă este capacitatea testului de a descrie situaţia
reală a morbidităţii în populaţia generală şi performanţele testului în
condiţii specifice de culegere a datelor. Depinde de:
- fiabilitatea şi reproductibilitatea testului;
- randamentul testului.

18
Sensibilitatea unui test exprimă capacitatea acesteia de a
identifica corect pe cei care au boala şi reprezintă proporţia rezultatelor
pozitive obţinute din totalul de bolnavi investigaţi prin metoda respectivă.
Reprezintă probabilitatea ca testul să fie pozitiv dacă cel investigat este
cu adevărat bolnav.

Specificitatea exprimă capacitatea testului de a identifica corect


pe cei care nu au boala, reprezentând proporţia rezultatelor negative
obţinute din totalul celor sănătoşi investigaţi prin această metodă.
Reprezintă probabilitatea ca un test să fie negativ dacă cel investigat este
cu adevărat sănătos.
Sensibilitatea unui test nu este complementară cu specificitatea.
Când sensibilitatea creşte, specificitatea scade dar nu în aceeaşi
măsură.
Sensibilitatea este complementară cu proporţia fals negativilor iar
specificitatea este complementară cu proporţia fals pozitivilor.

Interpretarea valorilor calculate pentru sensibilitatea şi


specificitatea unui test:

- un test cu o sensibilitate mare va determina o proporţie a fals


negativilor mică, adică nu vor fi depistaţi un număr redus de
bolnavi;
- un test cu specificitate mare va genera o proporţie a fals
pozitivilor mică, adică un număr redus de indivizi sănătoşi vor fi
etichetaţi ca fiind bolnavi.

Calculul sensibilităţii şi specificităţii se realizează utilizând tabelul de


contingenţă „2x2”:

Boala
(+) (-) Total
Rezultat (+) RP (a) FP (b) P (a+b)
test (-) FN (c) RN (d) N (c+d)
Total B (a+c) NB (b+d) n

RP = real - pozitivii (bolnavii la care rezultatele testului au fost pozitive);


FP = fals – pozitivii (persoanele sănătoase la care rezultatele au fost
pozitive);
FN = fals – negativii (bolnavii la care rezultatele au fost negative);
RN = real – negativii (persoanele sănătoase la care rezultatele au fost
negative);
P = pozitivii (persoanele la care rezultatele au fost pozitive);
N = negativii (persoanele la care rezultatele au fost negative);
NB = sănătoşi;
n = numărul total al subiecţilor luaţi în studiu.

19
RP
Sensibilitatea (Sb.) = x100 Pr (P/B)
B

RN
Specificitatea (Sp.) = x100 Pr (N/NB)
NB

Valoarea predictivă permite să fie selectată acea probă care are


cea mai mare probabilitate de a identifica corect afecţiunea (puterea de
identificare a bolii) fiind considerată cea mai importantă de către
clinicieni.

Valoarea predictivă a unui rezultat pozitiv (VPR+) exprimă


proporţia reală a pozitivilor din masa bolnavilor sau probabilitatea de a fi
bolnav cu condiţia de a fi pozitiv prin test.

a
VPR+ = x 100
ab

Valoarea predictivă a unui test negativ (VPR -) exprimă


posibilitatea de a nu fi bolnav în cazul în care testul este negativ sau
probabilitatea de a fi sănătos în situaţia în care testul este negativ:

d
VPR - = x 100
cb

Se doreşte ca testul utilizat să aibă valoarea predictivă cât mai


aproape de 100%.

In analiza validităţii unui test este foarte util calculul ratei


cazurilor fals pozitive şi a ratei cazurilor fals negative.

b
Rfp = x100
ab

c
Rfn = x100
ac

Valoarea globală (Po sau Vg) care exprimă eficienţa unui test
sau procentul de concordanţă, exprimă proporţia rezultatelor valabile pe
ansamblul măsurătorilor efectuate şi se calculează după formula:

20
ad
Po = x100
N

Reproductibilitatea sau fidelitatea testului măsoară gradul de


eroare care poate apare atunci când procesul de măsurare se repetă în
condiţii identice dar este efectuată de persoane diferite şi se evaluează
atât prin calcularea coeficientului simplu de concordanţă cât şi cu
ajutorul coeficientului de concordanţă Kappa (K) după formula:

Po  Pc
K=
1  Pc

Unde:
Po = proporţia observată a concordanţei;
Pc = proporţia aşteptată.

Coeficientul Kappa (K)este important deoarece măsoară


concordanţa ţinând cont şi de efectul hazardului. Concordanţa previzibilă
pentru hazard este dată de formula:

[p1 x p2] + [(1 – p1) (1 – p2)]

Valorile coeficientului exprimă intensitatea concordanţei cât şi


rolul hazardului, K putând lua orice valoare în intervalul -1 şi +1 cu
următoarele semnificaţii:
- ( - 1) = discordanţă totală;
- ( 0 ) = concordanţa este datorată în exclusivitate hazardului;
- ( + 1) = concordanţă perfectă;

Fiabilitatea (acurateţea, exactitatea) măsoară gradul în care un


instrument de măsură poate induce erori. Reprezintă acea caracteristică
a unui instrument de a aprecia constant valoarea reală a caracteristici
investigate.
Nu se confundă cu validitatea sau cu reproductibilitatea pentru că
măsoară erorile determinate de instrumentul de măsură, fiind de natură
tehnică sau umană.

Erorile (bias) întâlnite în practică pot fi sistematizate (cel mai


uşor de corectat când sunt descoperite, fiind de obicei de natură tehnică)
sau nesistematizate (mai greu de depistat şi corectat, fiind de obicei de
natură umană).
Exemple:
- Eroare sistematizată: un cântar medical a arătat constant o
greutate mai mică cu 125 gr.
- Eroare nesistematizată: citirea reacţiei de culoare de observatori
care suferă de discromatopsii.
21
Literatura de specialitate pe care o recomandăm în bibliografie
defineşte foarte amănunţit categoriile şi tipurile de erori care trebuie
evaluate în cadrul unui deviz de cercetare.

Cu ajutorul acestor date se pot face aprecieri obiective asupra


validităţii interne şi a validităţii externe a unui test.

Validitatea internă reprezintă capacitatea unui test de a


identifica persoanele bolnave şi depinde de:
- sensibilitate, specificitate, VPR+, VPR-;
- eficienţă (include costurile administrării şi prelucrării datelor brute
obţinute prin aplicarea testului).

Validitatea externă este capacitatea testului de a descrie situaţia


reală a morbidităţii în populaţia generală şi performanţele testului în
condiţii specifice de culegere a datelor şi este condiţionată de:
- fiabilitatea şi reproductibilitatea testului (K);
- randamentul testului.

Exemplu aplicaţie.
Analiza validităţii testului de depistare a giardiozei prin tehnica
frotiului comparativ cu tehnica Elisa, aplicat în cele 6 colectivităţi, a utilizat
rezultatele obţinute de la un număr de 564 de copii investigaţi individual
în paralel prin trei teste coproparazitologice succesive (la interval de 3
zile) şi un singur test Elisa (ce poate fi considerată „gold - standard”).

Sb Sp VPR VPR
(%) (%) + -
(%)
(%
)
Giardioza (Elisa) 32 100 100 73

(+) (-) Total


coproparazitologic (+) 67 0 67
I. (-) 141 356 497
Total 208 356 564

Giardioza (Elisa) 45 100 100 75

(+) (-) Total


coproparazitologic (+) 95 0 95
II. (-) 113 356 469
Total 208 356 564
Giardioza (Elisa) 54 100 100 78

(+) (-) Total


coproparazitologic (+) 113 0 113

22
III (-) 95 356 451
Total 208 356 564

Rf + Rf – Vg C.K.
(%) (%) (%) (%)
Giardioza (Elisa) 0 67,7 75 37,5

(+) (-) Total


coproparazitologic (+) 67 0 67
I. (-) 141 356 497
Total 208 356 564

Giardioza (Elisa) 0 54,3 79,9 51,3

(+) (-) Total


coproparazitologic (+) 95 0 95
II. (-) 113 356 469
Total 208 356 564
Giardioza (Elisa) 0 45,6 83% 59,7

(+) (-) Total


coproparazitologic (+) 113 0 113
III (-) 95 356 451
Total 208 356 564

Se poate constata că din totalul de copii investigaţi prin metoda


clasică (coproparazitologică), după prima investigare au fost depistaţi 67
ca pozitivi (infestaţi), după a doua examinare 95, iar după a treia, un num
de 115. Testul Elisa practicat o singură dată la întreaga colectivitate a
depistat un număr de 208 copii infestaţi.
Nici un caz negativ prin testul Elisa nu a fost depistat ca pozitiv
prin testele coproparazitologice, ceea ce constituie particularitatea
exemplului nostru. Acest aspect atipic reprezintă o capcană în
interpretarea validităţii şi a valorii predictive scoţând în evidenţă
importanţa acestor parametrii în luarea deciziilor diagnostice sau
terapeutice la nivel clinic sau de colectivitate precum şi analiza critică a
datelor din literatura de specialitate.
Un alt exerciţiu similar pe care îl vom face la studiul testelor de
screening este elaborat fără aceste aspecte atipice.
Sensibilitate, VPR -, Rf +, Rf -, Vg. Şi C.K. au valorile calculate
chiar şi după a treia probă coproparazitologică extrem de mici, reflectând
o valoare redusă pentru decizia diagnostică în sensul că foarte mulţi copii
infestaţi sunt declaraţi negativi.
VPR + ca şi Rf + de 100% trebuie înţeleasă, conform definiţiei,
că toţi copii depistaţi pozitivi prin testul coproparazitologic sunt cu
adevărat infestaţi, dar nu reflectă numărul nici pe departe numărul real de
bolnavi din colectivitatea investigată.

23
Specificitatate (capacitatea unei probe de a-i identifica corect pe
cei care nu au boala) de 100% calculată conform formulei propuse de
unii autori este de 0%, conform formulei de calcul propuse de alţi autori,
În cazul de faţă suntem obligaţi să afirmăm că specificitatea acestei
probe este nulă.
Pe baza acestor date, alături şi de alte studii de tip cost –
eficienţă, cost – utilitate, etc., se pot lua decizii strategice în
managementul serviciilor de sănătate.

24
I.4. Elemente de statistică utilizate în sănătatea publică şi
management.

Last (1988) defineşte statistica ca ştiinţa recoltării şi analizării


datelor care sunt supuse variaţiei randomizate.
Apărută din necesitatea cunoaşterii realităţii sub diversitatea
aspectelor sale de manifestare, statistica urmăreşte exprimarea din punct
de vedere cantitativ a fenomenelor şi proceselor de interes, utilizând
pentru aceasta metode de descriere numerică, alături de analiza
calitativă a fenomenelor studiate.
Cercetarea statistică are ca obiect de studiu populaţiile
(colectivităţi statistice) iar la nivelul acestora, anumite caracteristici de
interes (numite şi variabile) care se observă şi măsoară la nivel de
individ (unitate statistică).
Utilizarea metodelor statistice în medicină se datorează faptului
că medicină, prin introducerea tehnologiilor înalte, a devenit o ştiinţă
cantitativă ce permite măsurarea, cuantificarea şi compararea
fenomenelor iar pe de altă parte analiza fenomenelor de interes medical
nu se poate realiza prin studiul întregii populaţii (populaţii exhaustive) ci
pe eşantioane reprezentative fiind necesare tehnicile de inferenţă
statistică în scopul generalizării rezultatelor.

Domenii de utilizare a biostatisticii în domeniul medicinii, a


sănătăţii publice şi managementului serviciilor sanitare:
1. evaluarea stării de sănătate a colectivităţilor;
2. studiul procesului de cauzalitate (determinism) şi a relaţiei
doză efect;
3. diagnostic medical: analiza şi estimarea ponderii factorilor de
risc în etiologia bolilor şi a stării de sănătate;
4. experimente clinice randomizate;
5. elaborarea algoritmului de lucru în cercetarea clinică sau de
laborator (cercetarea experimentală);
6. elaborarea şi evaluarea intervenţiilor, etc.

Termeni utilizaţi în biostatistică inclusiv în sănătatea publică:


1. Colectivitatea statistică reprezintă totalitatea elementelor
care au caracteristici comune şi care formează obiectul
analizei statistice (ex. Populaţia unui sat, oraş, regiuni, nr. de
hematii circulante, nr. de bacterii de pe o cultură microbiană,
etc.).
2. Colectivitatea statistică generală (populaţia) exprimă
totalitatea elementelor de un anumit tip existente în realitate
sau teoretice;

25
3. Colectivitatea statistica parţială este constituită din
totalitatea unităţilor de observare existente şi care pot intra în
studiu;
4. Colectivitatea statistică parţial constituită aleator
(eşantion, mostră) reprezintă elementelor extrase întâmplător
dintr-o populaţie, după criterii bine stabilite, în scopul
determinării caracteristicilor populaţiei respective utilizând
instrumentele biostatisticii;
5. Colectivitate statistică parţială, constituită nealeator este
partea extrasă dintr-o populaţie după unul sau mai multe
criterii neutilizându-se elementele tehnicilor de eşantionare
aleatoare;
6. unitatea statistică (unitatea de observare) este
reprezentată de fiecare element component al colectivităţii
statistice;
7. caracteristica (variabila) este una din însuşirile de interes
medical prin care se manifestă unitatea de observaţie şi
exprimă acea însuşire comună unităţilor unei populaţii,
însuşire ce poate fi observată, măsurată şi înregistrată
putând prezenta valori diferite pe scala aleasă;
8. Caracteristicile cantitative sunt însuşirile măsurabile ale
unităţilor de observare şi care pot fi exprimate prin unităţi de
măsură (ex. Unităţile din sistemul internaţional de măsură);
9. Caracteristicile cantitative continue sunt acele însuşiri
măsurabile ce pot lua orice valoare numerică din domeniul
zecimal sau ordinal (ex. Talia, greutatea, tensiunea arterială,
uremia, etc.);
10. Caracteristicile cantitative discontinue (discrete) sunt
reprezentate de acele însuşiri care pot fi exprimate numai
sub forma numerelor întregi;
11. Variabila statistică este caracteristica ce prezintă
proprietatea de a varia în timp şi spaţiu condiţionată de
factorii care acţionează asupra populaţiei aflate în studiu;
12. Varianta (xi) este valoarea concretă sub care este
înregistrată o caracteristică;
13. Frecvenţă (fi ~ nf) este numărul de repetiţii sub care se
înregistrează aceeaşi variantă;
14. Seria statistică (repartiţia statistică) reprezintă şirul de valori
numerice ale unei caracteristici, ordonate după un anumit
criteriu, funcţie de şirul valorilor altei caracteristici. Repartiţiile
statistice sunt definite cu ajutorul legilor de repartiţie (ex.
legea distribuţiei normale);
15. Parametrul statistic este valoarea reprezentativă dedusă
dintr-un calcul numeric aplicat unei repartiţii statistice (media,
dispersia, etc.);
16. Indicatorul statistic este mărimea statistică cu ajutorul
căruia se poate caracteriza un fenomen de interes medical
26
sub raportul structurilor interdependenţelor sau modificărilor
în timp sau spaţiu.
17. Indicele statistic este valoarea numerică relativă ce rezultă
din compararea valorilor unui indicator statistic , fie la
momente diferite, fie în spaţii diferite sau pentru categorii
diferit constituite în raport cu o caracteristică oarecare

Etape principale în studiul statistic:


1. Fixarea obiectivului, scopului şi premiselor (ipotezei)
studiului;
2. Documentarea aprofundată asupra aspectelor luate în
studiu.
3. Alegerea metodelor de cercetare şi prelucrare;
4. Efectuarea investigaţiei (observarea şi măsurarea
evenimentelor);
5. Înregistrarea informaţiilor obţinute (după verificarea
cantitativ a şi calitativă);
6. Prelucrarea informaţiilor (codificare);
7. Tabelarea datelor şi realizarea graficelor;
8. Analiza, sinteza şi evaluarea datelor observate.

De aceea de la începutul unui studiu statistic trebuie definite:


- populaţia ţintă;
- eşantionul;
- caracteristicile de interes (de măsurat şi înregistrat).

Pentru că, din motive obiective, studiul nu se poate realiza ,de


regulă, la nivelul întregii populaţii, statistica a dezvoltat teoria (şi
metodele) selecţiei (a eşantionajului).
Caracteristicile de interes pentru cercetarea unui fenomen la
nivelul unei populaţii, numite şi variabile, sunt definite cu ajutorul teoriei
scalării în vederea măsurării şi înregistrării lor.
Calitatea prelucrării datelor înregistrate, deci şi a rezultatelor
obţinute depinde de modul cum au fost selectate metodele scalării
variabilelor şi a selecţiei eşantioanelor.

I.4.1. Teoria selecţiei.


Se bazează pe teoria probabilităţilor în vederea extragerii din
populaţia supusă cercetării a unui număr suficient de indivizi pentru a se
constitui un eşantion reprezentativ din investigarea căruia să deducem
care este repartiţia de frecvenţă a întregii populaţii pentru variabila
studiată.
Din definiţia de mai sus se desprind două aspecte importante:
1. determinarea volumului eşantionului:
2. reprezentativitatea eşantionului (tehnici de eşantionaj).

27
Metode de determinare a volumului eşantionului
reprezentativ.
Stabilirea mărimii eşantionului reprezentativ se face pe baza
acceptării unui compromis raţional între a opta pentru eşantioane de
volum mare, care asigură reprezentativitatea ridicată şi eşantioane de
volum mic dar care sunt mai economice.
Mărimea unui eşantion este dictată de :
 mărimea populaţiei de referinţă;
 gradul de variaţie a populaţiei de referinţă;
 forma de organizare a populaţiei studiate;
 importanţa cercetării efectuate care generează
nivelul de probabilitate.
Ca o regulă generală, dacă se stabileşte apriori un prag de
semnificaţie a (Pv), se impune ca abaterile dintre media populaţiei de
referinţă şi media eşantioanelor (care se pot genera) să respecte
inegalitatea:
(m - x) £ a

unde "a" reprezintă eroarea limită admisă (absolută sau relativă) există
mai multe tehnici de stabilire a volumului optim (minim) a eşantionului.

1. In cazul în care se cunoaşte distribuţia în populaţie a


caracteristicii studiate (din studii prealabile), se iau în calcul:
- eroarea limită cu care să se lucreze (Dx);
- nivelul de semnificaţie Pv.
2 s2
formula de calcul propusă: t
n=
t2 s2
Dx2 +
N
unde:
t = factorul de probabilitate corespunzător lui Pv de 1,96;
s = deviaţia standard
Dx = eroarea limită admisă de 0.05.
Această formulă este greu de definit fiind necesară pentru
stabilirea lui s efectuarea unui microstudiu prealabil.

2. În situaţia unei caracteristici alternative (dihotomice) se


utilizează formula:

t2pq
n=
t2pq
Dx2 +
N
28
unde:
- p = probabilitatea de apariţie a primei forme de manifestare;
- q = probabilitatea de manifestare a celeilalte forme de
manifestare.

3. O formulă de calcul care ţine cont numai de eroarea de


reprezentativitate (propusă de Tara Yamone) este:

n = N / 1 + er2 N.

unde er2 reprezintă eroarea de reprezentativitate.

4. Dacă se cunoaşte abaterea medie pătratică se poate utiliza


formula propusă de Mills:

n = 9NV2/ 9D2 + 9V2;


unde:
D = eroarea relativă care poate fi luată după rigurozitatea pe care
o impune cercetarea (5-15%)
N = volumul colectivităţii generale;
V = dispersia relativă, egală cu abaterea medie pătratică
împărţită la numărul de cazuri.

5. Există în literatura de specialitate o serie de tabele care


simplifică mult determinarea volumului eşantionului , tabele propuse de
mai mulţi autori cum ar fi:
- tabelele elaborate de Neal W. Chilton şi John W. Fertig
- tabelul elaborat de Internaţional Epidemiological Asociaţion
(I.E.A.), recomandat de OMS în special în studiul morbidităţii.
- tabel elaborat de I.E.A. pentru selecţii aleatoare pe bază de
cuiburi.

6. Formulele şi tabelele lui Schlesselmann sunt foarte importante


în cercetările epidemiologice de tip caz-control după care se poate stabili
fie eşantionul minim, fie intensitatea relaţiei de cauzalitate în cazul unui
eşantion dat.

7. Similare cu tabele de mai sus sunt tabelele lui Fliess care


permit cunoaşterea volumului eşantionului reprezentativ în vederea
acceptării sau respingerii ipotezei zero.

Tehnici de realizare a eşantioanelor


In practica statistică, după procedeul utilizat în constituirea
eşantionului, distingem două tipuri de sondaje:

1. nealeatoare sau prin "alegere raţională"; sunt mai puţin


costisitoare, sunt mai practice dar sunt mult mai puţin exacte.
29
2. aleatoare sau probabilistice.
In cadrul sondajelor aleatoare sunt incluse acele procedee
bazate pe modele de construire a eşantioanelor în care alegerea
unităţilor din populaţie se face în mod aleator (întâmplător), fiecare
unitate având o probabilitate cunoscută şi diferită de zero de a accede în
cadrul eşantionului.
Se pot utiliza numeroase procedee de eşantionare. În cadrul
aceluiaşi plan de eşantionare se poate folosi una sau mai multe metode
probabilistice sau neprobabilistice din anumite considerente practice.

Utilizarea eşantioanelor aleatoare prezintă unele avantaje, sunt


operativitate, permit înregistrarea concomitentă a mai multor
caracteristici, volum de muncă redus, dar cel mai important îl reprezintă
calitatea de reprezentativitate.

Reprezentativitatea permite generalizarea datelor obţinute la


populaţia generală prin tehnici specifice de inferenţă statistică.

Tehnici de realizare a eşantioanelor aleatoare:


- tragerea la sorţi;
- utilizarea tabelelor de numere aleatoare;
- utilizarea pasului de numărare.
Aceste tehnici se aplică bazei de sondaj (populaţiei studiate)
pentru care trebuie să existe o listă completă, actualizată şi exactă.

Tipuri de eşantioane.

1. Eşantionare aleatoare simplă; utilizează tabelul cu numere


aleatoare sau tragerea la sorţi.
2. Eşantionarea sistemică sau mecanică; utilizează pasul de
numărare.
3. Eşantionarea stratificată constă în împărţirea, în prealabil, a
populaţiei pe starturi, după unul sau mai multe criterii, pentru a realiza
creşterea şansei de obţinere a unei reprezentativităţi mai ridicate.
inferenţa se poate aplica şi la nivelul straturilor cât şi la nivelul întregului
eşantion.
4.Eşantionarea cu probabilităţi inegale. Acest tip de eşantionaj
se utilizează atunci când unităţile populaţiei, în raport cu una sau mai
multe caracteristici, au valori ce diferă semnificativ, iar aplicarea
eşantionării cu probabilităţi egale duce la o eficienţă scăzută a estimaţiilor
făcute.
5. Eşantionarea pe "grappe" (pe cuiburi), se utilizează când
dispersia teritorială a populaţiei de investigat este prea mare sau când
lipseşte o bază de sondaj.

30
Se caracterizează prin faptul că nu se mai extrag unităţi
independente ci grupuri de unităţi eterogene (pachete; grappe, cuiburi)
din populaţiile care sunt organizate sub forma unei ierarhii.
Este recomandat ca mărimea cuibului să fie cât mai mică,
numărul cuiburilor mici cât mai mare iar eterogenitatea cuiburilor să fie
cât mai mare.
6. Eşantionarea în mai multe trepte (multistadial).
Este o metodă de eşantionare care se desfăşoară în mai multe
etape succesive şi se aplică tot pentru o populaţie organizată ierarhic, pe
mai multe niveluri. practic se constituie pentru fiecare nivel una sau mai
multe baze de sondaj, cuprinzând unităţile elementare de nivelul imediat
următor.
7. Eşantionarea în mai multe faze (multifazic) este o
generalizare a eşantionării stratificate (tipice) şi se utilizează din
următoarele considerente:
- creşterea operativităţii şi reducerea cheltuielilor;
- de la o fază la alta se reduce numărul unităţilor din eşantion cu
creşterea corespunzătoare a obiectivelor pe care le propune cercetarea;
- se pot cuantifica non-răspunsurile.

I.4.2. Teoria scalarii.


Are ca scop definirea unei scale de măsurare (acordarea de
valori) pentru fiecare caracteristică luată în studiu în aşa fel încât să se
poată utiliza operatori algebrici în prelucrarea valorilor individuale pentru
obţinerea indicatorilor (măsurilor) de sinteză.
Caracteristicile investigate pot fi, după modul în care se măsoară,
calitative sau cantitative. Există astfel:

1. Scale pentru variabile (caracteristici) calitative,


care cuprind:
- a. scala nominală (sex, stare civilă, etc.), prin care se acordă
simboluri unor obiecte (nu există noţiune de distanţă sau ordine).
Toate tipologiile sunt clasificări nominale
- dihotomice (poate lua numai o formă din maxim două);
- polichotomice (poate lua o formă din mai multe
alternative)
- b. scala ordinală (calitatea I., a-II-a) introduce o ordine prin
atribuirea unui anumit nivel (rang)

2. Scale pentru variabile (caracteristici) cantitative,


care cuprind
a. scala de interval (temperatura măsurată pe scara
Celsius), măsoară ordinea şi adaugă o distanţă între
obiecte (între categorii) dar nu oferă informaţii despre
punctul de origine şi distanţa dintre ele.

31
Se caracterizează prin aceea că raportul între două valori
este lipsit de semnificaţie şi defineşte doar distanţa dintre
două măsurători;

b. scala de raport, de proporţii (vârsta, greutatea, etc.)


prin care se poate măsura fiecare punct funcţie de
punctul de origine existând un punct zero care semnifică
absenţa a ceva. Asigură conţinutul cel mai mare de
informaţie întrucât permite şi raportul între două
măsurători.

Exprimarea cantitativă a unei caracteristici permite deci


exprimarea valorică a acestora prin unităţi de măsură. Din acest punct de
vedere caracteristicile cantitative pot fi considerate :

 continue, când pot lua orice valoare numerică, inclusiv fracţiuni


zecimale; (talia, greutatea, T.A.);
 discontinue (discrete), când valorile iau forma numai a
numerelor întregi.

In practică o variabila poate fi exprimată atât sub formă


cantitativă cât şi calitativă dar trebuie specificat că trecerea de la
exprimarea cantitativă continuă de pe o scală de raport printr-o exprimare
calitativă pe scală calitativă se face cu pierdere de informaţie.

Etapele ulterioare în studiul statistică a datelor obţinute


cuprinde:
1. efectuarea observaţiilor;
2. înregistrarea datelor;
3. ordonarea, gruparea datelor (tabelarea, realizarea de grafice);
4. caracterizarea sintetică a fenomenelor;
5. analiza şi interpretarea lor (estimarea şi inferenţa datelor).

Înregistrarea datelor presupune:


- verificarea cantitativă şi calitativă a observaţiilor pentru
a reduce cât mai mult posibil erorile care pot fii nesistematice,
întâmplătoare (greu de eliminat) sau erorile sistematice (uneori voite, sau
generate de instrumentul de măsurat).
- codificarea tipurilor de observaţii

Ordonarea (gruparea) datelor presupune împărţirea datelor


obţinute după caracteristici cantitative sau calitative. Gruparea poate fi:
- simplă (după o singură caracteristica);
- complexă (după mai multe caracteristici);
- repetitivă (scindarea sau reunirea grupelor).

32
Tabelarea informaţiilor se realizează prin aşezarea lor sub
forma tabelelor (alcătuite din rânduri şi coloane, cuprinzând celule).
Tipuri de tabele:
- simple;
- enumerative;
- dinamice;
- cronologice;
- de grupare (pentru o singură caracteristică)
- combinate (pentru două caracteristici);
- de corelaţie (două sau mai multe caracteristici legate
cauzal).

După tipul caracteristicii:


1. tabelarea caracteristicilor cantitative presupune:
- ordonarea datelor;
- variantele găsite se aşează în mod crescător;
- în dreptul lor se specifică numărul observaţiilor găsite pentru
varianta respectivă;
- rezultă o serie de distribuţie a frecvenţelor (serie de varianţă
simplă;
- dacă seria de variaţie este lungă se poate utiliza gruparea
datelor pe grupe, (clase, intervale) şi se obţine o serie de variaţie
pe clase.

Rezultă din analiza unei serii de distribuţie:


- frecvenţa absolută;
- frecvenţa relativă;
- frecvenţa cumulată (absolută sau relativă);

2. tabelarea caracteristicilor calitative presupune simpla


dispunere în ordine crescătoare a observaţiilor.

33
I.4.3. Caracterizarea sintetică, statistică a fenomenului
studiat la nivel de eşantion.

În această etapă se utilizează două tipuri de indicatori:

1. Indicatori de tendinţă centrală, care se calculează în mod


distinct pentru variabilele cantitative şi cele calitative, reprezentaţi de
medie, mediană, modul, cuantile, şi exprimă modul în care valorile
observate tind să se grupeze în jurul anumitor valori observate.

2.Indicatori de împrăştiere (dispersie) care indică tendinţa


valorilor observate de a se abate (îndepărta) de la valorile medii calculate
pentru respectiva serie de distribuţie.

1. Indicatorii de tendinţă centrală sunt reprezentaţi de:

A. Pentru variabilele cantitative:

a. Media care poate să ia mai multe aspecte:


- media aritmetică
- simplă (suma valorilor observate /numărul de observaţii);
- ponderată (se calculează pentru valorile ordonate într-o serie
de variaţie). Reprezintă valoarea faţă de care suma abaterilor
variantelor din seria de variaţie este nulă
(x p = åxi fi/ åfi)
- media armonică (se utilizează în calculul valorii medii în cazul
mai multor mărimi relative)
Marm. = å X / (å1/x ')X.
- media cronologică (se calculează în cadrul unei serii de valori
care reprezintă variaţia în timp)
Mcr.= (X1/2 + X2 + X3 +...+ XN /2) / (N - 1);

- media geometrică. Se utilizează în cazul coeficienţilor de


creştere medie a unei serii cronologice logaritmice, sau în cazul
seriilor cu creştere progresivă (cu oraţie din ce în ce mai mare)

b. Mediana. Se utilizează în cazul variabilelor cantitative


şi a seriilor omogene. Mediana este o valoare observată care împarte
seria de valori în două părţi egale.
Me = (N + 1) / 2.
c. Modul (dominanta), reprezintă valoarea observată
corespunzătoare celei mai mari frecvenţe întâlnite în seria de distribuţie.

d. Cuantilele (centile, etc.) exprimă diviziuni ale unei


distribuţii în subgrupuri egale şi ordonate.

34
B. Pentru variabilele calitative.
Se utilizează calcularea proporţiei (numărul de observaţii de un
anumit fel / numărul total de observaţii):
- pentru caracteristicile alternative (a sau b): pa = a /a+b;
- pentru caracteristicile nealternative (a, b, c, ,n.): pa = a / n

2. Indicatori de dispersie (de împrăştiere).

Aceşti indicatori măsoară tendinţa de abatere a valorilor de la


valorile medii.
A. Pentru caracteristicile cantitative:
1. amplitudinea seriei (gama, range); exprimă intervalul
(distanţa) dintre valoarea maximă şi valoarea minimă a seriei.
2. gama semicuantilă; reprezintă gama celor două
cuantile din mijlocul seriei.
3. varianţa; este valoarea calculată care exprimă media
aritmetică a pătratului abaterilor dintre valorile observate şi media lor
aritmetică:

Sx2 = [å(xi -xm)2 fi] / åfi;

4. derivaţia standard (abaterea standard, deviaţia tip)


reprezintă rădăcina pătrată a variantei şi exprimă media abaterilor
varianţei faţă de media aritmetică a seriei:

Sx = + \/ Sx2

5. coeficientul de variaţie reprezintă raportul procentual dintre deviaţia


standard şi valoarea medie a eşantionului:

C.V% = (Sx / x) 100.

6. deviaţia standard a eşantionului (eroarea standard a mediei):

S
S.E. =
n
Nu se utilizează pentru a sumariza variabilitatea în cadrul
eşantionului, ci exprimă nivelul la care pot varia indicatorii de tendinţă
centrală în eşantioanele extrase din aceiaşi populaţie.

B. Pentru caracteristicile calitative:


1. variaţia se calculează după formula:

Sp2 = p(1-p) = pq

35
2. deviaţia standard:
Sp = pq

Evaluarea (estimarea) şi inferenţa datelor.

I. Intervalele de încredere (de confidenţă) permite să se


aprecieze cât de aproape este estimarea făcută pe seama datelor
obţinute la nivelul eşantionului faţă de valorile populaţiei de bază.

1. Intervalul de încredere reprezintă un interval de valori (gamă,


range) construit în jurul estimării, care interval va avea o probabilitate
specifică de a include adevăratele valori ale populaţiei.
2. nivelul de încredere (de confidenţă) reprezintă tocmai
această probabilitatea specifică.
3. Limitele intervalului de încredere se calculează utilizând:
- deviaţia standard a populaţiei (s)
- media estimată x a eşantionului
- dimensiunea eşantionului n.
- probabilitatea specifică de a include adevăratele valori
ale populaţiei
(95% = 1.96).
- se calculează limita superioară şi limita inferioară:
lim.(sup;inf) = x+ 1.96 s /\/ n

Interpretare:
Cu o probabilitate de 95%, valorile din populaţia generală se vor
regăsi între limitele superioară şi inferioară a intervalului de încredere
astfel calculat.

Inferenţă statistică. Testarea ipotezei (decizia statistică).

Sunt testele care determină cât de probabil este ca diferenţele


observate între date (populaţie, eşantioane, loturi) să fie datorate în
întregime erorilor sau întâmplării.
Ipoteza nulă (zero) afirmă că orice diferenţă observată se
datorează în întregime erorilor de eşantionaj (întâmplării).
Valoarea P (Pv) reprezintă probabilitatea ca diferenţe cel puţin la
fel de mari ca cele constatate în datele observate să se datoreze în
întregime (vor surveni) ca urmare a întâmplării.
Cercetătorul stabileşte o valoare a lui P ( de obicei nu mai mică
de 95%) care reprezintă valoarea predeterminată a lui Pv care
reprezintă nivelul de semnificaţie a testului.
Analiza se face prin modul în care Pv calculat se poziţionează
faţă de Pv predeterminat.
Dacă valoarea calculată a lui Pv este sub nivelul de semnificaţie,
ipoteza zero se respinge, adică este improbabil (dar nu imposibil) ca
36
diferenţele observate să se datoreze doar întâmplării (diferenţe cel puţin
la fel de mari se pot găsi doar într-o populaţie mică de eşantioane din
totalul posibil de eşantioane care se pot extrage din populaţia de bază).
Rezultă că valorile estimate pot caracteriza populaţia de bază (la
un anumit nivel de semnificaţie).
Se pot alege şi alte nivele de semnificaţie a testului pentru care
ipoteza zero să fie respinsă (99% - 0.01; mai rar 90% - 0.1)

Pentru calcularea valorii P se utilizează testele "Z". Acestea


permit calcularea valorii P pe baza caracteristicilor populaţiei de bază şi a
caracteristicilor observate în eşantion:
Xm = media eşantionului:
m = media cunoscută în populaţia de bază (generală);
s = deviaţia standard cunoscută în populaţia generală;
n = dimensiunea eşantionului.

Z = Xm - m / (s / \/n)
Valorii lui "z" i se asociază, tabelar, o valoare a lui P care
reprezintă tocmai valoarea lui P calculat.
Statistic semnificativ (semnificativ statistic sau rezultat
semnificativ statistic) înseamnă acel rezultat care a dus la respingerea
ipotezei zero, adică diferenţa dintre două grupuri este semnificativă
statistic.
Valoarea lui P (valoarea testului) este influenţată de :
- puterea asocierii;
- dimensiunea eşantionului.
Adică o valoare mic a lui P poate să corespundă unei puteri mici
de asociere şi o diferenţă între două grupuri poate să nu aibă semnificaţie
statistică dacă dimensiunea eşantionului nu este suficient de mare.
Este important de subliniat că ipoteza zero nu este niciodată
adevărată sau falsă, ci ea este acceptată sau respinsă la un nivel de
semnificaţie

Un alt grup de test utilizate în acelaşi scop sunt testele "t". aceste
se aplică de obicei la eşantioanele de volum mic.
Acestea, testează dacă media populaţiei este egală cu o valoare
predeterminată, atunci când deviaţia standard a populaţiei nu este
cunoscută ( se cunoaşte numai deviaţia standard a eşantionului):

t = Xm -m / s \/n.
Se utilizează pentru:
- a testa dacă două eşantioane independente sunt statistic
diferite; (eşantioane extrase din aceiaşi populaţie sau din două populaţii
cu aceiaşi varianţă)
- situaţia când deviaţia standard a populaţiei nu este cunoscută şi
este estimată pe baza deviaţiei standard a eşantionului.
- testarea regresiei liniare;
37
- testarea semnificaţiei coeficientului de corelaţie.

III. Erorile de tip I (a) şi de tip II (b).

Ipoteza analizată poate fi acceptată sau respinsă cu un anumit


grad de probabilitate (semnificaţie).
Eroarea de tip I(a) reprezintă probabilitatea de a respinge
ipoteza zero atunci când ea este de fapt adevărată.
Eroarea de tip II (b) reprezintă probabilitatea de a accepta
ipoteza zero atunci când ea este de fapt falsă.
Puterea testului statistic reprezintă probabilitatea de a respinge
ipoteza zero atunci când ea este falsă şi este egal cu 1 minus
probabilitatea unei erori de tip I(a)
Puterea testului depinde de:
- dimensiunea eşantionului; (direct proporţional),
- nivelul de semnificaţie ales.

IV. Analiza relaţiei dintre două variabile.

Relaţia de cauzalitate este studiată, de obicei, pe seama


stabilirii nivelului de independenţă între două variabile, una considerată
independentă (expunere, factor de risc) iar cealaltă considerată
dependentă (rezultat, boală)
Si în această situaţie se porneşte de la ipoteza zero care afirmă
că între distribuţiile celor două variabile nu există nici o legătură, adică că
frecvenţa de a se găsi într-o categorie a variabilei dependente este
aceiaşi pentru toate categoriile variabilelor independente.
In practică se utilizează mai frecvent următoarele trei metode:
1. testul c2;
2 corelaţia;
3. regresia.

1. Testul chi pătrat (c 2)

Acest tip de test examinează ipoteza zero, pentru variabilele de


tip categoric care sunt trecute în tabelul de contingenţă "2x2"(care deja a
mai fost prezentat.).
Formula de calcul cel mai frecvent utilizată este:

c 2 = (½ab -bc½ - n/2)2 n / (a+b) (a+c) (c+d) (b+d);

Nivelul de semnificaţie al testului statistic minim acceptat este de


0.05, căruia îi corespunde un c2 tabelar de 3.84.
In cazul în care valoarea calculată a lui c2 este mai mare de
3.84, ipoteza zero se respinge la nivelul de semnificaţie de 5%.

38
2.Testele de corelaţie

Cu ajutorul testelor de corelaţie se estimează gradul în care două


variabile se modifică împreună.
Estimarea se exprimă prin coeficienţi de corelaţie.
Toţi coeficienţii de corelaţie utilizaţi, indiferent de tehnica de
calcul utilizată au o gamă de valori cuprinsă între +1 şi -1 cu următoarea
semnificaţie:
+1 = corelaţie perfect pozitivă;
0 = nici o corelaţie;
-1 = corelaţie perfect negativă
Tipuri de coeficienţi:
1. Coeficientul Pearson (coeficient de corelaţie
momentană)
2. Coeficientul Spearman.
3. Coeficientul Kendall (de corelaţie rang-ordin)

3. Testele de regresie

Regresia reprezintă stabilirea unui model matematic care să


exprime (şi grafic) relaţia dintre două variabile sau o variabilă dependentă
şi mai multe variabile independente.
Cel mai utilizat model este cel de regresie liniară în care modelul
matematic este ecuaţia unei linii drepte care se adaptează cel mai bine la
datele disponibile.
Alte modele de analiză matematică:
- regresia polinomiala;
- regresia logistică;
- hazardurile proporţionale.

Punerea în aplicare a tuturor acestor metode statistice este


foarte mult uşurată, în prezent de tehnica de calcul foarte puternică , care
se sprijină şi pe softuri performante şi adaptate cum ar fi EPI.INFO. 5.0,
SPSS, etc.
Importantă este respectarea metodologiei cercetării şi
interpretarea rezultatelor obţinute prin prelucrarea electronică.

39
I.4.4. Obţinerea indicatorilor şi indicilor.

Datele numerice obţinute în urma centralizării se pot prezenta ca:


- valori absolute (indicatorii);
- valori relative (indicii);
- valori medii.

Expresia primară a dimensiunii fenomenelor de interes medical


se realizează cu ajutorul indicatorilor şi indicilor

Indicatorii (valori absolute)

Valoarea absolută a unui fenomen reprezintă numărul de unităţi


de observaţie pentru care s-a înregistrat aceeaşi valoare a unei
caracteristici (variabile) luate în studiu, măsurate şi înregistrate. Valorile
absolute sunt înregistrate (grupate, prezentate) sub formă de serii
statistice.
Seria statistică simplă se prezintă sub forma unui tabel cu două
coloane sau rânduri. În rubricile primei coloane (rând) sunt trecute, în
ordine (conform scalei utilizate), valorile pe care le poate lua
caracteristica. În a doua coloană (rând) sunt înregistrate numărul de
unităţi de observaţie (subiecţi supuşi investigaţiei) pentru care s-a
înregistrat valoarea corespunzătoare din rubrica primei coloane (rând).
După conţinutul datelor seriile statistice pot fi de timp (cronologice,
dinamice), de spaţiu, de distribuţie sau de frecvenţă.

Serie statistică simplă (cronologică)


Numărul de decese anuale în România (valori absolute)
Nr.
crt. JUDET 1995 1996 1997 1998 1999 2000
ROMANIA 271672 286158 279315 269166 265194 255820

Serie statistică simplă (cronologică)


Mortalitatea anuală în România (frecvenţă la ‰)
Nr.
crt. JUDET 1995 1996 1997 1998 1999 2000
ROMANIA 12.0 12.7 12.4 12.0 11.8 11.4

Seriile statistice de timp (cronologice, dinamice) prezintă


variaţia în timp a valorilor caracteristicii studiate (numărul de decese
înregistrate în fiecare an 1995 - 2000).
Seria statistică de spaţiu prezintă nivelul valorilor absolute a
caracteristicii studiate pe unităţi teritorial administrative (numărul de
decese într-un an pe judeţe).
Seria statistică de distribuţie (de repartiţie) utilizată pentru
variabile cantitative se numeşte serie de variaţie.
40
Numărul unităţilor de observaţie proprie fiecărui nivel (interval)
măsurat al caracteristicii poartă numele de frecvenţă (fi).
Frecvenţa poate fi exprimată sub formă:

- absolută - numărul total al indivizilor care au prezentat


aceeaşi valoare a caracteristicii măsurate; ex:
nr. de persoane având greutatea de 71,5 Kg. =
423; 72 Kg. = 481, etc.

- relativă Proporţia de indivizi cu aceeaşi valoare a


caracteristicii măsurate din totalul de indivizi
investigaţi; ex. persoane având greutatea de
71,5 Kg. = 39%; 72 Kg. = 41%, etc.

Suma frecvenţelor relative dintr-o serie este egală cu unitatea (1)


când se exprimă ca număr rezultat la fracţiei fi = fi / ∑ fi = 0.39 sau cu 100
% când exprimarea este în procente.

Indicii (valorile relative)

Indicii (ca valori relative) rezultă prin compararea sub formă de


raport a doi indicatori.
Este o mărime relativă (nu rezultă dintr-o măsurătoare directă) şi
arată câte unităţi observate (evenimente) ale unui indicator studiat revin
la o unitate de bază.
Sunt utilizate pentru a permite compararea aceluiaşi tip de
fenomen investigat în colectivităţi diferite(Ştiut fiind faptul că fiecare
colectivitate are caracteristici distincte, volum structură, etc.).
Ex. Un indicator este reprezentat de numărul de nou născuţi vii
iar al doile indicator este reprezentat de volumul populaţiei (numărul de
indivizi) al colectivităţii în care s-au înregistrat evenimentele.
n.n.vii
x1000
nr.pop.

După modul de formare, indicii se grupează în:

- de structură: Exprimă raportul dintre fiecare indicator al unei serii


(ponderi, greutăţi statistice faţă de indicatorul total al colectivităţii
specifice) (lotului, eşantionului) investigat – populaţia de sex
feminin din mediul rural raportat la numărul total al
populaţiei din mediul rural.
Exprimarea se face în procente sau proporţii.

- de intensitate: Rezultă din raportarea indicatorilor rezultaţi la alţi


indicatori cu care se găsesc în relaţie de
interdependenţă – număr nou născuţi raportaţi la
femeile de vârstă fertilă.
41
Exprimarea raportului se poate face sub formă de
procente (%), promile (‰), la 100.000 sau sub
formă de proporţii.
- ai dinamicii: Se construiesc din compararea indicatorilor
caracteristici unor intervale de timp distincte
raportate la:
- o bază fixă (numitorul este mereu
acelaşi);
numar decedati in anul 1990
populatie medie anul 1990

- o bază în lanţ (numitorul este


reprezentat de valoarea intervalului
de timp precedent perioadei în care
s-a realizat investigaţia)

numarul decese in 2002


numarul de decese in 2001

În studiul dinamicii fenomenelor se analizează:

- sporul absolut: - de bază: ca diferenţă între fiecare indicator şi


indicatorul de bază.
- de lanţ: ca diferenţă între indicatori succesivi.

- ritmul dinamicii: - ritmul de se calculează prin raportarea fiecărui


creştere: termen la baza iniţială.
- ritmul reprezintă raportul dintre sporul
sporului (negativ sau pozitiv) al unui an
(interval de timp) şi valoarea iniţială a
seriei (valoarea din intervalul de timp
de referinţă)

Intensitatea variaţiei (pozitive sau negative) a unei caracteristici


este mai bine reliefată cu ajutorul seriilor de mărimi relative decât în cazul
utilizării seriilor de valori absolute.

Valorile medii tipurile de valori medii utilizate şi formulele de


calcul au fost prezentate la capitolul de elemente de statistică utilizate în
sănătatea publică.

Prezentarea datelor (indicatori şi indici).


O cercetare a unui fenomen (în scopul analizei necesare
elaborării deciziilor de intervenţie şi evaluării acestora) presupune
măsurarea şi înregistrarea unui număr mare de caracteristici de la nivelul
fiecărei unităţi de observaţie (subiect investigat).
42
Aceste caracteristici sunt pe de o parte eterogene (cantitativ şi
calitativ) iar pe de altă parte sunt numeroase.
Deoarece rezultatele măsurătorilor la nivel de unitate de
observaţie sunt înregistrate în prima etapă într-o fişă de investigare
individuală (fişă care poate conţine înregistrări ale valorilor găsite pentru
zeci sau sute de caracteristici, cum ar fi spre exemplu foaia de observaţie
utilizată în secţiile clinice) acestea trebuie sistematizate (ordonate,
grupate, centralizate) într-o formă care să permită trecerea la etapa de
analiză, interpretare şi formulare a concluziilor.
Sistematizarea şi prezentarea datelor se face după criterii care
derivă din scopul şi devizul cercetării sub formă de tablele la care se pot
anexa grafice.
Tabelarea se realizează atât pentru indicatori cât şi pentru indici
sau chiar valori medii.
Ca definiţie, tabelul reprezintă o construcţie compusă din rânduri
şi coloane , fiecărui rând şi fiecărei coloane corespundu-i un element de
identitate propriu, individual (o caracteristică, o unitate de măsură sau o
valoare a unei caracteristici). Rândul este delimitat de două linii paralele,
succesive şi orizontale, în cazul coloanelor de două linii paralele,
succesive şi verticale.
Intersecţia dintre un rând şi o coloană delimitează un spaţiu
numit celulă sau rubrică în care se notează valoarea (cantitativă sau
calitativă) observată (măsurată) corespunzătoare rândului şi coloanei
căreia îi corespunde. Celulele se prezintă ca o înşiruire de date numerice
fără să conţină text.
Tabelele asigură caracterul unitar şi sistematizat al prezentării
informaţiilor obţinute, facilitând efectuarea etapelor ulterioare de
prezentare şi analiză a informaţiilor.
Proiectarea tabelelor trebuie să asigure adaptarea formei la
conţinutul lor, elemente care definesc tabelul statistic.
Elementele tabelului sunt reprezentate de matrice (macheta),
valorile numerice şi notele explicative.

Matricea
are ca elemente
constitutive:
- titlul Defineşte conţinutul
tabelului
- capetele de tabel Prima coloană din stânga
şi primul rând superior.
- reţeaua de rubrici În ele se înscriu datele
(celule) numerice
- datele numerice
- totalul Ultima coloană de la
stânga la dreapta şi ultimul
rând inferior

43
Titlul trebuie să conţină:
- denumirea fenomenului investigat;
- modul de abordare a măsurătorilor;
- intervalul de timp şi locul unde s-a realizat investigaţia.

Identificarea tabelelor se face prin numerotarea acestora în


ordinea apariţiei în text sau anexe, prin marcarea în colţul din dreapta sus
prin înscrisul Tabel nr. „x”, fără a se trece în conţinutul titlului termenul
„tabel”.

Capetele de tabel indică prin text elementele caracteristicii


măsurate. Pentru tabelele voluminoase, care se ocupă mai multe pagini,
se impune ca la fiecare pagini să se consemneze capetele de tabel.

Valorile numerice (datele numerice) se înscriu în rubrica


corespunzătoare conform definiţiei coloanei şi rândului cărora
corespunde. Aceste date pot fi valori absolute, relative sau medii.

Totalul (în tabelele care necesită acest aspect) trebuie formulat


funcţie de tipul de valori conţinute în tabel (de obicei sume). Pentru
tabelele voluminoase, care se ocupă mai multe pagini, se impune ca la
finalul fiecărei pagini să se consemneze subtotalul corespunzător paginii
sau paginilor respective.

Notele explicative se poziţionează în afara tabelului, de obicei


sub acesta.

Tipuri de tabele.

În practică se utilizează trei categorii de tabele:

Simple Sunt utilizate de obicei pentru prezentarea sistematizată


(pe criterii cronologice, teritoriale, etc.) a indicatorilor
statistici. Sunt alcătuite de regulă din două coloane, prima
coloană destinată notării valorilor pe care le poate lua
caracteristica iar în cea de-a doua se înscriu numărul de
observaţii (subiecţi) la care a fost identificată valoarea
corespunzătoare.

De grupare Sunt utilizate în cazul în care sunt înregistrate două sau


trei caracteristici prezente la membrii colectivităţii
investigate. În acest caz se centralizează (se notează în
fiecare celulă) numai frecvenţa de apariţie a unei
caracteristici la indivizii care prezintă şi cea de-a doua
caracteristică studiată.
De corelaţie Frecvenţele înregistrate în fiecare celulă reprezintă totalul
(cu dublă subiecţilor la care s-au identificat ambele caracteristici
44
intrare) luate în studiu (bolnav şi expus la factorul de risc, sănătos
care a fost expus factorului de risc, etc.):

boala total
(+) (-)
expunere (+) a b a+b
(-) c d c+d
total a+c b+d a+b+c+d

Tabelele cu dublă intrare sunt utilizate pentru calcularea


probabilităţilor (riscurilor) de asociere, corelaţie şi
validitate cel mai utilizat în practică fiind tabelul de
contingenţă „2x2”, ca în exemplul de mai sus, în care a, b,
c, d sunt simboluri alfabetice utilizate în prezentarea
formulelor de calcul şi în practică sunt înlocuite cu valorile
numerice corespunzătoare definiţiei fiecărei celule a
tabelului (ex. a = numărul de expuşi la factorul de risc şi
care au făcut şi boala = fumători care au fost diagnosticaţi
cu cancer bronşic).

Tabelele simple şi cele de grupare trebuie însoţite de o expunere


descriptivă sub formă de text care să conţină comentarii asupra date
astfel centralizate.
Această analiză poate să facă referiri la evaluarea de etapă
(amplitudinea), în timp (dinamica) sau de circumstanţă (populaţională,
spaţială).
Analiza permite formularea de ipoteze concluzii şi posibilităţi de
valorificare a rezultatelor.

Datele cuprinse în tabele simple sau de grupare pot fi însoţite de


reprezentări grafice, care pe lângă forma estetică de prezentare permit o
analiză complementară, ce pot contribui la descrierea fenomenului
reliefând uneori unele aspecte ce pot constitui puncte de plecare în
aprofundarea studiului formularea de ipoteze.
Pentru a-şi atinge scopul, realizarea graficelor trebuie să
respecte ca şi tabelele, reguli de construcţie şi prezentare. În practică,
pentru realizarea unui grafic sunt utilizate constant elemente comune, iar
acolo unde se impune apar elemente specifice diferitor categorii de
grafice.
Elementele comune de structură ale unui grafic sunt
reprezentate de:

Titlu - defineşte concis conţinutul graficul privind fenomenul


şi colectivitatea investigată, precizând aspectele
45
temporo-spaţiale.

Scara de - realizează dimensiuni vizibile şi comparabile a


reprezentare valorilor numerice pentru o expunere şi o analiză
(unde se sugestivă a fenomenului studiat. Scala se prezintă
impune) sub forma unei linii cu marcaje, fiecărui punct de
marcaj corespunzându-i o valoare exact determinată.
Reţeaua - se realizează utilizând diferite tipuri de linii, paralele
orizontale sau vertical, concentrice, fiecare având
diferite grosimi funcţie de necesităţile de
reprezentativitate. Există mai multe tipuri de reţele dar
cea mai utilizată este reţeaua rectangulară:

Semne - sunt reprezentate de elementele grafice (culori,


convenţionale haşurări, simboluri) care subliniază aspectele de
interes ce se dorec a fi scoase în evidenţă.

Legenda - plasată de regulă în dreapta graficului oferă explicaţii


asupra semnelor convenţionale.

Adnotări În interiorul graficului se permite a se scrie în chenar


scurte explicaţii.
Identificarea graficului se realizează ca şi în cazul
tabelelor prin numerotare, separat de titlu

Pentru a-şi atinge scopul, un grafic trebuie să:


- reprezinte un număr rezonabil de fenomene (să nu fie
încărcat);
- prezinte fenomenele care se exprimă prin aceeaşi unitate
de măsură;
- să utilizeze reţeaua (forma grafică) cea mai sugestivă.

Tipuri de reprezentări grafice.

46
Reprezentările grafice pot fi grupate în:
1. diagrame (sunt cele mai utilizate);
2. historiograme care pot folosi hărţi (cartograme) sau simboluri
(anumite figuri simbolice)

1. Diagramele utilizează pentru reprezentarea grafică a datelor


numerice suprafeţe sau / şi linii. După modul cum sunt alcătuite aceste se
clasifică în diagrame:

- de coloane Utilizează dreptunghiuri (cu latura mică dispusă pe


abscisă sau ordonată) cu înălţimea proporţională cu
valoarea indicatorilor pe care îi reprezintă. Coloanele
se aşează în ordinea descrescătoare a valorilor pe
care le reprezintă.
Este întrebuinţat pentru reprezentarea mai multor
fenomene distincte în aceeaşi dimensiune temporo
spaţială şi populaţională, sau a aceluiaşi fenomen
manifestat în acelaşi timp în teritorii diferite, deci şi
populaţii diferite. O formă particulară constă în
prezentarea sub formă de coloane multiple (grupate)
care permit compararea fenomenelor în teritorii sau
momente diferite.

- de benzi Sunt reprezentări grafice în care dreptunghiurile sunt


foarte înguste, orientate orizontal, cu latura mică pe
ordonată, realizând aspectul unor benzi. Lungimea
benzii este proporţională cu valoarea indicatorului
corespunzător caracteristicii respective. Exemplul cel
mai elocvent îl constituie graficul piramidei vârstelor.

47
Acest tip de reprezentare este indicat a fi folosită în
următoarele situaţii
- indicatorii sunt diferiţi (prevalenţa diferitor
categorii de afecţiuni)
- pentru reprezentarea seriilor având
caracteristici combinate;
- în cazul seriilor dinamice, cu intervale între
perioade (momente de observaţie) mari
(cincinale decenii) sau intervalele de timp sunt
inegale. În această ultimă situaţie nu trbuie
utilizată exprimarea grafică cu ajutorul liniilor
curbe.

- de structură Poate lua forma de dreptunghi, cerc sau disc şi arată


în ce raport se constituie diferitele grupe omogene
ale unei colectivităţi (constituite din indivizi care
prezintă aceeaşi valoare a unei caracteristici
studiate) fată de întreaga colectivitate şi exprimă
greutatea specifică a componentelor fenomenului
studiat. Sub formă grafică, forma geometrică utilizată
(dreptunghi, cerc sau disc) se împarte în părţi
proporţionale cu valoarea indicatorilor (greutăţii
specifice) a fiecărei părţi din colectivitatea studiată.
Pentru fiecare arie se va utiliza un marcaj propriu
(haşurare, culoare) care va fi explicat în legendă.

48
- de distribuţie Se pot prezenta sub formă de histogramă sau
poligon de frecvenţe şi impune utilizarea unui sistem
de coordonate (de regulă cartezian, rectangular).
Histograma este utilizată pentru reprezentarea
valorilor absolute sau relative, folosind clase de
valori sau intervale de variaţie. Elementul geometric
de reprezentare este dreptunghiul a cărui
dimensiune este proporţională cu valoarea numerică
a fiecărei clase, sunt alipite fără spaţii libere între
ele. Suprafaţa totală astfel constituită este egală cu
valoarea totală (absolută sau relativă) a fenomenului
investigat.
Pe abscisă sunt intervalele de valori pe care le poate
lua caracteristica iar pe ordonată sunt notate
frecvenţele, utilizându-se principiul proporţionalităţii.
Mărimea intervalelor de distribuţie determină
definirea a două categorii de histograme şi anume
pentru repartiţiile cu intervale egale sau pentru
repartiţiile cu intervale inegale. În cazul repartiţiilor
cu intervale de variaţie inegale se respectă două
principii care permit o interpretare corectă a
graficului:
- dreptunghiurile nu mai au aceeaşi
lăţime;
- se notează deasupra fiecărui
dreptunghi valoarea
corespunzătoare intervalului
respectiv.

Poligoanele de frecvenţă se realizează prin unirea


printr-o linie frântă, continuă (de obicei frântă) a
tuturor punctelor corespunzătoare centrelor fiecărui
interval.

49
2. Historiogramele pot folosi hărţi (cartograme) sau simboluri
(anumite figuri simbolice).
2.1. Cartograma este harta unui teritoriu împărţită în zone de interes
(de obicei administrativ-teritorial) care se marchează fiecare
distinct (prin culoare sau haşurare) şi în interiorul cărora se
introduc valorile observate ale fenomenului studiat. Poate
cuprinde în interiorul fiecărei zone diferite doagrame.
2.2. Reprezentarea prin simboluri are un caracter mai mult estetic,
sugestiv şi de impact („comercial”) utilizând diverse semne sau
reprezentări în construcţia graficelor.

Pentru prezentarea grafică a seriilor de distribuţie se ţine cont de


caracteristicile acestora în alegerea tipului de grafic corespunzător:

Serii de distribuţie:

Teritoriale Diagramele prin coloane, cu suprafeţe, prin benzi sau


de structură.
Cronologice Diagramele prin coloane, cu suprafeţe, prin benzi sau
histograme
Repartiţie Diagramele prin coloane, cu suprafeţe, prin benzi sau
de structură

50
I.5. Elemente de informatică.

O contribuţie deosebită în cercetare şi intervenţie o are


tehnologia informatică care s-a dezvoltat pe parcursul ultimilor decenii.
Există o multitudine de pachete de programe (softuri) ce pot fi
utilizate în activitatea curentă a oricărui medic sau cercetător. Dintre
acestea amintim Microsoft Excel (pentru calcul tabelar şi prezentare
grafică), Microsoft Access (gestiune baze date), componente ale
pachetului Microsoft Office, SPSS şi nu în ultimul rând pachetul de
programe Epi Info.
Pachetul de programe Epi Info este furnizat în mod gratuit de
O.M.S. şi CDC pentru utilizare în domeniul cercetării medicale, dar cu
restricţiile specificate de furnizori.
Deşi în prezent ultimele versiuni Epi Info operează direct pe
platforma Windos şi sunt foarte „prietenoase”, fiind însoţite de manuale
ajutătoare, trebuie spus că este necesară cumpărarea licenţei pentru
Windos şi utilizarea unui calculator cu resurse (configuraţie) superioare.
Este încă disponibilă varianta Epi Info 6.0. care rulează sub MS-
DOS şi solicită mai puţine resurse din parte calculatorului. Deşi imaginile
pe care le prezentăm în continuare sunt de pe penultima versiune
explicaţiile din text se referă la versiunea 6.0.

51
Elemente pentru utilizarea pachetului de programe
Epi – Info.

Pachetul de programe Epi Info este destinat prelucrării de date


organizate sub formă de chestionare şi sistematizării proiectelor de studiu
precum şi a rezultatelor pentru a fi incluse în comunicări şi rapoarte.
Conceput în primul rând pentru aplicaţii în domeniul
epidemiologiei, Epi Info poate fi utilizat şi în prelucrarea de date din
domeniul medical şi nu numai, pachetul incluzând facilităţi de gestiune a
datelor şi de statistică de tipul celor oferite de programele d – Base, SAS,
SPSS, facilităţi cuprinse într-un singur sistem a cărei copiere şi distribuire
liberă este permisă.

Programe incluse în pachetul Epi – Info şi funcţiile lor:

Epi = meniu principal, apelează celelalte programe;

Eped = editor de texte pentru compunerea chestionarelor sau uz


general; una dintre facilităţile editorului denumită epi – aid, permite
reluarea de programe ce asistă la alcătuirea de texte şi proiectarea
studiilor epidemiologice;

Enter = gestiunea de date, introducere, ştergere, adăugare,


actualizare şi regăsirea în fişierele pe disc.

Analysis = analiza de date cuprinse în fişiere create cu epi – info


sau d – Base: liste, frecvenţe, tabele, grafice, prelucrări statistice
generale sau specifice studiilor epidemiologice; programarea în limbaj
Epi – Info.

Check = verificarea datelor de introducere: domenii de variaţie,


valori legale, codificarea automată şi operaţii aritmetice sau logice între
câmpuri;

Stat calc = calcule statistice pentru date sub formă tabelară;

Convert = conversia fişierelor de date din formate epi – info în


formate compatibile cu alte programe de gestiune a bazelor de date şi
statistică;

Import = conversia de fişiere a datelor produse de alte programe


în fişiere de format epi – info.

Merge = legarea fişierelor de date şi actualizarea lor;

52
Validate = compararea fişierelor de date introduse de doi
operatori diferiţi cu semnalarea diferenţelor;

Epi Info mai cuprinde fişiere Help, o îndrumare interactivă pentru


deprinderea facilităţilor oferite de Eped şi Analysis.

Nivelele de utilizare Epi – Info.

Prelucrarea datelor cu ajutorul facilităţilor oferite de epi info se


poate situa pe trei nivele din punct de vedere al complexităţii.
1. Utilizarea la cel mai simplu nivel presupune:
- rularea meniului principal epi;
- compunerea unui formular de chestionar cu ajutorul Eped;
- introducerea datelor cu Eped;
- analiza datelor cu Analysis pentru a obţine liste, distribuţii de
frecvenţă, tabele de contingenţă, medii şi grafice.

2. O utilizare mai complexă va cuprinde foarte probabil şi


următoarele facilităţi suplimentare de configurare a introducerii şi analizei
datelor conform propriilor cerinţe:
- verificarea corectitudinii datelor introduse şi/sau codificare
automată cu CHECK;
- selectarea de înregistrări, crearea de noi variabile, recodificarea
datelor şi efectuarea de operaţii condiţionate cu ANAYSIS;
- includerea acestor operaţii în programe ce pot fi executate
repetat sau de către persoane fără cunoştinţe de programare;
- import şi export de fişiere din alte pachete de programe cum
sunt dBASE, LOTUS 1-2-3, SPSS;
- schimbarea numelor unor date din fişierele de date cu CHECK.

3. Al treilea nivel de utilizare răspunde nevoilor creării unei baze


de date cu caracter permanent, unui sistem de evidenţă, unui studiu de
mari dimensiuni sau adaptării facilităţilor Epi Info unor cerinţe speciale.
În aceste scopuri pot fi utilizate:
- programarea procesului de introducere a datelor pentru a
include operaţii matematice, verificări logice, schimbări de culoare,
oferirea de variante predefinite şi apelarea de rutine utilizator scrise în
alte limbaje;
- producerea de tabele cu format definit de utilizator din Analysis;
- introducerea concomitentă a datelor în mai multe chestionare în
aceeaşi sesiune de lucru cu ENTER;
- legarea mai multor fişiere în ANALYSIS pentru a realiza
prelucrări ce necesită date din aceste fişiere.

53
Formatul chestionarelor Epi Info.

Pentru a putea introduce date în format Epi Info, acesta trebuie


să aibă la dispoziţie un chestionar, păstrat într-un fişier de text cu
extensia QES şi se va afişa formularul pentru introducerea datelor.
Chestionarul poate fi creat cu EPED sau cu orice alt editor de
text ce poate produce fişiere text (ASCII), de exemplu Wordstar în modul
nondocument.

Chestionarul va cuprinde numele şi tipul câmpurilor variabilelor


din fişierul de date, NUMELE variabilei asociate unui câmp va fi un şir de
până la 10 caractere (litere sau cifre, începând cu o literă). Numele
câmpului va fi urmat de descrierea tipului de date pe care le va conţine.

Tipuri de câmpuri:
- text sau „subliniat” (-) indicat printr-o succesiune de caractere
subliniat, în număr egal cu lungimea dorită a câmpului (maxim 80
caractere);
În acest câmp pot fi introduse orice caractere:

- ex. PRENUMELE text cu majuscule indicat printr-un A


urmat de spaţii, totul cuprins între caracterele „mai mic”
(<) şi „mai mare (>), lungimea fiind dată de numărul de
caractere între < şi >; literele introduse în acest câmp
sunt transformate automat în majuscule;
- ex.: LOCALITATEA < A > sau SEX <A>;

- numeric indicat prin caractere #, numărul de cifre fiind indicat de


numărul de # înainte şi după punctul zecimal (maxim 14 cifre, inclusiv
punctul); se pot introduce cifre sau spaţii; dacă nu se introduce nimic,
rezultatul va fi un caracter – spaţiu ce va fi interpretat drept valoare lipsă;

ex. VÂRSTA # # # sau glicozurie # # . # #.


- „yes/no” indicat prin <Y>; se acceptă doar Y, N, spaţiu sau
apăsarea tastei Enter; ex.: VACCIN AR <Y>;
- data calendaristică; ex.: <dd/mm/yy> în format european.

54
55
Programul „Enter”

Programul „Enter” permite:


1. Crearea unui nou fişier de date (.REC): la solicitarea de a
introduce numele unui fişier de date se răspunde introducând numele
noului fişier, după care se introduce numele fişierului .QES
corespunzător.
2. Introducerea de date: se vor introduce datele dorite în spaţiile
formularului afişat. Pe ultima linie a ecranului sunt afişate comenzile
disponibile şi numărul înregistrării curente (în colţul din dreapta jos).
Apăsând Ctrl-F se afişează alte comenzi, utilizate pentru căutare şi
deplasare de la o înregistrare la alta. Pe penultima linie este indicat tipul
de dată acceptat şi eventual domeniul de variaţie sau valorile legale dacă
acestea au fost stabilite cu CHECK.
Următoarele taste pot fi folosite în timpul introducerii datelor:
- Backspace şterge caracter în stânga cursorului
- Săgeată dr. mută cursorul un caracter la dreapta
- Săgeată stg. mută cursorul un caracter la stânga
- Săgeată sus mută cursorul pe câmpul precedent
- Săgeată jos mută cursorul pe câmpul următor
- PgUp mută cursorul o pagină (ecran) în sus
- PgDn mută cursorul o pagină (ecran) în jos
- Home mută cursorul la primul rând
- End mută cursorul la sfârşitul chestionarului
- Insert comută între modul inserare (caractere
noi introduse între cele deja existente) şi
modul înlocuire (caracterele noi le
înlocuiesc cele existente)
- Delete şterge caracterul de pe poziţia cursorului
- F10 închide fişier . REC şi iese din ENTER
La introducerea datelor, când un câmp este plin, cursorul trece
automat la câmpul următor. Erorile sunt semnalate printr-un „bip” şi
corectarea se face imediat. După introducerea datelor în ultimul câmp,
operatorul este întrebat dacă datele să fie salvate pe disc; răspunsul cu Y
datele vor fi salvate şi se oferi un formular gol pentru o nouă înregistrare;
răspunzând cu N cursorul va sări pe primul câmp al formularului pentru a
putea face corecturile necesare.
3. Adăugarea de noi înregistrări într-un fişier de date: după
intrarea în ENTER se introduce numele fişierului .REC deja existent în
care se vor adăuga datele; ENTER va pune la dispoziţie un formular
pentru introducerea unei noi înregistrări după ultima înregistrare
existentă.
4. Mutarea de la o înregistrare la alta: apăsarea tastei F7 va face
trecerea la înregistrarea precedentă, iar F8 la înregistrarea următoare.
Pentru a obţine un formular gol corespunzând unei înregistrări noi, care
se va adăuga după ultima înregistrare existentă, se apasă Ctrl-N.

56
5. Găsirea unor înregistrări ce corespund unor criterii de căutare:
criteriile vor fi introduse în rubricile unui formular gol, obţinut apăsând Ctrl
– F sau Ctrl-N; căutarea va fi iniţiată la fiecare corespunzând unui anumit
domeniu de căutare:
F1 caută prima înregistrare pornind de la începutul fişierului
ce satisface criteriile dorite;
F2 caută înregistrarea cu un număr dat;
F3 caută prima înregistrare ce satisface criteriile dorite
pornind de la poziţia curentă înapoi (spre sfârşitul
fişierului);
6. Editarea (modificarea) înregistrărilor: pentru a edita (modifica)
o înregistrare introdusă anterior, aceasta va fi găsită î modul descris mai
sus, apoi se vor face modificările dorite utilizând tastele enumerate în
paragraful „introducerea datelor”; după terminarea modificării se va
deplasa cursorul pe ultimul câmp (prin apăsare pe End sau apăsare
repetată pe Enter) şi programul va întreba dacă se doreşte scrierea pe
disc a înregistrării – apăsând Y se va salva pe disc, apăsând N se va
reveni la primul câmp al înregistrării, ieşind din înregistrarea curentă cu
F7 sau F8 înainte de salvare, modificările făcute se pierd. Se pot face
modificări şi cu comanda UPDATE din ANALYSIS.
7. Ştergerea unei înregistrări: apăsarea tastei F6 va provoca
marcarea pentru ştergere a înregistrării curente. Înregistrarea va putea fi
vizualizată în continuare cu ENTER, dar nu se va ţine seama de ea la
prelucrările făcute de ANALYSIS; reactivarea înregistrării se face
apăsând iar pe F6.
8. Restructurarea fişierului de date: se reface chestionarul
conform noilor cerinţe, se lansează ENTER şi după ce se scrie numele
fişierului de date NU se apasă ENTER ci F6, răspunzând în continuare la
întrebarea cu privire la numele chestionarului (modificat). ENTER va
rescrie vechiul fişier . REC ca fişier .OLD.
9. Alte facilităţi oferite de ENTER:
F5 tipărirea unui chestionar în alb sau a unor
înregistrări
F9 afişare listă de valori legale (CHECK) pentru
câmpul curent.

Programul „Analysis”

Programul „Analysis” produce liste, tabele de contingenţă,


statistici şi grafice pe baza datelor înregistrate în fişierele create cu Epi
Info sau cu alte programe a bazelor de date. Cu ajutorul unor comenzi
simple se pot selecta înregistrări care îndeplinesc un anumit criteriu (sau
mai multe), se pot sorta înregistrările într-o anumită ordine, se pot efectua
operaţii matematice sau logice între variabilele fişierului, se pot direcţiona
rezultatele pe monitor, pe imprimantă sau într-un fişier.

57
Setul de comenzi ale programului „Analysis”formează un limbaj
de programe şi pot fi introduse una câte una de la tastatură sau pot fi
scrise într-un program care se poate lansa în execuţie de sub„Analysis”.
În continuare vor fi prezentate comenzile utilizabile în ANALYSIS.
Utilizarea programului „Analysis”presupune cunoaşterea unui minim de
comenzi.

Comenzi de uz general în „Analysis”

READ - Este comanda utilizată la începutul prelucrării


oricărui fişier de date. Fişierul .REC specificat va fi citit. devenind setul
activ de date ce va fi utilizat în toate prelucrările ulterioare până la o nouă
comandă READ. Extensia . REC nu trebuie specificată, fiind implicită.
Sintaxa: READ <nume fişier>
Exemplu: READ CAZHER

ROUTE - Direcţionează rezultatele prelucrărilor spre a fi afişate


pe monitor, pe imprimantă sau scrise într-un fişier.
Sintaxa: ROUTE SCREEN - afişare pe monitor
(implicită).
ROUTE PRINTER - tipărire pe imprimantă.
ROUTE <nume fişier>

58
QUIT - Termină sesiunea de lucru cu programul
ANALYSIS. În loc de comanda QUIT se poate utiliza tasta funcţională
F10 cu acelaşi efect.
Sintaxa: QUIT

VARIABLES - Afişează toate variabilele asociate fişierului de


date activ. În loc de comanda VARIABLES se poate utiliza tasta
funcţională F3.
Sintaxa: - VARIABLES

RELATE - Leagă unul sau mai multe fişiere la fişierul de


date activ, utilizănd un identificator comun. Comanda rămâne variabilă
numai pe durata lucrului cu programul ANALYSIS.
Sintaxa: RELATE <nume de variabila – identificator
comun> <nume fişier>.
Ex.: (READ PERSONE)
RELATE ADRESA GOSPODARII
(TABLES TIP INCALZ BOL RESP).

WRITE - scrie valorile unor / tuturor variabilelor


permanente şi / sau temporare în fişierul de ieşire specificat prin
comanda ROUTE, în formatul dorit de utilizator.
Sintaxa: WRITE („RECFILE”) (nume de variabile).

SET - Permite alegerea diferiţilor parametri de lucru ai


programului ANALYSIS.
Sintaxa: SET (< condiţie> = <valoare>)

Comenzi de vizualizare / actualizare date

LIST - Produce listarea setului de date din fişierul


activ. Dacă nu se specifică nici o variabilă, se listează atâtea variabile
câte încap pe un rând pe ecranul monitorului. Dacă se specifică şi
numele unor variabile, atunci se obţine listarea numai a acelor variabile.
Sintaxa: LIST < var. 1> <var. 2>.. <var.n>
Ex.: LIST NUME PRENUME VÂRSTA

BROWSE - Afişează pe ecran o „fereastră” din fişierul activ


de date, într-o formă tabelară. Cu ajutorul săgeţilor de mişcare a
cursorului se poate vizualiza întregul set de date. Această comandă nu
permite modificări ale setului de date.
Sintaxa: BROWSE (< nume câmpuri>)
Ex.: BROWSE
BROWSE NUME PRENUME VÂRSTA BOALA
TRATAMENT

59
UPDATE - Este o comandă identică cu comanda Browse,
cu deosebirea că se pot face şi modificări în fişierul activ de date.
Sintaxa: UPDATE

TITLE - Specifică titlul tabelelor sau al graficelor


obţinute ca rezultate ale comenzilor programului ANALYSIS. Se pot
adăuga până la 5 rânduri de titlu.
Sintaxa: TITLE < număr titlu 1 – 5 > („< text titlu>”)
Ex.: TITLE 1 „Distribuţia cazurilor de HEPATITĂ după
sex”

HEADER - Specifică un text ce va fi tipărit în partea de sus


a fiecărei pagini cu rezultate ale programului ANALYSIS. Se pot adăuga
până la trei linii de text.
Sintaxa: HEADER < număr header 1 – 3> („< text
header>”).
Ex.: HEADER 1 „ CENTRUL DE MEDICINĂ
PREVENTIVĂ ALBA”.

FOOTER - Specifică un text ce va fi tipărit în partea de jos


a fiecărei pagini cu rezultate ale programului ANALYSIS. Se pot adăuga
până la 3 linii de text.
Sintaxa: FOOTER < număr footer 1 – 3 > ( „< text
footer>”)
Ex: FOOTER 1 „ SURSA: ANUAR STATISTIC 1990”

NEWPAGE - Realizează saltul la pagină nouă când


rezultatele se tipăresc pe imprimantă.
Sintaxa: NEWPAGE

Comenzi pentru prelucrări statistice

FREQ - Produce un tabel pe baza datelor din fişierul


activ de date, cuprinzând frecvenţele absolute, relative procentuale şi
cumulate ale variantelor variabilei specificate în comandă. Dacă se
specifică mai mult de o variabilă, se va obţine câte un tabel pentru fiecare
variabilă.
Sintaxa: FREQ <nume variabilă> (nume variabile)
Ex.: FREQ BOALĂ, FREQ BOALĂ SEX

TABLES - Produce un tabel de contingenţă pentru


variabilele specificate în comandă. Liniile tabelului sunt denumite după
variantele primei variabile specificate, iar coloanele după variantele celei
de a doua variabile specificate în comandă Fiecare celulă a tabelului va
conţine numărul de înregistrări ce au valori corespunzătoare variantelor
liniei şi coloanei.
60
După cum se poate constata pe imaginea de mai sus prin simpla
trecere a datelor în tabelul de contingenţă sunt calculate automat o serie
de date:

+ Disease - Analysis of Single Table


+-----------------+ Odds ratio = 1.49 (1.12 <OR< 1.98)
+¦ 232 ¦ 121 ¦ 353 Cornfield 95% confidence limits for OR
+--------+--------¦ Relative risk = 1.17 (1.05 <RR< 1.30)
-¦ 325 ¦ 253 ¦ 578 Taylor Series 95% confidence limits for RR
+-----------------+ Ignore relative risk if case control study.
E 557 374 931
x Chi-Squares P-values
p ----------- --------
o Uncorrected : 8.22 0.0041452 ---
s Mantel-Haenszel: 8.21 0.0041654 ---
u Yates corrected: 7.83 0.0051419 ---
r
e

Programul permite trecerea la analize şi mai complexe, impuse


de devizul cercetării.

61
SPSS (Statistical Package for the Social Sciences) este un
produs destinat gestionarii si analizei statistice a datelor oferind o foarte
mare varietate de prelucrări statistice, de la cele mai des folosite în
practica (statistici descriptive, teste statistice) si până la cele care pretind
cunoştinţe statistice avansate.
În prezent, versiunile cele mai folosite pe calculatoare personale
sunt:
SPSS/Windows 7.0, care rulează sub sistemul de operare
Windows 95 si sub Windows NT 3.5;
SPSS/Windows 10.0, care funcţionează in reţea sub sistemul de
operare Windows 98 până la Windows XP.

Unele metode de calcul aplicate de SPSS/Windows nu sunt


accesibile în alte programe de analiza statistica, precum cele prezentate
mai sus.
SPSS/Windows este realizat sub forma modulara, fiecare
utilizator având posibilitatea de a achiziţiona doar acele componente care
îi sunt necesare. Noi prezentăm doar caracteristicile pentru „Base
module”.
Base module realizează gestionarea datelor si a fişierelor,
transformarea datelor, diverse reprezentări grafice (histograme, diagrame
de structura, nori statistici etc.), precum si prelucrările statistice cele mai
cunoscute si mai frecvent utilizate:
 • calculul frecventelor, al indicilor tendinţei centrale si al
indicatorilor variabilităţii;
 • calculul unor masuri de asociere si testarea
independentei probabilistice pentru date incluse în tabele
de contingenţa;
 • compararea mediilor si a dispersiilor eşantioanelor;
 • analiza de varianta unifactorială;
 • calculul coeficienţilor de corelaţie Pearson, Kendall si
Spearman;
 • analiza de regresie liniara;
 • teste neparametrice.

Modulul Professional Statistics include proceduri care servesc


la cercetarea relatiilor dintre variabile.
Modulul Advanced Statistics permite efectuarea unor prelucrări
statistice complicate, necesare atunci când datele nu îndeplinesc
condiţiile de aplicare a prelucrărilor statistice obişnuite.
Modulul Tables serveste la condensarea datelor în tabele cu
una, doua sau trei dimensiuni;
Modulul Exact Tests determina nivelul de semnificaţie (Pv);
Modulul CHAID (Chi-squared Automatic Interaction Detector)
aplica algoritmi de grupare, pentru împărţirea unei populaţii în grupe
disjuncte, care diferă între ele în ceea ce priveste un criteriu precizat;
62
Modulul Categories se foloseşte în scopul determinării influentei
exercitate de caracteristicile produselor sau a serviciilor asupra preferinţei
consumatorilor;
Modulul TRENDS serveşte la analiza si reprezentarea grafica a
seriilor de timp

63