Documente Academic
Documente Profesional
Documente Cultură
Biostatistica Spinei PDF
Biostatistica Spinei PDF
NICOLAE TESTEMIANU
COALA DE MANAGEMENT N SNTATE PUBLIC
Larisa SPINEI
Oleg LOZAN
Vladislav BADAN
BIOSTATISTICA
Chiinu 2009
BIOSTATISTICA
CZU: 311.2
S 73
CUPRINS
ISBN 978-9975-78-743-7
CAPITOLUL
BIOSTATISTICA
BIOSTATISTICA
BIOSTATISTICA
FURNIZOR DE
INFORMAIE
FR COMPUTER
S reinem c fa de statistic, teorie sau practic, ne gsim permanent n una din situaiile de mai jos:
- suntem utilizator de informaie statistic avnd sau nu la ndemn
un computer;
- suntem furnizor de informaie statistic avnd sau nu la ndemn
o reea de calculatoare;
10
BIOSTATISTICA
11
Fenomenele de mas, n general, apar ca o mulime de forme individuale diferite, cu existen distinct, aparent fr nici o legtur de la o
form la alta, dar care analizate comparativ se constat c au o aceeai
esen. Aceasta se explic, n principal, prin faptul c ele sunt generate
de o serie de cauze comune care se manifest, de regula, n condiii
diferite, n consecin, la fenomenele de mas din societate, relaiile de
multicauzalitate direct sau indirect care le determin fac imposibil
cunoaterea legilor care le produc i guverneaz, dac se iau n studiu
izolat doar cteva forme de manifestare a lor, ignornd ansamblul din
care fac parte. Explicaia const n faptul c n practic formele individuale de manifestare difer de la o unitate la alta n funcie de modul n
care se asociaz i se combin factorii sistematici cu cei ntmpltori, cei
eseniali cu cei neeseniali, cei obiectivi cu cei subiectivi, lsnd impresia
c fiecare form individual din cadrul ansamblului se produce la ntmplare, fr s existe o cauzalitate cert. Dar, analizndu-le la nivel de
ansamblu, ele par asemntoare ntre ele, fiind generate de cauze eseniale comune, supunndu-se aceleiai legi de apariie i dezvoltare. La
aceasta trebuie adugat i un alt aspect i anume, relaiile de cauzalitate
dintre fenomenele sociale au caracter dinamic, ca urmare a modificrii
permanente a condiiilor n care se manifest. De aici, se poate trage
concluzia logic c n astfel de cazuri, legea acioneaz att static, cnd
fenomenele de mas sunt circumscrise n aceleai condiii de timp, ct i
dinamic, cnd fenomenele sunt delimitate n spaiu i organizatoric, dar
nregistrate n uniti de timp diferite.
Ca atare, pentru a descoperi legea de apariie a unor astfel de fenomene nu sunt suficiente numai metodele experimentale, ca n cazul
fenomenelor de tip determinist ci i altele, bazate pe o serie de abstractizri succesive, prin care s se rein numai ceea ce este esenial, tipic
n forma lor de manifestare, prin eliminarea aspectelor ntmpltoare
i neeseniale. Aceasta presupune c se iau n studiu toate cazurile
individuale deoarece, spre deosebire de fenomenele care se produc
pe baza legilor dinamicii, care apar ca fenomene identice, fenomenele
de mas avnd cauze comune de apariie dar i unele cauze particulare care difer de la un caz la altul, sunt numai asemntoare ntre
ele. Principala lor proprietate este variabilitatea n timp i n spaiu i
legea de apariie a acestora se manifest ca tendin ce nu poate fi
cunoscut i verificat dect la nivelul ansamblului i nu n fiecare caz
12
BIOSTATISTICA
13
14
BIOSTATISTICA
i o mare parte din cunoaterea matematic se realizeaz n mod deductiv, ceea ce nseamn rezolvarea problemelor cunoaterii pornind
de la general la particular. Aceasta nu nseamn c nu se procedeaz
uneori i inductiv. Dar deosebirea const n faptul c statistica care are
ca obiect de studiu un anumit domeniu din natur, tehnologie sau societate, pornete de la particularul obinut prin observarea (nregistrarea) valorilor empirice spre ceea ce este general, valabil pentru ntregul
ansamblu pe cale inductiv. Orice cunoatere tiinific, inclusiv cea
statistic, se realizeaz prin alternana inductiv-deductiv, dar calea
tipic statistic este cea inductiv. Aceste deosebiri apar i mai evident
cnd fenomenele studiate au coninut social-economic.
Considernd societatea omeneasc ca fiind de natur obiectiv ce
se dezvolt pe baza unor legi care pot fi cunoscute i verificate n condiii specifice de timp i spaiu, statisticii, ca principal instrument de cunoatere, i revine o serie de sarcini ce pot fi rezolvate cu ajutorul unor
metode, procedee, tehnici de calcul i interpretare statistic. Totalitatea
operaiilor, tehnicilor, procedeelor i metodelor de investigare statistic
a fenomenelor formeaz metodologia statistic.
Datorit faptului c metoda statistic poate s fie folosit n studiile
concrete efectuate de celelalte tiine, care studiaz dintr-un anumit
unghi ntreaga societate sau numai o parte a acesteia, a fcut ca ea s
fie uneori considerat ca o disciplin metodologic ce poate fi aplicat
de fiecare dat cnd apare necesitatea caracterizrii cantitativ-numerice a fenomenelor i proceselor economice i sociale. De fapt, se i
apreciaz c metoda statistic a devenit un instrument eficient i indispensabil tuturor tiinelor empirice. Aceasta apreciere este nemijlocit
legat de faptul c statistica vine n ntmpinarea particularizrii tot mai
accentuate a tiinei, precum i dorina de cuantificare specific pentru aproape toate aceste tiine. Pentru a putea deveni un instrument
indispensabil cunoaterii actuale a fenomenelor din cadrul diferitelor
domenii particulare este necesar ca ea nsi s se preocupe n permanen de elaborarea i perfecionarea unei metodologii tiinifice,
unitare care s-i confere statutul de disciplin tiinific autonom. Ca
atare, definirea metodei statisticii social-economice trebuie s se fac
potrivit cu natura fenomenelor cercetate i cu scopul cercetrii. Procedeele i metodele se aplic urmnd etapele oricrui proces de cunoatere, conceput ca un proces dialectic. Specificitatea metodologiei sale
15
16
BIOSTATISTICA
17
18
CAPITOLUL
II
BIOSTATISTICA
19
20
BIOSTATISTICA
Aadar, suma probabilitii prezenei fenomenului cu contraprobabilitatea lui este egal cu unitatea, iar n procente cu 100,0%.
Rezultatele de mai sus pot fi exprimate i altfel, c probabilitatea
apariiei fenomenului P se afl n hotarele dintre 0 i 1 sau 0 -100,0%.
Cu ct probabilitatea e mai aproape de 1 sau 100,0% cu att prezena
fenomenului n totalitate e mai real. Aceast teorie argumenteaz legea cifrelor mari.
21
22
BIOSTATISTICA
23
cercetarea periodic (la anumite intervale de timp) se utilizeaz atunci cnd fenomenul studiat are o variabilitate mult mai
mic n timp, sau o apariie i evoluie periodic. De exemplu, se
tie c o parte din boli pot da acutizri n anumite perioade ale
anului (boala ulceroas, reumatismul) sau evolueaz n condiii
atmosferice specifice ale anului (gripa, virozele organelor respiratorii, unele boli infecioase etc.). Ca urmare, cercetarea poate
fi efectuat numai pe parcursul acestor perioade de timp sau
la sfritul lor. n alte cazuri se recurge la cercetri periodice
o dat la 5-10 ani. Astfel de cercetare se impune n cazul unui
volum mare al totalitii (structura populaiei dup sex, vrst,
ocupaie, locul de trai, starea civil etc.).
- cercetare la un moment critic atunci cnd se fixeaz data i
chiar ora de nregistrare a fenomenului studiat (recensmntul
populaiei, nregistrarea personalului medico-sanitar etc.).
Dup frecvena observrilor cercetrile pot fi:
- de o singur dat;
- repetate.
2. Metoda epidemiologic sintetizeaz cele evideniate prin metoda observrii i prezint un studiu corelativ al fenomenelor din cadrul
sntii publice cu factorii (cunoscui sau presupui) de risc. Aceast
metod, ca i cea precedent, folosete pe larg o serie de metode
matematice pentru a gsi legitatea schimbrilor variabile, dinamice,
structurii fenomenelor studiate n legtur cu factorii ce le determin
(valorile medii, dispersia, corelaia, regresia etc.).
3. Metoda istoric e strns legat cu primele dou metode fundamentnd studiul sanitar al sntii publice sau al activitii serviciilor
pentru sntate n cadrul dezvoltrii istorice a societii.
Este un fapt dovedit c gradul de dezvoltare a societii, ornduirea
social n trecut i n prezent determin nivelul de trai al populaiei,
calitatea vieii, deci i sntatea ei.
Aici mai des se folosete metoda comparrii aceluiai fenomen
raportat la diferitele categorii de populaie (difereniate dup semne
sex, grupuri sociale, vrst, ocupaii etc.), teritorii (continente, ri,
regiuni, localiti) studiate acum i n trecut.
4. Metoda economic precizeaz starea de sntate public,
determinat de prezena surselor bneti, materiale, economice etc.
24
BIOSTATISTICA
Aceast metod se folosete la aprecierea eficacitii activitii serviciilor pentru sntatea populaiei (din punct de vedere social i economic)
n cadrul medicinii de stat, prin asigurare, precum i celei private.
O varietate a acestei metode e metoda economico-matematic cnd
se utilizeaz n combinaie cu o serie de metode matematice ce ne permit s optimizm aciunile sanitare, reelei sanitare legate de probleme
de sntate a populaiei cu analiza de sistem, de prognozare etc.
5. Metoda experimental urmrete scopul de a elabora i aproba noi forme i metode de organizare a muncii, a asistenei medicale,
aplicarea n practic a experienei naintate, verificarea reciproc a diferitelor proiecte, ipoteze, a noilor metode de diagnosticare i tratament
etc. Specificul acestei metode const n aceea c cercettorul singur i
creeaz obiectul i metoda de cercetare, reproducnd astfel fenomenele sau aspectele ce-l intereseaz n condiii de laborator, iar mai apoi
analiznd totul n detaliu conform scopului stabilit.
Orice experiment nu depinde numai de dorina i nzuina savantului, ci e o problem de ordin social. Rezolvarea lui va cere din partea
acestuia mbinarea mai multor metode de cercetare.
n genere, n orice studiu statistic cu scop de cunoatere nu se
folosete numai o metod izolat de cercetare. Pentru o investigare
multilateral a fenomenului i innd cont de scopul propus cercettorul
trebuie s decid ce metode se impun i n ce etap.
Etapa I este legat direct de metoda de observare epidemiologic,
economic i de acumulare (culegere) a datelor informative. n etapa
a II-a se recurge la o serie de metode statistico-matematice de prelucrare a informaiei acumulate, de asemenea i la metode economice,
economico-matematice.
n etapa a III-a vom folosi i metoda istoric comparnd rezultatele curente ale studiului cu cele ce au fost nregistrate n trecut. Astfel
cercettorul poate s-i ating scopul studiului i s analizeze n ansamblu toate caracteristicile de baz ale fenomenului trgnd concluzii
corecte i elabornd msurile practice necesare.
Metoda observrii dup modalitatea ndeplinirii poate fi: statistic i de
expertiz. Iar dup timpul ndeplinirii: curent (pe parcursul anului), periodic (o dat la doi ani), la un moment critic (la finele anului calendaristic).
Metodele de colectare a datelor pot fi divizate n dou grupe mari:
direct i indirect:
25
Metoda observrii
Anchetare
Interviu
Monitorizare
Cea indirect reprezint extragerea datelor din documentaia medical.
Cel mai des n studiile statistice medicale sunt folosite urmtoarele
metode de colectare a informaiei.
1. Metoda observrii (direct) se utilizeaz de obicei n clinic,
cnd medicul, dup ce precizeaz anamnez bolnavului, face studiul
obiectiv i investigaiile de laborator ale pacientului, nregistreaz n
fi aceste date. Analogic se procedeaz i n policlinic, i la deservirea chemrilor la domiciliu. Dac cercettorul statistic vrea s foloseasc aceast metod, el trebuie s fie prezent alturi de medic i s
nregistreze datele de care are nevoie. Sunt cazuri cnd pe cercettor
l intereseaz nu numai date legate de boal, dar i probleme de ordin
personal i social, ca urmare nregistrarea direct poate fi fcut sub
form de anchet. n acest caz cercettorul trebuie s beneficieze de
ncrederea respondentului.
2. Metoda extragerii informaiei dintr-un formular statistic (indirect) fia medical a bolnavului de staionar, fia medical a bolnavului de ambulator, tichetul statistic de eviden a diagnosticului definitiv
(precizat), epicriz, raport statistic privind numrul de maladii nregistrate
la bolnavii domiciliai n teritoriul de deservire a instituiei curative etc.
Cnd se efectueaz acest lucru se ine cont de programul de culegere
a informaiei, unde trebuia s fie indicat concret care este unitatea de
eviden, caracteristicile ei atributive i cantitative. Datele privind aceste
caracteristici se extrag din documentele enumerate mai sus i se noteaz ntr-un registru special sau n mai multe fie, pe fiecare semn aparte.
Aceast metod se folosete frecvent n studiile statistice i poate fi utilizat de nsui cercettorul sau de persoane special instruite, n acest
caz fiind necesar controlul logic al materialului cules.
3. Metoda de anchetare utilizeaz informaia prin intermediul unor
anchete, anterior pregtite, care includ ntrebri speciale, la care respondenii trebuie s dea rspuns. Aceast metod se folosete n studiile sociologice, dar poate fi aplicat i n orice studiu statistic sanitar
26
BIOSTATISTICA
n mbinare cu alte metode de culegere a informaiei. Este foarte important ca ntrebrile incluse n anchet s fie formulate clar i concret,
n caz contrar respondenii nu vor ti ce s rspund la ele. Totodat
ancheta trebuie s fie anonim, adic s nu cerem de la respondeni s
ne comunice numele, adresa domiciliului .a., deoarece aceasta poate
s-l fac pe cel anchetat s nu rspund n genere la nici o ntrebare.
Anchetele de informare se utilizeaz mai ales n cercetrile strii
de sntate a populaiei i n cercetrile epidemiologice. ntrebrile din
anchet pot fi de tip:
- deschis cnd la ntrebare nu se dau variante de rspuns i respondentul trebuie s le formuleze singur;
- semideschis se dau variante de rspuns, dar se las un rnd
liber pentru expunerea unor opinii personale ale respondentului;
- nchis cnd la ntrebare sunt date 2 i mai multe variante de rspuns, iar respondentului i se propune s aleag unul din ele.
Datele acumulate pot fi analizate prin urmtoarele metode:
Metoda istoric
Metode epidemiologice
Metode economice
Metoda experimental
Calcularea indicatorilor relativi i medii
Metode de corelaie i regresie
Determinarea testului de semnificaie (t) i pragului de semnificaie (p)
27
Numrul de uniti de observare determin volumul totalitii supuse studiului i se noteaz prin litera n. Dup volum deosebim dou
tipuri de totaliti statistice:
Totalitatea integral (generala, univers statistic)
Totalitatea selectiv
Totalitatea selectiva are urmtoarele caracteristici de baz:
trebuie sa dein caracteristice de baz de care dispune cea
integral;
trebuie sa dispun de un volum.
Metodele de selectare a totalitii selective:
cercetarea prin sondaj
cercetarea monografic
cercetarea selectiv:
aleatorie
mecanic
tipic.
Cercetarea prin sondaj se bazeaz pe o metodologie precis, unitar, valoarea rezultatelor depinznd de efectuarea ei corect tiinific.
Aceast cercetare nu permite s se trag concluzii generale, valabile
pentru totalitatea integral, fiind mai mult o metod de investigaie preventiv unui studiu de mare volum. De obicei se efectueaz pe baza
unui eantion mic.
Cercetarea monografic e un studiu selectiv n care limitarea volumului eantionului e completat cu o aprofundare a cercetrii caracteristicilor eseniale. Acest tip de eantion poate fi limitat n cazul unui
examen medical clinic cu un scop bine determinat (stabilirea gradului de
rspndire al unei boli sau al unui grup de boli din aceeai clas). Tot astfel de cercetri pot fi aplicate pe un eantion mic dup spaiu, dar majorat
n volum dup timp, adic n dinamic (studiul natalitii, mortalitii pe o
perioad de mai muli ani ntr-o circumscripie rural, dar ntr-o strns
legtur cu factorii social-economici, sanitaro-igienici etc.).
Cercetarea selectiv studiul selectiv reprezentativ pentru totalitatea integral i care poate fi efectuat prin selecia:
- aleatorie (ntmpltoare, randomizat simpl) se efectueaz prin
extrageri din liste n care sunt nregistrate toate cazurile individuale
fr nici o grupare sistemic prealabil. O metod frecvent de selecie aleatorie este tragerea la sori;
28
BIOSTATISTICA
, fiecare al 10-lea;
etc.
29
30
BIOSTATISTICA
31
32
BIOSTATISTICA
speciale (specifice);
standardizate.
Vrsta
0-14
15-64
65->
Total
0-14
15-64
65->
Total
x 10n
Nord
Sud
x 10
Proporia
50%
30%
20%
100%
50%
30%
20%
100%
Tabelul 2.
Numrul de cazuri de mbolnviri n funcie de vrst i localitatea (abs., %).
Nord
Sud
Nr. cazuri
10
6
4
20
15
9
6
30
Exemplu Rata caz-fatalitate (RCF) proporia cazurilor unei condiii specifice fatale ntr-o perioad specific de timp.
Sinonimele pentru rat sunt: frecven, nivel, rspndire, intensitate.
Raportul permite compararea unei populaii cu alta.
Raportul este un numr mprit la altul.
Exemplu: raport dintre brbai i femei, nateri i avorturi, nr. de
medici i asistente medicale. n aceste cazuri nu este necesar o relaie specific ntre numrtor i numitor. Raportul poate fi prezentat
astfel x : y sau
33
Vrsta
0-14
15-64
65->
Total
0-14
15-64
65->
Total
Nr. cazuri
10
6
4
20
15
9
6
30
Proporia
50%
30%
20%
100%
50%
30%
20%
100%
Nr. populaiei
100
200
100
400
100
200
100
400
Rata
10%
3%
4%
15%
4,5%
6%
34
BIOSTATISTICA
35
Prelucrarea materialului statistic nu se oprete la gruparea materialului deoarece datele brute obinute, de cele mai multe ori, nu permit
aprecieri comparative. De aceea materialul statistic este supus n continuare unei prelucrri cu ajutorul metodelor de statistic matematic
n vederea obinerii unor indicatori statistici ca: valori relative, valori
medii, criterii de variaie, corelaie, veridicitate, ce vor permite aprecieri
comparative, corecte i concluzii semnificative.
Urmare gruprii datelor statistice rezult serii statistice.
Seria statistic de variaie este irul de valori numerice ale caracteristicii, ordonate cresctor sau descresctor n funcie de mrimea
acestora.
Seria statistic reprezint corespondena a dou iruri, cel al valorilor variantelor (x) i cel al frecvenelor (f), motiv pentru care se mai
numete i serie de distribuie/serie de frecvene. Suma frecvenelor
variantelor corespunztoare corespunde cu numrul de cazuri cercetate (f = n).
Seriile statistice de variaie pot fi de dou categorii: simple i grupate. Cnd fiecrei valori a caracteristicii i corespunde o singur frecven vorbim de o serie statistic simpl, iar cnd fiecrei valori i corespund mai multe frecvene vorbim de o serie statistic grupat.
Unii autori definesc seria statistic n modul urmtor: simpl de
regul se formeaz n cazul unui numr mic de cazuri cercetate
30 i grupat care se formeaz n cazul unui numr mare de cazuri
cercetate > 30.
Cerinele de baz pentru formarea seriei de variaie:
1. Ordonarea valorilor variantelor;
2. Numrarea frecvenelor fiecrei variante;
3. Determinarea numrului de grupe i valorii intervalului;
4. Gruparea seriei de variaie, utiliznd intervalul cu respectarea continuitii seriei;
5. Reprezentarea grafic a seriei de variaie.
Toate 5 cerine snt obligatorii pentru formarea seriei de variaie
grupate, cerinele 1,2 i 5 pentru formarea seriei de variaie simpl.
Numrul de grupe n serie se determin n dependen de numrul
cazurilor cercetate (Tab.3).
36
BIOSTATISTICA
Tabelul 3
Numrul de grupe n funcie de numrul de cazuri
Numr cazuri
31-45
46-100
101-200
201-500
Numr grupe
6-7
8-10
11-12
13-17
n cazul seriei de variaie n care variantele snt exprimate n intervale de grup, pentru a le putea introduce n calculul statistic stabilim
mijlocul fiecrei grupe, reprezentat printr-o singur valoare, care este
centrul intervalului grupei obinut prin semisuma valorilor variantelor
extreme ale fiecrui interval de grup (Tab.4).
Tabelul 4.
Gruparea seriei statistice n funcie de dini afectai
Grupe de valori ale dinilor
afectai
1-3
4-6
7-9
10-12
13-15
Total
Frecvene
2
5
8
11
14
106
252
75
50
25
508
37
38
BIOSTATISTICA
39
Exemple de calcul:
Greutatea la natere la un numr de 6 copii de sex masculin este
(n grame): 3000; 2600; 2800; 3100; 3200; 2700.
Aplicnd formula de calcul vom obine media greutii, la natere,
la lotul de 6 copii, de 2900 gr:
Exemple de calcul:
ntr-un spital, medicii prezint urmtoarea distribuie conform vrstei: 40 persoane de 37 ani; 40 persoane de 38 ani; 10 persoane de 41
ani i 10 persoane de 44 ani.
Aplicnd formula de calcul, vom obine vrsta medie a personalului,
de 38,5 ani:
40
BIOSTATISTICA
41
Tabelul 5
Tabelul 6
Zile (x)
10
11
12
13
14
18
21
Bolnavi (f)
12
17
14
Din exemple se poate constata c valoarea mediei aritmetice ponderate se situiaz n plus sau n minus de partea unde frecvenele snt
mai mari.
n cazul calculrii mediei aritmetice ponderate n serii statistice n
care valorile variantelor snt mari (de ordinul sutelor, miilor sau zecilor
de mii) i reprezentate de cifre zecimale, iar frecvenele corespunztoare fiecrei variante sunt de asemenea numeroase, operaia devine
deosebit de dificil. n acest caz recurgem la o metod simplificat a
calculrii mediei aritmetice ponderate, i anume metoda momentelor.
Formula de calcul:
= Xo M1
ap
unde:
media aritmetic ponderat
Xo media ipotetic
M1 momentul 1
Momentul 1:
unde:
d deviaiile (abaterile) de la medie
f frecvena
f suma frecvenelor (numrul cazurilor)
Lum ca exemplu seria de variaie a nlimii nou-nscuilor de sex
masculin, expus n tab. 6.
Valorile
variantelor
nlimii n cm
(x)
Frecvenele
(numrul
cazurilor)
Produsul
valorilor cu
frecvenele (xf)
Deviaia
de la medie
(d)
Produsul
deviaiei de la
medie cu frecvenele (df)
46
47
48
49
2
5
13
30
92
235
624
1470
-4
-3
-2
-1
50
89
4450
51
52
53
54
55
56
57
49
40
20
7
3
1
1
2499
2080
1060
378
165
56
57
1
2
3
4
5
6
7
49
80
60
28
15
6
7 +245
Total:
260 = f (n)
13166 = xf
-----
-8
-15
-26
-30 -79
166 = df
42
BIOSTATISTICA
43
Tabelul 7
nlimea nou-nscuilor de sex masculin (cm).
Valorile variantelor
Frecvenele
nlimii n cm (x) (numrul cazurilor)
Deviaia
de la medie (d)
Produsul deviaiei
de la medie cu
frecvenele (df)
46
47
48
49
50
2
5
13
30
89
-5
-4
-3
-2
-1
-10
-20
-39
-60
-89
51
49
0
40
40
21
12
5
6
6 + 124
52
53
54
55
56
57
40
20
7
3
1
1
1
2
3
4
5
6
Total:
260 = f (n)
-----
-218
94 = df
44
BIOSTATISTICA
Asupra mediei aritmetice sunt de fcut cteva observaii i de subliniat cteva proprieti:
1) Definiia dat mediei aritmetice este valabil numai dac valorile
individuale nregistrate sunt numerice. Pentru o serie cu valori nenumerice nu se poate calcula media aritmetic;
2) Mrimea mediei aritmetice calculate este unic; o serie nu posed
mai multe medii aritmetice distincte;
3) Mrimea mediei aritmetice poate sau nu s coincid cu vreo valoare individual nregistrat;
4) Media are ntotdeauna valoarea cuprins ntre valoarea minim din
serie (Xmin) i valoarea maxim (Xmax);
5) Suma abaterilor valorilor individuale de la media lor este ntotdeauna egal cu zero (adic distanele fa de centru se balanseaz, se
compenseaz reciproc);
6) Media aritmetic este legat de toate valorile numerice nregistrate
i, n consecin, este sensibil la prezena valorilor aberante.
7) Dac o serie este alctuit din mai multe serii componente, pentru
care s-au calculat medii pariale, atunci media ntregii serii poate fi
calculat ca o medie ponderat din mediile pariale.
Media armonic
Media armonic este o medie cu aplicaie special care se determin ca valoarea invers a mediei aritmetice calculat din inversele
valorilor seriei.
Media armonic simpl
45
Xi
suma
valorile individuale
inversul valorilor individuale
numrul de valori.
n realitate, media armonic se utilizeaz rar, n special la stabilirea
preurilor medii.
Media cronologic
Media cronologic se calculeaz n cazul unei serii de valori, care
prezint variaii n timp (lunare, anuale).
Formula de calcul
46
BIOSTATISTICA
unde:
X(1, 2, 3, 4, n) mrimea valorilor la nceputul primei perioade i sfritul celor patru perioade;
N numrul de perioade la care ne referim
Exemplu: numrul de gravide n eviden la medicul de familie la
nceput de an a fost 120, iar la sfritul celor patru trimestre 130, 144,
152, 100. Conform mediei aritmetice simple, ar fi fost 129 gravide, n
timp ce media cronologic este de 134, conform formulei:
Media ptratic
Este tot o medie de calcul cu aplicaii speciale i reprezint valoarea care, nlocuind termenii seriei, nu modific suma ptratelor lor.
Se folosete cnd fenonenul supus cercetrii nregistreaz modificri
aproximativ n progresie geometric.
Media ptratic simpl:
Modulul
Este mrimea medie care corespunde valorii cu cele mai multe
frecvene (n seriile de variaie simple). Calculul se efectuiaz deci simplu, lund valoarea cu frecven maxim drept valoare medie. Rapiditatea cu care se stabilete modulul este singurul avantaj, deoarece el
nu prezint un etalon precis al valorii medii dect n cazul distribuiilor
normale (simetrice) de frecvene.
Modulul nu se determin n funcie de toate mrimile valorilor variantelor, ci de una singur, cea cu frecven maxim (n repartiiile
47
unde:
XMo limita inferioar a intervalului modal;
h mrimea intervalului modal (cu frecvena cea mai mare);
1 diferena dintre frecvena intervalului modal i a intervalului precedent;
2 diferena dintre frecvena intervalului modal i a intervalului urmtor;
Se consider urmtoarea distribuie (Tab.8).
Tabelul 8
Distribuia persoanelor n funcie de salariu
Salariu
400-600
600-800
800-1000
1000-1200
1200-1400
Persoane
5
10
15
30
20
n cazul distribuiilor de frecvene moderat asimetrice exist urmtoarele relaii matematice aproximative ntre modul, median i medie
aritmetic:
Mo = 3( Me)
Mo = 3Me 2
Mo Me = 2(Me )
n cazul distribuiei simetrice de frecvene cele trei valori medii se
suprapun:
X = Me = Mo
48
BIOSTATISTICA
Observaii:
1) Pe graficul repartiiei statistice valoarea modal corespunde punctului n care graficul i atinge maximul;
2) Are avantajul principal fa de medie i cuantile c se determin
rapid si are o semnificaie simpl;
3) Exist n practic serii cu distribuii multimodale. n astfel de situaii
se determin mai multe valori modale;
Mediana (cuantila de ordinul 2)
Ca definiie, mediana, n serii statistice simple, este valoarea acelei
variante care mparte n dou jumti egale numrul variantelor, aezate n ordine crescnd sau descrescnd. n cazul unui numr impar
de variante, mediana va corespunde exact valorii de la mijlocul seriei.
n seriile cu numr par de variante mediana va corespunde mediei aritmetice simple a celor dou valori de la mijlocul seriei.
Exemplu de calcul:
nlimea la natere la un numr de 5 copii a fost: 47, 48, 49, 51,
52 cm. Mediana, coresponznd valorii de la mijlocul seriei va fi 49 cm.
n cazul unei serii de 6 valori, cum ar fi: 47, 48, 49, 51, 52, 53 cm,
mediana va fi 50cm (49 + 51/2).
n serii statistice grupate, formula de calcul a medianei este mai
complicat, valoarea medianei aflndu-se n interiorul intervalului valoric, n care se gsete valoarea frecvenei ce mparte seria n dou
jumti egale.
Formula de calcul:
Unde:
xMe limita inferioar a intervalului median;
f frecvenele valorilor variantelor;
fcm frecvenele cumulate pn la intervalul median;
h mrimea intervalului median;
fMe frecvena intervalului median;
49
50
BIOSTATISTICA
aciunea comun a factorilor eseniali i ntmpltori. Gradul de variabilitate a termenilor seriei cronologice depinde de fora cu care factorii
aleatori produc abateri, dar i de tendina de variaie impus de factorii
cu aciune sistematic.
b) omogenitatea termenilor unei SCR seriile cronologice sunt
omogene deoarece termenii seriei au n comun categoria economic
sau social pe care o reprezint n momente sau intervale succesive
de timp. Omogenitatea valorilor seriei este dat de faptul c acestea
sunt supuse aciunii sistematice a acelorai factori eseniali, iar termenii seriei cronologice sunt obinui prin aceeai metodologie de calcul i
folosesc aceeai unitate de msur.
c) periodicitatea termenilor unei SCR o caracteristic specific
seriilor cronologice. Aceast trstur exprim continuitatea datelor din
punct de vedere al variaiei timpului. Termenii seriei reprezint valori
ale unui fenomen dinamic, nregistrate la momente sau intervale de
timp de regul egale, astfel nct s se asigure continuitatea seriei. n
funcie de scopul concret al analizei efectuate, de natura fenomenului
nregistrat i de posibilitile de obinere a datelor, unitile de timp pot
fi mai mici sau mai mari: minut, or, zi, sptmn, decad, lun, trimestru, semestru, an, deceniu, secol.
d) interdependena n timp a termenilor unei SCR este determinat de modalitatea de construire a acestora prin nregistrarea nivelurilor succesive ale unui fenomen pentru aceeai unitate statistic precizat. Din aceast cauz, orice termen al seriei depinde de nivelurile
precedente i influeneaz mrimile urmtoare ale termenilor seriei.
Avnd n vedere aceste particulariti ale seriilor cronologice, analiza lor trebuie precedat de verificarea comparabilitii valorilor individuale nregistrate pentru fenomenul analizat. Pentru a asigura comparabilitatea termenilor seriei cronologice este necesar ca componena
seriei s fie identic pentru ntreaga perioad de timp, valorile seriei s
fie exprimate n aceleai uniti de msur, iar intervalele de timp ntre
valori s fie egale.
Tipuri de serii cronologice:
1. n funcie de modul de definire a timpului deosebim SCR de moment i SCR de interval.
Seriile cronologice de momente:
- sunt formate din mrimi care se refer la anumite momente de
timp (sfritul sau nceputul anului, trimestrului, lunii etc.).
51
2001
2002
2003
2004
2005
2006
155204
157257
155036
128595
147247
143146
Observaie:
nu permit cumularea valorilor termenilor, deoarece acestea reflect, n mod repetat, elementele care coexist n momente
diferite de timp.
Exemplu: numrul salariailor unui spital nregistrat la sfritul fiecrei luni se regsete n numrul salariailor nregistrat la sfritul
anului.
Cnd intervalele dintre dou momente succesive au lungime egal,
atunci vom avea o SCR de momente cu intervale egale ntre momente,
iar atunci cnd intervalele dintre dou momente vecine au lungime neegal avem o SCR de momente, cu intervale neegale ntre momente.
Serii cronologice de intervale:
- sunt formate din mrimi care caracterizeaz fenomenul ntr-un
interval de timp (zi, sptmn, lun, trimestru, an etc.);
- fiecare valoare individual reprezint rezultatul unui proces care
se desfoar pe un interval de timp.
De exemplu: dinamica anual a numrului de medici; evoluia lunar a numrului de cazuri mbolnvire IRVA, dinamica anual a natalitii
(Tab.10).
Tabelul 10
Numr copii nscui vii, mun. Chiinu, aa. 2002-2006.
2002
2003
2004
2005
2006
6924
7143
8296
8364
8626
52
BIOSTATISTICA
53
Observaie:
permit nsumarea valorilor, obinndu-se astfel un indicator totalizator pentru ntreaga perioad de analiz.
54
BIOSTATISTICA
55
Indicatori absolui
Indicatorii absolui ai unei serii cronologice de intervale exprim nivelul, volumul agregat i modificrile (n mrime absolut) fenomenului
analizat n perioade diferite de timp. Indicatorii absolui se exprim n
unitatea de msur a caracteristicii analizate (n uniti fizice, valorice,
procente etc.).
1) Valorile individuale absolute ale caracteristicii redau nivelul fenomenului analizat n fiecare interval de timp.
2) Volumul agregat (nivelul totalizat) reprezint suma termenilor seriei
cronologice de intervale.
3) Modificarea absolut (sporul sau scderea absolut) , reflect
creterea sau descreterea absolut (n uniti concrete de msur) a valorilor individuale ale fenomenului analizat, de la o perioad
de timp la alta. Se calculeaz ca diferen ntre doi termeni ai seriei.
n funcie de perioada aleas ca baz de comparaie (constant
sau variabil), exist dou forme ale acestui indicator:
- modificarea absolut cu baz fix reprezint distana (diferena)
fiecrui termen al seriei fa de o perioad fix de referin.
- modificarea absolut cu baz mobil se calculeaz ca diferen
ntre doi termeni succesivi ai seriei cronologice.
Se exprim n unitile de msur ale caracteristicii. Valorile pozitive ale acestor indicatori semnific sporuri (creteri, fa de perioada
aleas ca baz de comparaie), iar valorile negative scderi (deficit).
n cazul modificrii absolute cu baz fix este important alegerea
unei baze de comparaie convenabile, reprezentative pentru fenomenul
dat i care s nu fie influenat de variaii conjuncturale majore. Frecvent, se alege ca baz de comparaie primul termen al seriei (nceputul
perioadei de timp analizate) sau ultimul termen al perioadei anterioare.
Indicatori relativi
1) Indicele de dinamic (indice de modificare, ritm de cretere sau de
scdere) I. Este indicele care arat de cte ori (de ct la sut) s-a
modificat mrimea unui fenomen n timp. Se calculeaz prin raportarea termenului comparat la termenul baz de comparaie.
- indicele cu baz fix se calculeaz ca raportul simplu sau procentual al nivelului curent la nivelul ales baz de comparaie
(nivelul iniial).
- indicele cu baz mobil se calculeaz ca raportul simplu sau
procentual al nivelului curent la nivelul precedent.
56
BIOSTATISTICA
57
2) Modificarea medie absolut este media aritmetic simpl a modificrilor absolute cu baz mobil yn y1/n-1. Indicatorul arat cu
ct crete/scade fenomenul n medie (n valoare absolut) de la o
perioad de timp la alta.
Calcularea acestui indicator are sens atunci cnd modificrile
absolute cu baz n lan nu difer prea mult ca mrime. Modificarea
medie absolut poart numele de spor mediu, dac este calculat pentru un fenomen cu tendin de cretere. n caz contrar vorbim despre
scdere medie.
3) Indicele mediu de dinamic se calculeaz ca medie geometric
simpl a indicilor de dinamic cu baz mobil. Arat de cte ori s-a
modificat (a crescut sau a sczut) n medie fenomenul analizat pe
ntreaga perioad luat n calcul. Valoarea rezultat din calcul este
semnificativ ndeosebi pentru fenomenele care evolueaz n progresie geometric (indicii cu baz mobil au valori apropiate ntre
ele). Valori mai mari de 100% ale acestui indicator arat tendina
de cretere a fenomenului analizat. Valori mai mici de 100% corespund unei scderi pe ansamblul perioadei considerate.
4) Ritmul mediu de dinamic arat cu cte procente se modific n
medie fenomenul pe ntreaga perioad analizat.
Ultimii doi indicatori nu sunt reprezentativi pentru seriile cronologice
cu un numr mare de termeni i cu oscilaii mari.
Ajustarea seriilor cronologice
Specific seriilor cronologice este variabilitatea mare a termenilor.
Aceste variaii sunt produse de factori eseniali i ntmpltori. Aciunea factorilor eseniali determin tendina major de evoluie n timp
amrimilor nregistrate de fenomenul analizat. Aceast tendin (trend)
interfereaz cu cauzele neeseniale, ntmpltoare, efectul obinut fiind
valorile reale ale fenomenului.
Scopul ajustrii seriilor cronologice l reprezint evidenierea factorilor eseniali, cu aciune sistematic, care urmresc o legitate matematic de evoluie.
58
BIOSTATISTICA
59
Mediile mobile asigur compensarea abaterilor, a oscilaiilor periodice. Noua serie obinut prin ajustare are o variaie lin, continu,
evideniind tendina de evoluie a fenomenului (trendul), independent
de aciunea factorilor sezonieri.
Mediile mobile pot fi calculate dintr-un numr impar sau par de
termeni. Dac media mobil se calculeaz dintr-un numr impar (de
exemplu k = 3) de termeni, schema de calcul este urmtoarea: MM1 =
y1 + y2 + y3 : 3; MM2 = y2 + y3 + y4 : 3; MM3 = y3 + y4 + y5 : 3; MMn-2 = yn-2
+ yn-1 + yn : 3;
Numrul de medii mobile obinut este mai mic dect numrul de
termeni reali ai seriei. Primul i ultimul termen real nu vor avea corespondent o valoare ajustat, adic o medie mobil.
Pentru cazul general, prin aceast metod se pierd k-1 termeni ai
seriei (la nceputul i la sfritul irului), acesta fiind principalul dezavantaj al metodei.
Exemplu pentru k=3 (Tab.11).
Tabelul 11
Avorturi la vrsta pn la 15 ani, RM, aa.1995 2002
Anii
Termenul
Nr.avorturi
Media mobil
1995
y1
115
----
1996
y2
75
79
1997
y3
47
57
1998
y4
49
51
1999
y5
57
46
2000
yn-2
33
40
2001
yn-1
30
32
2002
yn
33
----
Dac mediile mobile se calculeaz din numr par de termeni, calculul se realizeaz n dou faze:
- se obin medii mobile provizorii, care se plaseaz ntre termenii
seriei reale;
- se determin medii mobile definitive (centrate) din cte dou
medii mobile provizorii succesive care se plaseaz n dreptul
termenilor reali (pe care i nlocuiesc).
i n acest caz, numrul de medii mobile obinute este mai mic
dect numrul de termeni reali ai seriei. Numrul termenilor reali care
se pierd este n acest caz k. n prima faz se pierd k 1 termeni, iar
n a doua faz un termen. Prima medie mobil centrat se va plasa n
dreptul celui de-al k + 2 : 2 -lea termen al seriei.
Pierderea de informaie produs de termenii lips afecteaz concluziile analizei, n special n cazul unui numr redus de observaii.
60
BIOSTATISTICA
y2
y3
y4
y5
y6
y7
y8
y2
y3
y4
y5
y6
t0
t1
t2
t3
t4
t5
122
122
140
139
168
156
176
173
192
190
206
206
61
Primul i ultimul termen ajustat sunt egali cu termenii corespunztori din seria real.
Metoda modificrii absolute medii i metoda indicelui mediu de dinamic sunt simple i rapide, dar nu iau n calcul toate valorile absolute
ale termenilor seriei.
5) Ajustarea prin metode analitice
Metodele analitice de estimare a tendinei se bazeaz pe folosirea
funciilor matematice. Alegerea funciei de ajustare se face pe baza
analizei graficului i a indicatorilor seriei cronologice. Situaiile cele mai
frecvent ntlnite sunt:
- fenomenul evolueaz dup o funcie liniar atunci cnd graficul
arat o tendin de cretere absolut constant i modificrile
cu baz mobil au valori apropiate;
- fenomenul evolueaz dup o funcie exponenial atunci cnd
graficul arat o tendin de cretere relativ constant i se obin valori apropiate ale indicilor cu baz n lan;
- fenomenul evolueaz dup o parabol atunci cnd graficul are
punct de maxim sau de minim iar diferenele dintre modificrile
succesive cu baz mobil (numite modificri cu baz n lan de
ordinul doi) au valori apropiate; frecvent, pe grafic, se evideniaz numai fragmente de parabol.
Dup ce se alege forma cea mai potrivit pentru funcia de ajustare,
se determin parametrii prin intermediul metodei celor mai mici ptrate.
Aceast metod pornete de la condiia minimizrii ptratelor abaterilor valorilor ajustate (Yi) de la valorile reale (yi).
EXTRAPOLAREA
Un obiectiv important al analizei seriilor cronologice l reprezint
estimarea evoluiei probabile n viitor a fenomenului analizat. Extrapolarea reprezint o prelungire a seriei cronologice n viitor, pe baza
trendului observat din analiza perioadei anterioare. Mrimile obinute
prin extrapolare sunt valori probabile, orientative. Nu se poate face o
predicie exact a viitorului din mai multe motive:
- pe lng trendul pe baza cruia se face previziunea acioneaz
i factori aleatori, ntmpltori, care influeneaz nivelul real al
fenomenului analizat;
- factorii de influen evideniai prin analiza seriei cronologice i
pot modifica aciunea n viitor;
62
BIOSTATISTICA
exist anumite limite (minime sau maxime) n evoluia fenomenelor. Aceste restricii impun o analiz critic, calitativ a rezultatelor obinute prin extrapolare.
Metodele de extrapolare sunt similare celor utilizate pentru estimarea trendului. Diferena const n perioada de timp implicat n calcule.
Astfel, dac analiza seriei cronologice a relevat o tendin de cretere constant, extrapolarea se poate face prin metoda modificrii
absolute medii.
Atunci cnd evoluia seriei cronologice tinde ctre o exponenial,
extrapolarea se poate face pe baza indicelui mediu de dinamic
Atunci cnd evoluia fenomenului a fost analizat cu ajutorul metodelor analitice i s-a constatat c reflect o anumit funcie matematic, extrapolarea se poate face utiliznd forma funciei de ajustare.
Atunci cnd n evoluia fenomenului considerat s-a constatat o variaie sezonier, valorile extrapolate vor cuprinde i aceast tendin,
prin nsumarea componentei sezoniere (n cazul modelului aditiv) sau
prin nmulire (pentru modelul multiplicativ).
Exemplu:
Tabelul 14
Evoluia numrului de avorturi la vrsta pn la 15 ani, RM, aa. 1991-2003
Anul
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
Numr
avorturi
58
72
76
81
115
75
47
48
56
32
30
33
16
Modificare
absolut
Ritm dinamic
Indice
dinamic
Val.absolut
1% ritm
dinamic
fix
mobil
fix
mobil
fix
mobil
fix
mobil
0
14
18
23
57
17
-11
-10
-2
-26
-28
-25
-42
14
4
5
34
-40
-28
1
8
-24
-2
3
-17
100
24
31
40
98
29
-19
-17
-3
-45
-48
-43
-72
24
6
7
42
-35
-37
2
17
-43
-6
10
-52
100
124
131
140
198
129
81
83
97
55
52
57
28
124
106
107
142
65
63
102
117
57
94
110
48
0
0,58
0,58
0,58
0,58
0,59
0,58
0,59
0,66
0,58
0,58
0,58
0,58
0,58
0,66
0,71
0,81
1,14
0,75
0,5
0,47
0,55
0,33
0,3
0,29
63
2.8. Standardizarea
Importan deosebit pentru asigurarea comparabilitii datelor statistice au metodele de standardizare a valorilor relative i medii.
Regula de baz a statisticii compar comparabilul presupune
compararea indicatorilor obinui n totaliti statistice omogene. ns
sunt frecvente cazurile cnd trebuie de comparat indicatori, asupra mrimii crora a influenat neomogenitatea totalitilor studiate.
n multe investigaii socio-medicale, precum i clinice, este exclus posibilitatea de a opera cu colectiviti omogene, productoare de
fenomene care se cer comparate. Mai frecvent aceasta se refer la
compararea indicatorilor sntii populaei (natalitate, mortalitate general, morbiditate) n ri, regiuni, raioane, orae cu structur diferit
a populaiei pe vrst, sex; compararea activitii instituiilor medicosanitare cu structur diferit a contingentelor de bolnavi.
Exemplul 1.
- Pentru a compara letalitatea n dou spitale i a face concluzie
privitor la cauzele diferenei acestor indicatori este necesar mai
nti s analizm dac bolnavii n aceste spitale au fost omogeni
nozologic. Evident, indicatorul letalitii va fi mai mare n spitalul
unde au fost internai mai muli bolnavi cu forme grave ale maladiei. Structura neomogen a contingentelor de bolnavi dup starea
sntii, vrst, sex i alte caractere face imposibil concluzia
corect privind cauzele diferenei mrimii indicatorilor letalitii n
aceste spitale.
Exemplul 2.
- Se compar indicii mortalitii generale n dou raioane. Calculul
simplu arat c n raionul A nivelul mortalitii generale este 10,
iar n raionul B 8,1. ns, pn a formula concluzia final referitor la factorii care au influenat diferena dintre indicatori, trebuie analizate totalitile comparate. Se acord atenie structurii
pe vrste a populaiei din raioanele corespunztoare, din motivul
c structura populaiei pe vrste incontestabil influeneaz indicatorul mortalitii generale. Cu ct sunt mai multe persoane vrstnice, cu att mai mare poate fi nivelul mortalitii. n cazul nostru,
n raionul A, ponderea persoanelor vrsta crora a depit 60 de
ani este de 30%, iar n raionul B 16%. Prin urmare, n raioanele
comparate structura populaiei pe vrste este diferit i, n acest
200
700
100
1000
12
21
5
38
4,0
3,8
valorile
ateptate
30
6
4
40
letalitatea
600
300
100
1000
valorile
ateptate
Terapie
Chirurgie
Boli infecioase
Total
Spitalul B
letalitatea
Secia
Spitalul A
Standardul
800
1000
200
2000
5,0
2,0
4,0
4,0
40
20
8
68
6,0
3,0
5,0
3,8
48
30
10
88
Indicatorii
standardizai
Spitalul B
decedai
Spitalul A
bolnavi
Tabelul 15
Repartizarea bolnavilor i decedailor conform profilului seciei n spitalele A i B
(datele sunt convenionale)
decedai
caz, indicatorii mortalitii generale (10 i 8,1) nu pot fi comparai n form brut.
Pentru a compara indicatorii menionai se va utiliza metoda de
standardizare.
65
bolnavi
BIOSTATISTICA
Letalitatea
%
64
3,4
4,4
Exemplu:
Etapa I Calculul indicilor intensivi. Determinm rata decedailor,
n dependen de profilul seciei, n ambele spitale. Spitalul A,
secia terapie (30/600)x100; secia chirurgie (6/300)x100;
boli infecioase (4/100)x100. Analogic se fac calculele i
pentru spitalul B. Ulterior determinm indicatorul general al
letalitii pentru spitalul A (40/1000)x100 i pentru spitalul B
(38/1000)x100.
Etapa II Selectarea i calculul standardului. Drept standard este
considerat acea componen a totalitilor, care reflect toate
particularitile totalitilor comparate.
!!!Standard poate fi: componena unei totaliti comparate; suma totalitilor comparate; semisuma totalitilor comparate; o valoare empiric.
n exemplul dat drept standard pe secii a fost luat numrul de bolnavi din seciile respective a fiecrui spital (coloana 1+coloana3), iar
standard general suma bolnavilor din ambele spitale (1000+1000).
Etapa III Calculul valorilor ateptate pentru fiecare grup de
standard. Calculul se face n modul urmtor: n spitalul A, secia terapie, au decedat 5% bolnavi. Ci decedai vor fi la 800 de
bolnavi nivelul letalitii va fi acelai?
66
BIOSTATISTICA
5% 100
x% 800
x = (5x800)/100
Astfel, 40 este numrul ateptat de decedai n secia terapie la
800 de bolnavi. Analogic se fac calculele pentru seciile chirurgie i boli
infecioase a spitalului A i seciile spitalului B.
Etapa IV Calculul indicatorilor standardizai. Indicatorul standardizat este raportul procentual al sumei valorilor ateptate din
fiecare totalitate la standardul general.
Spitalul A (68/2000)x100 = 3,4%
Spitalul B (88/2000)x100 = 4,4%
Etapa V Compararea indicatorilor (Tab.16).
Tabelul 16
Compararea indicatorilor intensive i standardizai
Indicatori
Intensivi
Standardizai
Spitalul A
4,0
3,4
Spitalul B
3,8
4,4
Comparare
A>B
A<B
Concluzii:
1. Compararea indicatorilor standardizai, calculai pentru spitalele A
i B, ne permite s facem concluzia urmtoare: dac profilul seciei
n spitalele A i B ar fi fost identic, letalitatea n spitalul A ar fi fost
mai mic dect n spitalul B.
2. Compararea indicatorilor intensivi a oferit rezultate inverse, din motivul c mrimea acestor indicatori a fost influenat de profilul seciei.
Metoda tangenial de standardizare se utilizeaz n cazurile cnd
n totalitile comparate lipsesc date privind bolnavii, decedaii etc. Drept
standard este luat un indicator cunoscut: exemplu indicatorii mortalitii
generale, mortalitii pe vrste, letalitii etc. din literatura de specialitate,
statistic oficial i cu acesta sunt comparai indicatorii primari.
Metoda indirect de standardizare se utilizeaz n cazurile cnd
indicatorii necesari pentru comparare i analiz lipsesc. Acestea sunt
reconstruii n mod invers, spre exemplu n baza datelor despre mortalitate, morbiditate, letalitate, care trebuie redai ct mai obiectiv n
corespundere cu informaia cunoscut despre numrul i structura populaiei.
67
68
BIOSTATISTICA
69
n care:
rxy
= coeficientul de corelaie;
dxdy = suma produselor dintre abaterile de la media aritmetic a valorilor frecvenelor celor dou fenomene (x i y) ce se coreleaz;
dx2 = suma ptratelor abaterilor de la media aritmetic a valorilor
frecvenelor fenomenului x;
dy2 = suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor fenomenului y. Exemplu: (Tab.17, Tab.18).
Tabelul 17
Timpul trecut din momentul accesului de pancreatit acut (x) i
numrul complicaiilor postoperatorii (y)
Nr.
1
2
3
4
5
6
Total
Timpul
Numr
x
complicaii, y
6
3
8
5
12
7
19
10
20
13
24
16
54
89
9
14,8
dX
dY
d2 X
-6
-4
-2
1
4
7
-8,8
-6,8
-2,8
4,2
5,2
9,2
36
16
4
1
16
49
122
d 2Y
77,4
46,2
7,8
17,6
27
84,6
260,6
178,3
d Xd Y
52,8
27,2
5,6
4,2
20,8
64,4
175
rXY = 0,98
70
BIOSTATISTICA
Tabelul 18
Nivelul de asigurare cu medici stomatologi (x) i ponderea copiilor sanai
n cadrul a 5 raioane (y)
Nr.
1
2
3
4
5
Total
Asigurare
medici, x
2,3
3,2
3,4
3,6
3,9
16,4
3,3
Copii
sanai, y
65,7
91,7
88,0
91,4
90,3
427,1
85,4
dX
dY
d2 X
-1
-0,1
0,2
0,3
0,6
-19,7
6,3
2,6
6,0
4,9
1
0,01
0,04
0,09
0,36
1,5
d 2Y
388,1
39,7
6,8
36
24,0
494,6
27,2
d Xd Y
19,7
-0,63
0,52
1,8
2,94
24,3
rXY= 0,89
n seriile statistice grupate coeficientul de corelaie se obine raportnd suma produselor dintre abaterile valorilor variantelor de la media
ponderat a celor dou fenomene ce se coreleaz i frecvenele perechi de valori ale variantelor la rdcina ptrat din suma produselor
dintre ptratele abaterilor valorilor variantelor de la media ponderat
i frecvenele corespunztoare fiecrei variante a primului fenomen,
nmulit cu suma produselor dintre ptratele abaterilor valorilor variantelor de la media ponderat i frecvenele corespunztoare fiecrei
variante a celui de al doilea fenomen, cu care se coreleaz.
Formula de calcul:
n care:
rxy
= coeficientul de corelaie;
= semnul nsumrii;
dxdyfxy = produsul dintre abaterile de la media ponderat a variantelor
celor dou fenomene ce se coreleaz i frecvenele perechi
corespunztoare variantelor fenomenelor x i y;
dx2fx = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului x i numrul de frecvene corespunztoare fiecrei variante;
dy2fy = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului y i numrul de frecvene corespunztoare fiecrei variante.
71
72
BIOSTATISTICA
Pentru a ne convinge de fidelitatea coeficientului de corelaie, n interpretarea legturii dintre fenomene obinute pe eantioane, ne servim
de eroarea coeficientului de corelaie, care se noteaz cu mr.
Formula de calcul pentru n < 30:
n care:
mr = eroarea coeficientului de corelaie;
r2xy = ptratul valorii coeficientului de corelaie, obinut pe eantioane;
1 = valoarea absolut a coeficientului de corelaie, obinut pe univers,
pe ntreaga populaie;
n = numrul variantelor perechi ale fenomenelor ce se coreleaz.
Dac n < 30 sau valoarea coeficientului de corelaie nu este mare,
trebuie de decis ct de real este legtura dintre fenomenele ce se coreleaz. n general, dac valoarea coeficientului de corelaie obinut pe
eantioane este mai mare dect triplul erorii sale, nseamn c acesta
a fost obinut pe eantioane reprezentative, este deci real i ne putem
bizui pe el n interpretarea legturii de dependen ntre fenomene.
Dac (rXY/mr) < 3 legtura dintre fenomene rmne nedeterminat i se
consider c valoarea coeficientului de corelaie, care difer de zero, a
fost obinut ntmpltor.
Raportul dintre coeficientul de corelaie i eroarea lui se numete
criteriu de exactitate al coeficientului de corelaie tr. Criteriul n cauz
se stabilete cu ajutorul tabelului valorilor criteriului t. Dac treal > ttabel,
coeficientul de corelaie se consider semnificativ.
73
CORELOGRAMA
Existena sau inexistena unei corelaii ntre fenomene se poate
evidenia aproximativ fr prea multe calcule, cu ajutorul reprezentrilor grafice. n acest caz, folosim un grafic cu dou scri, ordonat i abscis, pe care nscriem valorile variantelor celor dou fenomene x i y.
n reeaua graficului este reprezentat prin cte un punct fiecare
frecven la nivelul valorii variantei corespunztoare fenomenului x de
pe abscis i la nlimea valorii variantei corespunztoare fenomenului y de pe ordonat. Se realizeaz astfel norul de puncte. n funcie
dispoziia acestui nor de puncte putem aprecia, aproximativ, existena
sau absena corelaiei dintre fenomene, precum i sensul i intensitatea aproximativ a acesteia. Dac norul de puncte se va dispune
fuziform, oblic de jos n sus i de la stnga la dreapta, ntre cele dou
fenomene exist o corelaie direct. Crete un fenomen, crete i cel
de al doilea, cu care se coreleaz, sau ambele fenomene scad, evolund n aceeai direcie. Intensitatea legturii corelative dintre cele dou
fenomene se apreciaz, aproximativ, dup unghiul pe care dreapta ce
trece prin mijlocul norului de puncte l realizeaz cu abscisa. Cu ct
acest unghi ascuit este mai mare, avnd tendina s se apropie de
450, cu att corelaia dintre fenomene este mai puternic. Cu ct unghiul format de aceast dreapt i abscis este mai mic, dreapta oblic
avnd tendina s se apropie de orizontal, cu att corelaie dintre fenomene va fi mai slab.
Dac norul de puncte se dispune fuziform, oblic de sus n jos i
de la stnga la dreapta, ntre cele dou fenomene exist o corelaie
invers. Intensitatea acestei corelaii inverse se apreciaz dup mrimea unghiului ascuit pe care dreapta ce trece prin mijlocul norului de
puncte l formeaz cu abscisa, n partea opus ordonatei.
Dac punctele se dispun pe toat reeaua grafic, neavnd nici o
tendin de a se grupa, nseamn c ntre fenomene nu exist nici o
legtur de dependen, fenomenele evolund independent unul fa
de cellalt. n cazul acesta, dreapta care trece prin mijlocul punctelor
este paralel fie cu ordonata, fie cu abscisa.
74
BIOSTATISTICA
CORELAIA MULTIPL
Se stabilete ntre mai mult de dou fenomene, care au legtur
de dependen ntre ele. n asemenea situaii, existena legturii de
dependen ntre fenomene, sensul i intensitatea acestei legturi, se
stabilesc cu ajutorul coeficientului de corelaie linear multipl.
Spre exemplu, dac dorim s evideniem legtura de dependen
ntre nlimea (fenomen x), greutatea (fenomen y) i vrsta (fenomen
z) copiilor sau legtura de dependen ntre incidena dinilor cariai
(fenomen x), dinilor cu parodontopatii marginale (fenomen y) i dinilor
abseni (fenomen z) ne folosim de urmtoarea formul:
rxyz
rxy
ryz
rxz
n care:
= coeficientul de corelaie linear multipl ntre cele trei fenomene;
= coeficientul de corelaie linear simpl ntre fenomenele x i y;
= coeficientul de corelaie linear simpl ntre fenomenele y i z;
= coeficientul de corelaie linear simpl ntre fenomenele x i z;
1=
=
n care:
valoarea absolut a coeficientului de corelaie;
coeficientul de corelaie Spearman;
75
6 = valoare constant;
d2 = suma ptratelor diferenelor dintre rangurile primului ir de variante i rangurile celui de al doilea ir de variante, cu care se
coreleaz;
n = numrul variantelor perechi variantelor ce se coreleaz.
Coeficientul de corelaie al rangurilor poate avea valori cuprinse ntre 1 0- +1. El exprim o legtur perfect cnd are valoarea +1.
n aceast situaie, rangurile au valori egale, iar diferena ntre ranguri
este egal cu 0.
n general, cu ct numrul rangurilor cu aceeai valoare, n cele
dou clasamente, este mai mare, cu att suma ptratelor diferenelor ntre ranguri este mai mic, iar valoarea coeficientului de corelaie
Spearman va fi mai mare.
Exemplu (Tab.19, Tab.20).
Tabelul 19
Timpul trecut din momentul accesului de pancreatit acut (x) i
numrul complicaiilor postoperatorii (y)
Nr.
Timpul,
x
Numr
complicaii,
y
Rangul x
Rangul y
d2
1
2
3
4
5
6
3
5
7
10
13
16
6
8
12
19
20
24
1
2
3
4
5
6
1
2
3
4
5
6
0
0
0
0
0
0
0
0
0
0
0
0
54
89
Total
0
=1
76
BIOSTATISTICA
Tabelul 20
Legtura de corelaie ntre copiii cu deficien mintal (la 100 mii copii) i
invaliditatea copiilor (la 100 mii copii)
Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Total
ara
Armenia
Tadjikistan
Azerbaidjan
Turkmenistan
Georgia
Krgzstan
Uzbekistan
Kazahstan
Bielarusi
Ucraina
Rusia
Moldova
Estonia
Lituania
Letonia
Defici- Invalidien
tatea Rangul Rangul
mintal copiilor
x
y
x
y
120
138
167
198
245
318
342
455
538
625
795
1018
1110
1021
1127
33
27
38
30
43
28
30
29
36
48
38
44
47
57
33
1
2
3
4
5
6
7
8
9
10
11
12
14
13
15
6,5
1
9,5
4,5
11
2
4,5
3
8
14
9,5
12
13
15
6,5
-5,5
1
-6,5
-0,5
-6
4
2,5
5
1
-4
1,5
0
1
-2
8,5
30,25
1
42,25
0,25
36
16
6,25
25
1
16
2,25
0
1
4
72,25
=-24,5
=+24,5
=253,5
= 0,55
COEFICIENTUL DE ASOCIERE
n domeniul medicinei trebuie n multe cazuri de a stabili legtura
nu numai ntre indicatori cantitativi, ci i ntre cei calitativi, care au caracter alternativ prezena fenomenului lipsa fenomenului). n asemenea cazuri se utilizeaz tabelul de asociere format din patru cmpuri
(2x2), care exprim legtura de dependen ntre fenomenele cu caracter alternativ.
Legtura de corelaie se determin prin intermediul coeficientului
de asociere, utiliznd formula urmtoare:
77
S-au mbolnvit
40
a
Nevaccinai
250
c
TOTAL
290
a+c
Sntoi
5900
b
9620
d
15520
b+d
TOTAL
5940
a+b
9870
c+d
15810
a+b+c+d
78
BIOSTATISTICA
la cei mai calificai i la cei mai necalificai medici. Costurile cele mai
nalte sunt la medicii de calificare medie.
79
sau
n care:
Rgxy = coeficientul de regresie a lui x n funcie de y. El exprim, cantitativ, cu ct crete sau scade fenomenul x cnd y crete sau
scade cu o unitate de msur;
Rgyx = coeficientul de regresie a lui y n funcie de x. El exprim, cantitativ, cu ct crete sau scade fenomenul y cnd x crete sau
scade cu o unitate de msur;
rxy = coeficientul de corelaie liniar Bravais-Pearson;
x =
deviaia standard a fenomenului x;
y =
deviaia standard a fenomenului y.
Exemplu: (Tab. 22).
Fig.4. Calificarea medicilor i costul analizelor
2.9.2. Regresia
Termenul de regresie a fost introdus de F. Galton, care a observat
c nlimea descendenilor regreseaz ctre nlimea prinilor.
Coeficientul de corelaie ne d indicaii asupra sensului i intensitii legturii de dependen dintre fenomene, fr a putea preciza, sub
aspect cantitativ, cu ct crete sau scade un fenomen cnd cel cu care
se coreleaz crete sau scade cu o anumit cantitate.
Regresia, noiune strns legat de noiunea de corelaie, completeaz corelaia i prin intermediul coeficientului de regresie, stabilete
cu ct crete sau descrete sub aspect cantitativ, un fenomen, cnd cel
cu care se coreleaz crete sau descrete cu o unitate de msur.
Regresia poate fi simpl i multipl; liniar i neliniar. Ca i corelaia, regresia poate fi direct, cnd fenomenele evolueaz n acelai sens
(crete x, crete y sau scade x scade i y), sau indirect, cnd fenomenul
evolueaz n sens opus (crete x scade y sau scade x crete y).
Formula coeficientului de regresie este:
Tabelul 22
nalimea i greutatea copiilor de vrst Z (n=22)
nlimea
x
Frecvene
fx
Greutatea
y
Frecvene
fy
130
132
135
136
137
3
5
7
4
3
29
30
31
32
33
34
35
36
3
4
3
4
4
2
1
1
Repartizarea a 22 de copii conform nlimii (x) i greutii (y) a oferit urmtoarele date: nlimea medie 134 cm; greutatea medie 31,8
kg; abaterea standard pentru nlime (x) 2,37; abaterea standard
pentru greutate (y) 1,97; coeficientul de corelaie 0,82.
Cu ct se va modifica greutatea corpului la copiii n cauz, dac
nlimea acestora va crete cu 1 cm?
Substituind datele n formula coeficientului de regresie, obinem:
80
BIOSTATISTICA
81
Rg = y (1 r2 )
De exemplu seriile:
{2, 2, 2, 10, 18, 18, 18}
{9, 9, 9, 9, 10, 11, 11, 11, 11}
au aceeai medie i median dar dispersie diferit. Acest fapt este
evideniat de abaterile nregistrate fa de medie (10) sau median (10).
Seria a doua este mai omogen (nregistreaz o variabilitate mai mic
a valorilor individuale), iar valorile sale tipice sunt mai reprezentative.
Calculul i analiza indicatorilor variaiei valorilor individuale fa de
medie ofer posibilitatea de rezolvare a unor probleme de cunoatere
statistic. Dintre acestea se disting:
n statistic prin noiunea general de variabilitate se au n vedere abaterile msurabile ale valorilor individuale fa de o valoare central (tipic).
82
BIOSTATISTICA
1) analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendinei centrale i verificarea reprezentativitii acestora;
2) compararea n timp i (sau) spaii a mai multor serii de distribuie
dup caracteristici independente i (sau) interdependente;
3) selectarea obiectiv a factorilor semnificativi de influen dup care
se structureaz unitile unei colectiviti statistice;
4) separarea aciunii factorilor eseniali de factorii ntmpltori;
5) concentrarea valorilor individuale ale caracteristicilor i deplasarea
acestora fa de valorile tipice;
6) aplicarea diferitelor teste ale statisticii matematice.
Indicatorii variaiei utilizai n analizele statistice sun clasificai dup
mai multe criterii:
- dup numrul variantelor luate n calcul exist indicatori simpli
i indicatori sintetici;
- dup modul de sistematizare a datelor primare exist indicatori
ai variaiei calculai pentru serii de distribuie unidimensionale i
indicatori calculai pentru serii multidimensionale;
- dup modul de calcul i exprimare exist indicatori ai variaiei
calculai ca mrimi absolute i ca mrimi relative.
Indicatori simpli:
- amplitudinea variaiei;
- abaterea valorilor individuale de la medie;
- abaterea intercuantilic.
Indicatori sintetici:
- dispersia;
- abaterea medie ptratic;
- coeficientul de variaie;
Amplitudinea variaiei (A)
- Se mai numete cmp de variaie sau amplitudine absolut.
- Se determin prin diferena dintre cea mai mare i cea mai mic
valoare individual nregistrat.
A = xmax xmin
Exemplu: Un grup de bolnavi nregistreaz urmtoarele durate de
tratament n zile:
8, 7, 9, 8, 9, 9, 10, 11, 12, 11, 10, 10, 9, 9, 7, 8, 10,10,11,10
Amplitudinea variaiei pentru durata tratamentului: 12 7 = 5 zile.
83
Amplitudinea relativ (A%) este raportul procentual dintre amplitudinea absolut i media aritmetic a valorilor analizate.
Xmax
Xmin
Xmax
Xmin
Xmax
84
BIOSTATISTICA
Exemplu: considernd aceleai date din exemplul anterior, bolnavul care s-a tratat 12 zile se abate de la media grupei cu 3 zile ceea ce
reperezint 33,3% din medie iar pacientul care s-a tratat 7 zile se abate
de la media semigrupei cu 2 zile ceea ce reprezint 22,2% din medie.
Cu ct obinem mai multe abateri relative mari n analiza unui volum de date (ctre 100% sau peste acest nivel) cu att colectivitatea
este mai eterogen.
Observaii:
1) valorile individuale se compar cu valoarea lor medie, dar la fel de
bine poate fi utilizat pentru comparare oricare alt indicator al tendinei centrale (de ex. mediana);
2) n seriile de distribuie pe intervale valorice pentru calculul abaterilor individuale se iau n considerare centrele de interval;
3) Abaterea valorilor individuale nu poate da informaii dect la nivelul
fiecrei variante pierznd imaginea mprtierii pe ansamblul distribuiei.
4) n analizele statistice se urmresc n mod deosebit abaterile maxime pozitive (d+max) i abaterile maxime negative (d-max) calculate n
cifre absolute i relative astfel:
d+max = xmax sau d+max% = ( d+max/ ) 100
d-max = xmax sau d-max% = ( d-max/ ) 100
Abaterea intercuantilic
Se calculeaz ca diferen ntre cuantila superioar i cuantila inferioar de acelai ordin. Astfel pentru r = 4 Q3 Q1 conine 50% din
numrul observaiilor; pentru r = 10 D9 D1 conine 80% din numrul
observaiilor (Fig.6).
85
Observaii:
1) Acest indicator se exprim n unitatea de msur a caracteristicii;
2) Calculul abaterii intercuantilice, spre deosebire de cel al amplitudinii, prezint avantajul c evit valorile individuale extreme sau
aberante. Prin calculul acestui indicator se pierd informaii dar are
ctig de cauz omogenitatea.
3) Ca i amplitudinea, abaterea intercuantilic nu poate fi utilizat n
calcule algebrice.
Dispersia (2)
Se calculeaz ca media aritmetic a patratelor abaterilor valorilor
individuale de la tendina central (uzual de la medie).
Pentru o serie simpl formula dispersiei este:
Observaii:
1) Se mai numete varian sau moment centrat de ordin doi;
2) Este indicatorul care msoar variaia total a unei caracteristici studiate datorat att cauzelor eseniale ct i celor ntmpltoare;
3) Este un indicator cu valoare teoretic, util n verificri de ipoteze
statistice, o mrime abstract folosit ca baz de calcul pentru abaterea medie ptratic;
4) Nu are form concret de exprimare;
5) Cu ct valorile individuale ale caracteristicii sunt mai apropiate ntre
ele, cu att mrimea dispersiei este mai mic. La limit, dac toate
valorile individuale sunt egale ntre ele, dispersia este nul;
6) Dispersia, ca i media valorilor individuale, este sensibil la prezena valorilor extreme, aberante.
Abaterea medie ptratic ()
Este calculat ca o medie ptratic din abaterile valorilor individuale de la media lor.
86
BIOSTATISTICA
87
88
BIOSTATISTICA
sau al greutii, lotul de elevi este mai omogen, mai uniform dezvoltat.
n aceast situaie se recurge la coeficientul de variaie, care nu
este altceva dect deviaia standard exprimat procentual.
Ca definiie, coeficientul de variaie este rapotul procentual dintre
valoarea deviaiei standard i media aritmetic.
Formula de calcul:
Coeficientul de variaie arat ct la sut din medie reprezint deviaia standard. Astfel, exprimnd procentual pe , scpm de influena
unitii de msur, putnd compara ntre ele, sub aspectul omogenitii, cte eantioane dorim.
n exemplul anterior, coeficientul de variaie pentru nlime este:
Cv = (5cm/145cm) 100 = 3,4%
Pentru greutate coeficientul este:
Cv = (3kg/35kg) 100 = 8,6%
Din datele obinute rezult, c lotul de copii este mai omogen dezvoltat sub aspectul nlimii, i nu sub aspectul greutii, cum eram tentai s apreciem pe baza valorilor deviaiei standard.
Cu ct valoarea procentual a coeficientului de variaie este mai
mic, cu att eantionul cercetat este mai omogen.
n general, se consider c un coeficient de variaie cu valori sub
10% indic o variaie mic, deci o omogenitate care ne permite s
generalizm rezultatele, dac i din punct de vedere numeric eantionul este corespunztor. Un coeficient de variaie cu valori cuprinse
ntre 10% i 20% indic o variaie medie. Eantionul este mai puin
omogen ca n primul caz, dar totui permite generalizarea rezultatelor
obinute, cu o anumit probabilitate de a grei.
Valorile peste 20% ale coeficientului de variaie indic o variaie
mare, o lips aproape total de omogenitate, fapt ce contraindic generalizarea rezultatelor obinute pe un asemenea eantion.
De menionat c aceste limite ale coeficientului de variaie, ce ne
permit s apreciem omogenitatea sau lipsa de omogenitate a eantionului, trebuie s reprezinte valorile duble ale acestuia, n cazul cercetrilor clinice, i valorilor triple, n cazul cercetrilor experimentale, aa
cum am vzut i la deviaia standard.
89
n exemplul anterior, valoarea dubl a coeficientului de variaie pentru nlime este de 6,8 i pentru greutate 17,2 din valorile mediilor
respective.
Variabile standardizate
1) Variabila [z = d/] se numete variabil standardizat sau abatere
normat.
2) Unitatea de msur a abaterii normate se numete unitate standard sau valoare standard.
3) Exprim poziia unitii statistice ntr-o distribuie dat att fa de
medie ct i fa de dispersie.
4) Cu ajutorul acestei variabile se pot compara mrimi ce provin din
distribuii diferite.
2.11. Aprecierea veridicitii valorilor medii i relative
Constantele (medii sau de dispersie) obinute de noi pe eantioane
se numesc statistici i valorile lor sunt mai mult sau mai puin apropiate de valorile constantelor colectivitilor generale (parametrii) n
funcie de gradul de reprezentativitate (calitativ i cantitativ) al eantioanelor, ns niciodat nu sunt identice.
Cu ajutorul acestor constante de eantion, a statisticilor, se estimeaz constantele colectivitilor generale, parametrii. Estimatul
rezultat pe baza constantelor de eantionare este aleator. Ca atare
valorile exacte ale parametrilor colectivitii generale rmn necunoscute, n schimb se poate preciza un interval valoric n care se va situa
media colectivitii generale (MA = media absolut), n jurul creia, n
acel interval valoric se vor distribui mediile de eantion, cu o anumit
probabilitate.
Dac dintr-o colectivitate general extragem mai multe eantioane,
valorile medii ale acestor eantioane vor fi foarte apropiate de valoarea
mediei absolute, distribuia acestora, n jurul mediei absolute, fcnduse conform aceleiai curbe Gauss-Laplace.
Eroarea standard sau eroarea medie a mediilor
Constanta care ne permite s stabilim intervalul valoric n care
se gsete media absolut i n jurul creia se distribuie valorile
medii de eantion, cu o anumit probabilitate, se numete eroare
90
BIOSTATISTICA
n care:
ESM =eroarea standard;
= abaterea standard;
n = numrul frecvenelor.
n situaia n care numrul de frecvne al eantionmului este mai
mic sau egal cu 120, atunci se raporteaz la numrul de frecvene -1
i formula devine:
n care:
ESM = eroarea standard;
= abaterea standard;
n = numrul frecvenelor
Exemplul 1.
La 120 persoane a fost determinat tensiunea arterial sistolic. n
baza valorilor individuale s-a stabilit c M = 140,5 mm Hg i = 6,25.
Exemplul 2.
n baza controlului medical la 508 persoane au fost stabilite afeciuni
dentare. n medie au fost afectai cte 5,84 dini, = 3,16.
n primul nostru exemplu, eroarea standard va fi:
91
Valoarea erorii standard, adugat sau sczut din valoarea mediei eantionului, ne permite s obinem limitele intervalului n care se
gsete valoarea mediei absolute i n jurul ei distribuite mediile eantioanelor, cu o anumit probabilitate.
Intervalul de siguran
Intervalul valoric, determinat cu ajutorul erorii standard, n care
se estimeaz a se afla media absolut, se numete interval de siguran sau de ncredere statistic, n acest interval de siguran, determinat
de media eantionului plus/minus eroarea standard, media absolut se
va gsi ntr-o proporie de 68,26%, deci probabilitatea ca media absolut
s se gseasc n interiorul acestui interval este de 68,26%.
M-ES>I<(M+ES)=68,26%
P-ES>I<(P+ES)
n primul nostru exemplu, media ponderat fiind 140,5 mm Hg, intervalul de siguran va fi 140,5 0,57, deci va fi cuprins ntre 139,93 i
141,07 mm Hg. n cel de al doilea exemplu al nostru, media ponderat
fiind de 5,84 dini iar eroarea standard 0,14, intervalul de siguran va
fi 5,84 0,14, deci cuprins ntre 5,70 i 5,98.
2ES
3ES
Pragul de semnificaie
Contraprobabilitatea sau probabilitatea ca mediile de eantion
s depeasc limitele maxim i minim intervalului de siguran, situndu-se n afara lor, se numete prag de semnificaie, n
cazul n care intervalul de siguran este determinat de M ES, atunci
contraprobabilitatea (pragul de semnificaie) se obine scznd din 100
valoarea probabilitii, deci:
q = 100 68,26% = 31,74%
n exemplul nostru media ponderat fiind de 5,84 dini afectai, intervalul de siguran va fi: 5,84 0,14, deci va fi cuprins ntre 5,70 -5,98.
Dac vrem ca valoarea contraprobabilitii, a posibilitii de a grei,
s fie mai mic, atunci trebuie s mrim intervalul de siguran. Acest
interval se mrete adugnd i scznd din valoarea mediei de dou
ori valoarea erorii standard.
M 2.ES = 5,84 + 2.0,14 = 5,84 0,28
92
BIOSTATISTICA
93
cule s-a stabilit c pentru aceste praguri de semnificaie valorile corespunztoare ale lui t sunt de 1,96, 2,58 i 3,29. Ca atare, la pragul de
semnificaie de 5%, valoarea lui t va fi 1,96, iar intervalul de siguran
va fi: M 1.96.ES. La 1% prag de semnificaie valoarea lui t va fi de
2,58, iar mrimea intervalului de siguran va fi dat de M 2,58.ES.
La 0,1% prag de semnificaie valoarea lui t va fi de 3,29, iar intervalul
de siguran va fi dat de M: 3,29.ES.
Aceste valori ale lui t rmn nemodificate n situaia n care lucrm
pe eantioane al cror numr de frecvene este mai mare de 120. n
situaia n care lucrm pe eantioane cu un numr de frecvene mai mic
de 120, atunci valoarea testului de semnificaie se modific i se ia din
tabelul testului t, pe care o gsim n crile de statistic.
Acest tabel (Tab.23) are 4 coloane: prima coloan pentru gradul de
libertate iar celelalte trei corespund celor trei praguri de semnificaie:
5%, 1%, 0,1%. Prin grad de libertate nelegem numrul de frecvene
ale eantionului (sub 120)-1; deci GL = n-1.
Tabelul 23
Tabelul testului t
Grad de libertate
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
94
BIOSTATISTICA
Continuare Tab. 23
Grad de libertate
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
50
60
70
80
90
100
120
peste
(0,01)=1%
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,724
2,704
2,678
2,660
2,648
2,638
2,631
2,625
2,617
2,580
(0,001)=0,1%
3,922
3,883
3,850
3,819
3,792
3,767
3,745
3,725
3,707
3,690
3,674
3,659
3,646
3,591
3,551
3,496
3,460
3,435
3,416
3,402
3,390
3,373
3,290
n cazul n care rezultatele cercetrilor noastre sunt exprimate procentual, deci avem o probabilitate i o contraprobabilitate de eantion,
pentru a estima intervalul n care se gsete probabilitatea colectivitii
generale sau probabilitatea populaiei ne folosim tot de valoarea erorii
standard. Intervalul valoric n care se gsete probabilitatea fundamental sau a colectivitii generale se obine adunnd sau scznd din
probabilitatea eantionului sau eantioanelor valoarea erorii standard.
n aceast situaie eroarea standard ES este egal cu rdcina ptrat din produsul dintre probabilitatea i contraprobabilitatea eantionului, raportat la numrul frecvenelor acestuia, n cazul cnd numrul
95
frecvenelor eantionului este mai mic de 120, acest produs se raporteaz la numrul frecvenelor minus unu.
Formula erorii standard va fi deci:
sau
n 120
n care:
ES = eroarea standard;
Pe = probabilitatea eantionului;
qe = contraprobabilitatea eantionului;
n = numrul de frecvene ale eantionului.
Eroarea standard procentual
Eroarea standard n cazul valorilor medii este exprimat n uniti
de msur diferite, ca i deviaia standard. Ea nu poate servi deci la
compararea a dou sau mai multe eantioane, sub aspectul omogenitii, n asemenea situaii se calculeaz eroarea standard procentual,
pentru a scpa de influena unitii diferite de msur.
n care:
ES% = eroarea standard procentual;
M = media aritmetic sau ponderat.
n general, se consider c o eroare standard procentual cu valori
sub 1% este acceptabil, n jurul lui 2% dubioas i peste 3% inacceptabil, evideniind un eantion neomogen, deci necorespunztor pentru
a lucra pe el i a generaliza rezultatele.
n primul nostru exemplu, ES% va fi:
deci corespunztoare.
n cel de al doilea exemplu al nostru, ES% va fi:
deci necorespunztoare.
96
BIOSTATISTICA
observm c valoarea acesteia este direct proporional cu valoarea lui sigma i invers proporional cu rdcina ptrat din numrul
frecvenelor. Aceasta nseamn c urmrind o scdere a erorii standard de n ori, numrul de frecvene va trebui s creasc de n2 ori.
De exemplu, dac am efectuat o cercetare pe 100 de cazuri clinice
i am stabilit o =0,40, eroarea standard va fi:
97
98
BIOSTATISTICA
99
de unde:
n = 41,122 = 1691 persoane.
n al doilea exemplu
de unde:
n = 34,62 = 1197,16 deci 1198 de persoane.
Din aceste exemple putem conchide c numrul de frecvene ce
alctuiesc eantionul depinde pe de o parte de valoarea pragului de
semnificaie i de valoarea erorii limit, iar pe de alt parte de valoarea
lui sigma. Cu ct pragul de semnificaie i eroarea limit vor avea valori
mai mari, cu att numrul de frecvene va putea fi mai restrns i fcnd cercetarea pe un astfel de eantion putem generaliza rezultatele
cu o posibilitate mai mare de a grei (p=5% i delta = 1). Cu ct pragul
de semnificaie i eroarea limit vor avea valori mai mici (p=0,1% i delta = 0,01) cu att numrul de frecvene va trebui s fie mai mare pentru
ca lucrnd pe un astfel de eantion s putem garanta rezultatele cu o
precizie mai mare (deci cu o posibilitate de a grei foarte mic).
La aceleai valori ale pragului de semnificaie i ale erorii limit,
eantionul va fi cu att mai mare, mai numeros, cu ct sigma va avea
valori mai mari i cu ct sigma va fi mai mic, ca valoare, cu att numrul
de frecvene va putea fi mai restrns.
n cazul n care efectum un studiu longitudinal al morbiditii stomatologice, deci eantionul ales trebuie urmrit o perioad mai ndelungat de timp (cinci, zece ani), atunci pentru a ne asigura c numrul
de frecvene nu va deveni insuficient (prin plecarea din localitate sau
prin deces a unor persoane), la numrul de frecvene stabilit prin calcul
adugm nc 10%. Spre exemplu dac am stabilit c pentru eantionul nostru sunt suficiente 425 persoane i acest eantion vrem s-l
reexaminm la intervale de 2 ani, timp de zece ani, la numrul de 425
mai adugm 42-43 persoane (10%) i eantionul nostru va trebui s
fie de 468 persoane, n cazul cnd rezultatele cercetrii sunt exprimate
procentual, atunci pentru stabilirea mrimii eantionului se folosete
formula:
100
BIOSTATISTICA
persoane
Formulele de mai sus, folosite pentru determinarea volumului eantionului, sunt valabile pentru situaia n care extragem mai multe eantioane
din colectivitatea general sau nu cunoatem mrimea acesteia. Atunci
cnd extragem un singur eantion, cum se ntmpl de obicei, i cunoatem mrimea colectivitii generale, formulele de obinere a lui n devin:
sau
101
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
U
2 576
2.326
2,170
2.054
1,950
1,881
1,812
1,751
0,09
0,001
0,0001
0,00001
0,000001
0,0000001
0,00000001
0,000000001
U
1,695
3,29053
3.89059
4,41717
4,89164
5.32672
5,73073
6,10941
Acest lucru nseamn c din colectivitatea din care am extras eantionul exist anumii factori (de mediu fizic, de alimentaie, de munc,
etc.) care au determinat aceast diferen de valori.
Dac din contr, diferena ntre media universului i media eantionului este mai mic dect valoarea dubl sau tripl a erorii standard,
atunci diferena ntre cele dou medii este nesemnificativ din punct
de vedere statistic, este ntmpltoare i se datorete faptului c am
efectuat cercetarea pe un numr limitat de frecvene.
102
BIOSTATISTICA
103
104
BIOSTATISTICA
105
celor dou eantioane ar fi fost mai mic dect valoarea 1,96-D atunci
diferena ar fi fost nesemnificativ statistic, ambele eantioane provenind din colectiviti cu condiii asemntoare.
Exemplul 2. Pe dou eantioane, extrase din dou colectiviti limitrofe, deci cu condiii asemntoare (aceiai factori de mediu fizic,
acelai mediu de alimentaie, aceleai condiii de munc, acelai nivel
cultural-sanitar etc.), se stabilete media dinilor abseni i se gsete
c la primul eantion, de 250 persoane (e1) media (Me1) este de 5,5
dini abseni, cu o eroare standard de 0,7 iar la al doilea eantion
(e2), de 200 de persoane, media Me2 a dinilor abseni este de 6,2 iar
eroarea standard de 0,2. Diferena ntre medii este:
D = Me2 Me1
D = 6,2 5,5 = 0,7 dini abseni.
Dac din contr, diferena dintre cele dou probabiliti este mai
mic dect valoarea dubl sau tripl a erorii standard, atunci diferena
este nesemnificativ, este ntmpltoare i se datorete diferenei de
eantionaj.
Exemplul 1. La 278362 nscui vii n anul Z n ara S proporia
bieilor a fost 51,4% iar a fetelor de 43,5% eroarea standard a colectivitii generale:
dini abseni.
Diferena dintre medii (0,7) fiind mai mic dect valoarea diferenei
(D = 0,72) nseamn c ntre cele dou medii nu exist o diferen
semnificativ din punct de vedere statistic.
Compararea a dou valori calitative prin criteriul diferenei i
erorii diferenei (procentuale)
Cnd avem de comparat o probabilitate a colectivitii generale cu
o probabilitate de eantion, pentru a stabili semnificaia sau lipsa de
semnificaie a diferenei dintre aceste probabiliti, procedm n felul
urmtor:
Stabilim diferena ntre cele dou probabiliti (probabilitatea n colectivitatea general i probabilitatea eantionului). Calculm apoi valoarea erorii standard pentru eantion, conform formulei:
Interpretarea se face astfel: dac diferena dintre cele dou probabiliti este mai mare dect valoarea dubl sau tripl (U), a erorii
standard, atunci diferena este semnificativ i trebuie s stabilim cror
factori se datoreaz.
D > U sau
D > 2 (3)ES, atunci diferena este semnificativ statistic.
106
BIOSTATISTICA
107
n care:
t = testul de semnificaie
D = diferena dintre valorile medii sau procentuale
D = eroarea diferenei.
Stabilim apoi valoarea lui t tabelar n felul urmtor: dac numrul
frecvenelor celor dou eantioane depete suma de 120 atunci valoarea lui t tabelar o cunoatem ca fiind 1,96 pentru un p = 0,05 (5%);
2,58 pentru un p = 0,01 (1%) sau 3,29 pentru un p = 0,001 (0,1%).
Dac numrul nsumat de frecvene al celor dou eantioane ce
se compar este mai mic de 120 de frecvene, atunci valoarea lui t
tabelar o citim n tabela testului t n gradul de libertate dat de numrul
nsumat de frecvene minus 2.
Interpretarea se face n felul urmtor: dac valoarea lui t calculat
este mai mare dect valoarea lui t tabelar atunci diferena ntre cele
dou valori medii sau ntre cele dou probabiliti este semnificativ din
punct de vedere statistic.
t calculat > t tabelar = diferena semnificativ statistic. Dac
din contra, valoarea lui t calculat este mai mic dect valoarea lui t
tabelar, atunci diferena dintre cele dou medii sau dintre cele dou
probabiliti este nesemnificativ din punct de vedere statistic.
t calculat < t tabelar = diferen nesemnificativ. Pentru exemplificare i verificare, n acelai timp, vom lua aceleai exemple pe care
le-am apreciat, sub aspectul semnificaiei diferenei i cu ajutorul erorii
diferenei.
n cazul comparrii a dou medii obinute pe eantioane diferena
ntre medii a fost de 0,7 dini abseni iar eroarea diferenei a fost de
0,72 dini abseni atestnd o diferen nesemnificativ ntre medii,
ncercnd s stabilim semnificaia sau lipsa de semnificaie pe calea
testului t, obinem urmtoarele rezultate:
108
BIOSTATISTICA
Diferena dintre cele dou probabiliti (30%) fiind mai mare dect
triplul erorii diferenei (3*6,40%=19,20%) este semnificativ din punct
de vedere statistic un prag de semnificaie sub 1%.
D (30%) > D(19,20%) = diferen semnificativ statistic pentru un
p<0,01.
Folosind metoda testului t evideniem aceeai semnificaie a diferenei:
109
n care:
X2 = testul de comparaie sau de concordan chi ptrat;
FT = frecvenele universului sau frecvenele teoretice obinute prin
calcul;
FO = frecvenele observate sau frecvenele eantionului nostru.
n situaia n care avem o distribuie a colectivitii generale pe care
o comparm cu distribuia unui eantion, atunci introducem datele
respective n formul i calculm valoarea lui X2, n situaia n care nu
avem datele colectivitii generale, distribuia frecvenelor teoretice o
obinem prin calcul de aici denumirea de frecvene teoretice aa
cum vom vedea ulterior.
Valoarea lui X2, obinut pe baza formulei de mai sus, se numete
valoarea lui X2 calculat. Pentru a putea stabili dac ntre distribuia
colectivitii generale i cea a eantionului observat de noi este sau
nu o diferen semnificativ din punct de vedere statistic, avem nevoie
ca i n cazul comparaiei cu ajutorul testului t de valoarea lui X2
tabelar. Aceast valoare o lum din tabelul testului X2 (Tab. 25), care
este asemntoare cu tabelul Testului t.
110
BIOSTATISTICA
Tabelul 25
Tabelul testului X2
Grad de
libertate
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
(0,05) = 5%
3,8
5,9
7,8
9,4
11.1
12.6
14,1
15,5
16,9
18,3
197
21.0
22,4
23.7
?50
26,3
27,6
28,9
30,1
31,4
23,7
33,9
35,2
36,4
37.7
38,9
40,1
41,3
42,6
43,8
55,8
67,5
79,1
90,5
101,9
113,1
124,3
Prag de semnificaie
(0,01) = 1%
6,6
9,2
11,3
13,3
15,1
18,5
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34.8
36,2
37,6
38,9
40,3
41,6
43,6
44,3
45,6
47.0
48.3
49,6
50,9
63,7
76.2
88,4
100,4
112,3
124,1
135,8
(0,001) = 0,1%
10,8
13,8
16,3
18,5
20,5
22,5
24,3
26,1
27,9
29,6
31,3
32,9
34.5
36,1
37,7
39,3
40,8
42,3
43,8
45,3
46,8
48,3
49,7
51,2
52,6
54.1
55,5
56,9
58,3
59,7
73,4
86,7
99,6
112,3
124,8
137.2
149,4
111
ft=frecvene teoretice
180
210
290
320
230
65
42
=1337
Lsnd la o parte prima coloan a valorilor variabilei tensiunii arteriale sistolice i primul rnd cu denumirea coloanelor, tabelul nostru
conine 7 rnduri i dou coloane, deci valoarea lui X2 tabelar o vom
citi din tabelul X2 la gradul de libertate: GL = (nr. de rnduri 1) x (nr.
de coloane 1)=(7-1) x (2-1 )=6. Valoarea tabelar a lui X2 pentru GL =
6 i un risc = 5% este de 12,6. Pentru un risc = 1% este de 18,5 i
pentru un risc = 1 este de 22,5. 91 % X2 calculat se obine:
112
BIOSTATISTICA
Deci valoarea lui X2 calculat (1108,8) este mult mai mare dect
valorile gsite n tabelul X2 pentru oricare din cele trei riscuri asumate
(5%, 1%, 0,1%), deci diferena ntre cele dou distribuii de frecvene
teoretice i observate este semnificativ din punct de vedere statistic,
denotnd c n cadrul eantionului exist condiii diferite (factori de mediu, alimentari, de munc etc.) care au determinat aceast diferen,
fa de cele din colectivitatea general. Dac valoarea lui X2 calculat ar
fi fost mai mic dect valoarea lui X2 tabelar atunci diferena ntre cele
dou distribuii de frecvene ar fi fost nesemnificativ din punct de vedere statistic, eantionul provenind din aceeai colectivitate general,
reflectnd condiiile acesteia.
Exemplul 2. Dac am stabilit c pe teritoriul unui spital populaia
adult (39.620 locuitori) se distribuie n raport cu dinii extrai ca n
tabelul alturat (coloana FT), iar examinarea unui eantion de 5.500
persoane adulte evideniaz distribuia din coloana FO, atunci tabelul
nostru lsnd la o parte prima coloan, coloana variantelor, i primul
rnd, cu denumirea coloanelor, are 6 rnduri i 2 coloane, deci valoarea lui X2 tabelar o vom citi din tabelul testului X2 la gradul de libertate
5 (Tab. 27).
Tabelul 27
Determinarea gradelor de libertate.
Nr. dini
abseni
Nr. pers.
cot. gen.
Nr. pers.
eantion
X
1
2
3
4
5
6
FT
2850
5250
10320
15810
3860
1530
FO
860
920
1130
1620
650
320
GL = (6-1) (2-1) = 5
La acest grad de libertate, valoarea lui X2 tabelar va fi de: 11,1 pentru pragul de semnificaie 0,05 (5%); 15,1 pentru pragul de semnificaie
0,01 (1%); i 20,5 pentru pragul de semnificaie 0,001 (0,1%).
Valoarea lui X2 calculat o obinem prin calcul. Introducnd datele n
formula lui X2 calculat, avem:
113
Fumtori
FO
FT
39=a
39,8=A
6= b
5,2=B
45=a+b
45=A+B
Nefumtori
FO
FT
30=c
29,2=C
3=d
3,8=D
33=c+d
33=C+D
Total
69=a+c
9=b+d
78=a+b+c+d=n
114
BIOSTATISTICA
115
ELEVI CU CARII
FO
FT
250
249,50
180
480,50
430
430
ELEVI FR CARII
FO
FT
220
220,50
160
159,50
380
380
TOTAL
ELEVI
470
340
810
116
BIOSTATISTICA
Avnd acum frecvenele teoretice i pe cele observate, le introducem n formula lui X2 i obinem valoarea lui X2 calculat:
Fumtori
39=a
6=c
45=a+c=n3
Legend:
a=brbai fumtori
b=brbai nefumtori
c=femei fumtoare
d=femei nefumtoare
a+b+c+d-N numrul total de cazuri
Nefumtori
30= b
3=d
33=b+d=n
Total
69=a+b=n,
9=c+d=n2
78-a+b+c+d=N
117
X2 pentru un risc =5% i pentru GL=(numrul de rnduri-1) x (numr de coloane 1)=(2-1) x (2-1)=1 are valoarea de 3,8. Valoarea
calculat este mai mic dect valoarea tabelar deci diferena este
nesemnificativ ceea ce testeaz aceeai lips de semnificaie ntre
brbaii i femeile fumtoare sau brbaii i femeile nefumtoare.
Exemplul 6. S vedem dac exist diferene semnificative ntre
rezultatele tratamentului cu streptomicin i penicilin la dou loturi de
copii sub un an suferind de bronhopneumonie acut, am urmrit un
numr de 20 de copii pentru fiecare lot. Rezultatele obinute au fost
introduse n Tab. 31.
Tabelul 31
Rezultatele tratamentului bolnavilor cu bronhopneumonie
Bolnavi bronhopneumonie
Tratament penicilin
Tratament streptomicin
Total
Vindecai
a=14
c=16
a+c-n3=30
Complicaii
b=6
d=4
b+d=n4=10
Total
a+b=n1=20
c+d=n2=20
a+b+c+d=N=40
118
BIOSTATISTICA
119
120
BIOSTATISTICA
121
Ea e similar cu un instantaneu fotografic care exprim ce se petrece la un moment dat n snul populaiei din punct de vedere stomatologic, sau al valorilor tensiunii arteriale.
n cazul urmririi n dinamic a TA la populaia unei localiti, examinarea populaiei din aceast colectivitate se face la anumite intervale
de timp, pentru a stabili dac msurile preconizate pentru combaterea
HTA sunt eficiente sau nu.
n cazul exemplului cu administrarea fluorului, n diferite concentraii,
n apa potabil, lotul de populaie examinat iniial trebuie urmrit i examinat, comparativ cu un lot martor, la diferite intervale de timp, pentru a stabili dac fluorul exercit sau nu un rol protector mpotriva cariei dentare;
spaiu; cu care ocazie se stabilete teritoriul pe care ne propunem
s efectum cercetarea. Acest teritoriu poate s fie restrns (o clas, o coal, o ntreprindere) sau mai extins (o circumscripie, o
comun, teritoriul deservit de un anumit spital unificat etc.), n funcie de natura problemei pe care o cercetm i de scopul i obiectul
cercetrii. Cnd cercetarea se extinde pe un teritoriu mai mare,
atunci se respect de obicei mprirea administrativ a teritoriului:
sat, comun, raion etc. Starea de morbiditate prin HTA se poate
stabili fie la populaia unei colectiviti restrnse (ntreprindere, sat,
comun) fie la populaia ntregului raion. Starea de morbiditate prin
afeciuni stomatologice se poate stabili spre exemplu, fie la populaia colar de o anumit vrst sau la toat populaia colectivitii, pe ani de vrst sau pe grupe de vrst;
volum, urmrind s stabilim mrimea colectivitii pe care o vom
lua n studiu, sub raport cantitativ, deci numrul de uniti statistice
ce urmeaz a fi cercetate.
Cercetrile statistice se fac fie pe totalul unitilor statistice cuprinse
ntr-o populaie i atunci se spune c s-a lucrat pe univers, colectivitate statistic general, fie pe un numr limitat de uniti statistice din
cadrul populaiei i atunci se spune c s-a lucrat pe eantion. Cele
mai veridice concluzii se obin atunci cnd cercetarea a cuprins totalitatea unitilor statistice ce compun o mulime, o colectivitate. Asemenea
cercetri ns se efectueaz foarte rar ntruct sunt foarte costisitoare
necesitnd sume mari de bani, sunt greu de organizat, datorit numrului mare de personal, de aparatur, reactivi i necesit timp ndelungat. Uneori nici nu este necesar s efectum cercetri pe univers
122
BIOSTATISTICA
123
124
BIOSTATISTICA
125
126
BIOSTATISTICA
127
crescut la aceste vrste, n asemenea situaie spunem c am examinat i nregistrat partea de baz a colectivitii. La fel procedm n
cazul cercetrii morbiditii prin afeciuni cardio-vasculare etc.
Monografia este o metod de nregistrare parial utilizat pentru
studiul unei singure colectiviti (localitate, circumscripie, ntreprindere, coal) sau a unui singur fenomen (demografic, de morbiditate). Ea
urmrete s cunoasc aspectele caracteristice ale colectivitii sau
fenomenului respectiv, fr a le putea generaliza n populaia general.
Fiind o metod descriptiv, monografia se mulumete doar s sesizeze aspectele caracteristice ale colectivitii sau fenomenului fr s le
poat explica.
De exemplu, monografia unei localiti descrie: problemele demografice, nivelul de trai, ocupaia populaiei, nivelul cultural, obiceiurile
culinare ale populaiei, starea de sntate cu evidenierea problemelor
de morbiditate i mortalitate, factorii de risc din colectivitate etc. Ea nu
poate s explice relaia dintre aceste caracteristici ale populaiei din
localitatea respectiv.
Ancheta este o metod de investigaie parial a materialului statistic pe formulare adecvate problemei cercetate, n formularele de anchet
datele se nscriu fie de anchetator, i atunci vorbim de anchet direct,
fie de ctre persoana anchetat, i atunci vorbim de anchet indirect, n
cazul anchetei indirecte exactitatea rspunsurilor depinde de nivelul de
pregtire a celor anchetai. Ancheta de obicei succede monografiei, ncercnd s aprofundeze unele aspecte sesizate de monografie. Fiind o
metod de profunzime, ancheta se limiteaz la colectiviti mai restrnse
(secia unei ntreprinderi, clasa unei coli etc.). n cazul n care ancheta
stabilete rolul negativ al unor factori negativi din colectivitatea respectiv, ea se ncheie cu propuneri de remediere a acestora.
Exemplul 1. Dac n colectivitatea n care s-a ntocmit monografia
a rezultat c HTA este frecvent n snul colectivitii, atunci personalul
medical, fcnd un studiu pe eantion, stabilete cauzele sau factorii
de risc (alimentaie, solicitri la locul de munc, consum de alcool etc.)
i propune msuri concrete care s duc la eliminarea acestora i la
scderea incidenei HTA n colectivitatea respectiv.
Exemplul 2. Dac monografia a scos n relief faptul c populaia
prezint o dantur deficitar, atunci ancheta respectiv caut s stabileasc pe un eantion cauzele acesteia i se ncheie cu recomandarea
128
BIOSTATISTICA
129
130
BIOSTATISTICA
cifric atunci cnd urmrete s stabileasc dac datele nregistrate corespund realitii. Spre exemplu, pe baza anului naterii se
poate calcula caracteristica de vrst a individului n anul n curs i
verifica astfel concordana acestor date.
Codificarea materialului statistic
Codificarea nu este altceva dect notarea prin cifre (numeric) sau
litere (alfabetic), a diferitelor caracteristici ale unitilor statistice, n
scopul uurrii prelucrrii i interpretrii rezultatelor obinute. Codificarea se folosete de obicei n cadrul lucrrilor de amploare, care cuprind
un numr mare de uniti statistice. Spre exemplu n cadrul cercetrii
morbiditii din teritoriul unui spital se pot codifica cu litere localitile,
iar diagnosticele de boal se codific numeric conform clasificrii i codificrii cauzelor de boal i deces revizia a-X-a OMS pe 999 cauze
de mbolnvire. De exemplu, infarctul miocardic acut are codul 459,
pneumonia viral are codul 506, caria dentar are codul 544 etc.
Sortarea materialului statistic const n repartizarea unitilor
statistice dup caracteristici individuale. Sortarea poate fi fcut manual sau cu ajutorul calculatoarelor electronice, mai ales n lucrrile
mari cnd sunt nscrise mai multe caracteristici ale unitilor statistice
sub forma unor chestionare, sortarea acestor caracteristici fcndu-se
automat cu ajutorul calculatorului.
Centralizarea datelor statistice urmeaz sortrii sau repartizrii
unitilor statistice pe diferite caracteristici. Ea const n nsumarea caracteristicilor statistice i a unitilor statistice. Aceasta se poate face
sub forma unor tabele care s cuprind rubrica total. Centralizarea
poate fi simpl cnd la baza nsumrii st un singur criteriu (ex. centralizarea cazurilor noi de boal dintr-un teritoriu) sau grupat cnd la
baza nsumrii unitilor statistice stau mai multe criterii (ex. centralizarea mbolnvirilor pe sexe, grupe de vrst, cauze de boal etc.).
Gruparea materialului statistic const n aranjarea unitilor statistice, n funcie de diferitele caracteristici sau variabile, n grupe ct
mai omogene, pentru a le putea scoate ct mai uor n eviden. Gruparea este operaia statistic ce permite trecerea de la aspectele particulare, individuale ale unitilor statistice la aspecte generale, comune,
eseniale ale materialului cercetat.
Aa, spre exemplu, dac ne propunem s cercetm morbiditatea
prin HTA sau afeciuni stomatologice ntr-o colectivitate organizat
131
Afeciunea
Caria dentar
Pulpit
Gangren
Parodontopatii
TOTAL
Nr. mbolnviri
60
15
8
26
109
132
BIOSTATISTICA
M
F
0-15
2
3
Grupa de vrst
16-49
8
7
50-90
20
10
Total
30
20
50
Afeciunea
Total
Carie dentar
Pulpit
Gangren
Parodontopatii
F
55
35
8
2
10
133
Grupe de valori
TA
160-169,9
170-179,9
180-189,9
TOTAL
Centrul clasei
Frecvena
165
175
185
18
22
10
50
Grupe de vrst
0-19
20-39
40-59
60-80
TOTAL
Centrul clasei
10
30
50
70
Frecvena
79
38
42
64
223
De menionat c n cadrul gruprii trebuie s cunoatem exact valorile extreme maxim i minim ale caracteristicii i trebuie s
stabilim intervale de clas egale iar limitele intervalelor sau claselor s
fie distincte pentru a nu crea confuzii cu ocazia repartizrii materialului statistic. De exemplu, dac dorim s distribuim elevii unei clase pe
grupe de nlimi vom stabili nlimea maxim i minim a elevilor din
clasa respectiv iar n interiorul intervalului respectiv vom delimita, la
134
BIOSTATISTICA
intervale egale, grupe de valori ale nlimii. Cel mai scund elev, avnd
nlimea de 150 cm i cel mai nalt de 170 cm, n interiorul acestor
valori extreme vom stabili grupe de valori ale nlimii din 5 n 5 cm,
limitele grupelor de nlime fiind i ele distincte.
Exemplul 7. Distribuia pe grupe de nlimi a elevilor din clasa X
n anul Y (Tab.38).
Tabelul 38
Repartizarea elevilor pe grupe de nlimi din clasa X n anul Y
Nr.crt.
1.
2.
3.
4.
Grupe de nlime cm
150-154,9
155-159,9
160-164,9
165-169,9
TOTAL
Numr elevi
4
12
18
9
43
Elaborarea indicatorilor
Gruparea de obicei cuprinde cifre brute, valori absolute, care rareori pot fi interpretate ca atare. De aceea materialul statistic este supus
n continuare unei prelucrri cu ajutorul metodelor de statistic matematic n vederea obinerii unor indicatori statistici ca: mrimi medii,
mrimi relative, indici etc., ce vor permite aprecieri comparative, corecte i concluzii semnificative.
3.3. Eantionarea
Prin eantionare (eantionaj) nelegem totalitatea tehnicilor i procedeelor statistice cu ajutorul crora se poate caracteriza o colectivitate
(N) studiind o parte a acesteia. Se va studia un numr limitat de cazuri
(n), care vor fi extrase aleator, ntmpltor, din ntreaga colectivitate.
Elementele efectiv studiate constituie eantionul sau mostra;
populaia din care provine eantionul poart numele de colectivitate
general sau univers, baz de sondaj. Elementele individuale extrase din colectivitatea general, la care se studiaz caracteristicile sau
nsuirile, i care compun eantionul, se numesc uniti de selecie.
Scopul unui astfel de studiu pe eantion este de a nu studia ntreaga colectivitate general, ci o copie de dimensiuni mai mici a acesteia, iar caracteristicile obinute pe eantion s poat fi extrapolate cu o
anumit probabilitate asupra populaiei generale. Aceast probabilitate
(P) poate fi de 90%, 95%, 99%, dar niciodat de 100%, deci presupune
135
asumarea unui risc ( = 100-P) n efectuarea studiului, n biologie se lucreaz de obicei cu o probabilitate de 95%, deci cu un risc de 5%.
Dou condiii trebuie asigurate n vederea unui studiu pe un eantion: reprezentativitatea eantionului i precizia studiului.
Reprezentativitatea
Este asigurat de alegerea aleatoare, ntmpltoare, a unitilor
de selecie din baza de sondaj (univers), astfel nct fiecare din elementele colectivitii generale (univers) s aib aceeai ans de a fi
cuprinse n eantion. Prin aceast alegere aleatoare se va reproduce
populaia general la nivel de eantion cu anumite erori. Aceste erori
se numesc erori aleatoare i ele pot fi msurate i controlate de
cercettor. Nerespectarea acestei condiii de extragere ntmpltoare
a unitilor de selecie din baza de sondaj, din colectivitatea general,
duce la apariia unui alt tip de erori, i anume erori sistematice (biais), care sunt imposibil de determinat de ctre cercettor. De exemplu: un studiu experimental pentru verificarea unui nou medicament,
efectuat pe persoane care se prezint voluntar, va introduce astfel de
erori sistematice, pentru c acestea sunt persoane cu structuri psihice
modificate sau sufer de boala pentru care se testeaz medicamentul,
deci nu vor putea reprezenta trsturile colectivitii generale. De asemenea, un studiu efectuat asupra morbiditii printr-o afeciune ntr-o
secie clinic a unui spital nu poate reproduce structura morbiditii la
nivelul unui raion sau al rii. Deci ele nu pot constitui eantioane reprezentative pentru teritoriul respectiv.
Precizia
Se refer la volumul eantionului. Aceasta presupune determinarea
unui numr (n) minim de cazuri necesare pentru constituirea eantionului. Pentru determinarea acestuia, s presupunem c pornim de la o
colectivitate general, baz de sondaj, univers, care are un volum de
N cazuri i este caracterizat de indicatorul central (media ) i de dispersie (deviaie standard x). Din aceast populaie general extragem
aleator un eantion de volum n1 i care va putea fi caracterizat de media
, i abaterea standard 1. Din populaia general pot fi extrase i un
al doilea eantion, de volum n2 i caracterizat de media
i abaterea
standard 2; al treilea eantion, de volum n3 i caracterizat prin media
136
BIOSTATISTICA
Aceasta presupune, de altfel, c pentru un risc cu care proiectm sondajul, media populaiei generale se va situa ntr-un anumit
interval, numit interval de ncredere.
Numrul minim de cazuri necesar unui studiu pentru a nregistra o
eroare inferioar sau cel mult egal celei standard se va calcula conform uneia dintre formulele urmtoare:
pentru caracteristici cantitative:
137
Sau, dac ne propunem s generalizm incidena de 98% a afeciunilor stomatologice, cu un prag de semnificaie de 5% i o eroare
maxim de 1%, stabilit pe un lot de populaie, atunci volumul eantionului va fi:
138
BIOSTATISTICA
pe ntreaga populaie, pe colectivitatea general, ci pe pri reprezentative din colectivitate, din populaie, pe eantioane.
Aprecierea reprezentativitii eantionului sub aspect calitativ, sub
aspectul omogenitii deci, am vzut c se face cu ajutorul deviaiei
standard, respectiv al coeficientului de variaie. Aprecierea reprezentativitii eantionului sub aspect cantitativ, sub aspectul numrului de
frecvene sau de uniti statistice, pe care fcnd cercetarea s putem
generaliza rezultatele, se face cu ajutorul unor formule matematice pe
care le vom prezenta n continuare.
Alegerea prii din populaie sau din colectivitatea general reprezentativ din punct de vedere calitativ i cantitativ pe care fcnd
observaia sau efectund cercetarea s putem ajunge la rezultate sau
concluzii similare cu cele obinute pe ntreaga colectivitate, se numete
eantionare.
METODE DE EANTIONARE
Alegerea frecvenelor sau unitilor statistice care alctuiesc eantionul trebuie fcut de aa manier, nct aceasta s ofere anse egale de selecionare tuturor unitilor, prile componente ale colectivitii
generale s fie proporional reprezentate, iar eantionul analog cu
ntregul s reflecte toate caracteristicile, atributele i aspectele colectivitii generale (populaiei).
Alegerea poate fi:
- ntmpltoare cnd alegerea unitilor statistice se efectueaz prin
tragere la sori. n asemenea selecii trebuie asigurate anse egale
fiecrei uniti a colectivitii generale de a fi selecionate.
- Mecanic atunci cnd selecia unitilor statistice se face respectnd un anumit criteriu. Spre exemplu, de pe o anumit list n care
unitile statistice ale colectivitii au fost nscrise ntr-o anumit ordine (alfabetic, vrst, localitate etc.), se aleg unitile statistice
ale eantionului din 5 n 5 sau din 10 n 10 uniti:
- Stratificat atunci cnd extragerea unitilor statistice se face pe
grupe omogene (straturi) ce reflect ntocmai structura pe aceleai
grupe ale colectivitii generale. Spre exemplu, dac colectivitatea
general este reprezentat de 65% aduli, 25% copii i 10% btrni, atunci i eantionul ales din colectivitatea general s aib
proporional aceeai structur pe grupe de vrst a populaiei.
139
Tipuri de eantionare
n funcie de natura schemelor de eantionaj abordate putem s clasificm eantionajele n eantionaje aleatoare i nealeatoare sau empirice.
Din categoria eantionajelor aleatoare fac parte:
- eantionaje simple (elementare)
- eantionaje stratificate
- eantionaje n grupuri
- eantionaje n trepte (faze)
- eantionaje multifazice.
n ceea ce privete eantionajul simplu (elementar), procedeul
const n extragerea la sori a unitilor care vor compune eantionul
(n general identice cu unitile de selecie din populaie) din baza de
sondaj; procedeul presupune deci existena bazei de sondaj, adic o
list sau un fiier din care se extrag, ntr-o manier aleatorie, unitile
de selecie. Baza de sondaj poate fi o list a tuturor nscuilor vii, a
femeilor nsrcinate din ar sau dintr-un anumit teritoriu, o list a tuturor persoanelor spitalizate, o list a tuturor raioanelor, a comunelor, a
familiilor dintr-un teritoriu etc.
Eantionajul stratificat se utilizeaz cnd n interiorul populaiei de
referin unitile statistice se gsesc plasate pe categorii. Fiecare categorie este omogen din punct de vedere al coninutului intern, dar categoriile difer ntre ele. Aa este cazul populaiilor clasate dup caracteristicile vrst, mediu de provenien, diagnostic al bolnavilor externai,
clasai pe secii sau grupuri de boli etc. Se adopt n acest caz o selecie
proporional cu volumul stratului sau cu volumul optim cnd din unele
straturi mai puin reprezentate se ia un numr sporit de uniti.
Dac unitile statistice se gsesc plasate n grupuri asemntoare,
fiecare grup n parte avnd ns o compoziie eterogen (cazul familiei,
gospodriei, dispensarului medical etc.) se consider ca unitate de selecie grupul (familia, respectiv gospodria) i nu individul, nregistrarea
ulterioar a eantionului beneficiind de un plus de operativitate i precizie, comparativ cu selecia simpl a unitilor individuale.
Eantionajul n grupuri este un procedeu folosit cnd lipsete
baza de sondaj iar constituirea ei este dificil i foarte costisitoare i n
sfrit cnd dispersia teritorial a populaiei de investigat este exagerat. Se pornete de la faptul c populaia de studiat poate fi imaginar
ca fiind constituit din uniti de selecie ierarhizate.
140
BIOSTATISTICA
141
Simplu cu
repetiie
2.
Simplu
fr
repetiie
3.
Stratif.
proporional
4.
Stratif.
cu volum
optim
Volumul eantionului
Caract. cantitativ*
Caract. calitativ
_________________________________
* Dac sunt necesare eantioanele de volume mai mari de 30 uniti de observare, n locul coeficientului tay, se folosete U pentru care:
U0,05= 1,96; U0,01= 2,57; U0,001=3,29
142
BIOSTATISTICA
143
Eroarea maxim
(P)
0,05
0,06
0,07
0,08
0,09
0,10
p2=p(1-p)
Risc ()
Volumul eantionului
0,4x0,6
0,4x0,6
0,4x0,6
0,4x0,6
0,4x0,6
0,4x0,6
0,05
0,05
0,05
0,05
0,05
0,05
369
256
188
144
114
92
144
BIOSTATISTICA
145
Tabelul 41
Volumul eantionului pentru sondaj n grupuri*
Nr. total
de grupe 0,05
formate
400
26
400
25
300
25
250
24
200
24
150
23
100
22
90
21
80
20
70
20
60
19
50
18
40
16
35
15
30
14
25
13
20
12
15
10
10
8
0,1
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
24
24
23
23
23
22
20
20
19
19
18
17
16
15
14
13
12
10
8
23
22
22
22
21
21
19
19
18
18
17
16
15
14
13
12
11
9
7
21
21
21
20
20
19
18
18
17
17
16
15
14
14
13
12
11
9
7
20
19
19
19
19
18
17
17
16
16
15
15
14
13
12
11
10
9
7
18
18
18
17
17
17
16
16
15
15
14
14
13
12
12
11
10
9
7
17
17
16
16
16
16
15
15
14
14
14
13
12
12
11
10
10
9
7
15
15
15
15
15
14
14
14
13
13
13
12
12
11
11
10
9
8
7
14
14
14
14
13
13
13
12
12
12
12
11
11
10
10
9
9
8
6
13
13
12
12
12
12
12
11
11
11
11
10
10
10
9
9
8
7
6
146
BIOSTATISTICA
Unitile statistice pot fi simple i complexe. Cele simple sunt elementele constitutive ale colectivitii (persoana, bolnavul etc.), iar cele
complexe sunt rezultatul organizrii sociale i economice a colectivitii
(familia, echipa, secia, anul de studiu etc.). Unitile statistice sunt uniti independente care pot fi studiate separat, pe subcolectiviti sau pe
ntreaga colectivitate.
Unitile colectivitii pentru care se culeg date n procesul cunoaterii se deosebesc de unitile de raportare, ce pot fi, de exemplu, instituii i altele, care potrivit legislaiei n vigoare informeaz sistematic
asupra activitii unitilor aflate n structura lor organizatoric. Unitile
sunt purttoare ale unor trsturi variabile n timp i spaiu.
Caracteristicile statistice, denumite i variabile statistice, reprezint
criteriile pe baza crora se caracterizeaz unitile colectivitii. Aceste
criterii pot fi nsuiri sau trsturi ale unitilor care definesc i delimiteaz ntre ele unitile colectivitii i care urmeaz s fie nregistrate.
Formele concrete de manifestare ale caracteristicilor la nivelul fiecrei
uniti a colectivitii se numesc variante sau valori.
Caracteristicile statistice se difereniaz dup mai multe criterii.
Dup coninutul lor pot fi: de timp, de spaiu i atributive.
Caracteristicile de timp arat apartenena unitilor la un moment
sau o perioad de timp.
Caracteristicile de spaiu arat situarea n teritoriu a unitii. Se exprim prin cuvinte pe baza unui nomenclator al unitilor teritoriale.
Toate celelalte sunt caracteristici atributive i servesc pentru definirea fenomenelor studiate.
Dup modul de exprimare, ele se separ n: caracteristici calitative
(exprimate prin cuvinte) i caracteristici cantitative (exprimate numeric), de exemplu, profesia i vrsta.
Dup natura variaiei, cele numerice se mpart n caracteristici cu
variaie continu i cu variaie discontinu sau discret. Cele cu variaie continu, de exemplu, vrsta, care poate lua orice valoare ntr-un
interval dat i numrul de copii, ca variabil discret ce dimensioneaz
familiile i care nu poate lua dect valori strict determinate n intervalul
de valori nregistrate la un moment dat. De reinut c, n statisticile
practice toate variabilele numerice se nregistreaz ca variabile discrete, de exemplu, vrsta n ani mplinii.
Dup modul de manifestare la nivelul unitilor simple pot fi alternative manifestarea direct sau opus ei, de exemplu, urban-rural i
147
148
BIOSTATISTICA
Sex
Total
F.
M.
Total
50
32
18
160-169,9
28
20
8
Grupe de valori TA
170-179,9
180-189,9
15
7
8
4
7
3
200-209,9
...
-
Exemplul 2. Distribuia pe cauze, grupe de vrst i sex a mbolnvirilor stomatologice a elevilor liceului X anul Y (Tab.43).
Tabelul 43
Repartizarea pe cauze, grupe de vrst i sex a mbolnvirilor stomatologice
a elevilor liceului X anul Y
Numr elevi
Nr.
crt.
1.
2.
3.
4.
Afeciunea
Caria simpl
Pulpit
Gangrena
Extracii
Total
Total
118
15
4
18
155
Grupe de
vrst
Sexul
M
F
54
64
7
8
3
1
10
8
74
81
15-16
17-18
19-20
Sexul
M
F
20
24
3
4
1
5
2
28
31
Sexul
M
F
18
21
3
2
2
1
3
24
26
Sexul
M
F
16
10
1
2
1
4
3
22
24
149
150
BIOSTATISTICA
Tabelul 44
Distribuia elevilor pe sexe, locul de domiciliu i prezena sau absena cariei dentare
din colectivitatea X n anul Y
TOTAL
Sex
Domiciliu
R
200
100
150
50
300
500
F
200
Carii dentare
P
A
P
A
P
A
P
A
150
50
60
40
100
50
30
20
151
Tabelul 45
Distribuia bolnavilor hipertensivi n raport cu grupa de vrst i valorile TA
Grupe de vrst
40-44
45-47
50-54
55-59
Valori TA
170-179,9
180-189,9
160-169,9
5
190-199,9
10
15
20
Se observ o legtur strns ntre creterea valorilor TA i naintarea n vrst, legtur care va fi msurat printr-un coeficient de
corelaie, care va fi studiat la capitolul respectiv.
Exemplul 3. Dac dorim s stabilim ntr-o colectivitate dac ntre
vrst i parodontopatie exist o legtur de dependen sau nu, utilizm un astfel de tabel de corelaie n care una din variabile (factorial)
este reprezentat de grupele de vrst, iar cealalt variabil (determinat sau rezultant) este reprezentat de valori sau frecvene ale
dinilor afectai (Tab. 46).
Tabelul 46
Corelaia ntre grupele de vrst i numrul de dini afectai
Grupa de vrst
40-44
45-49
50-54
55-59
60-64
65-69
1-3
2
4-6
16-19
3
8
12
25
50
152
BIOSTATISTICA
153
154
BIOSTATISTICA
155
Suprafaa de reprezentare este mai mare dect cea a graficului. Include graficul i textul corespunztor acestuia astfel nct s constituie
o unitate coerent.
Suprafaa de reprezentare include:
- titlul graficului (hrii)
- axa vertical Y
- eticheta atribuit axei Y
- valoarea maxim
- valorile scalei
- marcajul care indic limita dintre valorile scalei (tick)
- valoare minim
- axa orizontal X
- eticheta atribuit axei X
- suprafaa ncadrat
- curbe, coloane etc.
- legenda
- sursa
Suprafaa graficului este suprafaa ocupat de grafic fr titlu,
valorile scalei etc. Suprafaa trebuie s fie suficient de mare pentru
a obine un grafic vizibil. Graficele care conin multe detalii necesit
o suprafa mai mare. Proporiile suprafeei sunt determinate pn la
un anumit punct de date o serie cronologic mare se reprezint de
obicei ntr-un dreptunghi. Ca regul, formatul orizontal este mult mai
potrivit i o alegere bun este dat de proporia 1:1,6.
Suprafaa de reprezentare este o suprafa imaginar ce conine ntregul grafic incluznd titlul i textele explicative. n mod normal
suprafaa de reprezentare nu este marcat n nici un fel, cu excepia
cazului n care fundalului i se atribuie o alt culoare.
Uneori irul 1:1,2 1:2,2 este dat ca reper pentru a stabili raportul
dintre cele dou laturi ale dreptunghiului format de axa vertical i cea
orizontal.
156
BIOSTATISTICA
Aria graficului
Aria graficului este o arie imaginar care conine desenul propriuzis (coloane, benzi, curbe etc.). Poate fi colorat ntr-o nuan deschis
pentru a pune mai bine n eviden coninutul graficului.
Reeaua de axe orizontale i verticale.
n unele cri este denumit reea ajuttoare de reprezentare grafic pentru a nu fi confundat cu reeaua rectangular format din sistemul coordonatelor carteziane.
Reeaua de axe permite citirea graficului cu mai mult uurin i
se pot aprecia cu aproximaie valorile. Axele orizontale se utilizeaz n
cazul reprezentrii prin dreptunghiuri verticale, n timp ce axele verticale se utilizeaz n cazul reprezentrii prin dreptunghiuri orizontale. n
ambele cazuri este mult mai uor de apreciat lungimea dreptunghiurilor. n diagramele n care reprezentarea este prin curbe se recomand
utilizarea ambelor reele de axe.
Reeaua de axe nu trebuie s fie obstructiv i nu trebuie s distrag atenia de la datele reprezentate. Axele trebuie s fie ct mai
subiri. Dac fundalul este colorat atunci culoarea alb pentru axe este
o alegere potrivit.
Textul
Toate informaiile necesare nelegerii graficului trebuie incluse n
suprafaa de reprezentare astfel nct aceasta s fie dominat de grafic
i nu de text. Textul trebuie s cuprind strictul necesar.
Titlul i alte texte
Titlul trebuie s descrie ntr-o form concis coninutul graficului.
Din titlu trebuie s reias foarte clar:
- grupul descris (femei ntre 25-29 ani)
- variabilele implicate (cauza decesului)
- anul la care se refer datele 2005
- tipul de date reprezentate (valori absolute, procente).
Titlul trebuie:
- s fie uor de citit
- s nceap cu informaia cea mai important
Este recomandat ca titlul s apar deasupra graficului pentru a respecta o ordine natural n citirea lui. Alinierea titlului cu textul corespunztor axei Y confer unitate graficului i paginii de text n care este
inserat acesta.
157
158
BIOSTATISTICA
Legenda
Aceleai principii se aplic att pentru arii ct i pentru curbe. Trebuie specificat ce reprezint fiecare arie sau curb.
n cazul ariilor, legenda poate fi scris direct pe aria respectiv sau
n afara ei n partea dreapt. Reprezentarea ariilor n legend trebuie
fcut n aceeai direcie cu reprezentarea din grafic, de la stnga la
dreapta sau de sus n jos.
Pentru dreptunghiurile verticale sau orizontale grupate, trebuie s
explicm ce reprezint fiecare grup n parte. Legenda trebuie poziionat n suprafaa grafic, sub grafic, sau lateral n partea dreapt a
graficului (varianta a, varianta b, varianta c).
Pentru barele verticale grupate, legenda poate fi aezat orizontal
n suprafaa grafic, dedesubtul ei sau n partea dreapt.
n cazul dreptunghiurilor orizontale, legenda este poziionat vertical fie n suprafaa grafic fie n afara ei, fie n partea dreapt.
159
Haurri/ culori
Pentru a putea face comparaii cu uurin se recomand respectarea unor principii elementare n utilizarea culorilor i haurrilor.
160
BIOSTATISTICA
161
Simbolurile
Seriile cronologice sunt alctuite din observaii unite prin linii. Uneori observaiile corespunztoare fiecrei perioade (lun, an) pot fi marcate prin simboluri.
Simbolurile au un rol important n cartograme. n aceste cazuri trebuie s fie simple cercuri sau ptrate, n general figuri geometrice
simple de dimensiuni relativ mici.
Tehnicile de baz n construirea unui grafic
Elementul de baz de la care se pornete n construirea unui grafic
este sistemul de coordonate (sistem de referin). Sistemul de coor-
162
BIOSTATISTICA
163
164
BIOSTATISTICA
Tabelul 46
Frecvena n cadrul fiecrei categorii a persoanelor investigate (%)
Ani de
colarizare
4 ani
5 ani
6 ani
7 ani
8 ani
Distribuia
frecvenelor
21
53
69
47
33
N = 223
vrsta
Fig.11. Histograma.
Unele variaii ale histogramei de baz sunt folosite pentru a reflecta anumite caracteristici ale datelor. Spre exemplu, dac variabila este
nominal dreptunghiurile din histogram pot fi separate astfel nct s
vizualizeze separat i distinct categoriile. De obicei acest grafic mai este
numit i diagrama prin coloane iar dreptunghiurile au limile egale.
165
166
BIOSTATISTICA
Acest tip de grafic este util atunci cnd una dintre variabile (de pe
axa X) este continu, este deci, variabil de tip interval (exemplu vrsta
i timpul).
Se poate folosi i o diagram prin coloane n cazul n care variabilele de pe axa X sunt nominale sau ordinale. n acest caz barele verticale
sunt mai indicate pentru comparri. Pentru seriile cronologice urmrirea vizual a coloanelor n scopul observrii evoluiei este mai dificil.
n diagrama linear curbele pentru seriile cronologice sunt mult mai
uor de urmrit i n acelai timp ofer o descriere (un desen) a evoluiei n timp a fenomenului observat.
167
2. Grafice speciale
Diagrama prin coloane
Este cea mai simpl form de grafic. Acest tip de diagram este
utilizat atunci cnd se urmrete:
- reprezentarea mai multor fenomene n acelai loc i n acelai
timp, sau
- acelai fenomen n mai multe locuri dar n acelai timp (ex. rata
de mortalitate general pe raioane n anul 2006).
Diagrama prin coloane este uor de reprezentat grafic i uor de
citit. Se utilizeaz atunci cnd dorim s reprezentm valori distincte ale
variabilelor variabile calitative sau discrete. Pentru ilustrarea acestui
lucru coloanele sunt separate de spaii.
Sunt utilizate pentru reprezentarea grafic a frecvenelor absolute
sau a frecvenelor relative, a sumelor sau a mediilor.
Pe axa X sunt reprezentate variabilele, n timp ce pe axa Y sunt
reprezentate frecvenele.
Utilizarea procentelor permite mult mai bine compararea mulimilor
de date de dimensiuni diferite.
Coloanele trebuie s fie mai late dect spaiile dintre ele, iar spaiile
trebuie s fie bine definite, astfel nct graficul de tip coloan s nu
poat fi confundat cu o histogram (varianta a este corect)
Atenie
- Axa Y trebuie s fie din lungimea axei X (sau de aceeai lungime).
- ntotdeauna axele frecvenelor sau ale procentelor ncep de la
punctul 0 sau de la origine. Axele scorurilor pot ncepe de la
orice scor convenabil pentru a obine o diagram clar.
- Fii siguri c diferenele numerice egale sunt reprezentate prin
distane fizice egale pe toate scalele.
- Etichetarea corect a graficului includerea scalelor, sursa datelor, titlul explicativ, note explicative, etc. Evitai confuziile: nu
reprezentai mai multe grafice diferite utiliznd aceleai sistem
de axe.
Reeaua de axe este util pentru comparaii i pentru citirea aproximativ a valorilor. Dac axele reelei sunt n numr prea mare graficul
este greu de citit, iar dac sunt n numr prea mic prezena lor nu se
justific (varianta e i varianta f).
Din punct de vedere al orientrii barele pot fi:
- verticale
- orizontale
168
BIOSTATISTICA
varianta d
varianta e
varianta f
Sngerei
169
170
BIOSTATISTICA
O alternativ de grupare a coloanelor o reprezint coloanele aranjate sub form de piramid, stivuite (stacked charts). Este cunoscut sub denumirea de diagram de structur prin dreptunghiuri (Fig. 13).
Dreptunghiurile sunt reprezentate unul deasupra celuilalt. n acest caz,
suprafaa dreptunghiului care reprezint ntreaga colectivitate (100%)
este divizat n pri proporionale cu ponderea specific a fiecrei
componente care alctuiete ntregul. Se recomand un numr relativ
mic de componente (variabile).
Pentru valoarea fiecrei variabile, nlimea coloanei corespunde
cu frecvena total a categoriei respective. Cu precizie, poate fi citit
numai dimensiunea categoriei de la baz; celelalte categorii pot fi apreciate cu aproximaie.
Haurrile sau culorile diferite indic divizarea totalului n categoriile componente.
Coloane suprapuse vs. coloane stivuite
- ambele reprezint situaii similare
- alegerea se limiteaz la ceea ce dorim s subliniem cel mai
mult
- n cazul coloanelor suprapuse este uor s compari ntre ele
categorii diferite dar mai dificil s nelegi ce se ntmpl la nivelul ntregii categorii
- n cazul coloanelor stivuite ansamblul este vizibil, n timp ce
dimensiunea fiecrei categorii este secundar.
Aceeai informaie poate fi reprezentat din dou puncte de vedere
utiliznd dou tipuri de grafice.
171
172
BIOSTATISTICA
Fig. 15. Structura deceselor pe cauze medicale n Republica Moldova, 2006 (%).
173
Dac dorim s comparm mai multe grupuri de date folosind aceast diagrama, atunci vom construi o diagram pentru fiecare grup n
parte. Aria fiecrui cerc va fi proporional cu dimensiunea grupului. n
acest fel putem compara att dimensiunile grupurilor ct i distribuiile
procentuale din cadrul fiecrui grup simultan.
Diagrama prin benzi
Diagrama prin benzi reprezint o alternativ a histogramei. n acest
tip de grafic dreptunghiurile sunt foarte nguste i capt aspectul de
benzi. Benzile sunt orizontale. Se poate alege ntre numere i procente. Sunt dou modaliti de reprezentare a procentelor:
- procentele pot fi procente din total brbai i separat procente
din total femei
- procente din totalul populaiei
Un exemplu de diagram prin benzi este piramida vrstelor (population pyramid) Piramida vrstelor descrie populaia unei ri sau
regiuni pe sexe i grupe de vrst. Const din dou histograme orizontale, una pentru brbai i una pentru femei. Histogramele sunt aezate
n oglind pentru a se face compararea ntre sexe, n populaia unei
ri/regiuni. Pe axa orizontal putem reprezenta att valori absolute ct
i procente.
Lungimea benzilor este proporional cu valorile reprezentate iar
limea lor este aceeai pentru toate benzile.
Tehnica este utilizat i n alte situaii, de exemplu:
- pentru a reprezenta proporia de fumtori n diferite grupuri de
vrst la brbai i respectiv la femei
- status marital etc.
Hri statistice
Hrile statistice ocup un loc special n reprezentarea variaiilor
spaiale (geografice) a diverselor fenomene sau probleme sociale de
sntate. Dintre acestea, n sistemul de sntate sunt frecvent utilizate cartogramele, care reprezint o combinare dintre grafic i hart
(Fig. 16).
Cartogramele exprim distribuia nivelelor unui fenomen ntr-o arie
geografic (ar, raioane, regiuni). Diferenele dintre proporii, rate, medii etc., sunt puse uor n eviden prin colorarea/haurarea diferit a
ariilor geografice. Permite compararea valorilor dintre diferitele zone n
acelai timp; compararea pune n eviden att zonele cu valorile cele
174
BIOSTATISTICA
mai ridicate, ct i zonele cu valorile cele mai sczute. Se obine o vizualizare spaial a informaiilor despre fenomenul observat (fertilitate,
mortalitate etc.)
Fig. 16. Clasificarea raioanelor dup nivelul infirmitii motorii cerebrale, anul X().
175
se stabilete un cod de culori sau haurri prin care vor fi exprimate valorile corespunztoare fiecrui interval de mrime;
- se coloreaz sau se haureaz fiecare zon conform grupului
de valori din care face parte;
- n legend se va explica codul utilizat.
n domeniul sntii publice s-a dezvoltat, n ultimii ani, conceptul
de HEGIS (Health Environment Geographic Information System) care
are la baz GIS (Geographic Information Systems).
Aranjarea graficelor n raportul statistic
n procesul de elaborare a raportului statistic, obiectivele autorului
au un rol major. Aceleai date pot fi reprezentate n moduri diferite conform mesajului pe care autorul dorete s-l transmit.
Exemplul 3. Mai jos este prezentat acelai indicator rata de inciden prin ciroz hepatic din dou perspective diferite conform
inteniilor autorului.
n varianta a, scopul este de a prezenta evoluia ratei de inciden
pe o anumit perioad relevant de timp, 5 ani. n varianta b, mesajul
este complet diferit i corespunde unui alt scop compararea ratei de
inciden pe 5 ani. Deoarece este vorba de o serie temporal mesajul transmis de aceste date se refer la evoluie. Diferena se poate
observa n modul n care sunt organizate graficele i din explicaiile
prezentate n text.
n varianta a, evoluia este subliniat de reprezentarea anilor pe
axa orizontal. Acesta este modul obinuit de reprezentare a datelor
temporale. De asemenea pentru a evidenia evoluia, anii sunt sortai
n ordine cresctoare. Textul asociat descrie evoluia n ansamblu i
subliniaz neregularitile remarcabile.
n varianta b, inteniile autorului sunt complet diferite, (obiectivul
este compararea).
Pentru comparaii sunt necesare schimbri structurale. n varianta
b anii sunt reprezentai pe axa vertical eliminnd impresia de evoluie.
Aceast schimbare este important pentru perceperea graficului, deoarece eliminnd diferenele false, mesajul devine mai clar.
176
BIOSTATISTICA
Ani
Fig. 17. Rata de inciden prin ciroz hepatic n Republica Moldova, 2000-2004
(la 100 mii locuitori).
177
Interpretare:
Varianta a Tendina incidenei este de cretere din 2000 pn n
2004, observndu-se un nivel mai sczut n 2000 i 2002.
Varianta b n perioada 2000-2004 nivelul cel mai sczut al ratei
de inciden prin ciroz hepatic s-a nregistrat n 2000 iar cel mai ridicat n 2004.
n varianta b anii sunt tratai ca variabile nominale n loc de variabile
ordinale i astfel, sortate n ordine cresctoare dup valorile variabilelor. Aceast reordonare are dou efecte pozitive: pe de o parte, distruge imaginea evoluiei, deoarece anii nu sunt prezentai n succesiune i
pe de alt parte, permite o mai bun comparare a valorilor.
La rndul lui textul asociat este diferit de cel din varianta a n locul
descrierii modului n care are loc evoluia ratei de inciden, se menioneaz numai anii cei mai buni i cei mai slabi. Aceast diferen este
important pentru autor, mai ales atunci cnd dorete s transmit mai
multe mesaje.
Exist situaii n care dou obiective pot fi combinate pentru a fi reprezentate grafic. n acest caz reprezentarea grafic ine cont n primul
rnd de obiectivul principal.
O prezentare grafic greit are consecine mai grave dect inexistena ei.
Anders Wallgren
Lista de verificare (Check-list)
nainte de a ncepe construirea graficului
Care este grupul int?
Care este rolul graficului?
Ce tip de grafic trebuie ales?
Cum trebuie prezentat graficul?
Ct de mare trebuie s fie graficul?
Este reprezentarea grafic cea mai bun alegere de prezentare a
informaiilor?
Dup ce construirea graficului a fost finalizat
Este graficul uor de citit?
Poate fi graficul interpretabil (interpretat greit)?
Sunt potrivite forma i mrimea graficului?
Este integrat graficul corect n text ?
Se recomand testarea graficului: se solicit unei persoane care
are caracteristicile grupului int citirea i interpretarea graficului. For-
178
BIOSTATISTICA
mulai ntrebri despre grafic astfel nct s nelegei cum este el perceput de persoana aleas.
179
180
181
BIOSTATISTICA
BIBLIOGRAFIE
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
182
BIOSTATISTICA
BIBLIOGRAFIE
183
184
BIOSTATISTICA
53. Wang, S. T., Klein, J. P., Moeschberger, M. L. (1995). Semi-parametric estimation of covariate effects using the positive stable frailty model. Applied
Stochastic Models and Data Analysis 11:121133.
54. Wei, L. J., Glidden, D. V. (1997). An overview of statistical methods for multiple failure time data in clinical trials. Statistics in Medicine 16:833839.
55. Wei, L. J., Lin, D. Y., Weissfeld, L. (1989). Regression analysis of multivariate incomplete failure time data by modelling marginal distributions.
Journal of the American Statistical Association 84:10651073.
56. Weinstein MC, Fineberg HV. Clinical Decision Analysis. Philadelphia: Saunders, 1980.
57. White, I. R., Babiker, A. G., Walker, A. S., Darbyshire, J. H. (1999). Randomization-based methods for correcting for treatment changes: examples
from the Concorde trial. Statistics in Medicine 18:26172634.
58. .., .., .. . .: , 1974.
59. .
.: , 1985.
60. .., B.., .., .., A..
, //, 1977. .
17. ,7.
61. ..; H.. .
.: , 1983.
62. .. . : , 1985.
63. .., ... ... .., ... ..
-3 //. 1977. .17. 6, 7.
64. .., . .. . . .: , 1984.
65. .., .
. .: , 1976.
66. E..
CLAMS IBM // .
. . . .:
, 1980.
67. ., .. CLAMS IM PC //.
. Te. . : , 1990.
68. .., .., ..
// . 1976. 3.
BIBLIOGRAFIE
185
69. .. , . .: , 1982.
70. A.. . : - , 1982.
71. A.. //[2].
72. A.. //.
. . .: , 1985.
73. A.. //. 1 . , , . . 1.
.: , . , 1988.
74. A.. // . .8. .: , 1982.
75. .., .. // I . -
- (8- 1985 ., ). : , 1986.
76. .. , - //
1984 . . . .: , 1986.
77. ..
//-
- . .: , 1987.
78. .. // . .: , 1983.
79. ..
// . .
, 1985. .: , 1987.
80. .. // . .: , 1980.
81. ..
// . .: , 1983.
82. .. - // . . , 1985. .: , 1987.
83. .. - . .:
, 1979.
186
BIOSTATISTICA
84. .., .. // . .:
, 1977.
85. .. // . 1982. 7.
86. .. // . .: , 1982.
87. .. //
. : . . -, 1991.
88. ..
// . .: , 1977.
89. H.., .., .. //. .
) . Te. . , 1977.
90. .B. //[2].
91. . . .
. .: , 1987.
92. .. . : , 1986.
93. .. -
//
. .: , 1984.
94. .. .
. .: , 1979.
95. .., .. . .: ,
1982.
96. A.M. - //
. .:
, 1980.