EDITURA TEHNOPRESS IAI 2003 ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 9
1. NOIUNI DE BAZ N BIOSTATISTIC
Statistica este tiina care are ca obiect de studiu fenomenele de mas, deci acele fenomene care se produc ntr-un numr mare de cazuri. Obiectivul fundamental al statisticii este de a rezuma i analiza datele statistice prin parcurgerea urmtoarelor etape: observarea statistic, n care se culeg date i informaii statistice privind toate caracteristicile urmrite ntr-o colectivitate definit; prelucrarea statistic, n care datele sunt sistematizate i se calculeaz indicatorii statistici ce caracterizeaz fenomenul studiat; analiza, interpretarea i prezentarea final a rezultatelor, n care sunt verificate ipotezele, formulate concluziile i fundamentate procesele decizionale. Datele statistice reprezint caracterizarea numeric pe care statistica o face n legtur cu colectivitatea studiat. Biostatistica este un domeniu al statisticii specializat n studierea fenomenelor biologice i medicale. Colectivitatea statistic este reprezentat de totalitatea elementelor care au caracteristici comune i care formeaz obiectul analizei statistice (populaia unui ora, bolnavii internai n spitalele din Iai, cazurile de SIDA la nivel naional, spitalele judeene din Romnia, etc.). Unitatea statistic este elementul component al unei colectiviti statistice supuse observrii i cercetrii. Uniti statistice pot fi: persoana, nscutul viu, decesul, cazul nou de boal, familia, centrul de sntate, secia de spital, animalul de experien, etc. Caracteristica statistic sau variabila reprezint trstura, proprietatea 10 ODETTA DUMA sau nsuirea comun tuturor unitilor unei colectiviti i care variaz de la o unitate la alta. Variabilele pot fi cantitative sau calitative i respectiv, continue sau discrete. Variabilele cantitative sunt nsuiri ale unitii statistice care pot fi exprimate numeric sau printr-o unitate de msur (talie, greutate, vrst, hemoglobin, tensiune arterial, etc.). Variabilele calitative sunt nsuirile care nu se pot exprima prin uniti de msur, ci prin atribute (sex, ras, religie, stadiul de evoluie al bolii, culoarea ochilor, etc.). Aceste variabile pot fi cu: dou variante de expresie, numite i variabile alternative, ca de exemplu, sexul (masculin/feminin), grupa sanguin Rh (Rh pozitiv / Rh negativ), statusul HIV (HIV+/HIV-); trei variante de expresie, de exemplu, mprirea populaiei n copii, aduli i vrstnici; patru variante de expresie, de exemplu, grupele sanguine n sistem ABO sau statusul marital n Romnia (cstorit, necstorit, divorat, vduv) ; cinci sau mai multe variante de expresie, de exemplu, starea pacienilor la externare (vindecat, ameliorat, staionar, agravat, decedat). Aceste variabile pot fi analizate cu ajutorul frecvenelor. Un exemplu de variabil calitativ este reprezentat de exprimarea nlimii n termeni de: scund, mediu, nalt, foarte nalt. Dei talia este o variabil cantitativ, ncadrarea unui individ ntr-una din categoriile menionate exprim un aspect calitativ. Variabilele continue sunt cele pentru care exist un numr nelimitat de valori posibile (de exemplu, greutile a doi copii sunt de 20, 325 i respectiv, 20,155 kg, fiind raportate ca 20 kg). Variabilele discontinue sau discrete sunt datele cu un numr limitat de ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 11 valori posibile reprezentate prin numere ntregi (de exemplu, cazurile de SIDA din jude, numrul de locuitori ai municipiului Iai, etc.). Varianta sau valoarea reprezint nivelul concret pe care l poate lua o variabil n cazul unei uniti sau grup de uniti statistice.
Exprimarea datelor statistice
1. Mrimile absolute se utilizeaz pentru consemnarea ca atare a unor evenimente sau cazuri. Numrul absolut este dependent de mrimea populaiei de referin. Acest mod de exprimare nu permite compararea riguroas a datelor statistice. Astfel, dac Albania i China ar avea exact acelai numr de cazuri de SIDA, nu s-ar putea spune c situaia epidemiei este la fel n ambele ri. Mrimile absolute se utilizeaz pentru a evidenia: numrul de locuitori dintr-o anumit regiune; incidena anumitor boli transmisibile deosebit de grave, cum ar fi lepra, SIDA, pesta, tetanos neonatorum, etc. Cazurile se raporteaz i apar n anuarele statistice ca atare, fr a le exprima la 100, 1000 sau 100 000 de locuitori. 2. Mrimile relative rezult prin calcul i au forma general: n 10 B A
Acestea permit compararea fenomenelor pentru c baza de comparare sau populaia de referin este aceeai. Ca tipuri de mrimi relative se descriu: rata; proporia; raportul. Rata exprim numrul de evenimente care au loc ntr-o populaie definit, 12 ODETTA DUMA pe durata unui anumit interval de timp sau la un anumit moment; se mai numesc i indicatori de intensitate. Distingem rate globale sau generale, care se refer la ntreaga populaie i rate specifice unei anumite subpopulaii (copii, femei, etnia rrom, persoanele vaccinate, etc.). Ratele se pot exprima n procente, promile, prodecimile, procentimile sau pri per milion (ppm). Ca exemple de rate avem: a. Prevalena de moment (1 iulie sau 31 decembrie) a tuturor cazurilor de boal 100 moment acel din referin de Populaia moment anumit un la vechi i noi cazuri Total
b. Natalitatea pentru un an calendaristic ntr-o regiune definit 1000 iulie) (1 locuitori Numr vii nscui Numr
c. Gradul de asigurare cu medici ntr-o populaie 10000 iulie) (1 locuitori Numr medici Numr
d. Incidena tuberculozei n anul 2002 5 10 2002 iulie 1 la de Populaia 2002 n TBC de noi Cazuri
e. Centenarii din Romnia 6 10 iulie) (1 locuitori Numr ani 100 persoane Numr
Corecia acestor rate cu multipli variabili de 10 este stabilit prin convenie internaional. n exemplele d i e avem multipli mari de 10 (10 5 , respectiv 10 6 ) deoarece diferena dintre numitor i numrtor este foarte mare i n cazul n care exprimarea s-ar face procentual, s-ar obine valori subunitare. Proporia se refer la relaia dintre o parte component i ntreg. Baza de raportare fie este egal cu 100 (cel mai frecvent), fie este egal cu 1, n acest caz toate proporiile avnd valori subunitare. Numrtorul este inclus n numitor ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 13 (similar ratelor) i rezultatul se exprim sub form de fracie, numr zecimal sau procente. Se poate spune c rata este o form de proporie multiplicat cu 10 n . Proporia mai este cunoscut ca indicator de structur. Astfel, ponderea sexului feminin n Romnia este de 51,2% fa de 48,8% sexul masculin. Din punctul de vedere al naionalitii sau etniei, aproximativ 90% sunt romni, aa cum se poate vedea din tabelul 1.1. Tabel 1.1. Structura etnic a populaiei Romniei Grupuri etnice Ponderea ( 0 / 0 ) Romni 89,5 Maghiari 6,6 Rromi 2,5 Germani 0,3 Ucraineni 0,3 Turci 0,2 Rui lipoveni 0,2 Srbi 0,1 Ttari 0,1 Altele 0,2
Raportul arat relaia dintre dou categorii de variabile evaluate n acelai moment sau acelai interval de timp (de exemplu, n localitatea A raportul masculin/ feminin pentru cazurile de SIDA este de 3/1). 3. Indicatorii statistici reprezint expresia numeric a unor fenomene biomedicale, definite n timp i spaiu. Au o form general de exprimare relativ, fiind n majoritate reprezentai prin rate i mult mai rar prin rapoarte sau medii. Ratele prezentate anterior sunt exemple de indicatori statistici sanitari de intensitate, ca i mortalitatea general, mortalitatea specific pe sexe, vrste, 14 ODETTA DUMA cauze sau mediu de reedin, fertilitatea, etc. Mortalitatea matern este un indicator ce se poate exprima fie ca rat, 1000 ani 49 15 femei Numr materne Decese
fie ca raport 1000 vii nscui Numr materne decese Numr
Este de preferat raportul i acesta se utilizeaz cel mai frecvent, pentru c el msoar n mod specific riscul de deces pe durata sarcinii, n timp ce rata de mortalitatea matern msoar riscul combinat pentru o femeie de a rmne nsrcinat cu acela de a muri datorit sarcinii, naterii sau luziei. 4. Indicele statistic este o mrime relativ care const dintr-un raport ce compar nivelul unui fenomen sau o rat nregistrate n momente/ intervale de timp diferite sau n regiuni diferite. Indicele nu are unitate de msur. "0" momentul la Rata t" " momentul la Rata
B" " zona n Rata A" " zona n Rata
Redm n tabelul 1.2. indicii care descriu evoluia numrului de medici stomatologi n Romnia, n intervalul 1985-1990, considernd ca baz egal cu 100 prima valoare nregistrat. Tabel 1.2. Dinamica numrului de medici stomatologi, 1985- 1990 Anul Nr. medici stomatologi Indici dinamici de baz 1985 3096 100 1986 3103 100,2 1987 3181 102,7 1988 3191 103,1 1989 3253 105,1 1990 3455 112 ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 15
Aplicaii
1. Stabilii care din urmtoarele exemple de date statistice sunt cantitative, respectiv calitative: luna din anul precedent n care s-au nregistrat cele mai multe cazuri de rubeol din judeul Iai; judeele din Romnia cu cea mai redus natalitate; cursul valutar oficial zilnic al leului n raport cu euro; venitul mediu al medicilor care au lucrat numai n sectorul privat n anul 2003; numrul persoanelor de sex feminin care ndeplinesc funcia de director de spital; tipul de antiinflamator nesteroidic recomandat cel mai frecvent de cei 86 medici de familie din oraul A; procentul mediu dintr-o zi de lucru consumat n edine de ctre directorii caselor judeene de asigurri; vrsta medie la prima cstorie pentru femeile din mediul urban; greutile celor 16 copii dintr-o secie de neonatologie.
2. Pentru caracterizarea unei serii de studeni din anul I de la Facultatea de Medicin n funcie de media de la admitere, unitatea statistic este: seria de studeni; media la admitere a fiecrui student; facultatea; studentul; anul de studiu.
16 ODETTA DUMA 3. Precizai care este unitatea statistic, variabila studiat i tipul de variabil (cantitativ, calitativ, continu, discontinu) pentru cazurile enumerate mai jos: cheltuielile pentru sntate exprimate per capita n 5 ri europene; numrul copiilor din 340 de familii intervievate ntr-un studiu privind sntatea familiei; specializrile a 32 medici; numrul personalului angajat n fiecare din cele 3 spitale ale oraului; absenteismul personalului medical (zile).
4. Stabilii care din urmtoarele date nu reprezint o variabil statistic pentru studiul colectivitii studenilor de la Facultatea de Medicin General: o vrsta; o grupa de studiu; o media de la admitere; o facultatea pe care o urmeaz; o numrul de ani de pregtire preclinic.
5. Statistica are ca obiectiv fundamental: identificarea valorilor extreme dintr-o serie de date; s rezume i s interpreteze datele statistice; s demonstreze formule matematice; s explice diferenele dintre seriile de date.
ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 17
2. PRELUCRAREA CARACTERISTICILOR CANTITATIVE
Indicatori de tendin central ai caracteristicilor cantitative Caracteristica statistic: nsuirea proprie fiecrei uniti statistice studiate, care prezint un nivel sau aspecte variate de la o unitate la alta, de la o persoan la alta. Exist dou tipuri de caracteristici: Caracteristici cantitative: se exprim numeric, cifric: Greutatea, vrsta, TA, calcemia, durata bolii (n ore, zile, ani), nr. zile de spitalizare, vrsta sarcinii, durata expunerii la o nox profesional etc. Caracteristicile cantitative sunt de dou categorii: A. de tip continuu: sunt acele nsuiri ce pot lua orice form numeric, inclusiv o fracie zecimal (greutatea, tensiunea arterial). B. de tip discontinuu sau discret: sunt acele nsuiri msurabile ce nu pot fi exprimate dect prin numere ntregi (nr. copii dintr-o familie, nr. decese, nr. nateri, etc.) Prin prelucrare, caracteristicile cantitative se transform n medii. Caracteristici calitative: care se exprim printr-o nsuire, o calitate a unitii statistice: de exemplu distribuia populaiei n funcie de caracteristica sex, tipul constituional, modul de alimentare, profesia, starea civil, grupa sanguin, starea la externarea din spital, mediul de reedin (urban, rural) etc. Prin prelucrare caracteristicile calitative se transform n frecvene. Unitate statistic: cazul de mbolnvire, persoana, familia, cstoria, nscutul viu, gravida, cabinetul medical individual, btrnul. 18 GEORGETA ZANOSCHI Caracteristicile cantitative (care se exprim numeric, cifric) se transform n VALORI MEDII, prin prelucrare. Principalele mrimi medii utilizate n statistic sunt: media aritmetic (simpl i ponderat); media patratic; media geometric; media armonic; media progresiv; media mobil (glisant). De asemenea, se mai folosesc dou mrimi medii, cu caracter orientativ, care nu necesit calcule speciale, ele servind la caracterizarea operativ, rapid, dar aproximativ a fenomenului: MEDIANA (Me) i MODULUL (Mo). MEDIA ARITMETIC Pentru a nelege modul de calcul al mediei aritmetice, este necesar a explica ce este o SERIE DE OBSERVAII (serie statistic, serie de variaie). Datele numerice, cantitative obinute n urma unor msurtori, determinri, calcule, numrri etc. deci a unor observri sau nregistrri statistice se nscriu sub forma unei serii de observaii. Aceasta reprezint un ir de numere (valori) care arat nivelul caracteristicii studiate, la fiecare unitate statistic, la fiecare caz individual studiat n parte. Aceste valori, numite OBSERVAII se dispun de regul vertical, sub forma unei coloane, fie n ordinea nregistrrii datelor experimentului, cnd se lucreaz cu puine cazuri fie dup o prealabil ordonare a lor, n sens cresctor sau descresctor a valorilor numerice n serie, atunci cnd sunt multe valori n serie. Aceste coloane se noteaz cu x, y, z etc. S presupunem c, n cadrul unei epidemii de tuse convulsiv nsumnd 35 de cazuri, s-a notat perioada de incubaie pentru fiecare caz n parte. Unitatea statistic, n exemplul nostru, este fiecare caz nou de tuse convulsiv. Fiecare cifr (12, 10, 9, 11 etc.) reprezint valoarea unei observaii; n total avem 35 de observaii, pentru c am urmrit 35 bolnavi cu tuse convulsiv, deci spunem c n (numrul de observaii) = 35. ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 19 Caracteristica statistic cercetat este, n cazul nostru, o caracteristic cantitativ, exprimat numeric: perioada de incubaie, msurat n zile, constatat la fiecare bolnav, mergnd de la 7 la 12 zile. Aceasta este o serie de observaie simpl, deoarece nu s-a efectuat nici o grupare a unitilor statistice, a observaiilor nregistrate n serie; ci ele sunt redate individual. Media aritmetic nu este altceva dect suma valorilor sau datelor numerice, mprit la numrul acestora. n n cazul seriei de observaii simple, media aritmetic se calculeaz dup formula mediei aritmetice simple:
n x x n care: x = media seriei statistice x; x = valoarea fiecreia din cele n observaii; n = numrul total de observaii nregistrate; n cazul nostru, fcnd suma valorilor seriei simple x, obinem 343 zile; tim c numrul observaiilor (n) este de 35. nlocuim n formul i obinem: zile 8 , 9 343 35 x Ex.: x (caracteristica cantitativ studiat) Deci, media seriei noastre este 9,8 (zile); n consecin, numrul mediu de zile al duratei privind incubaia prin tuse convulsiv, pentru lotul studiat de noi (al tuturor celor 35 cazuri) este de 9,8 zile. Media se exprim n aceiai unitate de msur ca i fiecare observaie, deci n unitatea de msur a caracteristicii statistice cercetate. Privind ns tabelul, observm c n aceast serie simpl de 35 observaii nivelul caracteristicii studiate variaz ntre 7 i 12, avnd valori din unitate n unitate (7, 8, 9, 10, 11 i 12), prezentnd deci ase variante de valori. Constatm de asemenea c fiecrei variante i X 12 10 9 11 12 7 11 9 8 10 9 10 10 9 8 9 11 11 7 8 9 10 10 11 12 11 10 10 11 10 9 10 11 10 8
n= 35
20 GEORGETA ZANOSCHI corespunde un numr diferit de observaii (varianta 7 zile apare de 2 ori, varianta 8 zile apare de 4 ori etc.). Prin gruparea seriei simple dup variantele existente se obine o SERIE GRUPAT, cu 6 variante i 35 observaii: O serie de observaii grupate se compune aadar din dou coloane: x caracteristica cantitativ studiat, care cuprinde variantele (adic valorile caracteristicii studiate, pe care le ntlnim n seria respectiv) i o coloan f, care reprezint frecvena (ponderea fiecrei variante n seria respectiv). n seria grupat, variantele se ordoneaz n sens cresctor sau descresctor al valorilor, n cadrul seriei respective.
x f 7 2 8 4 9 7 10 11 11 8 12 3 n =35
Numrul observaiilor (n) ntr-o serie grupat este egal cu suma frecvenelor. Deci, n = f. (Not: ntr-o serie simpl numrul observaiilor n, este egal cu numrul variantelor pentru c de fapt, n aceast serie, fiecrei variante i corespunde o singur frecven). n cazul seriei grupate, media aritmetic se calculeaz conform formulei MEDIEI ARITMETICE PONDERATE: n f x x , n care: x f = este produsul, ntre nivelul fiecrei variante i frecvena sa; ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 21 x f = nseamn suma acestor produse. Deoarece, n seria grupat, n = f, formula mediei aritmetice ponderate se mai poate scrie astfel: f f x x n seria noastr de observaii, media aritmetic ponderat a acestei serii grupate se calculeaz astfel: X f x f 7 2 14 8 4 32 9 7 63 10 11 110 11 8 88 12 3 36 35 343
zile 9,8 35 343 n f x x
(De remarcat c media x se exprim n aceiai unitate de msur ca i caracteristica cantitativ studiat, n cazul nostru n zile). n exemplele alese pentru demonstraie, fiind vorba de fapt de o aceiai serie, care n primul exemplu apare sub form de serie simpl, iar n urmtorul exemplu, sub forma unei serii grupate, rezultatele calculelor mediei sunt aceleai. Transformarea seriei simple n serie grupat se face cu scopul uurrii calculului parametrilor seriei de observaie (medie, deviaie standard etc.). Aceast necesitate este cu att mai accentuat, cu ct seria de observaii este mai mare. n concluzie, ntre formula mediei aritmetice simple i a mediei aritmetice ponderate nu exist deosebiri eseniale. Prima se utilizeaz n cazul seriei simple, iar a doua n cadrul seriei grupate, deci n funcie de modul n care sunt prezentate datele n seria de observaii.
22 GEORGETA ZANOSCHI
STABILIREA MEDIANEI I A MODULULUI
Mediana (Me) i modulul (Mo) constituie mrimi care ne pot oferi o orientare rapid asupra tendinei mediei, centrale a unei caracteristici sau fenomen studiat. n cazul loturilor mari, calculul mediei poate deveni anevoios i necesit un timp mai ndelungat. Seriile de observaii cantitative arat, prin simpla lor prezentare, care este tendina central a fenomenului studiat, mediana i modulul (pentru stabilirea crora nu sunt necesare calcule deosebite), fr a avea totui precizia mediei aritmetice, (care este rezultatul unui calcul), sunt considerate ca avnd un caracter orientativ, pentru caracterizarea unei colectiviti sau a unui fenomen. Mediana (Me) este valoarea observaiei care se gsete exact n centrul seriei de observaii, cu condiia ca observaiile s fie dispuse n ordine, cresctoare sau descresctoare n serie. Din aceast cauz, mediana se mai numete i medie de poziie. Mediana este acel indiciu al tendinei centrale, acea valoare central care mparte un ir de date (ordonat n sens cresctor sau descresctor) n dou grupe, egale ca numr. Deci, mediana se gsete la mijlocul irului, n sensul c jumtate dintre valori sunt mai mari, iar jumtate dintre ele sunt mai mici, n funcie de modul de ordonare a valorilor n serie. POZIIA MEDIANEI, deci locul sau rangul pe care-l ocup aceasta n cadrul unei serii de observaii ordonate se stabilete cu ajutorul formulei:
2 1 n n care: n = numrul de observaii
Stabilirea medianei comport oarecum diferene la seriile simple i la seriile grupate. ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 23 La seriile simple: S lum urmtoarea serie simpl, reprezentnd greutatea (n kg) a unui numr de 9 tineri recrui i al cror date sunt dispuse n sens cresctor al valorilor: Aplicnd formula 2 1 n aflm poziia medianei n aceast serie de observaii simpl: 5 2 1 9
Deci mediana seriei este cea de a 5-a observaie, adic valoarea central Aceasta este situaia ntr-o serie cu un numr impar (fr so) de observaii, n care ntotdeauna n mijlocul seriei se afl o singur valoare central, care este mediana.
kg 6 , 62 9 5 , 563 x
Situaia se schimb n cazul seriilor simple cu un numr par (cu so) de observaii, n care n mijlocul seriei se vor gsi ntotdeauna dou observaii. S presupunem c, n seria de mai sus, am avea i o a zecea observaie de: 84,0 kg.
n acest caz, poziia medianei se stabilete n felul urmtor:
5 , 5 2 11 2 1 10 2 1 n
Deci, mediana va fi media aritmetic dintre a 5-a i a 6 observaie, cele dou valori din centrul seriei cu un numr par (10) de observaii: 61,5 i 62,0 kg., adic 61,75 kg. x
54,0 57,5 59,0 61,0 61,5 62,0 66,5 60,0 72,0 84,0
n = 10 x
54,0 57,5 59,0 61,0 61,5 62,0 66,5 60,0 72,0
=563,5
n =9
24 GEORGETA ZANOSCHI La seriile grupate: S lum urmtoarea serie grupat, reprezentnd perimetrul toracic, la un lot de 15 biei, n vrst de 6 ani, din mediul urban:
X f x f f cumulat 53 1 53 1 54 3 162 4 55 5 275 9 56 4 224 13 57 2 114 15 15 828
Aceast serie grupat cuprinde 15 observaii. Dac am dispune acestea sub form de serie simpl, n ordine cresctoare, am obine urmtoarea serie: x / 53 54 54 54 55 55 55 55 55 56 56 56 56 57 57 / 828 n =15 Stabilim poziia medianei conform formulei: 8 2 16 2 1 15 2 1 n
Deci, mediana va fi a 8-a observaie, adic de 55 cm. Dar, aceast metod - aplicabil seriei grupate numai prin transformarea ei n serie simpl este greoaie i, mai ales, foarte dificil de aplicat la seriile mari. De aceea, n mod obinuit se procedeaz astfel: La seria respectiv grupat se mai adaug o coloan, reprezentnd frecvenele cumulate (f.cum.). Aceasta nseamn c n dreptul fiecrei variante vom trece frecvena sa proprie la care vom aduga frecvenele tuturor variantelor anterioare, mai mici, de la nceputul seriei i pn la varianta respectiv. Frecvena cumulat a unei valori oarecare (x) este egal cu numrul tuturor frecvenelor egale sau mai mici dect valoarea variantei respective (x), cumulate la un loc:
cm 55,2 15 828 x ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 25 X f f cumulat
53 1 1 54 3 4 55 5 9 56 4 13 57 2 15 15
Dup cum se observ, frecvena cumulat a ultimei variante (x = 57 cm) este f = 15, adic n sau f, deci numrul total de observaii al seriei grupate respective. tim deja c, n cazul seriilor statistice cu 15 observaii, poziia (locul, rangul) medianei este a 8-a valoare, dac ele sunt ordonate n serie. Din exemplul de mai sus, reiese c valoarea celei de a 8-a observaii adic mediana, este 55 cm, deoarece observm (la rubrica f cumulat) c un numr de 5 observaii i anume a 5-a, a 6-a, a 7-a, a 8-a i a 9-a reprezint valoarea 55 cm. Modulul (Mo) sau dominanta (varianta dominant) este varianta cu frecvena cea mai mare dintr-o serie de observaii, valoarea care se repet cel mai des ntr-un ir de rezultate, deci el se poate stabili numai pentru seriile grupate, pentru c numai acestea au variante i frecvene. La seria de observaii grupat de mai sus, modulul este egal cu frecvena (f=5), deci este varianta cea mai numeroas, cu cele mai multe cazuri individuale, adic este 55 cm. Deci, modulul poate fi determinat prin simpla examinare a valorilor unei serii (fr a fi necesare operaii de calcul). n concluzie, prin stabilirea operativ a medianei i modulului se poate obine o orientare rapid asupra zonei n care, cu aproximaie, se va afla media autentic, valoarea lor fiind, ns, doar orientativ. 26 GEORGETA ZANOSCHI De precizat c exist serii fr modul precum i serii bimodale sau plurimodale.
UTILITATEA PRACTIC A INDICATORILOR DE TENDIN CENTRAL PENTRU CARACTERISTICILE CANTITATIVE
Utilitatea mediei Este o valoare tipic important care ne permite s condensm un ir statistic i astfel ne ajut s trecem la etapele urmtoare ale cercetrii statistice, n special la comparaie (compararea mediei unei caracteristici cantitative din dou teritorii). Exemplu: Dou coli au elevi de aceeai vrst, n care dintre ele, elevii au valoare a taliei, exprimat n cm mai mare ? Calculm media nlimii exprimat n cm (dup ce am msurat elevii din cele dou coli i astfel le putem compara). Dar media unui singur ir statistic (unei serii de observaii) ne d o idee global, foarte general i numai orientativ asupra lui. Uneori media poate ascunde o realitate De exemplu: 6 medici care lucreaz n cabinete din policlinic i trebuie s controleze starea a cte unui bolnav cronic, fiecare medic avnd cte un bolnav cronic n eviden. ntr-o lun de zile, cele ase cabinete raporteaz per total 24 de vizite. Atunci media aritmetic simpl este egal cu 4, nseamn c fiecare i-a efectuat numrul normal de vizite ntr-o lun. Dac lum ns i controlm fiecare cabinet n parte constatm c: C 1 = 6 vizite C 2 = 7 vizite C 3 = 5 vizite C 4 = 2 vizite ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 27 C 5 = 2 vizite C 6 = 2 vizite n realitate, medicii din cabinetele 1, 2 i 3 i-au efectuat vizitele, chiar puin peste minimul necesar, n timp ce medicii din cabinetele 4, 5 i 6 nu au efectuat nici mcar numrul necesar (dou vizite). Sperana de via la natere este de fapt o medie aritmetic care poate fi estimat cu ajutorul celor doi indicatori de tendin central: mediana i modulul. Sperana de via la natere este un indicator sintetic de msurare a strii de sntate a populaiei, puternic influenat de dezvoltarea socio- economic a unei ri, de mortalitatea infantil, mortalitatea juvenil i a populaiei adulte de pn la 65 ani, ca efect a unui complex de factori negativi (PIB/cap de locuitor sczut, bugetul alocat sntii redus, un stil de via defavorabil, stresul, presiunea moral, insatisfaciile personale). n condiiile Romniei, n contextul unei dezvoltrii stagnante, rezult importana influenrii decidenilor astfel nct, acetia s favorizeze att direct ct i indirect investiiile n domeniul sntii. Durata median de via reprezint numrul de ani dup care vor fi n via jumtate din efectivul de supravieuitori. Reprezint un indicator sintetic al strii de sntate a populaiei, fiind determinat de condiiile socio-economice, geoclimatice, genetice, cultural sanitare a unei comuniti (indicator prin care este pus n eviden utilitatea medianei). Vrsta modal la deces reprezint punctul maxim al curbei deceselor, fcnd abstracie de efectivul deceselor la vrsta 0 1 an (indicator prin care este pus n eviden utilitatea modulului) (fig.2.1). 28 GEORGETA ZANOSCHI Fig. 2.1. Vrsta modal la deces
Utilitatea practic a medianei Mediana nu este influenat de valorile extreme ale seriei, chiar dac ele sunt mult diferite de celelalte, avnd un caracter aberant. Astfel, observnd greutatea la natere pentru dou loturi de noi nscui vii: I 2500 g 3000 g 3500 g II 2500 g 3000 g 5000 g i ntr-un caz i n cellalt mediana este de 3000 g, dei n a doua serie a aprut o valoare atipic de 5000 g care este mai puin caracteristic pentru serie. Ori de cte ori se nregistreaz valori aberante foarte mari tipicul seriei este mai bine evideniat prin median dect prin medie. - aceast proprietate a medianei este folosit la stabilirea dozelor letale, cnd n perioada testrilor, unele animale mor la doze foarte mici, n timp ce altele pot fi foarte rezistente. - prezena unui singur animal atipic care ar muri la o doz crescut poate influena puternic media dac n stabilirea dozelor letale am ine cont de medie. Pentru evitarea unor influene de acest fel, se folosete mediana ca MODULUL ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 29 doz letal 50 DL 50 (adic doza care omoar 50 % din animalele de experien).
MEDIA PTRATIC
n unele cazuri este necesar calcularea mediei ptratice. De exemplu, deviaia standard (ca unitate de msur a variabilitii, a dispersiei unui fenomen sau a unei serii de observaii) este o medie ptratic a variaiilor. Media ptratic se calculeaz fcnd media ptratelor valorilor x (x 2 ), din care se scoate apoi radicalul:
n x p x 2
S lum, ca exemplu, urmtoarea serie de observaii simpl:
x X 2 2 4 4 16 7 49 12 144 25 213
7,3 7,29 53,25 4 213 n x x 2 p
Pentru aceeai serie de observaii, media aritmetic se calculeaz astfel:
6,3 6,25 4 25 n x xa
Prin urmare, ntotdeauna, valoarea mediei ptratice este mai mare dect valoarea mediei aritmetice, pentru aceeai serie de observaii.
30 GEORGETA ZANOSCHI MEDIA GEOMETRIC
Media geometric se utilizeaz atunci cnd valorile seriei de observaii sunt dispuse ntr-o progresie geometric. Este cazul mediei unor titruri (utilizate n microbiologie, virusologie, imunologie, serologie) care se succed n proporie geometric: 1/2; 1/4; 1/8; 1/16; 1/32; 1/64 etc. n aceste cazuri se calculeaz media geometric a numitorilor titrurilor. n cadrul mediei geometrice se face produsul titrurilor seriei, din care se extrage rdcina de un indice egal cu numrul titrurilor seriei. Deci, dac vrem s calculm media geometric a 6 titruri (x), acetia se nmulesc ntre ei i, din produsul obinut se scoate rdcina de ordinul 6. Formula general de calcul a mediei geometrice este: n n 4 3 2 1 .......x x x x x xg sau, ntr-o form sintetic: n x g x , n care: x = termenii seriei; = semnul produsului n = numrul termenilor seriei (numrul de observaii). x/1/8 1/16 1/8 1/4 1/16 1/32 1/16 1/32 n =8 Calculul mediei geometrice este mult uurat prin folosirea logaritmilor zecimali, ceea ce a dus la denumirea de medie logaritmic. Prin logaritmare, formula mediei geometrice devine: n lgx n .......lgx lgx lgx lgx g x lg n 3 2 1
Considernd seria de mai sus, transformnd termenii numitorilor titrurilor (x) n logaritmii lor zecimali, obinem: ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 31 8 1,50515 1,20412 1,50515 1,20412 0,60206 0,90309 1,20412 0,90309 g x lg 1,12000 8 9,0309
1/13,2 deci 13,2 13,18 n lgx antilg g x
Pentru comparare, vom calcula i media aritmetic a acelei serii de observaii:
1/16,5 deci 16,5 8 132 a x
Media geometric este mai mic dect media aritmetic pentru aceeai serie de observaii; media aritmetic este puternic influenat de valorile mari ale seriei, comparativ cu media geometric.
Aplicaii: 1. Notele obinute de elevii unei clase la o lucrare scris au fost urmtoarele: 8,5,9,6,7,7,10,4,8,7,5,4,5,9,10,7,5,7,6,6,9,8,9,7,7,6,8,7,6,8 S se calculeze media aritmetic ponderat a ntregii clase la lucrarea scris respectiv.
2. n anul 2003, n comuna X, din totalul de 84 nscui vii, 16 au avut o greutate la natere sub 2500 g (prematuri). S se calculeze eroarea standard ( ) a frecvenei prematuritii n comuna X.
3. n urma determinrii Q.I. (coeficientului de inteligen) la un grup de 9 precolari s-au obinut urmtoarele rezultate:
S se calculeze media aritmetic i deviaia standard.
ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 85
8. MSURAREA FRECVENEI BOLII
Morbiditatea este fenomenul mbolnvirilor aprute ntr-o anumit populaie i ntr-un interval definit de timp. Evenimentul luat n considerare sau unitatea statistic este cazul de boal. Morbiditatea se poate msura cu ajutorul urmtorilor indicatori: incidena; prevalena; morbiditatea spitaliceasc; morbiditatea individual; morbiditatea cu incapacitate de activitate. Cunoaterea frecvenei bolilor ntr-o populaie n funcie de vrsta de apariie, sex, cauz, etc., este util n: instituirea unor activiti de prevenire i combatere a mbolnvirilor; evaluarea eficienei i eficacitii msurilor luate; planificarea adecvat a ngrijirilor de sntate; evaluarea efectelor economice i sociale ale bolii; comparaii naionale i internaionale privind mbolnvirile.
Incidena
Msoar frecvena cu care apar cazurile noi de boal ntr-o anumit populaie i pe parcursul unui interval definit de timp. Evenimentul studiat este cazul nou de boal. Rata de inciden se utilizeaz cu precdere n studiul morbiditii prin boli acute. Indicatorii de msurare ai incidenei sunt: 86 ODETTA DUMA incidena general anual; incidena specific; densitatea incidenei; incidena cumulativ. Incidena general mai poart numele de inciden global sau anual i ia n calcul toate cazurile nou diagnosticate n cursul unui an calendaristic. Populaia de referin este cea existent la mijlocul anului respectiv (1 iulie), astfel c indicatorul este: 1000 iulie 1 la de Populaia an un - ntr boal de noi Cazuri
Aceasta este o rat brut (ca i cea a mortalitii generale), deoarece include toate cazurile noi de boal diagnosticate i raportate. Incidena specific se poate calcula pe: sexe; rase; grupe de vrst; medii de reedin; cauze de boal. De exemplu, incidena tuberculozei n anul 2002 este: 5 10 2002 iulie 1 la de Populaia 2002 n TBC de noi Cazuri
Spre deosebire de celelalte rate specifice, incidena pe cauze se exprim la 100 000 de locuitori. Se pot calcula rate specifice care cumuleaz mai multe variabile ca de pild, incidena cancerului de col uterin n anul 2000, populaia la risc fiind desigur cea a femeilor de 25-69 ani: 5 10 2000 iulie 1 la ani 69 - 25 de feminin Populaia 2000 n ani 69 - 25 de femei la uterin col de cancer de noi Cazuri
Incidena cumulativ ia n calcul numrul de cazuri noi dintr-o perioad specificat, numitorul fiind reprezentat de populaia la risc de la nceputul ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 87 studiului, din care ulterior vor apare cazurile de boal. Cel mai frecvent, incidena cumulativ se exprim la 1000 de locuitori (populaia la risc). Notificarea numrului de cazuri n sine, ca o mrime absolut, fr referin la populaia la risc se poate face pentru o serie de boli transmisibile care reprezint veritabile probleme de sntate public. Astfel, cazurile de SIDA raportate la nivel naional sau regional sunt cifre cumulative care pornesc de la primele cazuri depistate n urm cu 2 decenii i nsumeaz tot ce a aprut pe parcurs pn n prezent. Evident c o parte din acetia nu mai sunt n via.
Prevalena
Acest indicator msoar numrul de cazuri existente de boal dintr-o populaie definit, la un moment dat sau pe parcursul unui anumit interval de timp. Se descrie o prevalen general i o prevalen specific. Cazurile noi de boal sunt cunoscute sub denumirea de cazuri incidente, iar cazurile existente ca i cazuri prevalente care includ cazurile noi i vechi. De aceea, numrul cazurilor prevalente pentru un anumit interval de timp va fi mai mare sau cel puin egal cu cel al cazurilor incidente. Exist dou moduri de exprimare a prevalenei: prevalena de moment i prevalena de perioad. Aceasta din urm nu este foarte utilizat, cel mai des cnd se vorbete de prevalen fiind vorba de prevalena de moment. Incidena se refer la apariia bolii, n timp ce prevalena se refer la prezena bolii i msoar ponderea sau povara acesteia n populaie. Prevalena de moment se calculeaz astfel: 100 moment acel din referin de Populaia moment anumit un la vechi i noi cazuri Total
Aceast rat se poate calcula la nceputul unui an calendaristic, la mijloc 88 ODETTA DUMA (1 iulie) sau la sfrit. Populaia de referin este cea existent la acel moment i care prezint risc de a avea boala. De exemplu, prevalena cancerului de col uterin se raporteaz la populaia feminin n vrst de 25-69 ani (fig. 8.1.).
Fig. 8.1. Populaia cu risc pentru cancerul de col uterin Prevalena de perioad raporteaz cazurile existente ntr-un anumit interval de timp la populaia cu risc de la mijlocul perioadei investigate. De exemplu, prevalena n anul 2000 este: 100 2000 iulie 1 la de Populaia 2000 n boal de existente Cazuri
Prevalena depinde de inciden i de durata bolii (fig. 8.2.).
Fig. 8.2. Relaia dintre inciden i prevalen (OMS, 1992) Presupunnd c valorile celor trei variabile sunt relativ stabile n timp, ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 89 relaia dintre ele poate fi scris astfel: Prevalena = Incidena x Durata medie a bolii P = I x D Ratele de prevalen se exprim la 100 de indivizi i fac parte din categoria indicatorilor de intensitate sau de frecven i nu de structur, pentru c arat frecvena cazurilor de boal la 100 de persoane investigate. n interpretarea ratelor de prevalen trebuie inut cont de faptul c unitatea de studiu este cazul existent de boal i nu individul. O persoan poate prezenta n acelai timp dou sau mai multe boli (cazuri de boal) concomitent.
Aplicaii
1. Un lot de 2000 de subieci de sex masculin cu vrste cuprinse ntre 30- 39 ani au intrat ntr-un program de screening de un an pentru boala X. La nceput au fost diagnosticate 80 de cazuri, din care dup 6 luni (deci n al doilea semestru), au decedat 10, ali 10 au plecat definitiv din regiune (au migrat) i 12 s-au vindecat (fig. 8.3.).
Fig. 8.3. Cazurile noi i cele prevalente dup un program de screening Dup detectarea iniial a celor 80 de cazuri, de-a lungul anului au mai 90 ODETTA DUMA fost diagnosticate alte 30 cazuri noi. S se calculeze: prevalena de moment pe 1 ianuarie; prevalena de moment pe 31 decembrie; prevalena anual.
2. n figura 8.4. sunt prezentate cazurile de boala Y ce apar ntr-un lot de 100 de subieci, pe parcursul unui an calendaristic. Durata bolii este proporional cu lungimea segmentelor figurate pentru fiecare caz.
Fig. 8.4. Cazurile noi i vechi de boal pe durata unui an calendaristic Atunci cnd este vorba de un caz cu durata foarte scurt (cteva zile) dup care urmeaz vindecarea, pe grafic apare semnul x. S se calculeze: prevalena de moment pe 1 ianuarie; prevalena de moment pe 1 iulie; prevalena de moment pe 31 decembrie; incidena anual; prevalena anual.
ELEMENTE DE STATISTIC APLICAT N SNTATEA PUBLIC 91 3. Stabilii care din urmtoarele propoziii sunt adevrate: prevalena anual este totdeauna mai mare sau cel puin egal cu incidena anual; prevalena nu depinde de inciden i de durata bolii; cazurile de SIDA raportate n Romnia la sfritul anului 2002 evideniaz numrul persoanelor cu SIDA n via la acel moment ; incidena pe cauze de boal se exprim la 1000 de locuitori; o prevalen general de 108% nu poate fi dect o valoare greit; un caz de boal poate iei din eviden numai prin vindecare; n Romnia incidena tuberculozei a crescut n intervalul 1990-2000; creterea duratei de supravieuire a unei boli duce la creterea prevalenei acelei boli.
4. ntr-o comunitate rural pe parcursul unui an calendaristic au fost depistate 10 cazuri noi de TBC, 5 cazuri noi de cancer de col uterin, 7 cazuri noi de HTAE, 1 caz de sifilis i 3 cazuri de pneumonie. Numrul de locuitori era de 685 la nceputul anului, 665 la 1 iulie i 645 la sfritul anului. Populaia feminin la 1 iulie era de 360, din care 200 n grupa de vrst 25-69 ani. Incidena anual a TBC a fost de: 1459,85 cazuri noi la 100.000 locuitori; 1503,7 cazuri noi la 100.000 locuitori; 1550,38 cazuri noi la 100.000 locuitori; 1,45 %.
Incidena anual a cancerului de col uterin a fost: 751,8 cazuri noi la 100.000 locuitori; 1388,8 cazuri noi la 100.000 locuitori; 1,3 %; 92 ODETTA DUMA Incidena general anual a fost : - 4031 cazuri noi la 100.000 locuitori; - 39,1 0 / 00 ; - 40,3 0 / 00 ; - 39,1 cazuri noi la 100.000 locuitori.