Sunteți pe pagina 1din 94

UNIVERSITATEA DE STAT DE MEDICIN I FARMACIE NICOLAE TESTEMIANU

COALA DE MANAGEMENT N SNTATE PUBLIC

Larisa SPINEI

Oleg LOZAN

Vladislav BADAN

BIOSTATISTICA

Chiinu 2009

2
CZU: 311.2 S 73

BIOSTATISTICA

CUPRINS
CAPITOLUL I. SCURT ISTORIC. GENERALITI .............................................4 1.1. Apariia i dezvoltarea statisticii ....................................................................4 1.2. Obiectul i metoda statisticii ........................................................................10 CAPITOLUL II. NOIUNI DE BAZ. METODE STATISTICE .............................18 2.1. Deniia, obiectivele, compartimentele ........................................................18 2.2. Teoria probabilitilor ...................................................................................19 2.3. Legea cifrelor mari .......................................................................................20 2.4. Metode de cercetare utilizate n biostatistic ..............................................21 2.5. Noiuni de baz n biostatistic ....................................................................26 2.5.1. Totalitatea statistic ..........................................................................27 2.5.2. Unitatea de observaie .....................................................................30 2.5.3. Indicatori statistici .............................................................................30 2.5.4. Date statistice...................................................................................32 2.6. Gruparea materialului statistic. Seria statistic de variaie. Indicatorii tendinei centrale. .................................................................................33 2.7. Seriile cronologice .......................................................................................48 2.8. Standardizarea ............................................................................................62 2.9. Corelaia i regresia ....................................................................................66 2.9.1. Corelaia ...........................................................................................66 2.9.2. Regresia ...........................................................................................77 2.10. Analiza statistic a variabilitii ....................................................................80 2.11. Aprecierea veridicitii valorilor mediii i relative .........................................88 2.12. Compararea valorilor absolute sau a distribuiilor de frecven: testul X2 ..............................................................................................................107 CAPITOLUL III. METODOLOGIA GENERAL A CERCETRII STATISTICE .............................................................................116 3.1. Colectarea sau observarea materialului statistic .......................................116 3.2. Prelucrarea materialului statistic ...............................................................126 3.3. Eantionarea .............................................................................................132 3.4. Prezentarea materialului statistic ..............................................................145 3.4.1. Prezentarea prin tabele ..................................................................145 3.4.2. Reprezentarea grac a materialului statistic ................................149 3.5. Analiza i interpretarea materialului statistic .............................................176 BIBLIOGRAFIE ..................................................................................................179

Aprobat de Consiliul de Experi al Ministerului Sntii Republicii Moldova din 27.06.08, proces-verbal nr. 6 Autori: Larisa Spinei, doctor habilitat n medicin, profesor universitar Lozan Oleg, doctor n medicin, confereniar universitar Badan Vladislav, lector superior Recenzeni: Maria Sagaidac, doctor n matematic, confereniar universitar, Universitatea de Stat RM Eco Constantin, doctor habilitat n medicin, profesor universitar, ef catedra Economie, Management i Psihopedagogie USMF N.Testemianu
Lucrarea dat este elaborat n conformitate cu cerinele didactice actuale i n corespundere cu planul de studii i programa analitic la Biostatistic pentru audieni colii de Management n Sntate Public.

Editarea manualului Biostatistica a fost posibil datorit suportului nanciar al Fundaiei SOROS-Moldova. Redactor: Lidia Ciobanu Machetare computerizat: Natalia Dorogan Corectori: Nadejda Koporskaia, Tatiana Colin Larisa Spinei, Oleg Lozan, Vladislav Badan coala de Management n Sntate Public, 2009
Descrierea CIP a Camerei Naionale a Crii Spinei, Larisa Biostatistica / Larisa Spinei, Oleg Lozan, Vladislav Badan; Univ. de Stat de Medicin i Farmacie Nicolae Testemianu; coala de Management n Sntate Public. Ch. : coala de Management n Sntate Public, 2009 (.S. F.E.-P. Tipograa Central). - 186 p. 250 ex. ISBN 978-9975-78-743-7 311.2

ISBN 978-9975-78-743-7

CAPITOLUL

BIOSTATISTICA

Scurt istoric. Generaliti

SCURT ISTORIC. GENERALITI

1.1. Apariia i dezvoltarea statisticii Statistica, prin obiectul i metoda sa, face parte din rndul tiinelor ce studiaz aspectele cantitative ale fenomenelor i proceselor din cadrul naturii, tehnologiei i societii. Ea s-a dezvoltat ca tiin cu obiect i metod proprii, ntr-un proces istoric ndelungat i s-a difereniat n funcie de particularitile domeniului studiat. Pentru a cuprinde coninutul, categoriile i principiile cu care opereaz statistica este necesar a se avea n vedere, n primul rnd, rolul pe care l are aceast disciplin n procesul cunoaterii societii. Cunoaterea i transformarea societii nu pot realizate dect folosind combinat principiile, metodele i tehnicile tuturor tiinelor care studiaz fenomenele i procesele ce se manifest n cadrul societii n scopul descoperirii legilor ce acioneaz n mod obiectiv n diferitele etape de dezvoltare. n acest sens, n dezvoltarea istoric a tiinelor social-economice exist, pe de o parte, un proces de difereniere n funcie de particularitile ei de studiu i, pe de alt parte, apariia unor discipline cu caracter multidisciplinar sau de grani impuse de multiplele conexiuni din cadrul societii. n cadrul studiilor social-economice, statistica a fost i este folosit ntotdeauna ca un instrument indispensabil pentru cunoaterea vieii social-economice. Procesul de conturare a statisticii a fost marcat de mai multe momente semnicative care au asigurat trecerea de la primele nregistrri izolate la statistica contemporan. Statistica face parte din cadrul disciplinelor care studiaz fenomenele ntr-o viziune sistematic, la nivel micro- i macroeconomic i, n consecin, ea ine seama de dinamismul structurilor existente i de factorii care acioneaz variabil n timp, n spaiu i n funcie de modul de organizare social i economic. Rdcinile istorice ale statisticii moderne sunt: statistica practic n sensul unor nregistrri sistematice sau izolate, ce pot asimilate unor observri statistice utilizate i azi; statistica descriptiv ca disciplin de nvmnt i de fundamentare a statisticii practice; aritmetica politic i calculul probabilitilor, ca baz conceptual i ca mod de interpretare a fenomenelor n statistica modern.

Forma cea mai veche statistica practic dateaz de peste patru milenii. Ea a servit unor scopuri scale, demograce i administrative. De exemplu: inventarierea (din doi n doi ani) a aurului i pmntului n Egipt (2650-2190 .e.n.). Din documentele descoperite rezult c i chinezii dispuneau nc din mileniile IV i III .e.n. de date cu privire la numrul populaiei, structura terenurilor i c utilizau diferite tabele statistice referitor la unele aspecte ale activitii agricole. Ca tiin statistica s-a dezvoltat n dou direcii. Una dintre ele a fost statistica descriptiv, aprut n Germania, i care s-a dezvoltat n paralel cu practica statistic n cadrul universitilor. Numele acestei coli provine de la faptul c, potrivit concepiei sale, statistica se ocup de descrierea situaiei geograce, economice i politice a unui stat. Printre primele descrieri sistematice, folosind statistica descriptiv, se numr i lucrarea lui Francisco Sansovino (1521-1586). Ca reprezentani de seam ai acestei coli se mai amintesc: Giovanni Botero (1540-1617); Hermann Conring (1606-1681), care a elaborat i primul curs de statistic; Gottfried Achenwall (1719-1772), considerat printele statisticii pentru faptul c a dat noii discipline numele de STATISTICA, argumentnd c etimologic provine de la status n sens de stare. Trstura caracteristic a statisticii descriptive este faptul c ea se rezum la descrierea fenomenelor sau a unor pri ale acestora fr s se ocupe i de cunoaterea regularitilor care se manifestau n interiorul lor, a legilor care guvernau aceste fenomene. Dar limitarea ei numai la descrierea fenomenelor fr o analiz cauzal, bazat pe identicarea factorilor determinani cu aciune variabil asupra lor, a dus la declinul acestei coli. n plus, practic, continuitatea folosirii statisticii n cunoaterea fenomenelor sociale a fost asigurat prin instituionalizarea statisticilor naionale ntr-un cadru ocial organizat (n 1796 n Suedia; n 1797 n Norvegia; n 1800 n Frana). Treptat interesul pentru studierea statisticii descriptive a sczut. Acest declin se datoreaz orientrii cunoaterii tiinice spre un mod de cercetare specic tiinelor naturii, zicii i chimiei, caracterizat prin descoperirea legilor care guverneaz fenomenele respective, prin folosirea unor procedee bazate pe experimente, ce conduc la formularea unor concluzii exacte. Astfel a aprut a doua direcie n Anglia, coala aritmeticii politice, care a reprezentat n acelai timp i un moment im-

BIOSTATISTICA

Scurt istoric. Generaliti

portant n conturarea statisticii ca tiin. Numele colii provine de la lucrarea lui William Petty (1623 1687) Aritmetica politic (1690), n care sunt utilizate o serie de noiuni de baz cu care opereaz i azi statistica (medie, proporie etc.). Reprezentanii acestei coli se deosebesc esenial de statistica descriptiv. Prin analogie cu tiinele naturii, aritmetica politic tinde spre exactitate i n cunoaterea social, obiectivul de baz ind gsirea regularitilor ce se produc n manifestrile sociale i economice. Ea depete faza de descriere i i fundamenteaz concluziile pe un numr mare de cazuri individuale cu care, prin generalizare, se pot interpreta tendinele de producere a fenomenelor economico-sociale. Cu alte cuvinte statistica ncepe s-i contureze etapele procesului su de cunoatere: nregistrarea empiric a fenomenelor, sistematizarea i prelucrarea datelor individuale n vederea generalizrii rezultatelor sintetice, pentru ca n nal s efectueze analiza i interpretarea statistic a fenomenelor medicale. Fondatorul acestei coli este considerat John Graunt (1620 1674) care, pe baza listelor privind natalitatea i mortalitatea din Londra (ntocmite ncepnd din anul 1600), a formulat n 1662 o serie de regulariti privind micarea natural a populaiei (proporia pe sexe, fertilitatea, mortalitatea etc.). Pe linia utilizrii, n mai mare msur, a metodelor cantitativ-numerice n studiul fenomenelor economice i sociale se nscriu lucrrile lui L. A. I. Qutelet (1796 1874), considerat de unii autori ca fondator al statisticii moderne. El a folosit n cercetrile sale, n domeniul demograei i criminalitii, calculul probabilitilor i legea numerelor mari, fr s in seama de particularitile fenomenelor social-economice, de variabilitatea lor n timp i n spaiu. Neinnd seama de tipurile calitative existente obiectiv n cadrul societii a fost normal s ajung la concluzia c legile care guverneaz aceste fenomene au caracter imuabil. Absolutiznd i extinznd la societatea omeneasc noiunile cu care se opereaz n statistic repartiii, frecvene, medii, dispersii etc. el a ajuns s formuleze aa denumita teorie a omului mediu fr s in seam c nu pentru orice categorie de fenomene pot folosite noiuni abstracto-convenionale cu care s se sintetizeze bogia manifestrilor individuale ale fenomenelor studiate. Ceea ce are sens pentru un anu-

mit domeniu al statisticii poate s rmn o abstracie pur* fr nici o reprezentare real pentru un alt domeniu. Dup prerea unor autori Lsnd la o parte latura sa fabuloas, conceptul de om mediu se cuvine evocat pentru ideile implicate: repartiie; medie; dispersie; observare de mas; regularitate; noiuni eseniale n cercetrile statistice. Pentru statistica din mijlocul secolului ai XVIII-lea i secolul al XIXlea este specic folosirea tot mai frecvent a metodelor matematice i, n special, a calculului probabilitilor n investigarea i interpretarea rezultatelor privind fenomenele i procesele din societate, utilizndu-le ca instrumente de cercetare n producerea fenomenelor, la cunoaterea legilor care le determin i pe aceast baz, la efectuarea de previziuni tiinice. Combinnd metoda inductiv i deductiv, folosind din ce n ce mai frecvent rezultatele bazate pe experimentri succesive, s-au formulat, pe de o parte, principiile teoriei seleciei i a extinderii rezultatelor acesteia pentru caracterizarea ntregului ansamblu i, pe de alt parte, necesitatea de a privi fenomenele din cadrul societii ca interdependente. Ia natere astfel statistica inductiv, la care i-au adus contribuii importante R. Fisher, G. Yule, K. Pearson, E. Pearson, P. Cebev, A. Ciuprov, A. Liapunov, A. Marcov i alii. Paralel cu dezvoltarea pe plan tiinic are loc i o extindere a ariei de aplicabilitate a statisticii ociale pentru studierea nu numai a unor fenomene izolate, ci a ntregului ansamblu, ind folosit att pentru studierea prezentului i a trecutului, ct i pentru elaborarea unor ipoteze asupra modului de comportare a acelorai fenomene n viitor. Statistica folosind metode cantitative studiaz fenomenele n continua lor dezvoltare istoric n condiii date de timp, spaiu, n deplin concordan cu aspectul calitativ al acestora. De aici se contureaz, cu mai mult claritate, cele dou aspecte: dezvoltarea statisticii ca activitate practic de cunoatere nemijlocit a fenomenelor din cadrul societii omeneti, activitate considerat ca instrument indispensabil procesului de conducere i decizie; statistica ca disciplin tiinic i de nvmnt. De asemenea, trebuie menionat c n literatura de specialitate, statisticii i se atribuie frecvent i unele sensuri cu coninut mai restrns ca,
* G. Moineagu, I. Negur, A. Urseanu, Statistica, Ed. tiinic i Enciclopedic, Bucureti, 1976, p. 21.

BIOSTATISTICA

Scurt istoric. Generaliti

de exemplu: mulimea datelor statistice obinute prin activitatea practic; metodologia statistic format din totalitatea metodelor de culegere, prelucrare i interpretare a datelor folosite ntr-o cercetare concret; metoda statistic de cercetare a fenomenelor de mas, indiferent de domeniul n care ele se produc, ceea ce i confer un aspect de generalitate. Dezvoltarea statisticii ca activitate practic trebuie urmrit n raport cu transformarea actului de conducere, din activitatea intuitiv n tiin a conducerii, precum i n interdependen cu progresele nregistrate n domeniul tehnicii de prelucrare a datelor pe plan naional i internaional. Evoluia statisticii ca disciplin de nvmnt trebuie urmrit avnd n vedere dezvoltarea general a tiinei i a creterii rolului su n procesul dezvoltrii societii omeneti. Apariia i dezvoltarea tehnicii electronice de calcul a impus regndirea locului i rolului statisticii n procesul de cunoatere i predicie a fenomenelor att n plan teoretic ct i practic. Aceasta cu att mai mult cu ct au aprut n vecintatea statisticii o serie de tiine cum sunt toate metriile, ca: econometrie, biometrie, psihometrie, sociometrie etc., care aplic sistematic statistica. La aceasta se adaug cibernetica, informatica, managementul, marketingul, cercetrile operaionale i economiile de ramur. Tuturor acestor discipline, statistica le ofer din plin serviciile devenind un fel de tiin metodologic, n gen de omnibus al cunoaterii empirice*. Toate aceste discipline care se folosesc de statistic n procesul de cunoatere au o serie de puncte comune cu statistica n ceea ce privete obiectul i metodele lor de cercetare, dar nici una nu este n msur s o suplineasc ntr-o manier satisfctoare pe cealalt. Tocmai acest aspect obliga la precizarea i delimitarea statisticii, ca tiin independent. ARGUMENTE N FAVOAREA CUNOATERII STATISTICE: suntem n mod curent utilizatori i furnizori de informaie, e n viaa particular e n cea profesional; suntem adesea decideni i calitatea deciziilor noastre depinde de o bun informare;

factorii decizionali au nevoie s tie cum s descrie i s prezinte n modul cel mai potrivit informaiile; factorii decizionali au nevoie s tie cum s obin previziuni credibile privind variabilele de interes; factorii decizionali au nevoie s tie cum s mbunteasc desfurarea activitilor de care sunt rspunztori; factorii decizionali au nevoie s tie cum s trag concluzii despre colectiviti numeroase, doar pe baza informaiilor obinute din eantioane suntem adesea interprei i calitatea nelegerii noastre depinde de o bun cunoatere. CE NSEAMN O GNDIRE STATISTIC?: nseamn recunoaterea variaiei n orice proces i fenomen i mai nseamn c studiind aceast variaie i cauzele ei vom gsi noi cunotine i vom putea lua decizii mai bune. Inseamn o nelegere concret, rapid, n context i n corelaie a realitii economice i sociale. DE CE TREBUIE S CUNOATEM TEORIA STATISTIC DAC COMPUTERUL OFER FACILITI N DOMENIU? CU COMPUTER UTILIZATOR DE INFORMAIE FR COMPUTER FURNIZOR DE INFORMAIE

* G. Menges, Grundriss der Statistik, Teii I. Theorie, Westdeutscher Verlag, Kohl und Opladen, 1968, p. 16.

S reinem c fa de statistic, teorie sau practic, ne gsim permanent n una din situaiile de mai jos: - suntem utilizator de informaie statistic avnd sau nu la ndemn un computer; - suntem furnizor de informaie statistic avnd sau nu la ndemn o reea de calculatoare;

10

BIOSTATISTICA

Scurt istoric. Generaliti

11

suntem concomitent utilizator i furnizor de informaie statistic cci potrivit teoriei sistemelor suntem sistem i subsistem n acelai timp. Pentru a riguroi i ecieni n oricare din situaiile prezentate mai sus se impune deopotriv cunoaterea teoriei statistice i a calculatoarelor.

1.2. Obiectul i metoda statisticii n toate momentele dezvoltrii sale, statistica s-a ocupat cu acele fenomene i procese care se produceau ntr-un numr mare de cazuri, prezentau n reproducerea lor anumite regulariti i care pot denumite fenomene de mas sau fenomene de tip colectiv. Pentru a nelege caracterul i particularitile acestor fenomene trebuie pornit de la natura raporturilor de cauzalitate a acestora. n general, n cadrul societii, ca i n natur i n tehnologie, fenomenele pot s apar ca rezultat al unei singure cauze, sau ca rezultat al mai multor cauze care se manifest izolat sau n interdependen ntre ele. n primul caz, sunt fenomene univoc determinate i, de regul, se prezint ca fenomene simple, identice ntre ele, denumite i fenomene tipice, n cel de-al doilea caz, apar ca fenomene multicauzale al cror proces de formare poate s prezinte grade diferite de complexitate, cu relaii multiple de interdependen, formnd mpreun un ansamblu a crui dimensiune i structur pot delimitate n timp, n spaiu i organizatoric. Spre deosebire de fenomenele tipice care apar ca rezultat al unei singure cauze, fenomenele de mas apar ca rezultat al inuenei comune a unui numr mare de cauze i condiii variabile, cu grade i sensuri diferite de inuen, ceea ce face ca ele s se prezinte ca o mas compact de fenomene atipice, aparent independente ntre ele. Fenomenele de mas, aparinnd unei forme superioare de micare a materiei se produc sub aciunea unor factori cu caracter sistematic, asociai cu cei ntmpltori i ca atare fenomenologia cauzalitii lor este complex. Astfel n cadrul fenomenelor simple univoc determinate, pe msur ce se produce cauza se produce i efectul, dac condiiile rmn neschimbate. Ele apar deci, ca fenomene deterministe, certe, ca rezultat al aciunii unor legi ale dinamicii, ce pot cunoscute cu ajutorul metodei experimentale i pentru care legea odat descoperit poate vericat pentru ecare caz n parte.

Fenomenele de mas, n general, apar ca o mulime de forme individuale diferite, cu existen distinct, aparent fr nici o legtur de la o form la alta, dar care analizate comparativ se constat c au o aceeai esen. Aceasta se explic, n principal, prin faptul c ele sunt generate de o serie de cauze comune care se manifest, de regula, n condiii diferite, n consecin, la fenomenele de mas din societate, relaiile de multicauzalitate direct sau indirect care le determin fac imposibil cunoaterea legilor care le produc i guverneaz, dac se iau n studiu izolat doar cteva forme de manifestare a lor, ignornd ansamblul din care fac parte. Explicaia const n faptul c n practic formele individuale de manifestare difer de la o unitate la alta n funcie de modul n care se asociaz i se combin factorii sistematici cu cei ntmpltori, cei eseniali cu cei neeseniali, cei obiectivi cu cei subiectivi, lsnd impresia c ecare form individual din cadrul ansamblului se produce la ntmplare, fr s existe o cauzalitate cert. Dar, analizndu-le la nivel de ansamblu, ele par asemntoare ntre ele, ind generate de cauze eseniale comune, supunndu-se aceleiai legi de apariie i dezvoltare. La aceasta trebuie adugat i un alt aspect i anume, relaiile de cauzalitate dintre fenomenele sociale au caracter dinamic, ca urmare a modicrii permanente a condiiilor n care se manifest. De aici, se poate trage concluzia logic c n astfel de cazuri, legea acioneaz att static, cnd fenomenele de mas sunt circumscrise n aceleai condiii de timp, ct i dinamic, cnd fenomenele sunt delimitate n spaiu i organizatoric, dar nregistrate n uniti de timp diferite. Ca atare, pentru a descoperi legea de apariie a unor astfel de fenomene nu sunt suciente numai metodele experimentale, ca n cazul fenomenelor de tip determinist ci i altele, bazate pe o serie de abstractizri succesive, prin care s se rein numai ceea ce este esenial, tipic n forma lor de manifestare, prin eliminarea aspectelor ntmpltoare i neeseniale. Aceasta presupune c se iau n studiu toate cazurile individuale deoarece, spre deosebire de fenomenele care se produc pe baza legilor dinamicii, care apar ca fenomene identice, fenomenele de mas avnd cauze comune de apariie dar i unele cauze particulare care difer de la un caz la altul, sunt numai asemntoare ntre ele. Principala lor proprietate este variabilitatea n timp i n spaiu i legea de apariie a acestora se manifest ca tendin ce nu poate cunoscut i vericat dect la nivelul ansamblului i nu n ecare caz

12

BIOSTATISTICA

Scurt istoric. Generaliti

13

n parte. Prezena printre factorii determinani i a factorilor aleatori face ca astfel de fenomene s nu poat interpretate dect recurgnd la principiile teoriei probabilitilor. Ca atare, ele pot considerate ca ind fenomene de tip nedeterminist sau stochastic. n acelai timp sub raport statistic, interpretarea aciunii factorilor ntmpltori nu se poate realiza dect folosind proprietile legii numerelor mari, potrivit crora variaiile ntmpltoare de la tendina general se compenseaz reciproc dac exist un numr mare de cazuri individuale de aceeai esen, luate n studiu. Fenomenele de mas sunt legile statistice specice legi care se manifest sub form de tendin, fa de care abaterile ntmpltoare ntr-un sens sau altul se compenseaz reciproc, n consecin, este necesar ca n cercetrile statistice s se ia toate cazurile individuale sau un numr sucient de mare, dar reprezentativ pentru ntregul ansamblu, pentru ca ele s poat intra sub aciunea legii numerelor mari. Sintetiznd cele relatate se poate conchide c o prim particularitate a statisticii economico-sociale const n faptul c: statistica studiaz fenomenele social-economice de mas n cadrul crora acioneaz legile statistice i care prezint proprietatea de a variabile n timp i spaiu, n literatura de specialitate ele se ntlnesc sub denumirea de fenomene de mas, fenomene de tip colectiv, fenomene stochastice sau fenomene atipice. Studierea fenomenelor sociale cu folosirea mai multor discipline, printre care i statistica, n aceste condiii, este necesar, s se stabileasc obiectul din care studiaz statistica aceste fenomene de mas, ajungnd astfel la cea, de-a doua particularitate, i anume: caracterizarea laturii cantitative a fenomenelor social-economice, stabilindu-le dimensiunea, dinamica, intensitatea, structura, raporturile de interdependen i celelalte aspecte ce pot caracterizate numeric n funcie de locul i timpul n care s-au produs n strns interdependen cu latura lor calitativ. Deci, opernd cu fenomene care apar n cadrul societii, statistica contribuie la procesul de cunoatere cantitativ pornind de la coninutul calitativ al acestora. Desigur, n analiza statistic accentul cade pe latura cantitativ, dar cercetarea trebuie s porneasc de la nelegerea trsturilor calitative ale fenomenelor. Abstractizrile i generalizrile realizate prin intermediul statisticii n vederea evidenierii a ceea ce este specic, tipic n manifestrile unui fenomen sunt corecte numai n condiiile ne-

legerii i respectrii integritii calitative a acestuia. Aceste consideraii privitoare la particularitile statisticii conduc la denirea obiectului su de studiu: statistica este tiina care studiaz aspectele cantitative ale determinrilor calitative ale fenomenelor de mas, fenomene care sunt supuse aciunii legilor statistice ce se manifest n condiii concrete, variabile n timp, spaiu i de organizare socio-economic. Deci, raiunea de a a statisticii sociale i economice const n necesitatea cunoaterii aspectelor cantitative ale fenomenelor de mas cu larg rspndire n viaa social-economic. Datorit ntinderii, diversitii i variabilitii de manifestare, aspectele eseniale ale acestora nu pot cunoscute dect la nivelul ntregului ansamblu, prin eliminarea a tot ceea ce este ntmpltor i neesenial n producerea lor. De aici rezult i modul de efectuare a studiului statistic al fenomenelor, care trebuie s in seama de faptul c astfel de fenomene colective sunt generate de legi i cauzaliti ce se manifest sub form de tendin, valabil pentru ntregul ansamblu. Cu alte cuvinte, metodologia de investigaie statistic a fenomenelor trebuie s porneasc de la trsturile caracteristice acestor fenomene de mas, astfel nct s se realizeze att cunoaterea individual a lor ct i ansamblul i structurile corespunztoare acestora. Aceste probleme apar numai pentru statisticile care se refer la un anumit domeniu de manifestare concret a fenomenelor de mas, unde, deci, este obligatoriu pentru statistic s in seama, n primul rnd, de specicitatea att a ansamblului ct i a structurilor componente. Aceast precizare trebuie fcut deoarece n procesul cunoaterii i statistica social i economic folosete i instrumentele formale furnizate de matematic, fapt ce a fcut uneori s se arme c orice statistic este o ramur a matematicii. Pentru a face o delimitare mai clar se accept, n general, c partea din statistic care poate considerat ramur a matematicii este denumit statistic matematic, iar celor care au un domeniu concret de investigare s li se ataeze un atribut corespunztor ariei de aplicabilitate. Deci, de ecare dat vor apare dou tiine complementare: statistica matematic i statistica domeniului de investigare. Aceste dou tiine ns se difereniaz din multe puncte de vedere, dintre care esenial este acela al metodei de cercetare. Se tie c, de regul, cmpul de activitate al matematicianului este domeniul obiectelor ideale, ipotetice

14

BIOSTATISTICA

Scurt istoric. Generaliti

15

i o mare parte din cunoaterea matematic se realizeaz n mod deductiv, ceea ce nseamn rezolvarea problemelor cunoaterii pornind de la general la particular. Aceasta nu nseamn c nu se procedeaz uneori i inductiv. Dar deosebirea const n faptul c statistica care are ca obiect de studiu un anumit domeniu din natur, tehnologie sau societate, pornete de la particularul obinut prin observarea (nregistrarea) valorilor empirice spre ceea ce este general, valabil pentru ntregul ansamblu pe cale inductiv. Orice cunoatere tiinic, inclusiv cea statistic, se realizeaz prin alternana inductiv-deductiv, dar calea tipic statistic este cea inductiv. Aceste deosebiri apar i mai evident cnd fenomenele studiate au coninut social-economic. Considernd societatea omeneasc ca ind de natur obiectiv ce se dezvolt pe baza unor legi care pot cunoscute i vericate n condiii specice de timp i spaiu, statisticii, ca principal instrument de cunoatere, i revine o serie de sarcini ce pot rezolvate cu ajutorul unor metode, procedee, tehnici de calcul i interpretare statistic. Totalitatea operaiilor, tehnicilor, procedeelor i metodelor de investigare statistic a fenomenelor formeaz metodologia statistic. Datorit faptului c metoda statistic poate s e folosit n studiile concrete efectuate de celelalte tiine, care studiaz dintr-un anumit unghi ntreaga societate sau numai o parte a acesteia, a fcut ca ea s e uneori considerat ca o disciplin metodologic ce poate aplicat de ecare dat cnd apare necesitatea caracterizrii cantitativ-numerice a fenomenelor i proceselor economice i sociale. De fapt, se i apreciaz c metoda statistic a devenit un instrument ecient i indispensabil tuturor tiinelor empirice. Aceasta apreciere este nemijlocit legat de faptul c statistica vine n ntmpinarea particularizrii tot mai accentuate a tiinei, precum i dorina de cuanticare specic pentru aproape toate aceste tiine. Pentru a putea deveni un instrument indispensabil cunoaterii actuale a fenomenelor din cadrul diferitelor domenii particulare este necesar ca ea nsi s se preocupe n permanen de elaborarea i perfecionarea unei metodologii tiinice, unitare care s-i confere statutul de disciplin tiinic autonom. Ca atare, denirea metodei statisticii social-economice trebuie s se fac potrivit cu natura fenomenelor cercetate i cu scopul cercetrii. Procedeele i metodele se aplic urmnd etapele oricrui proces de cunoatere, conceput ca un proces dialectic. Specicitatea metodologiei sale

poate urmrit i prin folosirea unor noiuni i categorii proprii legate de obiectul su (colectivitate statistic, unitate statistic, caracteristic statistic) sau de metodologia sa (date statistice, indicator statistic, indici, ecuaii de estimare, teste de semnicaie etc.). Astfel se ncepe cu observarea ecrui caz n parte pentru a cunoate mai nti manifestrile cantitative individuale. Observarea se realizeaz concret, sub diverse forme, ca: raportri statistice (dri de seam), recensmnturi, anchete etc. n continuare, datele individuale se prelucreaz prin metode specice statisticii, n vederea eliminrii abaterilor individuale din manifestrile cantitative. Astfel se obin indicatori statistici cu grade diferite de generalizare, n funcie de metodele folosite care pot : metoda gruprilor, metoda mediilor, analiza variaional, metoda indicilor, metoda corelaiei i altele. Pentru aceasta este necesar analiza prealabil a domeniului respectiv, realizat pe ci statistice i nestatistice, ceea ce confer statisticii caracter interdisciplinar, care se realizeaz n tot procesul de cunoatere. Procesul de cunoatere statistic se ncheie cu analiza i interpretarea rezultatelor i cu formularea concluziilor statistice, care obligatoriu trebuie s cuprind variante probabile de apariie a acelorai fenomene n viitor. n literatura didactic de specialitate, elaborarea principiilor, tehnicilor i metodelor folosite n cadrul culegerii (observrii), prelucrrii i analizei datelor statistice formeaz coninutul cursului ce poate intitulat: Teoria statisticii, Statistica general sau Statistica teoretic. Aceast parte a statisticii formeaz fundamentul metodologic pentru toate disciplinele statistice care studiaz fenomene i procese din diferite ramuri ale statisticii social-economice, avnd acelai obiect i aceeai metod, difereniindu-se numai n ceea cei privete coninutul particular al fenomenelor i proceselor specice ecare ramuri. Datorit acestui fapt ele apar ca discipline relativ independente, dei au un caracter unitar prin folosirea acelorai noiuni i metode elaborate de Teoria statisticii, n cadrul unor faculti economice ea se ntlnete i sub denumirea de Bazele statisticii social-economice. Adncirea diviziunii sociale a muncii a impus lrgirea ariei de investigaie statistic, ducnd n consecin la apariia de noi ramuri ale statisticii social-economice: statisticii teritoriale naionale i internaionale, statistica indicatorilor sociali, statistica mediului nconjurtor i altele.

16

BIOSTATISTICA

Scurt istoric. Generaliti

17

n concepia de astzi a tiinei, statistica poate considerat ca o disciplin de grani care, prin metodele sale, asigur cercetrii tiinice un caracter interdisciplinar. Apariia unor tiine noi: cibernetica, informatica, teoria sistemelor i altele, nu numai c nu se suprapun ca obiect i metod statisticii, dar au impulsionat folosirea din ce n ce mai mult a metodelor sale n lrgirea i adncirea cunoaterii fenomenelor de mas, cu deosebire a celor complexe din cadrul societii. Considerarea societii, ca un sistem de relaii cantitative i calitative au impus gsirea unor noi metode de reectare i analiz numeric a acesteia, modele care nu pot elaborate i aplicate dect dac se dispune de o informaie statistic corespunztoare, n acelai timp se poate aprecia efectul pozitiv pe care l-a avut asupra statisticii procesul de modernizare a tiinelor sociale, apariia unor tiine care se ocup cu studiul societii, sntii populaiei i care inueneaz asupra perfecionrii metodelor sale de investigaie, ca, de exemplu, sociologia, antropologia i altele. Rezult c aceste relaii ale statisticii cu celelalte tiine trebuie nelese ca un proces de reciprocitate, care are ca rezultat benec att dezvoltarea tiinelor generale, ct i a celor particulare i care face posibil ca statistica s se plaseze la grania dintre empiric i logic, dintre particular i general, dintre obiectiv i subiectiv. n plan practic, pentru statistic, relaiile de interdependen se realizeaz n analiza teoretic ce precede orice studiu statistic, dar mai ales n etapa nal la formularea concluziei statistice privind fenomenele investigate prin metode statistice. n concluzie, se poate arma c statistica se aplic n toate domeniile n care fenomenele se pot exprima cantitativ i prezint proprietatea de a variabile ntre ele ca form concret de manifestare. Astfel de fenomene, ntlnindu-se n natur, tehnologie i n societate au impus o difereniere a statisticii att n plan teoretic, ct i practic. Statistica social i-a dezvoltat o metodologie proprie cu aplicabilitate n toate compartimentele vieii sociale pornind de la dou premise eseniale: - studiile sale au ntotdeauna caracter concret, deci trebuie s porneasc de la specicitatea fenomenelor abordate, ce trebuie delimitate n timp, spaiu i structura organizatoric, ceea ce nseamn c ea se bazeaz ntotdeauna pe o cunoatere empiric; - variabilitatea fenomenelor sociale are, de regul, un grad mult mai mare de amplitudine ind rezultatul combinrii a numeroi

factori, care fac ca n cadrul ansamblelor studiate s apar structuri variate, ce pot s se modice esenial n dinamic. De regul nu exist probe martor cu care s se fac direct vericarea ipotezelor utilizate, ceea ce presupune c accentul trebuie s cad, n special, pe analiza logic cantitativ i calitativ. Aceasta nu nseamn, ns, c statistica social nu poate studia i unilateral unele fenomene care intereseaz la un moment dat, de exemplu, preurile, consumurile de materii prime, consumurile energetice, resursele materiale etc. Specicitatea acestor studii const n faptul c i n acest caz, este necesar s se stabileasc dimensiunea i dinamica fenomenului, factorii care l inueneaz, implicaiile pe care acest fenomen le are asupra altor fenomene coexistente n spatii diferite sau n dinamic. De aici i necesitatea ca statistica s studieze static i dinamic fenomenele i s elaboreze variante de predicii a fenomenelor pentru perioada viitoare.

18

CAPITOLUL

BIOSTATISTICA

Noiuni de baz. Metode statistice

19

II

NOIUNI DE BAZ. METODE STATISTICE

2.1. Deniia, obiectivele, compartimentele Fondatorul biostatisticii este John Graunt. STATISTICA este o tiin social, care studiaz partea cantitativ a fenomenelor sociale de mas n legtur strns cu particularitile lor calitative n condiii concrete de spaiu i timp. Reieind din deniie putem s evideniem dou particulariti ale ei: nu se ocup cu cazuri individuale ci numai cu fenomenele de mas; studiaz fenomenele de mas n condiii concrete de timp i spaiu. BIOSTATISTICA este statistica, ce studiaz aspectele, legate de medicin i ocrotirea sntii. Bazele teoretice ale biostatisticii sunt: 1) dialectica materiei; 2) teoria general a statisticii; 3) legitile economice; 4) bazele medicinii sau unor ramuri ale ei. Obiectivele biostatisticii. Biostatistica studiaz: 1. Starea sntii populaiei: Reproducerea i mortalitatea populaiei; Morbiditatea i invaliditatea; Parametrii dezvoltrii zice. 2. Legtura dintre inuena mediului ambiant i factorilor sociali asupra sntii populaiei. 3. Acumularea i analiza datelor referitor la activitatea instituiilor i cadrelor medicale. 4. Evaluarea ecacitii metodelor de prolaxie i tratament. 5. Planicarea, economia i nanarea ocrotirii sntii. Pornind de la obiective deosebim urmtoarele compartimente ale biostatisticii Statistica sntii populaiei; Statistica ocrotirii sntii; Statistica managementului de prolaxie, tratament i altor activiti n medicin.

2.2. Teoria probabilitilor Teoria probabilitilor este o teorie matematic ce se ocup cu studiul fenomenelor ntmpltoare ce pot aprea n gruparea unei caracteristici studiate pe baza unui experiment probabilist aleator. Adic, atunci cnd rezultatele nu pot prevzute cu exactitate, dar pot avea o oarecare frecven mai mult sau mai puin legitim. De exemplu, adresarea ecrui cetean la serviciul de urgen nu poate programat de nimeni, ns n totalitatea lor integral sau parial aceste adresri pot repartizate cu o anumit legitate n ece zi, pe ore. Studiind aceast legitate, putem face prognoze privind adresrile din anumite zile i ore. Iar acest lucru ne permite s planicm repartiia mijloacelor serviciului pentru satisfacerea necesitilor populaiei. Deci, probabilitate se numete acea msur de posibilitate a apariiei unor fenomene ntmpltoare n condiiile concrete date. Probabilitatea, de obicei, se nseamn prin litera P. Probabilitatea de apariie a unui fenomen poate estimat pe dou ci: - clasic dac fenomenul se produce n h posibiliti ale n experimente, atunci probabilitatea acestui fenomen va h/n; - frecvena empiric cnd experimentul se repet de mai multe ori (f), iar fenomenul se produce cu o frecven de acum xat h (cum e cazul cu adresrile la serviciul de urgen). Aici probabilitatea apariiei fenomenului va h/f. Probabilitatea apariiei n totalitatea parial a unui fenomen P se determin prin raportul fenomenelor deja aprute (m) la numrul tuturor cazurilor posibile (n) aceasta e deniia clasic a probabilitii lui Laplace. Atunci probabilitatea fenomenului P va :

Drept contraprobabilitate determinm alternativa probabilitatea lipsei fenomenului, nsemnat prin litera q. De aici:

20

BIOSTATISTICA

Noiuni de baz. Metode statistice

21

Aadar, suma probabilitii prezenei fenomenului cu contraprobabilitatea lui este egal cu unitatea, iar n procente cu 100,0%. Rezultatele de mai sus pot exprimate i altfel, c probabilitatea apariiei fenomenului P se a n hotarele dintre 0 i 1 sau 0 -100,0%. Cu ct probabilitatea e mai aproape de 1 sau 100,0% cu att prezena fenomenului n totalitate e mai real. Aceast teorie argumenteaz legea cifrelor mari.

2.3. Legea cifrelor mari Legea cifrelor mari (teorema lui P. Cebev) are dou aplicaii importante pentru determinarea totalitilor selective: 1. Pe msura majorrii numrului cazurilor de observare rezultatele cercetrii cptate pe baza totalitii selective tind s reproduc datele totalitii integrale; 2. La atingerea unui anumit numr de cazuri de observare n totalitatea selectiv rezultatele cercetrii vor maximal apropiate de cele posibile pe baza totalitii integrale. Deci, la un numr sucient de mare de cazuri de observare se manifest acea legitate ce st la baza totalitii integrale i care nu poate observat n cazul unui numr mic de cazuri cercetate. Pentru o nelegere mai bun a teoriei probabilitii i regulilor legii cifrelor mari descriem exemplul cu urna lui Galton, n care era introdus un numr egal de bile negre i albe (cte 500), deci, n proporie de 1:1 sau 50% i 50%. Se scoate cte o bil, se nseamn culoarea i apoi ea este pus napoi n urn. Operaia se repet de 10, 20, 50 ori i mai mult. La nceput proporia bilelor albe fa de cele negre era 1:4 sau 20% i 80%. La un numr mai mare de extrageri (100-200-250) proporia se apropie de cea real 0,5/0,5 sau 50% i 50%. Din acest moment orict s-ar prelungi numrul de extrageri proporia nu se va schimba. Deci, limita maxim corespunztoare a totalitii selective poate calculat cu o oarecare probabilitate. S presupunem c ponderea fenomenului n totalitatea selectiv (P1) e mai mic dect cea din totalitatea integral (P). Diferena dintre aceste mrimi exprim eroarea reprezentativ (m) i se explic prin faptul c nu toate unitile de observare au fost studiate. Comparnd aceste ponderi, dintre care una e cptat pe baza unei totaliti selective de un volum mai mare, vedem c valorile lor s-au apropiat. Deci, n

caz de un eantion de volum mai mare probabilitatea de necoinciden a ponderilor e att de mic c ea poate neglijat. Teoria statistic a demonstrat c n caz de totalitate selectiv mare (n >30) ponderea fenomenului (P1) difer fa de cea din totalitatea integral (P) cu probabilitatea de 95% i este egal cu 2 m; cu probabilitatea de 99,7% diferena ponderilor (P1-P) nu va depi 3 m. Cifrele 1, 2, 3 n, cu care se nmulete valoarea erorii (m) poart denumirea de coecieni de exactitate sau factori de probabilitate i se nseamn prin simbolul t. Cu majorarea coecientului t crete probabilitatea cu care vom putea spune c diferena ponderilor cptate din ambele totaliti este situat n intervalul: = tm , unde este eroarea limit admis pentru studiul dat. Deci, P = P1 n cazul experimentului cu bilele s-a observat o legitaie, i anume c la un anumit numr de extrageri se nregistreaz raportul real al bilelor albe i negre. Bazndu-se pe legea cifrelor mari i majornd volumul totalitii selective, se poate inuena asupra mrimii maxime a erorii, aducnd-o la valori minime. Pentru a determina numrul de cazuri de observaie (n) al totalitii trebuie s cunoatem eroarea limit admis () pentru studiul dat.

2.4. Metode de cercetare utilizate n biostatistic Metodele de cercetare aplicate n biostatistic nu difer cu mult de cele folosite n alte domenii, unele din ele au fost chiar mprumutate de la ele (cele matematice, economice). Utilizarea lor se va face ns innd cont de specicul acesteia. De exemplu, specicul statisticii sanitare n cadrul studiului sntii publice const nu numai n depistarea fenomenelor legate de ea, ci i a dinamicii lor, n evidenierea tendinei acestor fenomene, corelaiei lor cu factorii ce le provoac etc. Cunoaterea acestor lucruri se poate efectua prin intermediul urmtoarelor metode: 1. Metoda observrii const n urmrirea desfurrii unor fenomene pentru a le putea analiza n dinamic, sau prin compararea lor, ca apoi s se realizeze sinteza caracteristicilor lor eseniale. Cercetrile efectuate cu folosirea acestei metode n studiul sntii publice sau unor cazuri clinice se realizeaz pe diferite ci:

22

BIOSTATISTICA

Noiuni de baz. Metode statistice

23

a) statistic cnd se acumuleaz informaia sub form de valori numerice despre schimbrile fenomenului studiat sau activitatea organelor, instituiilor sanitare i altor servicii pentru sntate. Pe parcurs, observarea statistic dup volum poate efectuat prin: - cercetarea integral (adic a ntregului volum numeric al totalitii) cnd avem de a face cu un fenomen de apariie rar, cu un numr mic de cazuri n legtur cu care se cere de luat msuri urgente, sau cnd ne intereseaz determinarea strii ntregii populaii prin recensminte; - cercetarea selectiv fa de cea integral se folosete mai des i urmrete studiul unui fenomen cu o frecven mai mare pe baza unei totaliti selective. Dac este nevoie de a studia aprofundat un aspect, un fenomen rspndit ntr-o localitate, un grup de populaie, va folosit cercetarea monograc, prin cohort, prin sondaj etc. b) aprecierea prin expertiz prezint un supliment, cnd fenomenul general e studiat pe ecare aspect al lui n particular prin intermediul experilor. De exemplu, dac ne intereseaz morbiditatea spitalizat, atunci ecare caz de boal tratat n staionar e c va paralel studiat n decursul spitalizrii, e c dup externare pe baza istoriei de boal. Experii se pronun cu privire la termenele spitalizrii bolnavului, dat ind starea lui, apreciaz calitatea investigaiilor, corectitudinea diagnosticului i tratamentului n ecare caz concret de patologie. Acelai lucru se poate efectua n cadrul serviciului de ambulator, de urgen etc. Datele generalizate servesc la cptarea unor coecieni de corijare a indicilor obinui pe cale statistic. Expertiza este o metod mai mult calitativ de investigaie, permind elaborarea de msuri concrete de ajustare a fenomenului studiat. n funcie de timpul cnd se efectueaz observarea delimitm: - cercetarea curent (permanent, continu) se utilizeaz atunci cnd variabilitatea fenomenului studiat se poate schimba destul de des, iar aceste schimbri importante pot surveni zi de zi i chiar or de or. Astfel de cercetri se efectueaz de regul n clinic, mai ales n seciile de reanimare sau n maternitate, seciile de boli infecioase, unde observarea trebuie s se fac de cteva ori pe zi sau peste un anumit interval de timp.

cercetarea periodic (la anumite intervale de timp) se utilizeaz atunci cnd fenomenul studiat are o variabilitate mult mai mic n timp, sau o apariie i evoluie periodic. De exemplu, se tie c o parte din boli pot da acutizri n anumite perioade ale anului (boala ulceroas, reumatismul) sau evolueaz n condiii atmosferice specice ale anului (gripa, virozele organelor respiratorii, unele boli infecioase etc.). Ca urmare, cercetarea poate efectuat numai pe parcursul acestor perioade de timp sau la sfritul lor. n alte cazuri se recurge la cercetri periodice o dat la 5-10 ani. Astfel de cercetare se impune n cazul unui volum mare al totalitii (structura populaiei dup sex, vrst, ocupaie, locul de trai, starea civil etc.). - cercetare la un moment critic atunci cnd se xeaz data i chiar ora de nregistrare a fenomenului studiat (recensmntul populaiei, nregistrarea personalului medico-sanitar etc.). Dup frecvena observrilor cercetrile pot : - de o singur dat; - repetate. 2. Metoda epidemiologic sintetizeaz cele evideniate prin metoda observrii i prezint un studiu corelativ al fenomenelor din cadrul sntii publice cu factorii (cunoscui sau presupui) de risc. Aceast metod, ca i cea precedent, folosete pe larg o serie de metode matematice pentru a gsi legitatea schimbrilor variabile, dinamice, structurii fenomenelor studiate n legtur cu factorii ce le determin (valorile medii, dispersia, corelaia, regresia etc.). 3. Metoda istoric e strns legat cu primele dou metode fundamentnd studiul sanitar al sntii publice sau al activitii serviciilor pentru sntate n cadrul dezvoltrii istorice a societii. Este un fapt dovedit c gradul de dezvoltare a societii, ornduirea social n trecut i n prezent determin nivelul de trai al populaiei, calitatea vieii, deci i sntatea ei. Aici mai des se folosete metoda comparrii aceluiai fenomen raportat la diferitele categorii de populaie (difereniate dup semne sex, grupuri sociale, vrst, ocupaii etc.), teritorii (continente, ri, regiuni, localiti) studiate acum i n trecut. 4. Metoda economic precizeaz starea de sntate public, determinat de prezena surselor bneti, materiale, economice etc.

24

BIOSTATISTICA

Noiuni de baz. Metode statistice

25

Aceast metod se folosete la aprecierea ecacitii activitii serviciilor pentru sntatea populaiei (din punct de vedere social i economic) n cadrul medicinii de stat, prin asigurare, precum i celei private. O varietate a acestei metode e metoda economico-matematic cnd se utilizeaz n combinaie cu o serie de metode matematice ce ne permit s optimizm aciunile sanitare, reelei sanitare legate de probleme de sntate a populaiei cu analiza de sistem, de prognozare etc. 5. Metoda experimental urmrete scopul de a elabora i aproba noi forme i metode de organizare a muncii, a asistenei medicale, aplicarea n practic a experienei naintate, vericarea reciproc a diferitelor proiecte, ipoteze, a noilor metode de diagnosticare i tratament etc. Specicul acestei metode const n aceea c cercettorul singur i creeaz obiectul i metoda de cercetare, reproducnd astfel fenomenele sau aspectele ce-l intereseaz n condiii de laborator, iar mai apoi analiznd totul n detaliu conform scopului stabilit. Orice experiment nu depinde numai de dorina i nzuina savantului, ci e o problem de ordin social. Rezolvarea lui va cere din partea acestuia mbinarea mai multor metode de cercetare. n genere, n orice studiu statistic cu scop de cunoatere nu se folosete numai o metod izolat de cercetare. Pentru o investigare multilateral a fenomenului i innd cont de scopul propus cercettorul trebuie s decid ce metode se impun i n ce etap. Etapa I este legat direct de metoda de observare epidemiologic, economic i de acumulare (culegere) a datelor informative. n etapa a II-a se recurge la o serie de metode statistico-matematice de prelucrare a informaiei acumulate, de asemenea i la metode economice, economico-matematice. n etapa a III-a vom folosi i metoda istoric comparnd rezultatele curente ale studiului cu cele ce au fost nregistrate n trecut. Astfel cercettorul poate s-i ating scopul studiului i s analizeze n ansamblu toate caracteristicile de baz ale fenomenului trgnd concluzii corecte i elabornd msurile practice necesare. Metoda observrii dup modalitatea ndeplinirii poate : statistic i de expertiz. Iar dup timpul ndeplinirii: curent (pe parcursul anului), periodic (o dat la doi ani), la un moment critic (la nele anului calendaristic). Metodele de colectare a datelor pot divizate n dou grupe mari: direct i indirect:

La metoda direct se refer: Metoda observrii Anchetare Interviu Monitorizare Cea indirect reprezint extragerea datelor din documentaia medical. Cel mai des n studiile statistice medicale sunt folosite urmtoarele metode de colectare a informaiei. 1. Metoda observrii (direct) se utilizeaz de obicei n clinic, cnd medicul, dup ce precizeaz anamnez bolnavului, face studiul obiectiv i investigaiile de laborator ale pacientului, nregistreaz n aceste date. Analogic se procedeaz i n policlinic, i la deservirea chemrilor la domiciliu. Dac cercettorul statistic vrea s foloseasc aceast metod, el trebuie s e prezent alturi de medic i s nregistreze datele de care are nevoie. Sunt cazuri cnd pe cercettor l intereseaz nu numai date legate de boal, dar i probleme de ordin personal i social, ca urmare nregistrarea direct poate fcut sub form de anchet. n acest caz cercettorul trebuie s benecieze de ncrederea respondentului. 2. Metoda extragerii informaiei dintr-un formular statistic (indirect) a medical a bolnavului de staionar, a medical a bolnavului de ambulator, tichetul statistic de eviden a diagnosticului denitiv (precizat), epicriz, raport statistic privind numrul de maladii nregistrate la bolnavii domiciliai n teritoriul de deservire a instituiei curative etc. Cnd se efectueaz acest lucru se ine cont de programul de culegere a informaiei, unde trebuia s e indicat concret care este unitatea de eviden, caracteristicile ei atributive i cantitative. Datele privind aceste caracteristici se extrag din documentele enumerate mai sus i se noteaz ntr-un registru special sau n mai multe e, pe ecare semn aparte. Aceast metod se folosete frecvent n studiile statistice i poate utilizat de nsui cercettorul sau de persoane special instruite, n acest caz ind necesar controlul logic al materialului cules. 3. Metoda de anchetare utilizeaz informaia prin intermediul unor anchete, anterior pregtite, care includ ntrebri speciale, la care respondenii trebuie s dea rspuns. Aceast metod se folosete n studiile sociologice, dar poate aplicat i n orice studiu statistic sanitar

26

BIOSTATISTICA

Noiuni de baz. Metode statistice

27

n mbinare cu alte metode de culegere a informaiei. Este foarte important ca ntrebrile incluse n anchet s e formulate clar i concret, n caz contrar respondenii nu vor ti ce s rspund la ele. Totodat ancheta trebuie s e anonim, adic s nu cerem de la respondeni s ne comunice numele, adresa domiciliului .a., deoarece aceasta poate s-l fac pe cel anchetat s nu rspund n genere la nici o ntrebare. Anchetele de informare se utilizeaz mai ales n cercetrile strii de sntate a populaiei i n cercetrile epidemiologice. ntrebrile din anchet pot de tip: - deschis cnd la ntrebare nu se dau variante de rspuns i respondentul trebuie s le formuleze singur; - semideschis se dau variante de rspuns, dar se las un rnd liber pentru expunerea unor opinii personale ale respondentului; - nchis cnd la ntrebare sunt date 2 i mai multe variante de rspuns, iar respondentului i se propune s aleag unul din ele. Datele acumulate pot analizate prin urmtoarele metode: Metoda istoric Metode epidemiologice Metode economice Metoda experimental Calcularea indicatorilor relativi i medii Metode de corelaie i regresie Determinarea testului de semnicaie (t) i pragului de semnicaie (p)

2.5. Noiuni de baz n biostatistic n biostatistic sunt cunoscute urmtoarele noiuni de baz: totalitatea statistic unitatea de observare caracteristic statistic indicatori statistici date statistice
2.5.1. Totalitatea (colectivitatea) statistic Deniia: totalitatea statistica reprezint un numr de elemente (uniti de observare) omogene, luate mpreun n baza unui factor comun n anumit perioad de timp i spaiu.

Numrul de uniti de observare determin volumul totalitii supuse studiului i se noteaz prin litera n. Dup volum deosebim dou tipuri de totaliti statistice: Totalitatea integral (generala, univers statistic) Totalitatea selectiv Totalitatea selectiva are urmtoarele caracteristici de baz: trebuie sa dein caracteristice de baz de care dispune cea integral; trebuie sa dispun de un volum. Metodele de selectare a totalitii selective: cercetarea prin sondaj cercetarea monograc cercetarea selectiv: aleatorie mecanic tipic. Cercetarea prin sondaj se bazeaz pe o metodologie precis, unitar, valoarea rezultatelor depinznd de efectuarea ei corect tiinic. Aceast cercetare nu permite s se trag concluzii generale, valabile pentru totalitatea integral, ind mai mult o metod de investigaie preventiv unui studiu de mare volum. De obicei se efectueaz pe baza unui eantion mic. Cercetarea monograc e un studiu selectiv n care limitarea volumului eantionului e completat cu o aprofundare a cercetrii caracteristicilor eseniale. Acest tip de eantion poate limitat n cazul unui examen medical clinic cu un scop bine determinat (stabilirea gradului de rspndire al unei boli sau al unui grup de boli din aceeai clas). Tot astfel de cercetri pot aplicate pe un eantion mic dup spaiu, dar majorat n volum dup timp, adic n dinamic (studiul natalitii, mortalitii pe o perioad de mai muli ani ntr-o circumscripie rural, dar ntr-o strns legtur cu factorii social-economici, sanitaro-igienici etc.). Cercetarea selectiv studiul selectiv reprezentativ pentru totalitatea integral i care poate efectuat prin selecia: - aleatorie (ntmpltoare, randomizat simpl) se efectueaz prin extrageri din liste n care sunt nregistrate toate cazurile individuale fr nici o grupare sistemic prealabil. O metod frecvent de selecie aleatorie este tragerea la sori;

28

BIOSTATISTICA

Noiuni de baz. Metode statistice

29

mecanic (sistemic) este o metod superioar celei aleatorii, deoarece ecare unitate de observaie are anse egale s e aleas. Selecia eantionului se face dup modelul de ah sau cazurile de eviden sunt ordonate n ordine alfabetic sau localitile sunt aranjate dup hart i se selecteaz ecare a 4-a, a 6-a ori a 10-a, n funcie de pasul de numrare. n acest mod se obine o selecie teritorial uniform. Intervalul se calculeaz astfel ca eantionul s cuprind de la 5 pn la 10% din totalitatea integral. , ecare al 10-lea; etc.

De exemplu, 10% atunci:

Calea aceasta de selectare, dei rspndit, este anevoioas de nfptuit. Avantajul const numai n simplitatea selectrii eantionului, n timp ce exactitatea rezultatelor cercetrii poate avea erori mari, indc nu se ine cont de frecvena real de rspndire a fenomenului, de dispersia lui n spaiu; - tipic (straticat) (proporional cu mrimea eantionului) urmrete scopul seleciei unitilor de observaie din grupurile tipice ale universului statistic. Pentru nceput, n cadrul universului statistic toate unitile de observare se grupeaz dup anumite caracteristici n grupuri tipice (de exemplu, vrst, sex sau dup intensitatea frecvenei fenomenului). Din ecare grup, pe cale aleatorie sau mecanic, este selectat un anumit numr de uniti astfel ca raportul dup caracteristici n eantion s e acelai ca i n totalitatea integral. Dac e nevoie s se fac o nou straticare cu scopul obinerii unui grup i mai omogen, metoda n cauz se numete tipic straticat cu mai multe trepte. Avantajul ei este c fenomenele studiate pot mai uniform reprezentate i deci i eantionul va reprezentativ; - n cuiburi (n serii, n clastere) aici din totalitatea integral se selecteaz nu uniti individuale, ci serii (microzone), localiti care sunt ulterior examinate n ntregime. Distribuia datelor n totalitatea selectiv poate alternativ (Da/ Nu), simetric (normal) i asimetric.

30

BIOSTATISTICA

Noiuni de baz. Metode statistice

31

2.5.2. Unitatea de observare Reprezint ecare element component al colectivitii statistice, care este purttorul tuturor trsturilor comune ale colectivitii supuse studiului. Unitile statistice pot simple, care nu mai suport diviziune (persoana) i complexe, rezultate ale organizriii sociale (familia). 2.5.3. Caracteristica sau variabila statistic Reprezint trstura, proprietatea, nsuirea comun unitilor de observaie, reinut n studiul statistic pentru a nregistrat i care variaz ca valoare de la o unitate la alta. Caracteristicele statistice pot clasicate dup cum urmeaz: n funcie de modul de exprimare: - caracteristici calitative (nominative), exprimate n cuvinte: profesie, localitatea de domiciliu, culoarea prului, culoarea tegumentelor, sexul, starea de nutriie sau de boal, starea la externare a unui bolnav, etc.; - caracteristici cantitative (numerice), exprimate n cifre: salariu, vechimea n munc, nlime, greutate, perimetru, tensiune arterial, puls, temperatur, etc. Sunt caracteristici msurabile. n funcie de numrul variantelor/valorilor de rspuns pe care le pot lua: - caracteristici alternative (binare sau dihotomice), acelea care pot lua doar dou variante de rspuns: sex (M/F), starea civil (cstorit/necstorit), familie cu copii sau fr copii, etc; - caracteristici nealternative cele care pot lua mai multe valori/ variante de rspuns: salariu, profesie, localitate de domiciliu, starea la externare a unui bolnav, etc. n funcie de natura variaiei caracteristicilor cantitative: - caracteristici continue, care pot lua orice valoare din scara lor de variaie: greutatea unei persoane, nlimea, temperatura, etc.; - caracteristici discrete sau discontinue, care pot lua numai valori ntregi: numrul de copii pe care i are o familie, numrul de persoane dintr-o familie, numr de medici, numr de paturi, numr de vizite, etc. n funcie de coninutul caracteristicii: - caracteristici de timp (anul naterii);

caracteristici de spaiu (localitatea de domiciliu); caracteristici atributive, n care variabila reprezint un atribut, altul dect spaiul ori timpul cele calitative i cantitative. n funcie de modul de obinere i caracterizare a fenomenului: caracteristici primare (obinute, de regul, n etapa de colectare a datelor statistice prin msurare sau numrare); caracteristici derivate, obinute n procesul prelucrrii datelor statistice. n funcie de modul de inuen asupra fenomenului: - caracteristici factoriale; - caracteristici rezultative.

2.5.4. Indicatori statistici Indicatorul statistic este expresia numeric a unor fenomene, procese, activiti sau categorii economice i sociale, denite n timp, spaiu i structur organizatoric. Deosebim urmtoarele funcii ale indicatorilor statistici: funcia de msurare; funcia de comparare; funcia de analiz; funcia de sintez; funcia de estimare; funcia de vericare a ipotezelor i de testare a semnicaiei unor indicatori statistici calculai. Indicatorii statistici pot prezentai prin valori absolute, relative i medii. Ctre valorile relative pot atribuite rata, raportul i proporia. Rata ne arat ct de repede evenimentul (nateri, mbolnviri, decese) apare n populaie. Componentele ratei sunt: Numrtor: numrul de evenimente observate; Numitor: populaia n care evenimentele au loc; Timpul specicat cnd au loc evenimentele; De obicei un multiplicator transform rata dintr-o fracie incomod sau decimal ntr-un numr ntreg. Tipurile de rate sunt: brute;

32

BIOSTATISTICA

Noiuni de baz. Metode statistice

33

speciale (specice); standardizate.

Indicatorii de proporie nu pot comparai. Exemplu:


Tabelul 1. Numrul de cazuri de mbolnviri n funcie de vrst i localitatea (abs., %).
x 10n Nord Vrsta 0-14 15-64 65-> Total 0-14 15-64 65-> Total Nr. cazuri 10 6 4 20 15 9 6 30 Proporia 50% 30% 20% 100% 50% 30% 20% 100%

Exemplu: rata brut a mortalitii


Numrul deceselor, indiferent de cauz, ntr-o populaie, ntr-o perioad specic Numrul de persoane cu risc de a muri de-a lungul perioadei

Exemplu: rata mortalitii din cauze specice


Numrul de decedai, dintr-o cauz anume ntr-o populaie, ntr-o perioad specic de timp Numrul de persoane cu risc de a muri din acea cauz de-a lungul perioadei Sud x 10
n

Exemplu Rata caz-fatalitate (RCF) proporia cazurilor unei condiii specice fatale ntr-o perioad specic de timp. Sinonimele pentru rat sunt: frecven, nivel, rspndire, intensitate. Raportul permite compararea unei populaii cu alta. Raportul este un numr mprit la altul. Exemplu: raport dintre brbai i femei, nateri i avorturi, nr. de medici i asistente medicale. n aceste cazuri nu este necesar o relaie specic ntre numrtor i numitor. Raportul poate prezentat astfel x : y sau ,

Pentru comparaie pot utilizate ratele. Exemplu:


Tabelul 2. Numrul de cazuri de mbolnviri n funcie de vrst i localitatea (abs., %).
Vrsta 0-14 15-64 65-> Total 0-14 15-64 65-> Total Nr. cazuri 10 6 4 20 15 9 6 30 Proporia 50% 30% 20% 100% 50% 30% 20% 100% Nr. populaiei 100 200 100 400 100 200 100 400 Rata 10% 3% 4% 15% 4,5% 6%

Nord

Sud

unde: x numrul de paturi, nr. de medici, y numrul de populaie. Proporia ne arat ce fraciune a populaiei este afectat. Caracteristicile lor de baz sunt: coecientul a 2 numere; numrtorul este inclus n numitor; proporia ntotdeauna deviaz ntre 0 i 1 sau ntre 0 i 100%. Exemplu de proporie: n anul 2006 n Republica Moldova au fost recunoscui ca invalizi 7695 brbai i 6005 femei. Care este procentul femeilor din numrul total?

Sinonimele indicatorului de proporie sunt cota, ponderea, structura. 2.5.5. Date statistice Analiza datelor statistice se face n funcie de: timp; loc; persoan. Caracteristica de timp ne permite s stabilim: modicri pe termen scurt; modicri ciclice; modicri seculare (pe termen lung); poate aranjat n tabele i grace.

34

BIOSTATISTICA

Noiuni de baz. Metode statistice

35

Prin caracteristica de loc se descrie unitatea geograc. Pentru prima dat aceast descriere a fost efectuat de ctre John Snow n an. 1854 cnd n Londra a avut loc erupia de holer. Caracteristica de persoan ne permite s facem analiza datelor acumulate dup vrst, sex, etnie, etc.

2.6. Gruparea materialului statistic. Seria statistic de variaie. Indicatorii tendinei centrale. Gruparea materialului statistic const n aranjarea unitilor statistice, n funcie de diferitele caracteristici sau variabile, n grupe ct mai omogene, pentru a le putea scoate ct mai uor n eviden. Gruparea este operaia statistic ce permite trecerea de la aspectele particulare, individuale ale unitilor statistice la aspecte generale, comune pentru colectivitatea supus studiului. n funcie de numrul caracteristicilor de grupare se realizeaz grupri simple, cnd la baza repartizrii st un singur criteriu, i complexe, cnd la baza repartizrii stau dou sau mai multe criterii. Dup natura caracteristicii gruparea poate : - n timp, cnd repartizarea materialului statistic are la baz anumite intervale de timp; - n spaiu, cnd repartizarea materialului se face n raport cu locul sau teritoriul unde s-a examinat colectivitatea statistic, de exemplu mediu rural i mediu urban. n funcie de variaia caracteristicii de grupare se realizeaz grupri pe variante sau pe intervale. Limitele gruprii nu se stabilesc mecanic ci depind de natura fenomenului studiat i scopul cercetrii. n principiu o grupare prea amnunit a materialului statistic duce la o frmiare ce ne mpiedic s observm ce este caracteristic, esenial. De asemenea dac o caracteristic are prea multe valori vom repartiza materialul statistic pe grupe de valori. Fiecare grup de valori sau clas are la rndul ei o limit inferioar, o limit superioar i un centru al grupei egal cu semisuma celor dou limite. n cadrul gruprii trebuie s cunoatem exact valorile extreme maxim i minim ale caracteristicii i trebuie s stabilim intervale de grup egale, iar limitele claselor s e distincte pentru a nu crea confuzii cu ocazia repartizrii unitilor de observare.

Prelucrarea materialului statistic nu se oprete la gruparea materialului deoarece datele brute obinute, de cele mai multe ori, nu permit aprecieri comparative. De aceea materialul statistic este supus n continuare unei prelucrri cu ajutorul metodelor de statistic matematic n vederea obinerii unor indicatori statistici ca: valori relative, valori medii, criterii de variaie, corelaie, veridicitate, ce vor permite aprecieri comparative, corecte i concluzii semnicative. Urmare gruprii datelor statistice rezult serii statistice. Seria statistic de variaie este irul de valori numerice ale caracteristicii, ordonate cresctor sau descresctor n funcie de mrimea acestora. Seria statistic reprezint corespondena a dou iruri, cel al valorilor variantelor (x) i cel al frecvenelor (f), motiv pentru care se mai numete i serie de distribuie/serie de frecvene. Suma frecvenelor variantelor corespunztoare corespunde cu numrul de cazuri cercetate (f = n). Seriile statistice de variaie pot de dou categorii: simple i grupate. Cnd ecrei valori a caracteristicii i corespunde o singur frecven vorbim de o serie statistic simpl, iar cnd ecrei valori i corespund mai multe frecvene vorbim de o serie statistic grupat. Unii autori denesc seria statistic n modul urmtor: simpl de regul se formeaz n cazul unui numr mic de cazuri cercetate 30 i grupat care se formeaz n cazul unui numr mare de cazuri cercetate > 30. Cerinele de baz pentru formarea seriei de variaie: 1. Ordonarea valorilor variantelor; 2. Numrarea frecvenelor ecrei variante; 3. Determinarea numrului de grupe i valorii intervalului; 4. Gruparea seriei de variaie, utiliznd intervalul cu respectarea continuitii seriei; 5. Reprezentarea grac a seriei de variaie. Toate 5 cerine snt obligatorii pentru formarea seriei de variaie grupate, cerinele 1,2 i 5 pentru formarea seriei de variaie simpl. Numrul de grupe n serie se determin n dependen de numrul cazurilor cercetate (Tab.3).

36 Numrul de grupe n funcie de numrul de cazuri


Numr cazuri Numr grupe 31-45 6-7 46-100 8-10 101-200 11-12

BIOSTATISTICA

Noiuni de baz. Metode statistice

37

Tabelul 3
201-500 13-17

n cazul seriei de variaie n care variantele snt exprimate n intervale de grup, pentru a le putea introduce n calculul statistic stabilim mijlocul ecrei grupe, reprezentat printr-o singur valoare, care este centrul intervalului grupei obinut prin semisuma valorilor variantelor extreme ale ecrui interval de grup (Tab.4).
Tabelul 4. Gruparea seriei statistice n funcie de dini afectai
Grupe de valori ale dinilor afectai 1-3 4-6 7-9 10-12 13-15 Total Mijlocul intervalului de grup 2 5 8 11 14 Frecvene 106 252 75 50 25 508

Cele trei proprieti majore ale seriilor de variaie, pe care le putem analiza folosind indicatorii statistici sunt cele privitoare la tendina central, la variabilitatea i la forma distribuiilor. O clasicare a indicatorilor tendinei centrale se poate face, n funcie de modul de determinare a lor, n: - indicatori (mrimi) medii de calcul: media aritmetic, armonic, cronologic, ptratic, geometric etc.; - indicatori medii de poziie: modul, mediana. Indicatorii fundamentali ai tendinei centrale sunt: media aritmetic, modul i mediana, dar n anumite cazuri speciale putem apela i la alte tipuri de medii. Mrimile medii sunt mrimi tipice, caracteristice, ce denesc un fenomen variabil. n general, n toate cercetrile, dar n special cele care privesc starea de sntate a populaiei, de un interes deosebit este cunoaterea

comparativ a fenomenelor studiate fa de un etalon, mrimea medie. Fr cunoaterea mrimilor medii, comparaia nu este posibil dect n mod imperfect: compararea dintre dou sau mai multe fenomene pentru a constata diferena dintre ele, neputnd conclude dac aceste fenomene snt sau nu apropiate de o valoare etalon. Mrimea medie are aceleai dimensiuni concrete cu ale variabilei a crei repartiie de frecvene o caracterizeaz. Astfel dac variabila privete nlimea n cm a nou nscutului i mrimea medie va redat n cm. Dup Yule i Kendall condiiile pe care trebuie s le ndeplineasc o mrime medie ar : - S e denit n mod precis, independent de dorina utilizatorului; - S e expresia, sinteza tuturor observaiilor nregistrate; - S posede proprieti simple, evidente, clare chiar i pentru nespecialiti; - S e simplu i rapid de calculat; - S e puin sensibil la uctuaiile de selecie; - S poat studiat rapid cu ajutorul calcului algebric. n general, indicatorii tendinei centrale, calculai ca mrimi medii realmente nu satisfac toate condiiile prevzute mai sus. Utilizatorul trebuie ns s e interesat s cunoasc condiiile nesatisfcute i implicaiile acestora pentru fundamentarea deciziilor. MEDIA Media este expresia care sintetizeaz ntr-un singur nivel reprezentativ tot ceea ce este esenial, tipic, comun, obiectiv n apariia, manifestarea i dezvoltarea unui fenomen. Exemple: durata medie de utilizare a patului pe an; durata medie de spitalizare a bolnavului la pat; nota medie la examen a unei grupe de studeni; numrul mediu de vizite la medicul de familie n an la 1 locuitor, care locuiete n teritoriul deservit. Cnd este o medie reprezentativ? - Cnd calculul mediei se bazeaz pe folosirea unui numr mare de cazuri individuale: Nu putem spune c durata medie de spitalizare a bolnavului la pat n RM a fost n anul 2006 9,1 zile lund n calcul doar trei spitale.

38

BIOSTATISTICA

Noiuni de baz. Metode statistice

39

Cnd valorile din care se calculeaz media sunt omogene: Aceeai armaie de mai sus poate greit, adic media nu este reprezentativ i n consecin nu este credibil, dac durata de tratament a variat de la 7 zile la 77 zile. - Cnd se alege forma de medie care corespunde cel mai bine variaiei caracteristicii i volumului de date de care se dispune. Valorile medii pot exprimate prin cifre absolute sau prin indici. De exemplu, n cazul cunoaterii tensiunii arteriale sistolice sau diastolice la un grup de populaie, sau n cazul nlimii sau greutii medii la diferite vrste i sexe, valorile medii se exprim n valori absolute (mmHg, cm, kg). n cazul morbiditii sau mortalitii generale sau specice pe vrste sau sexe, cauze de boal, etc., valorile medii se exprim prin cifre relative (la 1000 sau 100000 de locuitori). Fac excepie cazurile foarte rare de boal sau deces care se exprim mult mai corect prin cifra absolut (de exemplu un caz de difterie sau poliomielit). Ce tipuri de mrimi medii se pot calcula? - Media aritmetic - Media armonic - Media cronologic - Media ptratic - Media geometric Media aritmetic simpl Media aritmetic simpl este valoarea medie care se obine din suma valorilor individuale dintr-o colectivitate omogen, divizat la numrul total al cazurilor studiate. Media aritmetic simpl se utilizeaz pentru a stabili valoarea medie n seriile statistice n care ecrei valori a variantei i corespunde o singur frecven. Formula de calcul:

Durata de tratament la 8 bolnavi cu aceeai maladie a fost (zile): 10; 12; 15; 18; 20; 22; 24; 27. Aplicnd formula de calcul vom obine media duratei de tratament la lotul de 8 bolnavi de 18,5 zile:

Cele expuse anterior, cu privire la valorile medii, se pot vedea din formula mediei aritmetice simple: nici un copil nou-nscut nu are greutatea medie de 2900 gr.; nici un bolnav nu are durata medie de tratament de 18,5 zile; valorile individuale ind situate e sub, e peste medie i doar pe ntreg lotul studiat se obine valoarea medie. Media aritmetic ponderat Media aritmetic ponderat este valoarea medie care se obine din suma produsului valorilor dintr-o colectivitate omogen, cu frecvenele corespunztoare, divizat la numrul total al cazurilor studiate. Media aritmetic ponderat se utilizeaz n calcularea valorii medii n cazul n care valorile individuale au frecvene diferite. n acest caz media aritmetic simpl nu se poate utiliza. Formula de calcul:

Exemple de calcul: ntr-un spital, medicii prezint urmtoarea distribuie conform vrstei: 40 persoane de 37 ani; 40 persoane de 38 ani; 10 persoane de 41 ani i 10 persoane de 44 ani. Aplicnd formula de calcul, vom obine vrsta medie a personalului, de 38,5 ani:

Exemple de calcul: Greutatea la natere la un numr de 6 copii de sex masculin este (n grame): 3000; 2600; 2800; 3100; 3200; 2700. Aplicnd formula de calcul vom obine media greutii, la natere, la lotul de 6 copii, de 2900 gr:

40 Durata de spitalizare a bolnavului la pat (zile):


Zile (x) Bolnavi (f) 10 2 11 6 12 8 13 12 14 17

BIOSTATISTICA

Noiuni de baz. Metode statistice

41 Tabelul 6

Tabelul 5 nlimea nou-nscuilor de sex masculin (cm)


18 14 21 6 Valorile variantelor nlimii n cm (x) 1 46 47 48 49 50 51 52 53 54 55 56 57 Total: Frecvenele (numrul cazurilor) 2 2 5 13 30 89 49 40 20 7 3 1 1 260 = f (n) Produsul valorilor cu frecvenele (xf) 3 92 235 624 1470 4450 2499 2080 1060 378 165 56 57 13166 = xf Deviaia de la medie (d) 4 -4 -3 -2 -1 0 1 2 3 4 5 6 7 -----

Produsul deviaiei de la medie cu frecvenele (df) 5 -8 -15 -26 -30 -79 0 49 80 60 28 15 6 7 +245 166 = df

Aplicnd formula de calcul, vom obine durata medie de spitalizare a bolnavului la pat de 14,7 zile:

Din exemple se poate constata c valoarea mediei aritmetice ponderate se situiaz n plus sau n minus de partea unde frecvenele snt mai mari. n cazul calculrii mediei aritmetice ponderate n serii statistice n care valorile variantelor snt mari (de ordinul sutelor, miilor sau zecilor de mii) i reprezentate de cifre zecimale, iar frecvenele corespunztoare ecrei variante sunt de asemenea numeroase, operaia devine deosebit de dicil. n acest caz recurgem la o metod simplicat a calculrii mediei aritmetice ponderate, i anume metoda momentelor. Formula de calcul: = Xo M1 ap unde: media aritmetic ponderat Xo media ipotetic M1 momentul 1 Momentul 1:

unde: d deviaiile (abaterile) de la medie f frecvena f suma frecvenelor (numrul cazurilor) Lum ca exemplu seria de variaie a nlimii nou-nscuilor de sex masculin, expus n tab. 6.

Prima coloan cuprinde seria de variaie a valorilor de nlime (x), iar a doua coloan frecvenele (f) ce corespund ecreia din valori. Coloana a 3-a corespunde produsului valorilor cu frecvenele respective, adic produsul datelor corespunztoare din coloana 1 i a 2-a (xf). Dac adunm coloana a 3-a i mprim la numrul total de cazuri (f) vom obine media ponderat, egal cu 50,64 cm. Pentru a substitui acest calcul, care poate deveni destul de dicil n cazul valorilor mari sau cu zecimale, precum i n cazul frecvenelor mari, recurgem la calculul momentului 1. Acesta se efectueaz n felul urmtor: alegem, n mod arbitrar, ca medie ipotetic, una dintre valorile nlimii, i anume valoarea variantei cu cele mai multe frecvene (modulul) n cazul nostru vom selecta ca medie ipotetic nlimea de 50 cm. n dreptul acestei valori notm, n coloana a 4-a, zero coresponznd originei i apoi completm coloana, n sus, spre valorile mai mici de nlime, notnd cu minus, iar n jos notnd cu plus, n progresie aritmetic. Aceast coloan a deviaiei de la medie, sau mai bine-zis de la origine o notm cu d. n coloana a 5-a

42

BIOSTATISTICA

Noiuni de baz. Metode statistice

43 Tabelul 7

trecem produsul dintre coloana a 2-a i a 4-a, adic produsul deviaiei de la medie cu frecvenele corespunztoare (df). Vom obine n coloana a 5-a, n partea de sus, rezultatele cu semnul algebric minus (), iar n parte de jos sub origine, spre valorile mari ale seriei de variaie, rezultatele cu semnul algebric plus (+). Adunm separat cele dou grupe de produse i apoi scdem suma valorilor cu minus din suma valorilor cu plus, rezultatul mprindu-l la suma frecvenelor (numrul de cazuri). nlocuind simbolurile formulei momentului 1 cu datele rezultate din tab.6 vom obine:

nlimea nou-nscuilor de sex masculin (cm).


Valorile variantelor Frecvenele nlimii n cm (x) (numrul cazurilor) 1 46 47 48 49 50 51 2 2 5 13 30 89 49 40 20 7 3 1 1 260 = f (n) Deviaia de la medie (d) 3 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 ----Produsul deviaiei de la medie cu frecvenele (df) 4 -10 -20 -39 -60 -89 0 40 40 21 12 5 6 6 + 124 94 = df

-218

Adunm aceast valoare a momentului 1 cu media ipotetic aleas n mod arbitrar i vom obine media aritmetic ponderat: = 50,0 cm + 0,64 = 50,64 cm. Din tabel se poate constata felul n care utilizarea momentului 1 uureaz calcularea mediei. Astfel, n loc de a nmuli coloana 1 cu coloana 2, obinnd astfel coloana a 3-a cu cifre mari, care nsumate trebuie mprite la numrul total de cazuri, vom nmuli doar coloana a 4-a cu coloana a 2-a. nmulirea se va face cu 4, 3, 2, 1 etc. n loc de 46, 47, 48, 49 etc. mprirea la numrul total de cazuri este, de asemenea, uurat prin metoda momentului 1, cci n loc de a mpri 13166 la 260, ca n calculul simplu al mediei aritmetice ponderate, n cazul momentului 1 mprim 166 la 260. Ca medie ipotetic se poate alege oricare din valorile variantelor de nlime, rezultatul nal ind identic, dar pentru a uura ct mai mult calculul se alege valoarea care are o frecven mai mare. Astfel dac n exemplul anterior am lua ca medie ipotetic nu 50 cm ci 51 cm am ajunge la aceeai valoare medie, cu singura diferen c n acest caz momentul 1 are o valoare negativ, ce trebuie sczut din media ipotetic (Tab. 7).

52 53 54 55 56 57 Total:

Formula momentului 1 se calculeaz ca i n exemplul anterior:

= 51,0 cm 0,36 = 50,64 cm. ap Deci rezultatul este identic n toate mprejurrile, indiferent de media ipotetic aleas. Pentru uurarea calculului se ia, ns, ca medie ipotetic, totdeauna, valoarea variantei cu cele mai multe frecvene. Exist cazuri cnd intervalele valorilor seriei nu snt de 1, ci de 2 sau 3 uniti, sau din contra de 0,5 sau 0,3. n aceste cazuri, nainte de a trece la calculul mediei mediei aritmetice ponderate trebuie s nmulim momentul 1 cu valoarea corespunztoare a intervalului.

44

BIOSTATISTICA

Noiuni de baz. Metode statistice

45

Asupra mediei aritmetice sunt de fcut cteva observaii i de subliniat cteva proprieti: 1) Deniia dat mediei aritmetice este valabil numai dac valorile individuale nregistrate sunt numerice. Pentru o serie cu valori nenumerice nu se poate calcula media aritmetic; 2) Mrimea mediei aritmetice calculate este unic; o serie nu posed mai multe medii aritmetice distincte; 3) Mrimea mediei aritmetice poate sau nu s coincid cu vreo valoare individual nregistrat; 4) Media are ntotdeauna valoarea cuprins ntre valoarea minim din serie (Xmin) i valoarea maxim (Xmax); 5) Suma abaterilor valorilor individuale de la media lor este ntotdeauna egal cu zero (adic distanele fa de centru se balanseaz, se compenseaz reciproc); 6) Media aritmetic este legat de toate valorile numerice nregistrate i, n consecin, este sensibil la prezena valorilor aberante. 7) Dac o serie este alctuit din mai multe serii componente, pentru care s-au calculat medii pariale, atunci media ntregii serii poate calculat ca o medie ponderat din mediile pariale. Media armonic Media armonic este o medie cu aplicaie special care se determin ca valoarea invers a mediei aritmetice calculat din inversele valorilor seriei. Media armonic simpl

2. Trei investiii produc acelai venit. Valorile lor sunt urmtoarele: 5%, 10% i 15% i media de plasare a capitalului pentru toate trei.

Media armonic ponderat

Dac, de exemplu, mortalitatea general din 3 localiti rurale este de 8,0, 9,0 i 10, iar numrul de locuitori 4000, 4500 i 7000 i nu cunoatem cifrele absolute de decedai, media aritmetic simpl este de 9 n timp ce media armonic, pondernd valorile relative cu populaia la care se refer, va 9,12:

Xi

suma valorile individuale inversul valorilor individuale

numrul de valori. n realitate, media armonic se utilizeaz rar, n special la stabilirea preurilor medii. Media cronologic Media cronologic se calculeaz n cazul unei serii de valori, care prezint variaii n timp (lunare, anuale). Formula de calcul

1. Fie valorile: 1, 5, 10. Care este valoarea medie?

46

BIOSTATISTICA

Noiuni de baz. Metode statistice

47

unde: X(1, 2, 3, 4, n) mrimea valorilor la nceputul primei perioade i sfritul celor patru perioade; N numrul de perioade la care ne referim Exemplu: numrul de gravide n eviden la medicul de familie la nceput de an a fost 120, iar la sfritul celor patru trimestre 130, 144, 152, 100. Conform mediei aritmetice simple, ar fost 129 gravide, n timp ce media cronologic este de 134, conform formulei:

unimodale). Totui el exprim mrimea cu cea mai mare pondere, deci caracteristica determinant. n cazul seriilor de variaie grupate modulul se calculeaz dup formula:

Media ptratic Este tot o medie de calcul cu aplicaii speciale i reprezint valoarea care, nlocuind termenii seriei, nu modic suma ptratelor lor. Se folosete cnd fenonenul supus cercetrii nregistreaz modicri aproximativ n progresie geometric. Media ptratic simpl:

unde: XMo limita inferioar a intervalului modal; h mrimea intervalului modal (cu frecvena cea mai mare); 1 diferena dintre frecvena intervalului modal i a intervalului precedent; 2 diferena dintre frecvena intervalului modal i a intervalului urmtor; Se consider urmtoarea distribuie (Tab.8). Tabelul 8 Distribuia persoanelor n funcie de salariu
Salariu 400-600 600-800 800-1000 1000-1200 1200-1400 Persoane 5 10 15 30 20

Media ptratic ponderat:

Intervalul modal este (1.000 1.200)

Modulul Este mrimea medie care corespunde valorii cu cele mai multe frecvene (n seriile de variaie simple). Calculul se efectuiaz deci simplu, lund valoarea cu frecven maxim drept valoare medie. Rapiditatea cu care se stabilete modulul este singurul avantaj, deoarece el nu prezint un etalon precis al valorii medii dect n cazul distribuiilor normale (simetrice) de frecvene. Modulul nu se determin n funcie de toate mrimile valorilor variantelor, ci de una singur, cea cu frecven maxim (n repartiiile

n cazul distribuiilor de frecvene moderat asimetrice exist urmtoarele relaii matematice aproximative ntre modul, median i medie aritmetic: Mo = 3( Me) Mo = 3Me 2 Mo Me = 2(Me ) n cazul distribuiei simetrice de frecvene cele trei valori medii se suprapun: X = Me = Mo

48

BIOSTATISTICA

Noiuni de baz. Metode statistice

49

Observaii: 1) Pe gracul repartiiei statistice valoarea modal corespunde punctului n care gracul i atinge maximul; 2) Are avantajul principal fa de medie i cuantile c se determin rapid si are o semnicaie simpl; 3) Exist n practic serii cu distribuii multimodale. n astfel de situaii se determin mai multe valori modale; Mediana (cuantila de ordinul 2) Ca deniie, mediana, n serii statistice simple, este valoarea acelei variante care mparte n dou jumti egale numrul variantelor, aezate n ordine crescnd sau descrescnd. n cazul unui numr impar de variante, mediana va corespunde exact valorii de la mijlocul seriei. n seriile cu numr par de variante mediana va corespunde mediei aritmetice simple a celor dou valori de la mijlocul seriei. Exemplu de calcul: nlimea la natere la un numr de 5 copii a fost: 47, 48, 49, 51, 52 cm. Mediana, coresponznd valorii de la mijlocul seriei va 49 cm. n cazul unei serii de 6 valori, cum ar : 47, 48, 49, 51, 52, 53 cm, mediana va 50cm (49 + 51/2). n serii statistice grupate, formula de calcul a medianei este mai complicat, valoarea medianei andu-se n interiorul intervalului valoric, n care se gsete valoarea frecvenei ce mparte seria n dou jumti egale. Formula de calcul:

Cum se stabilete intervalul median? Pe irul frecvenelor cumulate cresctor, intervalul care corespunde primei frecvene cumulate mai mare dect este intervalul median. Cuantilele sunt indicatorii care descriu anumite poziii particulare din cadrul seriilor de distribuie. Conceptul de cuantil indic o divizare a distribuiei observaiilor ntr-un numr oarecare de pri. Frecvent se utilizeaz urmtoarele cuantile: - mediana sau cuantila de ordin 2 (r = 2); - cuartilele sau cuantilele de ordinul 4 (r = 4); - decilele sau cuantilele de ordinul 10 (r = 10); - centilele sau cuantilele de ordinul 100 (r = 100). Cuantilele de ordin superior se calculeaz n cadrul distribuiilor cu numr mare de grupe sau clase de valori individuale.

Unde: xMe limita inferioar a intervalului median; f frecvenele valorilor variantelor; fcm frecvenele cumulate pn la intervalul median; h mrimea intervalului median; fMe frecvena intervalului median;

2.7. Seriile cronologice Un obiectiv important al medicinii i ocrotirii sntii este studierea sntii publice, analiza informaiei privind caracterul i volumul activitii instituiilor medico-sanitare sub aspectul modicrilor lor dinamice. Studierea acestor modicri este deosebit de important pentru prognozarea i planicarea msurilor cu caracter organizaional, curativ-prolactic etc. Pentru a analiza modicrile dinamice a fenomenelor medico-sociale este necesar de a forma serii cronologice (dinamice), a cunoate metodele de ajustare i analiz a lor. Seria cronologic (serie de timp sau serie dinamic): - este seria format din valori omogene comparabile, care caracterizeaz modicrile unui anumit fenomen ntr-o perioad de timp. - vizeaz msurarea creterilor sau descreterilor de nivel n evoluia unui fenomen. - ecare valoare numeric a seriei se numete nivel. - nivelurile seriei cronologice pot prezentate prin valori absolute, relative i medii. Seriile cronologice se disting printr-o serie de particulariti, trsturi specice ei, ntre care menionm: a) variabilitatea termenilor SCR ntre valorile individuale care compun seria cronologic exist diferene de mrime explicate prin

50

BIOSTATISTICA

Noiuni de baz. Metode statistice

51

aciunea comun a factorilor eseniali i ntmpltori. Gradul de variabilitate a termenilor seriei cronologice depinde de fora cu care factorii aleatori produc abateri, dar i de tendina de variaie impus de factorii cu aciune sistematic. b) omogenitatea termenilor unei SCR seriile cronologice sunt omogene deoarece termenii seriei au n comun categoria economic sau social pe care o reprezint n momente sau intervale succesive de timp. Omogenitatea valorilor seriei este dat de faptul c acestea sunt supuse aciunii sistematice a acelorai factori eseniali, iar termenii seriei cronologice sunt obinui prin aceeai metodologie de calcul i folosesc aceeai unitate de msur. c) periodicitatea termenilor unei SCR o caracteristic specic seriilor cronologice. Aceast trstur exprim continuitatea datelor din punct de vedere al variaiei timpului. Termenii seriei reprezint valori ale unui fenomen dinamic, nregistrate la momente sau intervale de timp de regul egale, astfel nct s se asigure continuitatea seriei. n funcie de scopul concret al analizei efectuate, de natura fenomenului nregistrat i de posibilitile de obinere a datelor, unitile de timp pot mai mici sau mai mari: minut, or, zi, sptmn, decad, lun, trimestru, semestru, an, deceniu, secol. d) interdependena n timp a termenilor unei SCR este determinat de modalitatea de construire a acestora prin nregistrarea nivelurilor succesive ale unui fenomen pentru aceeai unitate statistic precizat. Din aceast cauz, orice termen al seriei depinde de nivelurile precedente i inueneaz mrimile urmtoare ale termenilor seriei. Avnd n vedere aceste particulariti ale seriilor cronologice, analiza lor trebuie precedat de vericarea comparabilitii valorilor individuale nregistrate pentru fenomenul analizat. Pentru a asigura comparabilitatea termenilor seriei cronologice este necesar ca componena seriei s e identic pentru ntreaga perioad de timp, valorile seriei s e exprimate n aceleai uniti de msur, iar intervalele de timp ntre valori s e egale. Tipuri de serii cronologice: 1. n funcie de modul de denire a timpului deosebim SCR de moment i SCR de interval. Seriile cronologice de momente: - sunt formate din mrimi care se refer la anumite momente de timp (sfritul sau nceputul anului, trimestrului, lunii etc.).

ecare valoare individual caracterizeaz numeric nivelul la care a ajuns fenomenul analizat ntr-un moment dat. De exemplu: numrul de gravide aate sub supraveghere la nceputul anului; numrul de nscui vii la sfritul ecrui trimestru; numrul populaiei la o anumit dat, numrul copiilor bolnavi aai n eviden la nele anului (Tab.9). Tabelul 9 Numr copii bolnavi aai n eviden la nele anului, RM
2001 155204 2002 157257 2003 155036 2004 128595 2005 147247 2006 143146

Observaie: nu permit cumularea valorilor termenilor, deoarece acestea reect, n mod repetat, elementele care coexist n momente diferite de timp.

Exemplu: numrul salariailor unui spital nregistrat la sfritul ecrei luni se regsete n numrul salariailor nregistrat la sfritul anului. Cnd intervalele dintre dou momente succesive au lungime egal, atunci vom avea o SCR de momente cu intervale egale ntre momente, iar atunci cnd intervalele dintre dou momente vecine au lungime neegal avem o SCR de momente, cu intervale neegale ntre momente. Serii cronologice de intervale: - sunt formate din mrimi care caracterizeaz fenomenul ntr-un interval de timp (zi, sptmn, lun, trimestru, an etc.); - ecare valoare individual reprezint rezultatul unui proces care se desfoar pe un interval de timp. De exemplu: dinamica anual a numrului de medici; evoluia lunar a numrului de cazuri mbolnvire IRVA, dinamica anual a natalitii (Tab.10). Tabelul 10 Numr copii nscui vii, mun. Chiinu, aa. 2002-2006.
2002 6924 2003 7143 2004 8296 2005 8364 2006 8626

52

BIOSTATISTICA

Noiuni de baz. Metode statistice

53

Observaie: permit nsumarea valorilor, obinndu-se astfel un indicator totalizator pentru ntreaga perioad de analiz.

Exemplu: prin nsumarea numrului de internri zilnice se obine cifra de internri lunar; Alegerea perioadei de timp pentru seria cronologic de interval este determinat ntr-o oarecare msur de variabilitatea fenomenului. Cu ct mai lent se modic fenomenul n timp, cu att mai mari pot perioadele de supraveghere. 2. n funcie de modul de exprimare a termenilor seriei deosebim serii cronologice formate din valori absolute, relative sau medii. Seriile cronologice formate din valori absolute reprezint situaia cea mai frecvent ntlnit. Fiecare termen al seriei este n acest caz o mrime absolut exprimat n uniti concrete de msur. De exemplu: numr de populaie, numr de paturi, numr de medici, numr de nou-nscui, numr de decedai, numr de nateri, numr avorturi, nr. anomalii fetale, depistate ecograc, cheltuielile anuale n IMSP etc. Seriile cronologice formate din valori relative. Termenii acestor serii pot reprezentai prin rate, proporii i raport. De exemplu: natalitatea, mortalitatea, morbiditatea, invaliditatea primar, asigurarea populaiei cu medici, paturi, ponderea populaiei n vrst de peste 55 de ani. Baza de raportare trebuie s e ntotdeauna precizat. Seriile cronologice formate din valori medii. De exemplu: numrul mediu de paturi, durata medie de spitalizare, durata medie de utilizare a patului pe an, salariul mediu al medicilor. 3. n funcie de numrul termenilor seriei deosebim serii cronologice de lungime mic, medie, mare. Reprezentri grace ale seriilor cronologice a) CRONOGRAMA (historiograma) este, aa cum i arat i numele, reprezentarea grac tipic, specic a SCR. Ea se traseaz ntr-un sistem de axe rectangulare, de obicei n cadranul nti al acestuia. Pe cele dou axe se vor reprezenta: timpul pe abscis (se marcheaz momentele sau intervalele), iar termenii SCR pe ordonat (Fig.1).

Fig.1. Numrul de avorturi la femeile n vrst pn la 15 ani n RM, aa.2001-2006 (abs.)

b) DIAGRAMA PRIN COLOANE n care timpul se reprezint pe abscis, iar termenii SCR pe ordonat (Fig.2).

Fig.2. Numrul de medici n Republica Moldova, aa. 2002-2006 (abs.)

54

BIOSTATISTICA

Noiuni de baz. Metode statistice

55

c) DIAGRAMA PRIN BENZI este recomandat a se folosi atunci cnd se reprezint (simultan) termenii unor SCR, termeni care constituie nite indicatori strns legai ntre ei. d) DIAGRAME POLARE (numite i diagrame radiale sau diagrame n spiral) se construiesc cu ajutorul reelelor radiale i se utilizeaz n special n reprezentarea SCR afectate de uctuaii sezoniere.

Fig.3. Numrul cazuri IRVA n localitatea N pe parcursul a. 2006

Indicatorii seriilor cronologice Pentru caracterizarea unei SCR, se calculeaz, pe baza termenilor acesteia, un sistem de indicatori statistici, analitici i sintetici care, dup modul de calcul i exprimare, pot structurai astfel: a) indicatori absolui; b) indicatori relativi; c) indicatori medii. Atunci cnd compararea se face cu primul termen al seriei (y1) vom vorbi de indicatori cu baz x, iar atunci cnd compararea unui termen (yt) se face cu termenul imediat anterior (yt-1), vom vorbi de indicatori cu baz n lan (mobil).

Indicatori absolui Indicatorii absolui ai unei serii cronologice de intervale exprim nivelul, volumul agregat i modicrile (n mrime absolut) fenomenului analizat n perioade diferite de timp. Indicatorii absolui se exprim n unitatea de msur a caracteristicii analizate (n uniti zice, valorice, procente etc.). 1) Valorile individuale absolute ale caracteristicii redau nivelul fenomenului analizat n ecare interval de timp. 2) Volumul agregat (nivelul totalizat) reprezint suma termenilor seriei cronologice de intervale. 3) Modicarea absolut (sporul sau scderea absolut) , reect creterea sau descreterea absolut (n uniti concrete de msur) a valorilor individuale ale fenomenului analizat, de la o perioad de timp la alta. Se calculeaz ca diferen ntre doi termeni ai seriei. n funcie de perioada aleas ca baz de comparaie (constant sau variabil), exist dou forme ale acestui indicator: - modicarea absolut cu baz x reprezint distana (diferena) ecrui termen al seriei fa de o perioad x de referin. - modicarea absolut cu baz mobil se calculeaz ca diferen ntre doi termeni succesivi ai seriei cronologice. Se exprim n unitile de msur ale caracteristicii. Valorile pozitive ale acestor indicatori semnic sporuri (creteri, fa de perioada aleas ca baz de comparaie), iar valorile negative scderi (decit). n cazul modicrii absolute cu baz x este important alegerea unei baze de comparaie convenabile, reprezentative pentru fenomenul dat i care s nu e inuenat de variaii conjuncturale majore. Frecvent, se alege ca baz de comparaie primul termen al seriei (nceputul perioadei de timp analizate) sau ultimul termen al perioadei anterioare. Indicatori relativi 1) Indicele de dinamic (indice de modicare, ritm de cretere sau de scdere) I. Este indicele care arat de cte ori (de ct la sut) s-a modicat mrimea unui fenomen n timp. Se calculeaz prin raportarea termenului comparat la termenul baz de comparaie. - indicele cu baz x se calculeaz ca raportul simplu sau procentual al nivelului curent la nivelul ales baz de comparaie (nivelul iniial). - indicele cu baz mobil se calculeaz ca raportul simplu sau procentual al nivelului curent la nivelul precedent.

56

BIOSTATISTICA

Noiuni de baz. Metode statistice

57

Se exprim n uniti sau procente. Valori mai mari de 1 sau 100% ale acestui indicator arat creteri fa de perioada baz de comparaie. Valorile sub 1 sau 100% semnic scdere, reducere. 2) Ritmul de dinamic (ritmul sporului) R. Arat cu ct s-a modicat procentual (a crescut sau a sczut) mrimea fenomenului ntro anumit perioad de timp fa de o perioad de referin x sau mobil. Se determin scznd 100% din indicele de dinamic corespunztor (cu baz x sau mobil). Poate calculat i prin urmtoarele modaliti: - cu baz x se calculeaz ca raportul procentual al sporului absolut cu baz x la nivelul ales baz de comparaie (nivelul iniial). - cu baz mobil se calculeaz ca raportul procentual al sporului absolut cu baz mobil la nivelul precedent. 3) Valoarea absolut a unui procent din ritmul de dinamic (de spor) A. Arat mrimea absolut a modicrii ce revine pe un procent din ritmul dinamicii sau exprim cte uniti de msur revin unui procent din ritmul dinamicii. Se calculeaz sub forma unui raport ntre modicarea absolut i ritmul modicrii i se exprim n unitatea de msur a caracteristicii. Variante de calcul: - cu baz x se calculeaz ca raportul modicrii absolute cu baz x la ritmul dinamicii cu baz x. Are aceeai valoare pentru toat perioada analizat. - cu baz mobil se calculeaz ca raportul modicrii absolute cu baz mobil la ritmul dinamicii cu baz mobil. Indicatori medii 1) Nivelul mediu, calculat ca medie a valorilor seriei. Calculul se justic numai dac nivelurile seriei sunt omogene. - pentru o serie cronologic de intervale nivelul mediu se a calculnd media aritmetic simpl a valorilor seriei. - pentru o serie cronologic de momente nivelul mediu se a calculnd media cronologic simpl pentru momente egal distanate:

ponderat pentru momente inegal distanate:

2) Modicarea medie absolut este media aritmetic simpl a modicrilor absolute cu baz mobil yn y1/n-1. Indicatorul arat cu ct crete/scade fenomenul n medie (n valoare absolut) de la o perioad de timp la alta. Calcularea acestui indicator are sens atunci cnd modicrile absolute cu baz n lan nu difer prea mult ca mrime. Modicarea medie absolut poart numele de spor mediu, dac este calculat pentru un fenomen cu tendin de cretere. n caz contrar vorbim despre scdere medie. 3) Indicele mediu de dinamic se calculeaz ca medie geometric simpl a indicilor de dinamic cu baz mobil. Arat de cte ori s-a modicat (a crescut sau a sczut) n medie fenomenul analizat pe ntreaga perioad luat n calcul. Valoarea rezultat din calcul este semnicativ ndeosebi pentru fenomenele care evolueaz n progresie geometric (indicii cu baz mobil au valori apropiate ntre ele). Valori mai mari de 100% ale acestui indicator arat tendina de cretere a fenomenului analizat. Valori mai mici de 100% corespund unei scderi pe ansamblul perioadei considerate. 4) Ritmul mediu de dinamic arat cu cte procente se modic n medie fenomenul pe ntreaga perioad analizat. Ultimii doi indicatori nu sunt reprezentativi pentru seriile cronologice cu un numr mare de termeni i cu oscilaii mari. Ajustarea seriilor cronologice Specic seriilor cronologice este variabilitatea mare a termenilor. Aceste variaii sunt produse de factori eseniali i ntmpltori. Aciunea factorilor eseniali determin tendina major de evoluie n timp amrimilor nregistrate de fenomenul analizat. Aceast tendin (trend) interfereaz cu cauzele neeseniale, ntmpltoare, efectul obinut ind valorile reale ale fenomenului. Scopul ajustrii seriilor cronologice l reprezint evidenierea factorilor eseniali, cu aciune sistematic, care urmresc o legitate matematic de evoluie.

58

BIOSTATISTICA

Noiuni de baz. Metode statistice

59

Ajustarea este operaia de nlocuire a termenilor reali ai seriei cronologice cu termeni teoretici care exprim o anumit legitate matematic de evoluie a fenomenului considerat. Pentru seriile cronologice, aceast legitate de evoluie se realizeaz n funcie de timp. ntruct abaterea termenilor reali de la cei teoretici calculai este efectul cauzelor neeseniale, ntmpltoare, prin ajustare se evideniaz mai bine tendina de evoluie n timp a fenomenului. Exist mai multe procedee de ajustare: - ajustarea prin metoda grac; - ajustarea prin metoda mediilor mobile; - ajustarea prin metoda modicrii medii absolute; - ajustarea prin metoda indicelui mediu de dinamic; - ajustarea prin metode analitice. Primele patru procedee formeaz grupul metodelor mecanice de ajustare. 1) Metoda grac de ajustare const n reprezentarea grac a seriei (cronograma), pe axa 0x (abscisa) ind trecute momentele sau intervalele succesive de timp, iar pe axa 0y (ordonata) nscriindu-se valorile numerice ale termenilor seriei. Se construiete pe acelai grac o dreapt sau curb care s uneasc cele dou puncte extreme ale seriei cronologice astfel nct s prezinte abateri minime fa de poziia valorilor reale de pe grac. Forma curbei astfel trasate indic legitatea matematic, forma de evoluie a fenomenului, dup o dreapt sau o funcie curbilinie. Metoda este simpl i rapid, dar exist pericolul interpretrii subiective a gracului. Metoda grac precede obligatoriu aplicarea metodelor analitice de ajustare. 2) Metoda mediilor mobile const n nlocuirea termenilor reali ai SCR cu valori teoretice, numite medii mobile (medii glisante sau alunectoare). Mediile mobile se calculeaz ca medii aritmetice pariale dintr-un anumit numr de termeni succesivi ai seriei. Acest numr depinde de periodicitatea oscilaiilor i este ales astfel nct ecare medie s cuprind toi termenii la care se manifest o oscilaie complet. Aceasta poate evideniat cu ajutorul reprezentrii grace, observnd mrimea distanei medii dintre punctele de inexiune ale gracului.

Mediile mobile asigur compensarea abaterilor, a oscilaiilor periodice. Noua serie obinut prin ajustare are o variaie lin, continu, evideniind tendina de evoluie a fenomenului (trendul), independent de aciunea factorilor sezonieri. Mediile mobile pot calculate dintr-un numr impar sau par de termeni. Dac media mobil se calculeaz dintr-un numr impar (de exemplu k = 3) de termeni, schema de calcul este urmtoarea: MM1 = y1 + y2 + y3 : 3; MM2 = y2 + y3 + y4 : 3; MM3 = y3 + y4 + y5 : 3; MMn-2 = yn-2 + yn-1 + yn : 3; Numrul de medii mobile obinut este mai mic dect numrul de termeni reali ai seriei. Primul i ultimul termen real nu vor avea corespondent o valoare ajustat, adic o medie mobil. Pentru cazul general, prin aceast metod se pierd k-1 termeni ai seriei (la nceputul i la sfritul irului), acesta ind principalul dezavantaj al metodei. Exemplu pentru k=3 (Tab.11). Tabelul 11 Avorturi la vrsta pn la 15 ani, RM, aa.1995 2002
Anii Termenul Nr.avorturi Media mobil 1995 y1 115 ---1996 y2 75 79 1997 y3 47 57 1998 y4 49 51 1999 y5 57 46 2000 yn-2 33 40 2001 yn-1 30 32 2002 yn 33 ----

Dac mediile mobile se calculeaz din numr par de termeni, calculul se realizeaz n dou faze: - se obin medii mobile provizorii, care se plaseaz ntre termenii seriei reale; - se determin medii mobile denitive (centrate) din cte dou medii mobile provizorii succesive care se plaseaz n dreptul termenilor reali (pe care i nlocuiesc). i n acest caz, numrul de medii mobile obinute este mai mic dect numrul de termeni reali ai seriei. Numrul termenilor reali care se pierd este n acest caz k. n prima faz se pierd k 1 termeni, iar n a doua faz un termen. Prima medie mobil centrat se va plasa n dreptul celui de-al k + 2 : 2 -lea termen al seriei. Pierderea de informaie produs de termenii lips afecteaz concluziile analizei, n special n cazul unui numr redus de observaii.

60

BIOSTATISTICA

Noiuni de baz. Metode statistice

61

Exemplu pentru k=4 (Tab.12).


Tabelul 12 Avorturi la vrsta pn la 15 ani, RM, aa.1995 2002
y1 Anii Nr. avorturi Medii mobile pariale Medii mobile centrate y2 y3 y4 y5 y6 y7 y8 1995 1996 1997 1998 1999 2000 2001 2002 115 75 47 49 57 33 30 33 71,5 57 46,5 42,3 38,3 ----64 52 44 40 -----

3) Ajustarea prin metoda modicrii medii absolute. Aceast metod este indicat atunci cnd seria cronologic prezint tendina de cretere sub forma unei progresii aritmetice, situaie evideniat prin valorile relativ apropiate ale modicrilor absolute cu baz mobil. Termenii ajustai se determin cu relaia: Yi = y1 + ti unde: Yi valorile ajustate, care nlocuiesc valorile reale; y1 primul termen al seriei cronologice reale (sau un alt termen luat ca baz de ajustare); sporul mediu (modicarea absolut medie); ti variaia timpului: t1 = 0, t2 = 1, t3 = 2, ..., tn = n-1 dac se ia ca baz primul termen al seriei. Primul termen ajustat este egal cu primul termen al seriei reale iar ultimul termen ajustat este egal cu ultima valoare a seriei reale. Metoda nseamn netezirea evoluiei fenomenului dup a linie dreapt, care unete primul i ultimul termen observat al seriei cronologice. Exemplu: = 17 (Tab.13). Tabelul 13 Cazuri de narcomanie n localitatea N,aa. t (reale i ajustate)
y1 Anii Prevalena narcomanie, real Prevalena narcomanie, ajustat t0 122 122 y2 t1 140 139 y3 t2 168 156 y4 t3 176 173 y5 t4 192 190 y6 t5 206 206

Primul i ultimul termen ajustat sunt egali cu termenii corespunztori din seria real. Metoda modicrii absolute medii i metoda indicelui mediu de dinamic sunt simple i rapide, dar nu iau n calcul toate valorile absolute ale termenilor seriei. 5) Ajustarea prin metode analitice Metodele analitice de estimare a tendinei se bazeaz pe folosirea funciilor matematice. Alegerea funciei de ajustare se face pe baza analizei gracului i a indicatorilor seriei cronologice. Situaiile cele mai frecvent ntlnite sunt: - fenomenul evolueaz dup o funcie liniar atunci cnd gracul arat o tendin de cretere absolut constant i modicrile cu baz mobil au valori apropiate; - fenomenul evolueaz dup o funcie exponenial atunci cnd gracul arat o tendin de cretere relativ constant i se obin valori apropiate ale indicilor cu baz n lan; - fenomenul evolueaz dup o parabol atunci cnd gracul are punct de maxim sau de minim iar diferenele dintre modicrile succesive cu baz mobil (numite modicri cu baz n lan de ordinul doi) au valori apropiate; frecvent, pe grac, se evideniaz numai fragmente de parabol. Dup ce se alege forma cea mai potrivit pentru funcia de ajustare, se determin parametrii prin intermediul metodei celor mai mici ptrate. Aceast metod pornete de la condiia minimizrii ptratelor abaterilor valorilor ajustate (Yi) de la valorile reale (yi). EXTRAPOLAREA Un obiectiv important al analizei seriilor cronologice l reprezint estimarea evoluiei probabile n viitor a fenomenului analizat. Extrapolarea reprezint o prelungire a seriei cronologice n viitor, pe baza trendului observat din analiza perioadei anterioare. Mrimile obinute prin extrapolare sunt valori probabile, orientative. Nu se poate face o predicie exact a viitorului din mai multe motive: - pe lng trendul pe baza cruia se face previziunea acioneaz i factori aleatori, ntmpltori, care inueneaz nivelul real al fenomenului analizat; - factorii de inuen evideniai prin analiza seriei cronologice i pot modica aciunea n viitor;

4) Ajustarea pe baza indicelui mediu de dinamic Aceast metod este recomandabil n situaiile n care seria cronologic are forma unei progresii geometrice. n acest caz indicii de dinamic cu baz mobil au valori relativ apropiate.

62

BIOSTATISTICA

Noiuni de baz. Metode statistice

63

exist anumite limite (minime sau maxime) n evoluia fenomenelor. Aceste restricii impun o analiz critic, calitativ a rezultatelor obinute prin extrapolare. Metodele de extrapolare sunt similare celor utilizate pentru estimarea trendului. Diferena const n perioada de timp implicat n calcule. Astfel, dac analiza seriei cronologice a relevat o tendin de cretere constant, extrapolarea se poate face prin metoda modicrii absolute medii. Atunci cnd evoluia seriei cronologice tinde ctre o exponenial, extrapolarea se poate face pe baza indicelui mediu de dinamic Atunci cnd evoluia fenomenului a fost analizat cu ajutorul metodelor analitice i s-a constatat c reect o anumit funcie matematic, extrapolarea se poate face utiliznd forma funciei de ajustare. Atunci cnd n evoluia fenomenului considerat s-a constatat o variaie sezonier, valorile extrapolate vor cuprinde i aceast tendin, prin nsumarea componentei sezoniere (n cazul modelului aditiv) sau prin nmulire (pentru modelul multiplicativ). Exemplu: Tabelul 14 Evoluia numrului de avorturi la vrsta pn la 15 ani, RM, aa. 1991-2003
Anul Numr avorturi 58 72 76 81 115 75 47 48 56 32 30 33 16 Modicare absolut x 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 0 14 18 23 57 17 -11 -10 -2 -26 -28 -25 -42 mobil 14 4 5 34 -40 -28 1 8 -24 -2 3 -17 Ritm dinamic x 100 24 31 40 98 29 -19 -17 -3 -45 -48 -43 -72 mobil 24 6 7 42 -35 -37 2 17 -43 -6 10 -52 Indice dinamic x 100 124 131 140 198 129 81 83 97 55 52 57 28 mobil 124 106 107 142 65 63 102 117 57 94 110 48 Val.absolut 1% ritm dinamic x 0 0,58 0,58 0,58 0,58 0,59 0,58 0,59 0,66 0,58 0,58 0,58 0,58 mobil 0,58 0,66 0,71 0,81 1,14 0,75 0,5 0,47 0,55 0,33 0,3 0,29

2.8. Standardizarea Importan deosebit pentru asigurarea comparabilitii datelor statistice au metodele de standardizare a valorilor relative i medii. Regula de baz a statisticii compar comparabilul presupune compararea indicatorilor obinui n totaliti statistice omogene. ns sunt frecvente cazurile cnd trebuie de comparat indicatori, asupra mrimii crora a inuenat neomogenitatea totalitilor studiate. n multe investigaii socio-medicale, precum i clinice, este exclus posibilitatea de a opera cu colectiviti omogene, productoare de fenomene care se cer comparate. Mai frecvent aceasta se refer la compararea indicatorilor sntii populaei (natalitate, mortalitate general, morbiditate) n ri, regiuni, raioane, orae cu structur diferit a populaiei pe vrst, sex; compararea activitii instituiilor medicosanitare cu structur diferit a contingentelor de bolnavi. Exemplul 1. - Pentru a compara letalitatea n dou spitale i a face concluzie privitor la cauzele diferenei acestor indicatori este necesar mai nti s analizm dac bolnavii n aceste spitale au fost omogeni nozologic. Evident, indicatorul letalitii va mai mare n spitalul unde au fost internai mai muli bolnavi cu forme grave ale maladiei. Structura neomogen a contingentelor de bolnavi dup starea sntii, vrst, sex i alte caractere face imposibil concluzia corect privind cauzele diferenei mrimii indicatorilor letalitii n aceste spitale. Exemplul 2. - Se compar indicii mortalitii generale n dou raioane. Calculul simplu arat c n raionul A nivelul mortalitii generale este 10, iar n raionul B 8,1. ns, pn a formula concluzia nal referitor la factorii care au inuenat diferena dintre indicatori, trebuie analizate totalitile comparate. Se acord atenie structurii pe vrste a populaiei din raioanele corespunztoare, din motivul c structura populaiei pe vrste incontestabil inueneaz indicatorul mortalitii generale. Cu ct sunt mai multe persoane vrstnice, cu att mai mare poate nivelul mortalitii. n cazul nostru, n raionul A, ponderea persoanelor vrsta crora a depit 60 de ani este de 30%, iar n raionul B 16%. Prin urmare, n raioanele comparate structura populaiei pe vrste este diferit i, n acest

64

BIOSTATISTICA

Noiuni de baz. Metode statistice

65

caz, indicatorii mortalitii generale (10 i 8,1) nu pot comparai n form brut. Pentru a compara indicatorii menionai se va utiliza metoda de standardizare. Standardizare metod de calcul a indicatorilor standardizai (ipotetici), care substituie valorile relative sau medii care sunt incomparabile din cauza neomogenitii structurale a totalitilor comparate. Exist trei metode de standardizare: - metoda direct. - metoda indirect; - metoda tangenial Cea mai frecvent utilizat este metoda direct de standardizare. n cazul utilizrii acestei metode drept standard este structura populaiei, care se consider c este identic n ambele totaliti comparate. Esena metodei este n eliminarea factorilor ce inueneaz mrimea indicatorilor obinui. Etapele metodei directe de standardizare: 1. Calculul indicatorilor intensivi (rata) sau medii speciali (pentru ecare grup pe sexe, vrst, durata de spitalizare, termenul de internare etc.) i generali pentru ecare totalitate. 2. Selectarea i calculul standardului. 3. Calculul valorilor ateptate pentru ecare grup de standard 4. Calculul indicatorilor standardizai 5. Compararea totalitilor dup indicatorii intensivi sau medii generali i indicatorii standardizai. Concluzii. Calculele efectuate, pentru o mai bun intuivitate, se vor prezenta n form de tabel (Tab.15)

Tabelul 15 Repartizarea bolnavilor i decedailor conform prolului seciei n spitalele A i B (datele sunt convenionale)
Spitalul A decedai bolnavi Secia Spitalul B decedai bolnavi Standardul 800 1000 200 2000 Indicatorii standardizai Spitalul A letalitatea valorile ateptate Spitalul B letalitatea 6,0 3,0 5,0 3,8 4,4 valorile ateptate 48 30 10 88

Terapie Chirurgie Boli infecioase Total Letalitatea %

600 300 100 1000

30 6 4 40

200 700 100 1000

12 21 5 38

5,0 2,0 4,0 4,0

40 20 8 68

4,0

3,8

3,4

Exemplu: Etapa I Calculul indicilor intensivi. Determinm rata decedailor, n dependen de prolul seciei, n ambele spitale. Spitalul A, secia terapie (30/600)x100; secia chirurgie (6/300)x100; boli infecioase (4/100)x100. Analogic se fac calculele i pentru spitalul B. Ulterior determinm indicatorul general al letalitii pentru spitalul A (40/1000)x100 i pentru spitalul B (38/1000)x100. Etapa II Selectarea i calculul standardului. Drept standard este considerat acea componen a totalitilor, care reect toate particularitile totalitilor comparate. !!!Standard poate : componena unei totaliti comparate; suma totalitilor comparate; semisuma totalitilor comparate; o valoare empiric. n exemplul dat drept standard pe secii a fost luat numrul de bolnavi din seciile respective a ecrui spital (coloana 1+coloana3), iar standard general suma bolnavilor din ambele spitale (1000+1000). Etapa III Calculul valorilor ateptate pentru ecare grup de standard. Calculul se face n modul urmtor: n spitalul A, secia terapie, au decedat 5% bolnavi. Ci decedai vor la 800 de bolnavi nivelul letalitii va acelai?

66

BIOSTATISTICA

Noiuni de baz. Metode statistice

67

5% 100 x% 800 x = (5x800)/100 Astfel, 40 este numrul ateptat de decedai n secia terapie la 800 de bolnavi. Analogic se fac calculele pentru seciile chirurgie i boli infecioase a spitalului A i seciile spitalului B. Etapa IV Calculul indicatorilor standardizai. Indicatorul standardizat este raportul procentual al sumei valorilor ateptate din ecare totalitate la standardul general. Spitalul A (68/2000)x100 = 3,4% Spitalul B (88/2000)x100 = 4,4% Etapa V Compararea indicatorilor (Tab.16). Tabelul 16 Compararea indicatorilor intensive i standardizai
Indicatori Intensivi Standardizai Spitalul A 4,0 3,4 Spitalul B 3,8 4,4 Comparare A>B A<B

!!! Indicatorii standardizai sunt convenionali (ipotetici) i nu ofer informaie despre mrimea real a fenomenului studiat. Fr indicatorii intensivi sau valorile medii nu sunt valabili. Avantajul acestor indicatori este faptul c permit de a elimina inuena asupra mrimii indicatorilor intensivi sau valorilor medii a neomogenitii structurale a totalitilor comparate i ofer rspuns la ntrebarea Care era s e mrimea fenomenului studiat dac totalitile comparate ar fost identice.

2.9. Corelaia i regresia


2.9.1. Corelaia n medicin i biologie, ca de altfel n toate domeniile de activitate, exist o interdependen ntre fenomene. Apariia i evoluia unui fenomen este n strns legtur cu o serie de alte fenomene sau factori care intervin n determinarea sau favorizarea acestuia. Corelaia este o metod care ne permite s cunoatem fenomenele din natur i societate sub raportul interferenei lor, a conexiunilor n care se gsesc. n statistic, pentru studierea legturilor multiple ce au loc ntre diferite fenomene, se folosete noiunea de funcie f, care const n faptul c ecrei valori a variabilei independente (X), numit argument, i corespunde valoarea altei variabile numit funcie (Y). n general, deosebim dou tipuri de corelaii: corelaii funcionale sau matematice i corelaii statistice sau stohastice (ntmpltoare). Corelaiile funcionale sunt perfecte, rigide, exprimnd legtura de la cauz la efect ntre fenomene. Asemenea corelaii sunt studiate n cadrul tiinelor exacte, unde avnd de-a face cu fenomene simple, legtura de la cauz la efect se evideniaz mai uor i se exprim sub form de lege. n cazul corelaiei funcionale unei valori determinate a unei variabile independente X (argument) i corespunde strict o valoare a variabilei dependente Y (funcie). Corelaiile statistice sunt mai puin perfecte, se evideniaz mai greu, exprimnd legtura de dependen care exist ntre fenomene. n cazul corelaiei statistice ecrei valori numerice a variabilei X corespund nu una ci mai multe valori a variabilei Y, adic o totalitate statistic a acestei valori, care se grupeaz n jurul mediei x.

Concluzii: 1. Compararea indicatorilor standardizai, calculai pentru spitalele A i B, ne permite s facem concluzia urmtoare: dac prolul seciei n spitalele A i B ar fost identic, letalitatea n spitalul A ar fost mai mic dect n spitalul B. 2. Compararea indicatorilor intensivi a oferit rezultate inverse, din motivul c mrimea acestor indicatori a fost inuenat de prolul seciei. Metoda tangenial de standardizare se utilizeaz n cazurile cnd n totalitile comparate lipsesc date privind bolnavii, decedaii etc. Drept standard este luat un indicator cunoscut: exemplu indicatorii mortalitii generale, mortalitii pe vrste, letalitii etc. din literatura de specialitate, statistic ocial i cu acesta sunt comparai indicatorii primari. Metoda indirect de standardizare se utilizeaz n cazurile cnd indicatorii necesari pentru comparare i analiz lipsesc. Acestea sunt reconstruii n mod invers, spre exemplu n baza datelor despre mortalitate, morbiditate, letalitate, care trebuie redai ct mai obiectiv n corespundere cu informaia cunoscut despre numrul i structura populaiei.

68

BIOSTATISTICA

Noiuni de baz. Metode statistice

69

Legtura de corelaie dup form poate linear (rectilinie) sau nelinear (curbilinie), iar dup sens direct (pozitiv) i invers (negativ). n cazul corelaiei lineare schimbrilor uniforme a valorilor medii a unei variabile, au loc schimbri egale a altei variabile. Pentru corelaia nelinear schimbrilor uniforme a unei valori i corespund valori medii a altei variabile, care poart caracter de cretere ori de micorare. Aprecierea legturilor de corelaie lineare se realizeaz cu ajutorul coecientului de corelaie rxy, iar celor nelineare cu raportul de corelaie (eta). Corelaii directe se stabilesc ntre fenomene care evolueaz n acelai sens, n aceeai direcie. Crete unul, crete i cel cu care are legtur de dependen; sau scade un fenomen, scade i cel cu care coreleaz. Spre exemplu, mrirea nlimii copiilor determin mrirea greutii lor. Corelaiile inverse se stabilesc ntre fenomene care evolueaz n sens opus. Crete un fenomen i scade cel cu care are o legtur de dependen; sau scade un fenomen i crete cel cu care se coreleaz. Spre exemplu, cu ct e mai mare vrsta copiilor, cu att e mai mic mortalitatea lor. Corelaiile statistice directe presupun evoluia n acelai sens a fenomenelor ce se coreleaz, dar nu cu aceeai unitate de msur. Spre exemplu, crete nivelul de trai al populaiei unei colectiviti de dou ori, crete i rezistena organismului la mbolnviri dar nu n aceeai msur, pentru c n afar de nivelul de trai, receptivitatea organismului la mbolnviri este determinat i de ali factori (biologici, climatici, geograci etc.). Corelaiile statisitice inverse presupun creterea unui fenomen i scderea celui cu care se coreleaz, dar nu n aceeai msur. Spre exemplu, dac ntr-o colectivitate am efectuat un numr dublu de vaccinri anti-pertussis, numrul copiilor ce vor contracta boala, n anul urmtor, va cu siguran mai sczut, dar nu va de dou ori mai mic dect n anul premergtor. Corelaiile statistice, spre deosebire de cele funcionale, pot numai vremelnice i ntr-un singur sens. Aa spre exemplu, ntre nlime i vrst exist o legtur de dependen direct numai pn la vrsta de 18-20 de ani. Dup aceast vrst, nlimea rmne nemodicat sau eventual ctre btrnee scade. Sau alt exemplu: nivelul de trai inueneaz nivelul mortalitii infantile, dar aceasta din urm nu poate inuena nivelul de trai.

CALCULAREA COEFICIENTULUI DE CORELAIE Legtura de dependen dintre dou sau mai multe fenomene, sensul i intensitatea acesteia, se stabilesc cu ajutorul coecientului de corelaie linear (simpl sau multipl) al lui Bravais-Pearson. n seriile statistice simple, cnd n<30, coecientul de corelaie se obine raportnd suma produselor dintre abaterile de la media aritmetic a valorilor frecvenelor primului fenomen i abaterile de la media aritmetic a valorilor frecvenelor celui de al doilea fenomen, la rdcina ptrat din produsul realizat ntre suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor primului fenomen i suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor celui de al doilea fenomen, cu care se coreleaz. Formula de calcul:

n care:
rxy = coecientul de corelaie; dxdy = suma produselor dintre abaterile de la media aritmetic a valorilor frecvenelor celor dou fenomene (x i y) ce se coreleaz; dx2 = suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor fenomenului x; dy2 = suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor fenomenului y. Exemplu: (Tab.17, Tab.18). Tabelul 17 Timpul trecut din momentul accesului de pancreatit acut (x) i numrul complicaiilor postoperatorii (y)
Nr. 1 2 3 4 5 6 Total Timpul Numr x complicaii, y 6 3 8 5 12 7 19 10 20 13 24 16 54 89 9 14,8 dX -6 -4 -2 1 4 7 dY -8,8 -6,8 -2,8 4,2 5,2 9,2 d2 X 36 16 4 1 16 49 122 d 2Y 77,4 46,2 7,8 17,6 27 84,6 260,6 178,3 d Xd Y 52,8 27,2 5,6 4,2 20,8 64,4 175 rXY = 0,98

70

BIOSTATISTICA

Noiuni de baz. Metode statistice

71

Tabelul 18 Nivelul de asigurare cu medici stomatologi (x) i ponderea copiilor sanai n cadrul a 5 raioane (y)
Nr. 1 2 3 4 5 Total Asigurare medici, x 2,3 3,2 3,4 3,6 3,9 16,4 3,3 Copii sanai, y 65,7 91,7 88,0 91,4 90,3 427,1 85,4 dX -1 -0,1 0,2 0,3 0,6 dY -19,7 6,3 2,6 6,0 4,9 d2 X 1 0,01 0,04 0,09 0,36 1,5 d 2Y 388,1 39,7 6,8 36 24,0 494,6 27,2 d Xd Y 19,7 -0,63 0,52 1,8 2,94 24,3 rXY= 0,89

n seriile statistice grupate coecientul de corelaie se obine raportnd suma produselor dintre abaterile valorilor variantelor de la media ponderat a celor dou fenomene ce se coreleaz i frecvenele perechi de valori ale variantelor la rdcina ptrat din suma produselor dintre ptratele abaterilor valorilor variantelor de la media ponderat i frecvenele corespunztoare ecrei variante a primului fenomen, nmulit cu suma produselor dintre ptratele abaterilor valorilor variantelor de la media ponderat i frecvenele corespunztoare ecrei variante a celui de al doilea fenomen, cu care se coreleaz. Formula de calcul:

n care:
rxy = coecientul de corelaie; = semnul nsumrii; dxdyfxy = produsul dintre abaterile de la media ponderat a variantelor celor dou fenomene ce se coreleaz i frecvenele perechi corespunztoare variantelor fenomenelor x i y; dx2fx = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului x i numrul de frecvene corespunztoare ecrei variante; dy2fy = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului y i numrul de frecvene corespunztoare ecrei variante.

INTERPRETAREA COEFICIENTULUI DE CORELAIE Coecientul de corelaie poate cuprins ntre minus unu, zero i plus unu. Cnd valoarea coecientului de corelaie se apropie de +1, nseamn c ntre cele dou fenomene ce se coreleaz exist o legtur foarte puternic. Semnul + al coecientului de corelaie denot c legtura de dependen dintre fenomene este direct. Deci ambele fenomene evolueaz n acelai sens, n aceeai direcie. Cnd valoarea coecientului de corelaie se apropie de 1, nseamn c ntre cele dou fenomene exist o legtur foarte puternic, dar invers, n sens opus: crete un fenomen, scade cel cu care se coreleaz. n medicin, ntlnim de obicei valori ale coecientului de corelaie intermediare valorilor 1 i +1. Pentru interpretarea intensitii legturii de dependen dintre fenomene e utilizeaz urmtoarele CRITERII: valoarea coecientului de corelaie cuprins ntre 1 denot o corelaie foarte puternic ntre fenomene; valoarea coecientului de corelaie cuprins ntre 0,99 i 0,70 denot o corelaie puternic; valoarea coecientului de corelaie cuprins ntre 0,69 i 0,30 denot o corelaie medie ntre fenomene; valoarea coecientului de corelaie cuprins ntre 0,0 i 0,29 exprim existena unei corelaii slabe ntre fenomene; valoarea coecientului de corelaie 0 denot c legtura dintre fenomene n mod practic o considerm inexistent. Cele dou fenomene evolueaz deci independent unul de altul. Coecientul de corelaie ntre fenomene poate corect interpretat dac se ine seama de urmtoarele ASPECTE: ntre fenomenele ce se coreleaz s existe, n mod logic, o legtur; cele dou fenomene s e cercetate pe eantioane omogene; alegerea sau selecionarea frecvenei eantioanelor s se fac la ntmplare. EROAREA COEFICIENTULUI DE CORELAIE LINEAR Coecientul de corelaie, ce exprim legtura de dependen dintre dou fenomene, se obine de obicei pe eantioane i nu pe univers. Valorile acestuia difer mai mult sau mai puin fa de valoarea coecientului de corelaie pe care am obinut-o studiind fenomenele pe ntreaga populaie.

72

BIOSTATISTICA

Noiuni de baz. Metode statistice

73

Pentru a ne convinge de delitatea coecientului de corelaie, n interpretarea legturii dintre fenomene obinute pe eantioane, ne servim de eroarea coecientului de corelaie, care se noteaz cu mr. Formula de calcul pentru n < 30:

n cazul cnd 30 < n < 100 se utilizeaz formula:

pentru n > 100:

n care: mr = eroarea coecientului de corelaie; r2xy = ptratul valorii coecientului de corelaie, obinut pe eantioane; 1 = valoarea absolut a coecientului de corelaie, obinut pe univers, pe ntreaga populaie; n = numrul variantelor perechi ale fenomenelor ce se coreleaz. Dac n < 30 sau valoarea coecientului de corelaie nu este mare, trebuie de decis ct de real este legtura dintre fenomenele ce se coreleaz. n general, dac valoarea coecientului de corelaie obinut pe eantioane este mai mare dect triplul erorii sale, nseamn c acesta a fost obinut pe eantioane reprezentative, este deci real i ne putem bizui pe el n interpretarea legturii de dependen ntre fenomene. Dac (rXY/mr) < 3 legtura dintre fenomene rmne nedeterminat i se consider c valoarea coecientului de corelaie, care difer de zero, a fost obinut ntmpltor. Raportul dintre coecientul de corelaie i eroarea lui se numete criteriu de exactitate al coecientului de corelaie tr. Criteriul n cauz se stabilete cu ajutorul tabelului valorilor criteriului t. Dac treal > ttabel, coecientul de corelaie se consider semnicativ.

CORELOGRAMA Existena sau inexistena unei corelaii ntre fenomene se poate evidenia aproximativ fr prea multe calcule, cu ajutorul reprezentrilor grace. n acest caz, folosim un grac cu dou scri, ordonat i abscis, pe care nscriem valorile variantelor celor dou fenomene x i y. n reeaua gracului este reprezentat prin cte un punct ecare frecven la nivelul valorii variantei corespunztoare fenomenului x de pe abscis i la nlimea valorii variantei corespunztoare fenomenului y de pe ordonat. Se realizeaz astfel norul de puncte. n funcie dispoziia acestui nor de puncte putem aprecia, aproximativ, existena sau absena corelaiei dintre fenomene, precum i sensul i intensitatea aproximativ a acesteia. Dac norul de puncte se va dispune fuziform, oblic de jos n sus i de la stnga la dreapta, ntre cele dou fenomene exist o corelaie direct. Crete un fenomen, crete i cel de al doilea, cu care se coreleaz, sau ambele fenomene scad, evolund n aceeai direcie. Intensitatea legturii corelative dintre cele dou fenomene se apreciaz, aproximativ, dup unghiul pe care dreapta ce trece prin mijlocul norului de puncte l realizeaz cu abscisa. Cu ct acest unghi ascuit este mai mare, avnd tendina s se apropie de 450, cu att corelaia dintre fenomene este mai puternic. Cu ct unghiul format de aceast dreapt i abscis este mai mic, dreapta oblic avnd tendina s se apropie de orizontal, cu att corelaie dintre fenomene va mai slab. Dac norul de puncte se dispune fuziform, oblic de sus n jos i de la stnga la dreapta, ntre cele dou fenomene exist o corelaie invers. Intensitatea acestei corelaii inverse se apreciaz dup mrimea unghiului ascuit pe care dreapta ce trece prin mijlocul norului de puncte l formeaz cu abscisa, n partea opus ordonatei. Dac punctele se dispun pe toat reeaua grac, neavnd nici o tendin de a se grupa, nseamn c ntre fenomene nu exist nici o legtur de dependen, fenomenele evolund independent unul fa de cellalt. n cazul acesta, dreapta care trece prin mijlocul punctelor este paralel e cu ordonata, e cu abscisa.

74

BIOSTATISTICA

Noiuni de baz. Metode statistice

75

CORELAIA MULTIPL Se stabilete ntre mai mult de dou fenomene, care au legtur de dependen ntre ele. n asemenea situaii, existena legturii de dependen ntre fenomene, sensul i intensitatea acestei legturi, se stabilesc cu ajutorul coecientului de corelaie linear multipl. Spre exemplu, dac dorim s evideniem legtura de dependen ntre nlimea (fenomen x), greutatea (fenomen y) i vrsta (fenomen z) copiilor sau legtura de dependen ntre incidena dinilor cariai (fenomen x), dinilor cu parodontopatii marginale (fenomen y) i dinilor abseni (fenomen z) ne folosim de urmtoarea formul:

6 = valoare constant; d2 = suma ptratelor diferenelor dintre rangurile primului ir de variante i rangurile celui de al doilea ir de variante, cu care se coreleaz; n = numrul variantelor perechi variantelor ce se coreleaz. Coecientul de corelaie al rangurilor poate avea valori cuprinse ntre 1 0- +1. El exprim o legtur perfect cnd are valoarea +1. n aceast situaie, rangurile au valori egale, iar diferena ntre ranguri este egal cu 0. n general, cu ct numrul rangurilor cu aceeai valoare, n cele dou clasamente, este mai mare, cu att suma ptratelor diferenelor ntre ranguri este mai mic, iar valoarea coecientului de corelaie Spearman va mai mare. Exemplu (Tab.19, Tab.20).
Tabelul 19 Timpul trecut din momentul accesului de pancreatit acut (x) i numrul complicaiilor postoperatorii (y)
Nr. 1 2 3 4 5 6 Total Timpul, x 3 5 7 10 13 16 54 Numr complicaii, y 6 8 12 19 20 24 89 =1 Rangul x 1 2 3 4 5 6 Rangul y 1 2 3 4 5 6 d 0 0 0 0 0 0 d2 0 0 0 0 0 0 0

rxyz rxy ryz rxz

n care: = coecientul de corelaie linear multipl ntre cele trei fenomene; = coecientul de corelaie linear simpl ntre fenomenele x i y; = coecientul de corelaie linear simpl ntre fenomenele y i z; = coecientul de corelaie linear simpl ntre fenomenele x i z;

Coecientul de corelaie linear multipl are valori mai mari dect valorile coecienilor de corelaie linear simpl luai n parte i totdeauna semn pozitiv. Interpretarea intensitii corelaiei multiple ine seama de aceleai criterii enunate la interpretarea coecientului de corelaie linear simpl. CORELAIA RANGURILOR (SPEARMAN) n cazul n care dorim s stabilim legtura de dependen ntre fenomene cercetate pe eantioane mici (n < 30), deci pe un numr redus de frecvene, utilizm coecientul de corelaie al rangurilor, propus de Spearman (1904). Acest coecient se noteaz cu litera greac (ro) i se determin dup formula propus de Spearman:

1= =

n care: valoarea absolut a coecientului de corelaie; coecientul de corelaie Spearman;

76

BIOSTATISTICA

Noiuni de baz. Metode statistice

77 Tabelul 21

Tabelul 20 Legtura de corelaie ntre copiii cu decien mintal (la 100 mii copii) i invaliditatea copiilor (la 100 mii copii)
Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total ara Deci- Invalidien tatea Rangul Rangul mintal copiilor x y x y 120 138 167 198 245 318 342 455 538 625 795 1018 1110 1021 1127 33 27 38 30 43 28 30 29 36 48 38 44 47 57 33 1 2 3 4 5 6 7 8 9 10 11 12 14 13 15 6,5 1 9,5 4,5 11 2 4,5 3 8 14 9,5 12 13 15 6,5 d -5,5 1 -6,5 -0,5 -6 4 2,5 5 1 -4 1,5 0 1 -2 8,5 =-24,5 =+24,5 d
2

Exemplu: (Tab. 21).


Vaccinarea contra unei maladii i morbiditatea populaiei n oraul A
Vaccinai Nevaccinai TOTAL S-au mbolnvit 40 a 250 c 290 a+c Sntoi 5900 b 9620 d 15520 b+d TOTAL 5940 a+b 9870 c+d 15810 a+b+c+d

Armenia Tadjikistan Azerbaidjan Turkmenistan Georgia Krgzstan Uzbekistan Kazahstan Bielarusi Ucraina Rusia Moldova Estonia Lituania Letonia

30,25 1 42,25 0,25 36 16 6,25 25 1 16 2,25 0 1 4 72,25 =253,5 = 0,55

Concluzie: ntre vaccinare i morbiditate este legtur invers, astfel cu ct mai multe persoane sunt vaccinate, cu att mai puine cazuri de mbolnvire se nregistreaz. Exemplu de legtur de corelaie nelinear. A fost efectuat analiza activitii a 21 de medici pentru a determina dac exist legtur ntre calicarea medicului i costul analizelor necesare pentru diagnostic.* Comisia special a evaluat calicarea ecrui medic. Ulterior medicii au primit ranguri de la 1 (cel mai calicat) pn la 21 (cel mai necalicat). Costul mediu al analizelor necesare pentru ecare medic n primele 3 zile de aare a bolnavului n clinic a primit n mod analogic rangul de la 1 (cel mai mic) pn la 21 (cel mai mare). Perechile de ranguri pentru ecare medic sunt prezentate n g.4. Coecientul Spearman = -0,13. Valoarea absolut a coecientului este mai mic dect cea critic chiar pentru pragul de semnicaie 0,05, ceea ce denot lipsa semnicaiei statistice pentru valoarea obinut. Exist sau nu legtur ntre calicarea medicului i costul analizelor necesare pentru stabilirea diagnosticului? Exist, ns legtur nelinear. Analiznd atent repartiia din g. 4, vom observa c cel mai mic cost mediu al analizelor se nregistreaz
* S.A. Schroeder, A. Schliftman, T.E. Piemine. Variation among physicians in use of laboratory tests: relation to quality of care. Med. Care, 12: 709-713, 1974

COEFICIENTUL DE ASOCIERE n domeniul medicinei trebuie n multe cazuri de a stabili legtura nu numai ntre indicatori cantitativi, ci i ntre cei calitativi, care au caracter alternativ prezena fenomenului lipsa fenomenului). n asemenea cazuri se utilizeaz tabelul de asociere format din patru cmpuri (2x2), care exprim legtura de dependen ntre fenomenele cu caracter alternativ. Legtura de corelaie se determin prin intermediul coecientului de asociere, utiliznd formula urmtoare:

unde: a, b, c, d corespund valorilor situate n cele patru cmpuri.

78

BIOSTATISTICA

Noiuni de baz. Metode statistice

79

la cei mai calicai i la cei mai necalicai medici. Costurile cele mai nalte sunt la medicii de calicare medie.

sau

n care: Rgxy = coecientul de regresie a lui x n funcie de y. El exprim, cantitativ, cu ct crete sau scade fenomenul x cnd y crete sau scade cu o unitate de msur; Rgyx = coecientul de regresie a lui y n funcie de x. El exprim, cantitativ, cu ct crete sau scade fenomenul y cnd x crete sau scade cu o unitate de msur; rxy = coecientul de corelaie liniar Bravais-Pearson; x = deviaia standard a fenomenului x; y = deviaia standard a fenomenului y. Exemplu: (Tab. 22).
Fig.4. Calicarea medicilor i costul analizelor Tabelul 22 nalimea i greutatea copiilor de vrst Z (n=22)
nlimea x 130 132 135 136 137 Frecvene fx 3 5 7 4 3 Greutatea y 29 30 31 32 33 34 35 36 Frecvene fy 3 4 3 4 4 2 1 1

2.9.2. Regresia Termenul de regresie a fost introdus de F. Galton, care a observat c nlimea descendenilor regreseaz ctre nlimea prinilor. Coecientul de corelaie ne d indicaii asupra sensului i intensitii legturii de dependen dintre fenomene, fr a putea preciza, sub aspect cantitativ, cu ct crete sau scade un fenomen cnd cel cu care se coreleaz crete sau scade cu o anumit cantitate. Regresia, noiune strns legat de noiunea de corelaie, completeaz corelaia i prin intermediul coecientului de regresie, stabilete cu ct crete sau descrete sub aspect cantitativ, un fenomen, cnd cel cu care se coreleaz crete sau descrete cu o unitate de msur. Regresia poate simpl i multipl; liniar i neliniar. Ca i corelaia, regresia poate direct, cnd fenomenele evolueaz n acelai sens (crete x, crete y sau scade x scade i y), sau indirect, cnd fenomenul evolueaz n sens opus (crete x scade y sau scade x crete y). Formula coecientului de regresie este:

Repartizarea a 22 de copii conform nlimii (x) i greutii (y) a oferit urmtoarele date: nlimea medie 134 cm; greutatea medie 31,8 kg; abaterea standard pentru nlime (x) 2,37; abaterea standard pentru greutate (y) 1,97; coecientul de corelaie 0,82. Cu ct se va modica greutatea corpului la copiii n cauz, dac nlimea acestora va crete cu 1 cm? Substituind datele n formula coecientului de regresie, obinem:

80

BIOSTATISTICA

Noiuni de baz. Metode statistice

81

Concluzie: Creterea nlimii medii la copiii studiai cu 1cm va avea drept urmare creterea greutii lor cu 0,68 kg. Utiliznd coecientul de regresie se poate aa mrimea fenomenului y (n cazul analizat anterior greutatea), fr a recurge la msurarea acestuia, utiliznd n acest scop numai fenomenul x (greutatea). Se folosete urmtoarea ecuaie a regresiei: y = + Rgyx (x ) n care: y greutatea cercetat; x mrimea cunoscut a nlimii; Rgyx coecientul de regresie al nlimii n raport cu greutatea; greutatea medie a colectivitii cercetate; nlimea medie a colectivitii cercetate. n cazul dat nlimea medie 134 cm; greutatea medie 31,8 kg; Rgyx 0,68. Se cere de aat care va greutatea copiilor care au nlimea de 135cm. nlocuim datele n formul, obinem: y = + Rgyx (x ) = 31,8+0,68(135-134) = 31,8+0,681 =32,5 kg Astfel, nlimii de 135 cm i corespunde greutatea de 32,5 kg. Scara regresiei: n domeniul cercetrilor somatometrice a copiilor i adolescenilor este foarte important metoda de estimare a indicatorilor nlimii, greutii corpului, perimetrului toracic etc. Valorile individuale ale acestor valori difer uneori destul de evident. La persoanele care au aceeai nlime greutatea corpului poate varia n limite destul de mari. Mrimea diversitilor individuale a acestor caracteristici este redat de abaterea standard a regresiei Rg, care este calculat cu ajutorul formulei urmtoare:

2.10. Analiza statistic a variabilitii Caracterizarea unei colectiviti statistice prin indicatorii tendinei centrale ne ajut s depistm ceea ce este comun, esenial n manifestarea unui fenomen. Orice colectivitate are o anumit organizare intern, denit prin felul n care valorile individuale se mprtie sau se concentreaz n jurul valorii centrale. Astfel se poate ntmpla ca dou colectiviti analizate dup aceeai variabil s e diferite prin tendina central (Fig. 5a), prin dispersie (Fig. 5b) sau prin amndou (Fig. 5c). n felul acesta o valoare central poate credibil, o alta nu. Din acest motiv se impune ca analiza prin indicatorii tendinei centrale s e completat cu indicatori ai variaiei i ai formei de distribuie.

Fig.5: a) Distribuii cu tendin central diferit; b) Distribuii cu variabilitate diferit; c) Distribuii cu tendin central i variabilitate diferite.

n statistic prin noiunea general de variabilitate se au n vedere abaterile msurabile ale valorilor individuale fa de o valoare central (tipic). De exemplu seriile: {2, 2, 2, 10, 18, 18, 18} {9, 9, 9, 9, 10, 11, 11, 11, 11} au aceeai medie i median dar dispersie diferit. Acest fapt este evideniat de abaterile nregistrate fa de medie (10) sau median (10). Seria a doua este mai omogen (nregistreaz o variabilitate mai mic a valorilor individuale), iar valorile sale tipice sunt mai reprezentative. Calculul i analiza indicatorilor variaiei valorilor individuale fa de medie ofer posibilitatea de rezolvare a unor probleme de cunoatere statistic. Dintre acestea se disting:

Rg = y (1 r2 )
Cu ct va mai mic valoarea abaterii standard a regresiei, cu att mai mici vor limitele de variaie a valorilor individuale fa de media lor. n exemplul anterior, conform datelor obinute, valoarea abaterii standard a regresiei va :

Rg = y (1 r2 ) = 1,97(10,822) = 1,970,33 = 0,65 kg/cm


Cunoscnd valoarea coecientului de regresie, folosind ecuaia regresiei i abaterea standard a regresiei se poate de format scara regresiei.

82

BIOSTATISTICA

Noiuni de baz. Metode statistice

83

1) analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendinei centrale i vericarea reprezentativitii acestora; 2) compararea n timp i (sau) spaii a mai multor serii de distribuie dup caracteristici independente i (sau) interdependente; 3) selectarea obiectiv a factorilor semnicativi de inuen dup care se structureaz unitile unei colectiviti statistice; 4) separarea aciunii factorilor eseniali de factorii ntmpltori; 5) concentrarea valorilor individuale ale caracteristicilor i deplasarea acestora fa de valorile tipice; 6) aplicarea diferitelor teste ale statisticii matematice. Indicatorii variaiei utilizai n analizele statistice sun clasicai dup mai multe criterii: - dup numrul variantelor luate n calcul exist indicatori simpli i indicatori sintetici; - dup modul de sistematizare a datelor primare exist indicatori ai variaiei calculai pentru serii de distribuie unidimensionale i indicatori calculai pentru serii multidimensionale; - dup modul de calcul i exprimare exist indicatori ai variaiei calculai ca mrimi absolute i ca mrimi relative. Indicatori simpli: - amplitudinea variaiei; - abaterea valorilor individuale de la medie; - abaterea intercuantilic. Indicatori sintetici: - dispersia; - abaterea medie ptratic; - coecientul de variaie; Amplitudinea variaiei (A) - Se mai numete cmp de variaie sau amplitudine absolut. - Se determin prin diferena dintre cea mai mare i cea mai mic valoare individual nregistrat. A = xmax xmin Exemplu: Un grup de bolnavi nregistreaz urmtoarele durate de tratament n zile: 8, 7, 9, 8, 9, 9, 10, 11, 12, 11, 10, 10, 9, 9, 7, 8, 10,10,11,10 Amplitudinea variaiei pentru durata tratamentului: 12 7 = 5 zile.

Amplitudinea relativ (A%) este raportul procentual dintre amplitudinea absolut i media aritmetic a valorilor analizate.

n exemplul de mai sus A% = (5/9)100 = 55,5% Observaii referitor la amplitudine: 1) Se exprim n unitatea de msur a caracteristicii studiate sau n procente n cazul amplitudinei relative; 2) Amplitudinea nu ine seama de toate valorile, ci numai de cele extreme, care adeseori sunt aberante; 3) Este sensibil la valorile aberante, se consider un indicator mai puin relevant nepermind cunoaterea structurii interne de variaie. De exemplu, urmtoarele trei serii vizualizate au aceeai amplitudine, dar prezint variaii diferite: Xmin Xmin Xmin Xmax Xmax Xmax

Aceasta nseamn c amplitudinea variaiei este un indicator destul de rezonabil numai dac valorile individuale ale seriei sunt repartizate n mod uniform; 4) n cazul seriei de distribuie pe intervale valorice calculul amplitudinii este lipsit de sens; 5) Amplitudinea se utilizeaz frecvent la alegerea numrului de intervale de grupare a datelor i la stabilirea mrimii intervalelor. Abaterea valorilor individuale de la medie (di). Exprim cu cte uniti de msur sau de cte ori (sau ct la sut) valoarea caracteristicii individuale a colectivitii se abate de la mrimea unui indicator al tendinei centrale. - n forma absolut: - n forma relativ:

84

BIOSTATISTICA

Noiuni de baz. Metode statistice

85

Exemplu: considernd aceleai date din exemplul anterior, bolnavul care s-a tratat 12 zile se abate de la media grupei cu 3 zile ceea ce reperezint 33,3% din medie iar pacientul care s-a tratat 7 zile se abate de la media semigrupei cu 2 zile ceea ce reprezint 22,2% din medie. Cu ct obinem mai multe abateri relative mari n analiza unui volum de date (ctre 100% sau peste acest nivel) cu att colectivitatea este mai eterogen. Observaii: 1) valorile individuale se compar cu valoarea lor medie, dar la fel de bine poate utilizat pentru comparare oricare alt indicator al tendinei centrale (de ex. mediana); 2) n seriile de distribuie pe intervale valorice pentru calculul abaterilor individuale se iau n considerare centrele de interval; 3) Abaterea valorilor individuale nu poate da informaii dect la nivelul ecrei variante pierznd imaginea mprtierii pe ansamblul distribuiei. 4) n analizele statistice se urmresc n mod deosebit abaterile maxime pozitive (d+max) i abaterile maxime negative (d-max) calculate n cifre absolute i relative astfel: d+max = xmax sau d+max% = ( d+max/ ) 100 d-max = xmax sau d-max% = ( d-max/ ) 100 Abaterea intercuantilic Se calculeaz ca diferen ntre cuantila superioar i cuantila inferioar de acelai ordin. Astfel pentru r = 4 Q3 Q1 conine 50% din numrul observaiilor; pentru r = 10 D9 D1 conine 80% din numrul observaiilor (Fig.6).

Observaii: 1) Acest indicator se exprim n unitatea de msur a caracteristicii; 2) Calculul abaterii intercuantilice, spre deosebire de cel al amplitudinii, prezint avantajul c evit valorile individuale extreme sau aberante. Prin calculul acestui indicator se pierd informaii dar are ctig de cauz omogenitatea. 3) Ca i amplitudinea, abaterea intercuantilic nu poate utilizat n calcule algebrice. Dispersia (2) Se calculeaz ca media aritmetic a patratelor abaterilor valorilor individuale de la tendina central (uzual de la medie). Pentru o serie simpl formula dispersiei este:

Pentru o serie de distribuie pe frecvene formula dispersiei este:

Observaii: 1) Se mai numete varian sau moment centrat de ordin doi; 2) Este indicatorul care msoar variaia total a unei caracteristici studiate datorat att cauzelor eseniale ct i celor ntmpltoare; 3) Este un indicator cu valoare teoretic, util n vericri de ipoteze statistice, o mrime abstract folosit ca baz de calcul pentru abaterea medie ptratic; 4) Nu are form concret de exprimare; 5) Cu ct valorile individuale ale caracteristicii sunt mai apropiate ntre ele, cu att mrimea dispersiei este mai mic. La limit, dac toate valorile individuale sunt egale ntre ele, dispersia este nul; 6) Dispersia, ca i media valorilor individuale, este sensibil la prezena valorilor extreme, aberante. Abaterea medie ptratic () Este calculat ca o medie ptratic din abaterile valorilor individuale de la media lor.

Fig.6. Abaterea Q3 Q1 n distribuia normal

86

BIOSTATISTICA

Noiuni de baz. Metode statistice

87

n seriile statistice simple:

n seriile de distribuie pe frecvene:

Menionm, c n cazul n care numrul de frecvene este mai mic de 120, numitorul formulelor deviaiei standard devine n-1. Deviaia standard este cel mai util i mai important indicator de dispersie. Ea pune n eviden intervalul valoric, n jurul mediei, n care s-au distribuit valorile individuale ale fenomenului studiat. O deviaie standard cu valoare mic, pune n eviden strns o distribuie strns a valorilor frecvenelor fenomenului cercetat n jurul mediei, deci evideniaz un eantion omogen. O valoare mare a deviaiei standard pune n eviden o dispersie mare a valorilor individuale n jurul mediei, dovedind c eantionul este neomogen i ca atare rezultatele obinute pe un aa eantion nu pot generalizarte. n general, cu ct deviaia standard are valori mai mari, cu att media caracterizeaz mai puin fenomenul cercetat. Deviaia standard are o valoare semnicativ atunci cnd eantionul pe care am lucrat are o distribuie normal, adic distribuia se face conform curbei Gauss Laplace (Fig. 7).

n cadrul unei asemenea distribuii, n mod normal, ntre valoarea mediei i cea a deviaiei standard se distribuie 68,26% din totalul valorilor unei colectiviti statistice; ntre medie i dou valori ale sigmei se distribuie 95,45% din valori, iar ntre medie i trei valori ale sigmei sunt cuprinse 99,73% din valori. De obicei, n practica, datorit variabilitii mari a fenomenelor biologice, se consider ca normale valorile cuprinse n intervalul determinat de X 2. n cercetrile experimentale, care necesit o exactitate mai mare, intervalul n care considerm ca normale valorile frecvenelor fenomenului cercetat este mai mare, determinat de X 3. Observaii: 1) Se mai numete abatere standard, deviaie standard, abatere tip, standard deviation; 2) Este un indicator important n analiza variaiei, se folosete la estimarea erorilor de selecie; stabilirea eantionului; n calcule de corelaie; 3) Se utilizeaz pentru elaborarea standardelor de dezvoltare zic, pentru delimitarea strilor normale de cele patologice; 4) Exprim cu ct se abate n medie ecare valoare individual de la media valorilor evideniind inuena abaterilor mari; 5) Se calculeaz ca o medie ptratic simpl sau ponderat a ptratelor abaterilor valorilor individuale de la media lor; 6) Se exprim n unitatea de msur n care se exprim i caracteristica. Coecientul de variaie (Cv) Pe lng multiplele utilizri practice, deviaia standard are i un mare neajuns. Datorit faptului c deviaia standard este exprimat n uniti de msur diferite, specice fenomenelor pe care le cercetm, ea nu poate utilizat n aprecierea comparativ a dou sau mai multe eantioane, sub aspectul omogenitii, care se exprim n uniti de msur diferite. Spre exemplu, dac am msurat nlimea i greutatea unui lot de 30 de elevi i am gsit pentru nlime o medie de 145 cm cu o deviaie standard de 5 cm, iar pentru greutate am gsit o medie de 35 de kg cu o deviaie de 3 kg, pe baza valorilor deviaiei standard, exprimate n centimetri i kilograme, nu putem aprecia sub ce aspect, al nlimii

Fig.7. Curba Gauss Laplace.

88

BIOSTATISTICA

Noiuni de baz. Metode statistice

89

sau al greutii, lotul de elevi este mai omogen, mai uniform dezvoltat. n aceast situaie se recurge la coecientul de variaie, care nu este altceva dect deviaia standard exprimat procentual. Ca deniie, coecientul de variaie este rapotul procentual dintre valoarea deviaiei standard i media aritmetic. Formula de calcul:

n exemplul anterior, valoarea dubl a coecientului de variaie pentru nlime este de 6,8 i pentru greutate 17,2 din valorile mediilor respective. Variabile standardizate 1) Variabila [z = d/] se numete variabil standardizat sau abatere normat. 2) Unitatea de msur a abaterii normate se numete unitate standard sau valoare standard. 3) Exprim poziia unitii statistice ntr-o distribuie dat att fa de medie ct i fa de dispersie. 4) Cu ajutorul acestei variabile se pot compara mrimi ce provin din distribuii diferite. 2.11. Aprecierea veridicitii valorilor medii i relative Constantele (medii sau de dispersie) obinute de noi pe eantioane se numesc statistici i valorile lor sunt mai mult sau mai puin apropiate de valorile constantelor colectivitilor generale (parametrii) n funcie de gradul de reprezentativitate (calitativ i cantitativ) al eantioanelor, ns niciodat nu sunt identice. Cu ajutorul acestor constante de eantion, a statisticilor, se estimeaz constantele colectivitilor generale, parametrii. Estimatul rezultat pe baza constantelor de eantionare este aleator. Ca atare valorile exacte ale parametrilor colectivitii generale rmn necunoscute, n schimb se poate preciza un interval valoric n care se va situa media colectivitii generale (MA = media absolut), n jurul creia, n acel interval valoric se vor distribui mediile de eantion, cu o anumit probabilitate. Dac dintr-o colectivitate general extragem mai multe eantioane, valorile medii ale acestor eantioane vor foarte apropiate de valoarea mediei absolute, distribuia acestora, n jurul mediei absolute, fcnduse conform aceleiai curbe Gauss-Laplace. Eroarea standard sau eroarea medie a mediilor Constanta care ne permite s stabilim intervalul valoric n care se gsete media absolut i n jurul creia se distribuie valorile medii de eantion, cu o anumit probabilitate, se numete eroare

Coecientul de variaie arat ct la sut din medie reprezint deviaia standard. Astfel, exprimnd procentual pe , scpm de inuena unitii de msur, putnd compara ntre ele, sub aspectul omogenitii, cte eantioane dorim. n exemplul anterior, coecientul de variaie pentru nlime este: Cv = (5cm/145cm) 100 = 3,4% Pentru greutate coecientul este: Cv = (3kg/35kg) 100 = 8,6% Din datele obinute rezult, c lotul de copii este mai omogen dezvoltat sub aspectul nlimii, i nu sub aspectul greutii, cum eram tentai s apreciem pe baza valorilor deviaiei standard. Cu ct valoarea procentual a coecientului de variaie este mai mic, cu att eantionul cercetat este mai omogen. n general, se consider c un coecient de variaie cu valori sub 10% indic o variaie mic, deci o omogenitate care ne permite s generalizm rezultatele, dac i din punct de vedere numeric eantionul este corespunztor. Un coecient de variaie cu valori cuprinse ntre 10% i 20% indic o variaie medie. Eantionul este mai puin omogen ca n primul caz, dar totui permite generalizarea rezultatelor obinute, cu o anumit probabilitate de a grei. Valorile peste 20% ale coecientului de variaie indic o variaie mare, o lips aproape total de omogenitate, fapt ce contraindic generalizarea rezultatelor obinute pe un asemenea eantion. De menionat c aceste limite ale coecientului de variaie, ce ne permit s apreciem omogenitatea sau lipsa de omogenitate a eantionului, trebuie s reprezinte valorile duble ale acestuia, n cazul cercetrilor clinice, i valorilor triple, n cazul cercetrilor experimentale, aa cum am vzut i la deviaia standard.

90

BIOSTATISTICA

Noiuni de baz. Metode statistice

91

standard (ES) sau eroare medie a valorilor medii de eantion fa de media universului. Formula de calcul:

Valoarea erorii standard, adugat sau sczut din valoarea mediei eantionului, ne permite s obinem limitele intervalului n care se gsete valoarea mediei absolute i n jurul ei distribuite mediile eantioanelor, cu o anumit probabilitate. Intervalul de siguran Intervalul valoric, determinat cu ajutorul erorii standard, n care se estimeaz a se aa media absolut, se numete interval de siguran sau de ncredere statistic, n acest interval de siguran, determinat de media eantionului plus/minus eroarea standard, media absolut se va gsi ntr-o proporie de 68,26%, deci probabilitatea ca media absolut s se gseasc n interiorul acestui interval este de 68,26%. M-ES>I<(M+ES)=68,26% P-ES>I<(P+ES) n primul nostru exemplu, media ponderat ind 140,5 mm Hg, intervalul de siguran va 140,5 0,57, deci va cuprins ntre 139,93 i 141,07 mm Hg. n cel de al doilea exemplu al nostru, media ponderat ind de 5,84 dini iar eroarea standard 0,14, intervalul de siguran va 5,84 0,14, deci cuprins ntre 5,70 i 5,98. 2ES 3ES Pragul de semnicaie Contraprobabilitatea sau probabilitatea ca mediile de eantion s depeasc limitele maxim i minim intervalului de siguran, situndu-se n afara lor, se numete prag de semnicaie, n cazul n care intervalul de siguran este determinat de M ES, atunci contraprobabilitatea (pragul de semnicaie) se obine scznd din 100 valoarea probabilitii, deci: q = 100 68,26% = 31,74% n exemplul nostru media ponderat ind de 5,84 dini afectai, intervalul de siguran va : 5,84 0,14, deci va cuprins ntre 5,70 -5,98. Dac vrem ca valoarea contraprobabilitii, a posibilitii de a grei, s e mai mic, atunci trebuie s mrim intervalul de siguran. Acest interval se mrete adugnd i scznd din valoarea mediei de dou ori valoarea erorii standard. M 2.ES = 5,84 + 2.0,14 = 5,84 0,28

n care: ESM =eroarea standard; = abaterea standard; n = numrul frecvenelor. n situaia n care numrul de frecvne al eantionmului este mai mic sau egal cu 120, atunci se raporteaz la numrul de frecvene -1 i formula devine:

n care: ESM = eroarea standard; = abaterea standard; n = numrul frecvenelor Exemplul 1. La 120 persoane a fost determinat tensiunea arterial sistolic. n baza valorilor individuale s-a stabilit c M = 140,5 mm Hg i = 6,25. Exemplul 2. n baza controlului medical la 508 persoane au fost stabilite afeciuni dentare. n medie au fost afectai cte 5,84 dini, = 3,16. n primul nostru exemplu, eroarea standard va :

n cel de al doilea exemplu al nostru, eroarea standard va :

92

BIOSTATISTICA

Noiuni de baz. Metode statistice

93

Intervalul de siguran va cuprins deci ntre limitele de 5,56 i 6,12. n acest interval, ceva mai mare, valoarea mediei absolute se va gsi cu o probabilitate mai mare dect n primul caz, de 95,45%, iar posibilitatea de a se situa n afara acestui interval de siguran se reduce la 4,55% (100% 95,45% = 4,55%). Dac vrem s reducem i mai mult probabilitatea de a grei, atunci mrim intervalul de siguran, adugnd i scznd din valoarea mediei de trei ori valoarea erorii standard. Intervalul de siguran va : M 3.ES = 5.84 3.0.14 = 5.84 0,42 Intervalul de siguran n acest caz va cuprins ntre 5,42 i 6,26. n acest interval de siguran, mult mai mare, media absolut se va gsi cu o probabilitate de 99,73%, iar pragul de semnicaie va de 0,27% (100% 99,73% = 0,27%). Rezult c intervalul de siguran nu are limite xe ci ele se modic n funcie de dorina cu care vrem s asigurm rezultatele noastre, n cazul n care acceptm un prag de semnicaie mai mare, deci o probabilitate mai mare de a grei, atunci intervalul de siguran este mai mic. Cu ct vrem s lucrm mai precis, deci s greim mai puin, cu att intervalul de siguran crete. Testul de semnicaie Mrimea intervalului de siguran depinde de faptul dac n jurul mediei lum o singur dat, de dou sau de trei ori valoarea erorii standard. Multiplul erorii standard (1, 2 sau 3), care determin mrimea intervalului de siguran, se numete test de semnicaie i se noteaz cu litera t. Ca atare, la o probabilitate de 68,26% i un prag de semnicaie de 31,74% valoarea lui t=1; la 95,45% probabilitate i 4,55% prag de semnicaie, valoarea lui t=2; la o probabilitate de 99,73% i un prag de semnicaie de 0,27% valoarea lui t=3. n mod obinuit, noi nu garantm rezultatele sau concluziile, obinute pe eantion, cu probabilitatea cu care acestea se gsesc n interiorul intervalului de siguran i cu contraprobabilitatea, cu probabilitatea de a grei, deci cu pragul de semnicaie. n medicin i biologie pragurile de semnicaie de 31,74%, de 4,55% i de 0,27%, corespunznd valorilor lui t de 1,2 sau 3, nu se prea folosesc, n schimb, rezultatele se garanteaz cu pragurile de semnicaie de 0,05 (5%), 0,01 (1%) i 0,001 (0,1%). Pe baz de cal-

cule s-a stabilit c pentru aceste praguri de semnicaie valorile corespunztoare ale lui t sunt de 1,96, 2,58 i 3,29. Ca atare, la pragul de semnicaie de 5%, valoarea lui t va 1,96, iar intervalul de siguran va : M 1.96.ES. La 1% prag de semnicaie valoarea lui t va de 2,58, iar mrimea intervalului de siguran va dat de M 2,58.ES. La 0,1% prag de semnicaie valoarea lui t va de 3,29, iar intervalul de siguran va dat de M: 3,29.ES. Aceste valori ale lui t rmn nemodicate n situaia n care lucrm pe eantioane al cror numr de frecvene este mai mare de 120. n situaia n care lucrm pe eantioane cu un numr de frecvene mai mic de 120, atunci valoarea testului de semnicaie se modic i se ia din tabelul testului t, pe care o gsim n crile de statistic. Acest tabel (Tab.23) are 4 coloane: prima coloan pentru gradul de libertate iar celelalte trei corespund celor trei praguri de semnicaie: 5%, 1%, 0,1%. Prin grad de libertate nelegem numrul de frecvene ale eantionului (sub 120)-1; deci GL = n-1. Tabelul 23 Tabelul testului t
Grad de libertate 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Ce t trebuie utilizat la un prag de semnicaie (0,05)=5% (0,01)=1% (0,001)=0,1% 12,706 63,657 4,303 9,925 31,598 3,182 5,841 12,941 2,776 4,604 8,610 2,571 4,032 6,859 2,447 3,707 5,959 2,365 3,499 5,405 2,306 3,355 5,041 2,262 3,250 4,781 2,228 3,169 4,587 2,201 3,106 4,437 2,179 3,055 4,218 2,160 2,977 4,140 2,145 2,977 4,140 2,131 2,947 4,073 2,120 2,921 4,015 2,110 2,898 3,965

94

BIOSTATISTICA

Noiuni de baz. Metode statistice

95

Continuare Tab. 23
Grad de libertate 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 50 60 70 80 90 100 120 peste Ce t trebuie utilizat la un prag de semnicaie (0,05)=5% 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,030 2,021 2,008 2,000 1,994 1,989 1,986 1,982 1,980 1,960 (0,01)=1% 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,724 2,704 2,678 2,660 2,648 2,638 2,631 2,625 2,617 2,580 (0,001)=0,1% 3,922 3,883 3,850 3,819 3,792 3,767 3,745 3,725 3,707 3,690 3,674 3,659 3,646 3,591 3,551 3,496 3,460 3,435 3,416 3,402 3,390 3,373 3,290

frecvenelor eantionului este mai mic de 120, acest produs se raporteaz la numrul frecvenelor minus unu. Formula erorii standard va deci: sau n 120

n care: ES = eroarea standard; Pe = probabilitatea eantionului; qe = contraprobabilitatea eantionului; n = numrul de frecvene ale eantionului. Eroarea standard procentual Eroarea standard n cazul valorilor medii este exprimat n uniti de msur diferite, ca i deviaia standard. Ea nu poate servi deci la compararea a dou sau mai multe eantioane, sub aspectul omogenitii, n asemenea situaii se calculeaz eroarea standard procentual, pentru a scpa de inuena unitii diferite de msur.

n cazul n care rezultatele cercetrilor noastre sunt exprimate procentual, deci avem o probabilitate i o contraprobabilitate de eantion, pentru a estima intervalul n care se gsete probabilitatea colectivitii generale sau probabilitatea populaiei ne folosim tot de valoarea erorii standard. Intervalul valoric n care se gsete probabilitatea fundamental sau a colectivitii generale se obine adunnd sau scznd din probabilitatea eantionului sau eantioanelor valoarea erorii standard. n aceast situaie eroarea standard ES este egal cu rdcina ptrat din produsul dintre probabilitatea i contraprobabilitatea eantionului, raportat la numrul frecvenelor acestuia, n cazul cnd numrul

n care: ES% = eroarea standard procentual; M = media aritmetic sau ponderat. n general, se consider c o eroare standard procentual cu valori sub 1% este acceptabil, n jurul lui 2% dubioas i peste 3% inacceptabil, evideniind un eantion neomogen, deci necorespunztor pentru a lucra pe el i a generaliza rezultatele. n primul nostru exemplu, ES% va :

deci corespunztoare. n cel de al doilea exemplu al nostru, ES% va :

deci necorespunztoare.

96

BIOSTATISTICA

Noiuni de baz. Metode statistice

97

Eroarea maxim admis sau eroarea limit este eroarea pe care o acceptm anticipat n alegerea eantionului, n funcie de natura cercetrii, de precizia cu care vrem s garantm rezultatele i de volumul sau mrimea eantionului. Ea reprezint deci intervalul de siguran n care se va ncadra media universului, cu o probabilitate dat. Eroarea maxim admis se noteaz cu litera greceasc delta (A) i se obine nmulind valoarea testului de semnicaie cu valoarea erorii standard. Formula de calcul: x=tES n care: x = eroarea maxim admis; t = testul de semnicaie; ES = eroarea standard. n primul nostru exemplu, admind un prag de semnicaie de 5%, x=1,96x0,57=1,11. n cel de al doilea exemplu al nostru, admind un prag de semnicaie de 5%, x=1,96x0,14=0,27. Pornind ns de la formula erorii standard:

n general valoarea erorii maxime admise nu trebuie s e mai mare de 1, atunci cnd lucrm cu valori absolute, sau de 1%, atunci cnd lucrm cu valori procentuale. Pornind de la formula x = t ES, putem stabili volumul sau mrimea eantionului pe care, efectund lucrarea sau cercetarea noastr, s putem asigura rezultatele cu un prag de semnicaie de 0,05 (5%), 0,01 (1%) sau 0,001 (0,1%). Cum procedm? nlocuim eroarea standard cu formula din care o obinem, n cazul valorilor medii i n cazul valorilor procentuale; formula devine: sau Trecnd pe n de partea cealalt a egalitii, vom avea: sau de unde: sau Din aceste formule de obinere a mrimii eantionului cunoatem: valoarea lui t, ntruct aceasta va 1,96, 2,58 sau 3,29, n funcie de pragul de semnicaie cu care dorim s garantm rezultatele (5%, 1% sau 0,1%); valoarea erorii limit, creia i atribuim anticipat valorile dorite n funcie de precizia cu care vrem s lucrm (0-1 sau 0-1%). Ce nu cunoatem, atunci cnd ne propunem s stabilim volumul sau mrimea eantionului, este valoarea lui sigma. Valoarea lui sigma o lum e din literatura de specialitate, dac exist cercetri fcute anterior de ali cercettori n domeniul n care vrem s lucrm noi, e o stabilim efectund cercetarea pe un eantion pilot alctuit dintr-un numr restrns de cazuri (nu mai puin de 5) i valoarea lui sigma, astfel obinut, se introduce n formula de calcul a mrimii eantionului. n primul nostru exemplu, admind o eroare limit de 0,5, dorind s garantm rezultatele cu un prag de semnicaie de 5% (deci t = 1,96) i avnd o valoare a lui sigma egal cu 6,25, mrimea eantionului ar trebui s e:

observm c valoarea acesteia este direct proporional cu valoarea lui sigma i invers proporional cu rdcina ptrat din numrul frecvenelor. Aceasta nseamn c urmrind o scdere a erorii standard de n ori, numrul de frecvene va trebui s creasc de n2 ori. De exemplu, dac am efectuat o cercetare pe 100 de cazuri clinice i am stabilit o =0,40, eroarea standard va :

Pentru a reduce eroarea standard de dou ori, de la 0,04 la 0,02, numrul de frecvene trebuie s creasc de 22 ori, deci de la 100 la 400 cazuri. Dac vrem s reducem de 4 ori valoarea erorii standard, numrul frecvenelor eantionului trebuie s creasc de 42 ori, deci de la 100 la 1600 cazuri,

98

BIOSTATISTICA

Noiuni de baz. Metode statistice

99

n = 24,52 = 600,25 cazuri. Deci, pentru a putea generaliza media valorilor TA (140,5 mm Hg) cu un prag de semnicaie de 5% i un delta de 0,5, era necesar s examinm 600 persoane, nu 120 cte au fost examinate. n cel de al doilea exemplu al nostru, admind o eroare limit de 0,3, dorind s garantm rezultatele cu un prag de semnicaie de 5% (deci t = 1,96) i avnd o valoare a lui sigma egal cu 3,16, mrimea eantionului ar trebui s e:

de unde: n = 41,122 = 1691 persoane. n al doilea exemplu

n = 20,62 = 424,36, respectiv 425 persoane. Deci, pentru a putea generaliza media dinilor afectai (5,84) cu un prag de semnicaie de 5% i un delta de 0,3, era sucient s examinm, din punct de vedere stomatologic, numai 425 persoane, nu 508 cte au fost examinate. Dac la aceleai valori ale lui delta i ale lui sigma am dorit s garantm rezultatele noastre cu un prag de semnicaie de 1%, n loc de 5%, atunci mrimea eantionului trebuia s e: n primul exemplu

n = 32,252 = 1040 cazuri. n al doilea exemplu:

n 27,22 = 739,81, deci 740 de persoane. Dac am dorit ca pragul de semnicaie s e 0,1% (t=3,29), pstrnd celelalte valori constante, atunci numrul de persoane examinate ar trebuit s e: n primul exemplu:

de unde: n = 34,62 = 1197,16 deci 1198 de persoane. Din aceste exemple putem conchide c numrul de frecvene ce alctuiesc eantionul depinde pe de o parte de valoarea pragului de semnicaie i de valoarea erorii limit, iar pe de alt parte de valoarea lui sigma. Cu ct pragul de semnicaie i eroarea limit vor avea valori mai mari, cu att numrul de frecvene va putea mai restrns i fcnd cercetarea pe un astfel de eantion putem generaliza rezultatele cu o posibilitate mai mare de a grei (p=5% i delta = 1). Cu ct pragul de semnicaie i eroarea limit vor avea valori mai mici (p=0,1% i delta = 0,01) cu att numrul de frecvene va trebui s e mai mare pentru ca lucrnd pe un astfel de eantion s putem garanta rezultatele cu o precizie mai mare (deci cu o posibilitate de a grei foarte mic). La aceleai valori ale pragului de semnicaie i ale erorii limit, eantionul va cu att mai mare, mai numeros, cu ct sigma va avea valori mai mari i cu ct sigma va mai mic, ca valoare, cu att numrul de frecvene va putea mai restrns. n cazul n care efectum un studiu longitudinal al morbiditii stomatologice, deci eantionul ales trebuie urmrit o perioad mai ndelungat de timp (cinci, zece ani), atunci pentru a ne asigura c numrul de frecvene nu va deveni insucient (prin plecarea din localitate sau prin deces a unor persoane), la numrul de frecvene stabilit prin calcul adugm nc 10%. Spre exemplu dac am stabilit c pentru eantionul nostru sunt suciente 425 persoane i acest eantion vrem s-l reexaminm la intervale de 2 ani, timp de zece ani, la numrul de 425 mai adugm 42-43 persoane (10%) i eantionul nostru va trebui s e de 468 persoane, n cazul cnd rezultatele cercetrii sunt exprimate procentual, atunci pentru stabilirea mrimii eantionului se folosete formula:

100

BIOSTATISTICA

Noiuni de baz. Metode statistice

101

Exemplul 1. ntr-un studiu longitudinal (prospectiv) al persoanelor, pe o perioad ndelungat de timp (5-10 ani), pentru a ne asigura c numrul de frecvene nu va diminua prin plecarea sau decesul unor persoane, la numrul de frecvene stabilit iniial adugm 10%; dac numrul de cazuri stabilit iniial a fost de 600, adugnd 10% vom avea nevoie de 660 cazuri. Exemplul 2. Dac ne propunem s generalizm incidena de 98% a afeciunilor stomatologice, cu un prag de semnicaie de 5% i o eroare maxim de 1%, stabilit pe un lot de populaie, atunci volumul eantionului va :

persoane
Formulele de mai sus, folosite pentru determinarea volumului eantionului, sunt valabile pentru situaia n care extragem mai multe eantioane din colectivitatea general sau nu cunoatem mrimea acesteia. Atunci cnd extragem un singur eantion, cum se ntmpl de obicei, i cunoatem mrimea colectivitii generale, formulele de obinere a lui n devin: sau

te pe colectivitatea general sunt asemntoare sau, din contr, difer semnicativ ntre ele, ne folosim de comparaia statistic. Compararea mediei unei colectiviti generale cu media unui eantion prin criteriul diferenei l erorii diferenei Cnd dispunem de o medie a colectivitii generale cu care comparm o medie de eantion, se procedeaz la stabilirea diferenei ntre cele dou medii scznd valoarea cea mai mic din cea mai mare. Se calculeaz dup aceea valoarea erorii standard pentru eantion. Cum se face interpretarea ? Dac diferena ntre cele dou medii absolut i de eantion este mai mare dect valoarea dubl sau tripl a erorii standard, atunci diferena este semnicativ statistic. D >2(3) x ES diferen semnicativ din punct de vedere statistic sau D> U x ES U coecient tabelar n funcie de riscul ; a crui valori se vor citi n Tab. 24: Tabelul 24 Limitele de semnicaie a distribuiei U
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 U 2 576 2.326 2,170 2.054 1,950 1,881 1,812 1,751 0,09 0,001 0,0001 0,00001 0,000001 0,0000001 0,00000001 0,000000001 U 1,695 3,29053 3.89059 4,41717 4,89164 5.32672 5,73073 6,10941

n care: N = mrimea colectivitii generale. Pentru a stabili dac dou sau mai multe rezultate obinute pe eantioane sau dac rezultatele obinute pe eantioane i cele obinute pe colectivitatea general sunt asemntoare sau, din contr, difer semnicativ ntre ele. ne folosim de comparaia statistic. Compararea statistic Am vzut c n medicin i biologie efectum cercetri pe eantion i rezultatele obinute le extrapolm la nivelul colectivitii generale, acestea ind valabile ca i cnd am efectuat cercetarea pe ntreaga colectivitate. Rezultatele obinute pe eantion difer ns de la un eantion la altul, ind cu att mai reprezentative cu ct eantionul este mai omogen i mai bine reprezentat numeric. Pentru a stabili dac dou sau mai multe rezultate obinute pe eantioane sau dac rezultatele obinute pe eantioane i cele obinu-

Acest lucru nseamn c din colectivitatea din care am extras eantionul exist anumii factori (de mediu zic, de alimentaie, de munc, etc.) care au determinat aceast diferen de valori. Dac din contr, diferena ntre media universului i media eantionului este mai mic dect valoarea dubl sau tripl a erorii standard, atunci diferena ntre cele dou medii este nesemnicativ din punct de vedere statistic, este ntmpltoare i se datorete faptului c am efectuat cercetarea pe un numr limitat de frecvene.

102

BIOSTATISTICA

Noiuni de baz. Metode statistice

103

n aceast situaie nu trebuie s cutm, cu orice pre, o justicare pentru diferena existent cci mrind numrul de frecvene al eantionului aceast diferen dispare. D < 2 (3)ES diferena nesemnicativ din punct de vedere statistic. Exemplul 3. Dac am examinat din punct de vedere al valorilor TA sistolice populaia adult a unei colectiviti generale i am obinut o medie a TA (=147,5 mm Hg), iar pe un eantion de 120 de persoane am obinut o medie M = 140,5 mm Hg i o eroare standard (ES) de 0,57 mm Hg, stabilind diferena dintre cele dou medii obinem: D=-M=147,5-140.5=7 mm Hg D>2(3)ES sau D>UxES D=7mmHg>Ux0,57, iar pentru =5% vom citi n tabelul distribuiei U valoarea de 1,98. Deci 7>1,98x0,57 deci diferena dintre cele dou medii, a colectivitii generale i a eantionului este semnicativ statistic pentru un risc =5%. Dac diferena dintre cele dou medii ar fost mai mic dect UxES atunci diferena ar fost nesemnicativ statistic i media eantionului s-ar ncadrat n limitele admisibile de variabilitate fa de media colectivitii generale, deci s-ar situat n interiorul intervalului de siguran, n acest caz diferena dintre cele dou medii s-ar datorat unui numr prea mic de cazuri examinate n cadrul eantionului i nu unor condiii de mediu diferite, existente n cele dou colectiviti. Exemplul 4. Dac examinndu-se din punct de vedere stomatologic populaia unui jude (colectivitatea general), s-a obinut o medie (Ma) egal cu 7,50 dini afectai, iar noi pe eantionul nostru am gsit o medie de 5,84 dini afectai i o eroare standard de 0,14 dini afectai, stabilind diferena ntre cele doua medii obinem: D = M sau D = Ma Me; D = 7,50 5,84 = 1,66 D (1,66) > 2 x 0,14 (3 x 0,14), deci diferena ntre cele dou medii este semnicativ din punct de vedere statistic. Dar dac media pe ntreaga colectivitate ar fost de 6,2 dini afectai i media eantionului nostru de 5,84 dini afectai, eroarea standard avnd aceeai valoare de 0,14, atunci: D = 6,10 5,84=0,26: D = 0,26 dini afectai D (0,26) < (2 x 0,14) i dect (3 x 0,14), dei diferena ar fost nesemnicativ din punct de vedere statistic.

Compararea mediilor a dou eantioane diferite (testul Student) Cnd cele dou medii care se compar sunt medii de eantion, stabilim diferena dintre cele dou medii: D = Me1 Me2. Calculm apoi eroarea diferenei (D) dintre cele dou valori medii: n care: D = eroarea diferenei ES21 = eroarea standard a eantionului unu la ptrat ES22 = eroarea standard doi la ptrat. Interpretarea se face astfel: dac diferena ntre cele dou medii de eantion este mai mare dect valoarea dubl sau tripl a erorii diferenei atunci diferena ntre medii este semnicativ din punct de vedere statistic, deci cele dou eantioane luate n studiu, nu aparin aceleiai colectiviti generale. Unul din eantioane a avut deci condiii diferite de cellalt. Ca atare n cadrul discutrii rezultatelor trebuie s stabilim care au fost acele condiii care au fcut ca rezultatele s difere semnicativ. Dac, din contr, diferena dintre cele dou medii de eantion este mai mic dect valoarea dubl sau tripl a erorii diferenei, atunci diferena este nesemnicativ din punct de vedere statistic, este ntmpltoare i se datorete diferenei de eantionaj. Ca atare nu trebuie s cutm neaprat o explicaie a acestei diferene. Exemplul 1. Pe dou eantioane extrase din dou colectiviti diferite s-au msurat valorile TA sistolice i am gsit pentru primul eantion alctuit din 120 persoane o medie M1 =140,5 mm Hg i o eroare standard egal cu ES1=0,57 mm Hg iar pentru al doilea eantion alctuit dintr-un numr de 160 de persoane am gsit o medie a TA sistolice M2=154,5 mm Hg i o eroare standard ES2=1,2. Stabilind diferena dintre medii obinem: |M1-M2|=|140,5-154,5| = 14 mm Hg, iar Diferena dintre cele dou medii de eantion ind egal cu 14, iar eroarea diferenei nmulit cu 1,96+2 care pentru un risc (coecient tabelar) de 5% i D=14 mm Hg > 1,96 D nseamn c diferena este semnicativ din punct de vedere statistic. Dac diferena dintre cele dou medii a

104

BIOSTATISTICA

Noiuni de baz. Metode statistice

105

celor dou eantioane ar fost mai mic dect valoarea 1,96-D atunci diferena ar fost nesemnicativ statistic, ambele eantioane provenind din colectiviti cu condiii asemntoare. Exemplul 2. Pe dou eantioane, extrase din dou colectiviti limitrofe, deci cu condiii asemntoare (aceiai factori de mediu zic, acelai mediu de alimentaie, aceleai condiii de munc, acelai nivel cultural-sanitar etc.), se stabilete media dinilor abseni i se gsete c la primul eantion, de 250 persoane (e1) media (Me1) este de 5,5 dini abseni, cu o eroare standard de 0,7 iar la al doilea eantion (e2), de 200 de persoane, media Me2 a dinilor abseni este de 6,2 iar eroarea standard de 0,2. Diferena ntre medii este: D = Me2 Me1 D = 6,2 5,5 = 0,7 dini abseni. dini abseni. Diferena dintre medii (0,7) ind mai mic dect valoarea diferenei (D = 0,72) nseamn c ntre cele dou medii nu exist o diferen semnicativ din punct de vedere statistic. Compararea a dou valori calitative prin criteriul diferenei i erorii diferenei (procentuale) Cnd avem de comparat o probabilitate a colectivitii generale cu o probabilitate de eantion, pentru a stabili semnicaia sau lipsa de semnicaie a diferenei dintre aceste probabiliti, procedm n felul urmtor: Stabilim diferena ntre cele dou probabiliti (probabilitatea n colectivitatea general i probabilitatea eantionului). Calculm apoi valoarea erorii standard pentru eantion, conform formulei:

Dac din contr, diferena dintre cele dou probabiliti este mai mic dect valoarea dubl sau tripl a erorii standard, atunci diferena este nesemnicativ, este ntmpltoare i se datorete diferenei de eantionaj. Exemplul 1. La 278362 nscui vii n anul Z n ara S proporia bieilor a fost 51,4% iar a fetelor de 43,5% eroarea standard a colectivitii generale:

Pe un eantion de 16901 nscui vii n anul Z n ara F proporia bieilor a fost de 51,2% iar a fetelor 48,8%.

Diferena ntre cele dou probabiliti D=P-p=51,4%-51,2%=0,2% iar ES n eantionul nostru este 0,14% diferena D=0,2% este mai mic dect U-ES=1,960,14 deci probabilitatea bieilor este aceeai n eantion ca i n colectivitatea general, diferena ind nesemnicativ statistic. De fapt pe glob diferena ntre cele dou sexe este aproximativ egal. Exemplul 2. Dac pe populaia unui jude s-a stabilit c probabilitatea parodontopatiei pariale este de 60% iar pe un eantion de 350 de locuitori s-a stabilit c parodontopatia parial este prezent la 80% din populaie, atunci diferena este: D = 80%-60%; D = 20% Eroarea standard pentru eantion va :

Interpretarea se face astfel: dac diferena dintre cele dou probabiliti este mai mare dect valoarea dubl sau tripl (U), a erorii standard, atunci diferena este semnicativ i trebuie s stabilim cror factori se datoreaz. D > U sau D > 2 (3)ES, atunci diferena este semnicativ statistic.

D (20%) > 2 x 2,13% (3 x 2,13%) = diferena este semnicativ din punct de vedere statistic, ntre cele dou probabiliti exist o diferen semnicativ din punct de vedere statistic, asigurnd aceasta armaie cu un prag de semnicaie de 5%, respectiv 1%. Cnd avem de comparat dou probabiliti obinute pe 2 eantioane, procedm n felul urmtor:

106

BIOSTATISTICA

Noiuni de baz. Metode statistice

107

Stabilim diferena dintre cele dou probabiliti de eantion: D = Pe1 Pe2 Calculm dup aceea eroarea diferenei dintre cele dou probabiliti, dup formula:

Dac diferena dintre cele dou probabiliti de eantion este mai mare dect valoarea dubl sau tripl a erorii diferenei, atunci diferena este semnicativ din punct de vedere statistic. D > 2 (3) D = diferen semnicativ statistic. Dac din contr, diferena dintre probabilitile de eantion este mai mic dect valoarea dubl sau tripl a erorii diferenei, atunci diferena este nesemnicativ din punct de vedere statistic, este ntmpltoare i se datorete diferenei de eantionaj. D < 2 (3)D = diferen nesemnicativ din punct de vedere statistic. Compararea a dou valori medii sau alternative prin criteriul testului student Semnicaia sau lipsa de semnicaie a dou valori medii sau procentuale, obinute pe eantioane, se poate stabili i pe o alt cale i anume pe calea testului Student. Atunci cnd, n cadrul eantionrii, am discutat i am denit testul t am spus c testul t este multiplul erorii standard i c cu ajutorul lui stabilim mrimea intervalului de siguran. Acest test t a crui valoare n cazul n care lucrm pe eantioane cu un numr mai mic de 120 frecvene o lum din tabela testului t, se numete t tabelar. Dar valoarea lui t o mai putem obine i prin calcul dup formula:

n care: t = testul de semnicaie D = diferena dintre valorile medii sau procentuale D = eroarea diferenei. Stabilim apoi valoarea lui t tabelar n felul urmtor: dac numrul frecvenelor celor dou eantioane depete suma de 120 atunci valoarea lui t tabelar o cunoatem ca ind 1,96 pentru un p = 0,05 (5%); 2,58 pentru un p = 0,01 (1%) sau 3,29 pentru un p = 0,001 (0,1%). Dac numrul nsumat de frecvene al celor dou eantioane ce se compar este mai mic de 120 de frecvene, atunci valoarea lui t tabelar o citim n tabela testului t n gradul de libertate dat de numrul nsumat de frecvene minus 2. Interpretarea se face n felul urmtor: dac valoarea lui t calculat este mai mare dect valoarea lui t tabelar atunci diferena ntre cele dou valori medii sau ntre cele dou probabiliti este semnicativ din punct de vedere statistic. t calculat > t tabelar = diferena semnicativ statistic. Dac din contra, valoarea lui t calculat este mai mic dect valoarea lui t tabelar, atunci diferena dintre cele dou medii sau dintre cele dou probabiliti este nesemnicativ din punct de vedere statistic. t calculat < t tabelar = diferen nesemnicativ. Pentru exemplicare i vericare, n acelai timp, vom lua aceleai exemple pe care le-am apreciat, sub aspectul semnicaiei diferenei i cu ajutorul erorii diferenei. n cazul comparrii a dou medii obinute pe eantioane diferena ntre medii a fost de 0,7 dini abseni iar eroarea diferenei a fost de 0,72 dini abseni atestnd o diferen nesemnicativ ntre medii, ncercnd s stabilim semnicaia sau lipsa de semnicaie pe calea testului t, obinem urmtoarele rezultate:

Acest t obinut raportnd valoarea diferenei la eroarea sa, se numete t calculat. n cazul n care dorim s apreciem semnicaia sau lipsa de semnicaie a diferenei dintre dou valori medii sau dou probabiliti, obinute pe eantioane, procedm n felul urmtor: calculm valoarea lui t, raportnd diferena dintre cele dou medii la eroarea sa.

108

BIOSTATISTICA

Noiuni de baz. Metode statistice

109

t tabelar, n cazul exemplului nostru datorit faptului c numrul de frecvene este mult mai mare dect 120, are valori constante (1,96; 2,58; 3,29). t calculat avnd o valoare mult mai mic (0,09) dect valoarea lui t tabelar (1,96; 2,58; 3,29) testeaz, aa dup cum am artat, o diferen nesemnicativ din punct de vedere statistic ntre cele dou medii de eantion. n cazul comparrii a dou valori procentuale, de eantion cu ajutorul testului t stabilim valoarea lui t calculat i valoarea lui t tabelar. Spre exemplu, s-a examinat un eantion de 84 de elevi i s-a stabilit c frecvena cariei dentare este de 90%, iar examinarea unui alt eantion de 60 de elevi, extrase dintr-o alt colectivitate colar, a evideniat prezena cariei dentare doar la 60% dintre acetia. Spre a stabili dac diferena dintre cele dou probabiliti este semnicativ din punct de vedere statistic sau nu, stabilim mai nti diferena dintre cele dou probabiliti: D = Pe1 Pe2 n care; D = diferena Pe1 = probabilitatea primului eantion Pe2 = probabilitatea celui de al doilea eantion D = 90% 60%=30% Diferena este egal cu 30%, calculm apoi eroarea diferenei conform formulei:

ttabelar=1,96; 2,58; 3,29 n funcie de pragul de semnicaie. Interpretarea t calculat (4,68) ind mai mare dect oricare din valorile lui t tabelar evideniaz aceeai diferen semnicativ ntre cele dou probabiliti de eantion. 2.12. Compararea valorilor absolute sau a distribuiilor de frecven: testul X2 Cnd avem de comparat ntre ele valori absolute sau distribuii de frecvene, folosim testul X2 (chi ptrat) al lui Pearson. Testul X2 se obine nsumnd rapoartele dintre ptratul diferenelor stabilite ntre frecvenele colectivitii generale (frecvenele teoretice) i frecvenele observate i frecvenele colectivitii generale. Formula de calcul:

Diferena dintre cele dou probabiliti (30%) ind mai mare dect triplul erorii diferenei (3*6,40%=19,20%) este semnicativ din punct de vedere statistic un prag de semnicaie sub 1%. D (30%) > D(19,20%) = diferen semnicativ statistic pentru un p<0,01. Folosind metoda testului t evideniem aceeai semnicaie a diferenei:

n care: X2 = testul de comparaie sau de concordan chi ptrat; FT = frecvenele universului sau frecvenele teoretice obinute prin calcul; FO = frecvenele observate sau frecvenele eantionului nostru. n situaia n care avem o distribuie a colectivitii generale pe care o comparm cu distribuia unui eantion, atunci introducem datele respective n formul i calculm valoarea lui X2, n situaia n care nu avem datele colectivitii generale, distribuia frecvenelor teoretice o obinem prin calcul de aici denumirea de frecvene teoretice aa cum vom vedea ulterior. Valoarea lui X2, obinut pe baza formulei de mai sus, se numete valoarea lui X2 calculat. Pentru a putea stabili dac ntre distribuia colectivitii generale i cea a eantionului observat de noi este sau nu o diferen semnicativ din punct de vedere statistic, avem nevoie ca i n cazul comparaiei cu ajutorul testului t de valoarea lui X2 tabelar. Aceast valoare o lum din tabelul testului X2 (Tab. 25), care este asemntoare cu tabelul Testului t.

110 Tabelul testului X2


Grad de libertate 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 (0,05) = 5% 3,8 5,9 7,8 9,4 11.1 12.6 14,1 15,5 16,9 18,3 197 21.0 22,4 23.7 ?50 26,3 27,6 28,9 30,1 31,4 23,7 33,9 35,2 36,4 37.7 38,9 40,1 41,3 42,6 43,8 55,8 67,5 79,1 90,5 101,9 113,1 124,3 Prag de semnicaie (0,01) = 1% 6,6 9,2 11,3 13,3 15,1 18,5 18,5 20,1 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4 34.8 36,2 37,6 38,9 40,3 41,6 43,6 44,3 45,6 47.0 48.3 49,6 50,9 63,7 76.2 88,4 100,4 112,3 124,1 135,8

BIOSTATISTICA

Noiuni de baz. Metode statistice

111

Tabelul 25

(0,001) = 0,1% 10,8 13,8 16,3 18,5 20,5 22,5 24,3 26,1 27,9 29,6 31,3 32,9 34.5 36,1 37,7 39,3 40,8 42,3 43,8 45,3 46,8 48,3 49,7 51,2 52,6 54.1 55,5 56,9 58,3 59,7 73,4 86,7 99,6 112,3 124,8 137.2 149,4

Valoarea lui X2 tabelar se citete n tabelul testului X2 innd seama de gradul de libertate i de pragul de semnicaie cu care vrem s garantm semnicaia sau lipsa de semnicaie dintre cele dou distribuii de frecvene. Prin grad de libertate n tabelul testului X2 nelegem produsul dintre numrul rndurilor tabelului (n care am introdus distribuiile de frecven) minus 1 i numrul coloanelor acestui tabel minus 1. GL=(NrR-1)-(NrC-1) Exemplul 1. Examinnd ntreaga populaie adult a unei colectiviti de 1337 locuitori sub aspectul valorilor tensiunii arteriale sistolice i a unui eantion de 120 de persoane am obinut urmtoarele distribuii de frecvene pe grupe de valori ale tensiunii arteriale sistolice (Tab. 26). Tabelul 26 Distribuii de frecvene pe grupe de valori ale tensiunii arteriale sistolice
xi=variabila TA sistolic 127,5 132,5 137,5 142,5 147,5 152,5 157,5 f0= frecvene observate 6 17 31 42 17 5 2 =120 ft=frecvene teoretice 180 210 290 320 230 65 42 =1337

Lsnd la o parte prima coloan a valorilor variabilei tensiunii arteriale sistolice i primul rnd cu denumirea coloanelor, tabelul nostru conine 7 rnduri i dou coloane, deci valoarea lui X2 tabelar o vom citi din tabelul X2 la gradul de libertate: GL = (nr. de rnduri 1) x (nr. de coloane 1)=(7-1) x (2-1 )=6. Valoarea tabelar a lui X2 pentru GL = 6 i un risc = 5% este de 12,6. Pentru un risc = 1% este de 18,5 i pentru un risc = 1 este de 22,5. 91 % X2 calculat se obine:

112

BIOSTATISTICA

Noiuni de baz. Metode statistice

113

Deci valoarea lui X2 calculat (1108,8) este mult mai mare dect valorile gsite n tabelul X2 pentru oricare din cele trei riscuri asumate (5%, 1%, 0,1%), deci diferena ntre cele dou distribuii de frecvene teoretice i observate este semnicativ din punct de vedere statistic, denotnd c n cadrul eantionului exist condiii diferite (factori de mediu, alimentari, de munc etc.) care au determinat aceast diferen, fa de cele din colectivitatea general. Dac valoarea lui X2 calculat ar fost mai mic dect valoarea lui X2 tabelar atunci diferena ntre cele dou distribuii de frecvene ar fost nesemnicativ din punct de vedere statistic, eantionul provenind din aceeai colectivitate general, reectnd condiiile acesteia. Exemplul 2. Dac am stabilit c pe teritoriul unui spital populaia adult (39.620 locuitori) se distribuie n raport cu dinii extrai ca n tabelul alturat (coloana FT), iar examinarea unui eantion de 5.500 persoane adulte evideniaz distribuia din coloana FO, atunci tabelul nostru lsnd la o parte prima coloan, coloana variantelor, i primul rnd, cu denumirea coloanelor, are 6 rnduri i 2 coloane, deci valoarea lui X2 tabelar o vom citi din tabelul testului X2 la gradul de libertate 5 (Tab. 27). Tabelul 27 Determinarea gradelor de libertate.
Nr. dini abseni X 1 2 3 4 5 6 Nr. pers. cot. gen. FT 2850 5250 10320 15810 3860 1530 Nr. pers. eantion FO 860 920 1130 1620 650 320

Deci X2 calculat are o valoare de 29503. Interpretarea diferenei dintre cele dou distribuii de frecvene (a colectivitii generale i a eantionului nostru) se face comparnd cele dou valori ale lui X2 (obinute prin calcul i din tabele), ca i n cazul testului t. Dac valoarea lui X2 calculat este mai mare dect a lui X2 tabelar, atunci ntre cele dou distribuii de frecvene este o diferen semnicativ din punct de vedere statistic. Dac, din contr, valoarea lui X2 calculat este mai mic dect valoarea lui X2 tabelar, diferena ntre distribuii este nesemnicativ, n exemplul nostru X2 calculat, avnd valoarea de 38116, adic mai mare dect a lui X2 tabelar, testeaz o diferen semnicativ din punct de vedere statistic ntre cele dou distribuii de frecvene. n situaia n care nu cunoatem distribuia colectivitii generale, stabilim prin calcul valorile frecvenelor teoretice. Exemplul 3. ntr-o secie de oncologie au fost internai cu diagnostic de cancer pulmonar un numr de 78 de bolnavi. Dintre acetia 69 erau brbai i 9 femei. Din cei 69 brbai bolnavi de cancer pulmonar 39 erau fumtori iar 30 nefumtori. Dintre cele 9 femei cu cancer pulmonar 6 erau fumtoare i 3 nefumtoare. Pentru a stabili dac ntre bolnavii fumtori i nefumtori cu cancer bronhopulmonar exist diferene semnicative din punct de vedere statistic sau nu, vom introduce datele n Tab. 28. Tabelul 28 Numrul de bolnavii fumtori i nefumtori cu cancer bronhopulmonar
Cancer pulmonar Brbai Femei Total Fumtori FO FT 39=a 39,8=A 6= b 5,2=B 45=a+b 45=A+B Nefumtori FO FT 30=c 29,2=C 3=d 3,8=D 33=c+d 33=C+D Total 69=a+c 9=b+d 78=a+b+c+d=n

GL = (6-1) (2-1) = 5 La acest grad de libertate, valoarea lui X2 tabelar va de: 11,1 pentru pragul de semnicaie 0,05 (5%); 15,1 pentru pragul de semnicaie 0,01 (1%); i 20,5 pentru pragul de semnicaie 0,001 (0,1%). Valoarea lui X2 calculat o obinem prin calcul. Introducnd datele n formula lui X2 calculat, avem:

Admind de la nceput c ntre fumtori i nefumtori nu exist diferene statistice, deci admind ipoteza nul (H0), pe baza unei re-

114

BIOSTATISTICA

Noiuni de baz. Metode statistice

115

guli de trei simple, pornind de la valorile frecvenelor observate se pot stabilii valorile frecvenelor teoretice astfel: Dac la 78 bolnavi avem 45 fumtori la 69 bolnavi... avem x fumtori

n mod asemntor vom obine prin calcul i celelalte valori (B, C, D), pe care le vom introduce n tabel corespunztor frecvenelor teoretice. Dispunnd n acest fel att de valorile frecvenelor observate ct i de frecvenele teoretice putem prin formula menionat anterior:

Vrem s tim dac ntre bieii cu carii i fetele cu carii exist o diferen semnicativ din punct de vedere statistic sau nu. Cu alte cuvinte, vrem s vedem dac aceast afeciune, caria dentar, are o predispoziie legat de sex sau din contr sexul nu are nici o inuen n determinarea cariei dentare. Pentru a putea calcula valoarea lui X2 avem nevoie de frecvenele teoretice. Cum le obinem? Introducem datele cunoscute, deci frecvenele observate, ntr-un tabel quadruplu (un tabel cu dou intrri i cu ieiri: cu 2 rnduri i 2 coloane) (Tab. 29). Tabelul 29 Numrul de elevi cu carie i far carie n funcie de sex
LOTUL DE ELEVI Biei Fete TOTAL ELEVI CU CARII FO FT 250 249,50 180 480,50 430 430 ELEVI FR CARII FO FT 220 220,50 160 159,50 380 380 TOTAL ELEVI 470 340 810

se obine valoarea lui X2 calculat astfel:

deci X2 calculat =0,33. Pentru a vedea dac diferena dintre brbaii i femeile fumtoare sau ntre brbaii i femeile nefumtoare este sau nu o diferen semnicativ din punct de vedere statistic comparm valorile XC2=0,33 cu valoarea Xt2 din tabele care pentru un risc =5% este de 3,8, pentru =1% este 6,6, iar pentru =0,1% este 10,8. n exemplul nostru X2 calculat este mai mic dect X2 tabelar pentru oricare din riscurile de mai sus asumate, deci diferena este nesemnicativ statistic. Dac X2 calculat ar fost mai mare dect X2 tabelar atunci diferena ar fost semnicativ statistic, ceea ce ar demonstrat c sexul joac un rol important n cancerul bronhopulmonar. Exemplul 4. Examinnd din punct de vedere stomatologic un eantion de 810 elevi (470 biei i 340 fete) dintr-o colectivitate colar, am constatat urmtoarele: => dintre cei 470 biei examinai 250 prezentau carii dentare, iar 220 erau fr carii; => la fete 180 prezentau carii dentare iar 160 erau fr carii.

Frecvenele teoretice le obinem prin calcul. Considerm c ntre incidena cariei dentare la biei i la fete nu exist nici un fel de deosebire. Acceptm, deci, de la nceput, principiul ipotezei nule i universul nostru este reprezentat de numrul total al frecvenelor. Cu ajutorul regulii de trei simple obinem frecvenele teoretice, fcnd raionamentul: dac la cei 810 elevi examinai corespund 430 elevi cu carii, dintre cei 470 biei examinai ci vor avea carii? X = 470430:810= 249,50 Deci, frecvenele teoretice pentru bieii cu carii, 249,50, le introducem n csua corespunztoare a tabelului. Dac la cei 810 elevi au fost gsii 380 fr carii, la cei 470 biei ci vor fr carii? X = 470380:810 = 220,50 Acelai raionament l facem i pentru obinerea frecvenelor teoretice ale fetelor cu i fr carii: X = 340430:810 = 180,50 deci frecvenele teoretice ale fetelor cu carii, 180,50, le introducem n csua corespunztoare a tabelului. X = 340380: 810= 159,50 deci frecvenele teoretice ale fetelor fr carii le introducem n csua corespunztoare a tabelului nostru.

116

BIOSTATISTICA

Noiuni de baz. Metode statistice

117

Avnd acum frecvenele teoretice i pe cele observate, le introducem n formula lui X2 i obinem valoarea lui X2 calculat:

Aplicnd formula simplicat obinem:

deci X2 calculat = 0, 0049. X2 tabelar, avnd n vedere c datele noastre le-am nscris ntr-un tabel cu dou rnduri i cu dou coloane, l vom citi din tabelul testului X2 la gradul de libertate 1 i va avea valoarea: 3,84 pentru pragul de semnicaie de 0,05 (5%); 6,63 pentru pragul de semnicaie de 0,01 (1%); i 10,80 pentru pragul de semnicaie de 0,001 (0,1%). X2 calculat avnd o valoare mult mai mic (0,0049) dect valoarea Iui X2 tabelar (3,84; 5,64; 10,80) testeaz lipsa de semnicaie a diferenei dintre frecvena cariei dentare la biei i la fete. Cu alte cuvinte, caria dentar este la fel de frecvent att la biei ct i la fete, deci nu are o predispoziie de sex. Calea de obinere a lui x2 calculat Situaia n care frecvenele teoretice trebuie s le obinem prin calcul este anevoioas, presupunnd calcule laborioase, n aceast situaie putem folosi o alt formul, mai simpl, n activitatea practic i anume:

X2 pentru un risc =5% i pentru GL=(numrul de rnduri-1) x (numr de coloane 1)=(2-1) x (2-1)=1 are valoarea de 3,8. Valoarea calculat este mai mic dect valoarea tabelar deci diferena este nesemnicativ ceea ce testeaz aceeai lips de semnicaie ntre brbaii i femeile fumtoare sau brbaii i femeile nefumtoare. Exemplul 6. S vedem dac exist diferene semnicative ntre rezultatele tratamentului cu streptomicin i penicilin la dou loturi de copii sub un an suferind de bronhopneumonie acut, am urmrit un numr de 20 de copii pentru ecare lot. Rezultatele obinute au fost introduse n Tab. 31. Tabelul 31 Rezultatele tratamentului bolnavilor cu bronhopneumonie
Bolnavi bronhopneumonie Tratament penicilin Tratament streptomicin Total Vindecai a=14 c=16 a+c-n3=30 Complicaii b=6 d=4 b+d=n4=10 Total a+b=n1=20 c+d=n2=20 a+b+c+d=N=40

Aceast formul rezult din desfacerea binomului lui Newton (a+b)n. Exemplul 5. Bolnavii de cancer pulmonar fumtori i nefumtori (Tab.30). Tabelul 30. Numrul de bolnavii fumtori i nefumtori cu cancer bronhopulmonar
Cancer pulmonar Brbai Femei Total Fumtori 39=a 6=c 45=a+c=n3 Nefumtori 30= b 3=d 33=b+d=n Total 69=a+b=n, 9=c+d=n2 78-a+b+c+d=N

Xt2=3,8 pentru =5% Rezult c valoarea XC2<Xt2 ceea ce nseamn c rezultatele ntre cele dou tratamente (penicilin i streptomicin) folosite n tratamentul bronhopneumoniei nu difer semnicativ la cele dou loturi de copii bolnavi.

Legend: a=brbai fumtori b=brbai nefumtori c=femei fumtoare d=femei nefumtoare a+b+c+d-N numrul total de cazuri

118

CAPITOLUL METODOLOGIA GENERAL A CERCETRII III STATISTICE

BIOSTATISTICA

Metodologia general a cercetrii statistice

119

Dezvoltarea istoric a statisticii, complexitatea obiectului su de cercetare, multitudinea proceselor i fenomenelor social-economice i culturale pe care le studiaz au determinat apariia procesului de difereniere pe ramuri a statisticii: statistica economic, statistica demograc, statistica medical, statistica industrial etc. Indiferent de domeniul de activitate, totalitatea operaiunilor folosite n cercetarea statistic poart denumirea de metodologia cercetrii statistice. n cadrul metodologiei statistice, diferitele operaiuni se succed ntr-o ordine bine stabilit, reprezentnd n desfurarea lor cronologic etapele cercetrii statistice ce trebuie respectate n cercetrile ntreprinse n toate domeniile de activitate. Uneori, pentru elucidarea unor mecanisme sau precizarea aciunii sau rolului anumitor substane n organism, ntreprindem cercetri experimentale pe animale de laborator, a cror rezultate ncercm s le transpunem la om. Nu trebuie s uitm ns nicicnd c rezultatele obinute pe animale nu sunt superpozabile cu cele nregistrate la om. Astzi dezvoltarea impetuoas a tiinelor, n mod deosebit a celor tehnice, este indisolubil legat de utilizarea unor metode noi, complexe i precise, de evaluare i cuanticare a diferitelor aspecte calitative, obinute pn de curnd prin vechile metode descriptive, mai puin precise i exacte. Aceste cteva aspecte generale justic i impun cunoaterea i aplicarea metodei statistice n general, a statisticii matematice ndeosebi, alturi de celelalte metode de investigaie, n cercetrile clinice, de laborator, ca i n cele menite s contribuie la cunoaterea i aprecierea strii de sntate a populaiei. Etapele principale ale cercetrii statistice sunt: adunarea sau observarea, prelucrarea, prezentarea i analiza materialului statistic.

3.1. Adunarea sau observarea materialului statistic Este operaia care ne permite s obinem datele necesare efecturii unei cercetri statistice. Termenul de ADUNAREA se utilizeaz atunci cnd datele necesare efecturii lucrrii statistice le lum din evidene primare aate la nivelul unitilor sanitare, ca rezultat al activitii personalului acestor uniti.

Exemplul 1. Dac ne propunem s stabilim incidena hipertensiunii arteriale ntr-o secie de spital, extragem ele medicale ale bolnavilor din staionar, care prezint valori ale TA peste limitele normale (140/90 mm Hg) din secia de boli interne. Aceste date le supunem ulterior operaiei de prelucrare a materialului statistic. Exemplul 2. Dac ne propunem s facem un studiu privind boala parodontal, atunci datele necesare efecturii studiului le extragem din registrele sau ele de consultaie ale bolnavilor examinai la nivelul unitilor stomatologice dintr-un anumit teritoriu. Termenul de observare se utilizeaz atunci cnd materialul necesar efecturii lucrrii l obinem ca rezultat nemijlocit al muncii proprii. Exemplul 3. n cadrul stabilirii incidenei TA la populaia dintr-un teritoriu, examinm o parte (lot) din colectivitatea respectiv, prin examen clinic i de laborator, consemnnd n mijloacele de nregistrare valorile tensionale obinute de noi pentru ecare persoan examinat. Exemplul 4. Dac ne propunem s efectum o cercetare din care s reias rolul uorului din apa potabil asupra cariei dentare, n cazul observrii materialului statistic, lum un lot de animale crora le administrm ap cu uor n diferite concentraii, o anumit perioad de timp i consemnm n protocoalele de lucru, ntocmite n acest scop, toate modicrile ce survin la animalele din lotul de cercetare, comparativ cu un lot martor. Adunarea sau observarea materialului statistic constituie operaiunea de baz ntr-o cercetare statistic, deoarece corectitudinea i valabilitatea rezultatelor depind n cea mai mare msur de modul n care se efectueaz aceasta. Ca atare adunarea materialului se va face cu mare atenie, n mod obiectiv, fr a ncerca s denaturm datele, pe baza unor idei preconcepute. S nu se uite niciodat c n cercetarea tiinic un nu categoric este mai valoros dect un da ndoielnic. Buna reuit a etapei de adunare a materialului statistic depinde n egal msur i de uniformitatea metodelor i mijloacelor de lucru. ntruct cercetrile statistice incumb un volum mare de munc, n efectuarea acestora sunt angrenate mai multe persoane. Pentru realizarea uniformitii n munca de adunare a materialului se folosesc metode i mijloace de lucru judicios ntocmite, iar personalul care particip la operaia de adunare a materialului este bine i amnunit instruit asupra coninutului mijloacelor de nregistrare.

120

BIOSTATISTICA

Metodologia general a cercetrii statistice

121

Operaiunea de adunare sau observare a materialului statistic cuprinde urmtoarele subetape: Subetapa datelor preliminare sau a datelor pregtitoare n care, nainte de efectuarea propriu-zis a operaiei de adunare a materialului statistic, se stabilesc i se precizeaz unele noiuni absolut necesare bunei desfurri a operaiei propriu-zise. Stabilirea scopului i obiectului lucrrii n aceast subetap se precizeaz scopul n care se efectueaz lucrarea statistic i obiectul acesteia. Exemplul 5. n cazul cercetrii incidenei hipertensiunii arteriale scopul incidenei este acela de a cunoate care sunt factorii biologici, de mediu, sociali-economici i comportamentali care au determinat o inciden crescut a bolii hipertensive, n vederea eliminrii sau diminurii acestora, iar obiectul lucrrii statistice este persoana creia i s-au determinat valorile TA. Exemplul 6. n cazul cercetrii experimentale: rolul uorului n protejarea organismului mpotriva cariei dentare, scopul urmrit este acela de a cunoate n ce msur uorul, administrat n anumite concentraii, n apa de but, exercit asupra organismului un rol protector mpotriva cariei dentare, iar obiectul lucrrii l constituie caria dentar. Este necesar s stabilim n cadrul datelor pregtitoare scopul i obiectul lucrrii, ntruct coninutul mijloacelor de observare a materialului este impus de aceste dou noiuni. Delimitarea cercetrii Dup ce s-a stabilit scopul i obiectul cercetrii statistice se trece la delimitarea cercetrii. Aceast delimitare se face n: timp, stabilindu-se, n funcie de natura problemei cercetate, perioada de timp n care ne propunem s adunm sau s observm materialul necesar efecturii lucrrii. Din acest punct de vedere trebuie precizat c sunt cercetri care se fac pe baza materialului obinut la un moment dat, pe baza unei singure examinri iar altele necesit perioade mai lungi sau mai scurte de timp. Spre exemplu starea de morbiditate prin HTA i respectiv prin afeciuni stomatologice se poate cunoate pe baza unei singure examinri a populaiei dintr-o colectivitate, fr a necesita o urmrire n timp a acesteia.

Ea e similar cu un instantaneu fotograc care exprim ce se petrece la un moment dat n snul populaiei din punct de vedere stomatologic, sau al valorilor tensiunii arteriale. n cazul urmririi n dinamic a TA la populaia unei localiti, examinarea populaiei din aceast colectivitate se face la anumite intervale de timp, pentru a stabili dac msurile preconizate pentru combaterea HTA sunt eciente sau nu. n cazul exemplului cu administrarea uorului, n diferite concentraii, n apa potabil, lotul de populaie examinat iniial trebuie urmrit i examinat, comparativ cu un lot martor, la diferite intervale de timp, pentru a stabili dac uorul exercit sau nu un rol protector mpotriva cariei dentare; spaiu; cu care ocazie se stabilete teritoriul pe care ne propunem s efectum cercetarea. Acest teritoriu poate s e restrns (o clas, o coal, o ntreprindere) sau mai extins (o circumscripie, o comun, teritoriul deservit de un anumit spital unicat etc.), n funcie de natura problemei pe care o cercetm i de scopul i obiectul cercetrii. Cnd cercetarea se extinde pe un teritoriu mai mare, atunci se respect de obicei mprirea administrativ a teritoriului: sat, comun, raion etc. Starea de morbiditate prin HTA se poate stabili e la populaia unei colectiviti restrnse (ntreprindere, sat, comun) e la populaia ntregului raion. Starea de morbiditate prin afeciuni stomatologice se poate stabili spre exemplu, e la populaia colar de o anumit vrst sau la toat populaia colectivitii, pe ani de vrst sau pe grupe de vrst; volum, urmrind s stabilim mrimea colectivitii pe care o vom lua n studiu, sub raport cantitativ, deci numrul de uniti statistice ce urmeaz a cercetate. Cercetrile statistice se fac e pe totalul unitilor statistice cuprinse ntr-o populaie i atunci se spune c s-a lucrat pe univers, colectivitate statistic general, e pe un numr limitat de uniti statistice din cadrul populaiei i atunci se spune c s-a lucrat pe eantion. Cele mai veridice concluzii se obin atunci cnd cercetarea a cuprins totalitatea unitilor statistice ce compun o mulime, o colectivitate. Asemenea cercetri ns se efectueaz foarte rar ntruct sunt foarte costisitoare necesitnd sume mari de bani, sunt greu de organizat, datorit numrului mare de personal, de aparatur, reactivi i necesit timp ndelungat. Uneori nici nu este necesar s efectum cercetri pe univers

122

BIOSTATISTICA

Metodologia general a cercetrii statistice

123

ntruct statistica matematic ne ofer criterii exacte pentru stabilirea numeric a colectivitii ce urmeaz a cercetat, pentru ca concluziile obinute n urma cercetrii s poat generalizate ca i cnd am lucrat pe univers sau pe colectivitatea statistic general. Stabilirea unitii statistice Stabilirea unitii statistice adic a prii componente a mulimii sau colectivitii expus cercetrii. Este necesar s stabilim unitatea statistic cu care lucrm pentru c nu totdeauna aceasta este distinct, iar uneori ea e impus de natura cercetrii i scopul urmrit. Exemplul 1. Dac dorim s stabilim incidena HTA ntr-o colectivitate atunci ecare persoan examinat care prezint valori crescute ale TA constituie o unitate statistic. Ea reprezint un caz nou de mbolnvire. Prin caz nou de mbolnvire nelegem orice mbolnvire din momentul depistrii sau lurii n eviden pn n momentul vindecrii sau decesului. Cazul nou de mbolnvire nu se confund nici cu persoana bolnav nici cu consultaia, pentru c una i aceeai persoan poate prezenta mai multe mbolnviri noi ntr-o anumit perioad de timp i pentru aceeai mbolnvire persoana respectiv se poate prezenta de mai multe ori la consultaie. n cazul recensmntului de populaie unitatea statistic este persoana recenzat cu caracteristicile: vrst, sex, naionalitate, profesiune etc. Alte exemple de uniti statistice sunt: familia, cstoria, nscutul viu, gravida, instituia medical etc. Exemplul 2. Dac iniiem o cercetare n scopul cunoaterii morbiditii stomatologice pe afeciuni, atunci ecare afeciune nou constituie o unitate statistic i o folosim n calculul morbiditii. Prin afeciune nou sau caz nou de mbolnvire nelegem n cazul nostru, orice afeciune stomatologic din momentul depistrii pn n momentul vindecrii. Deci pentru a stabili care este morbiditatea stomatologic prin caria dentar, ntr-o anumit colectivitate, nregistrm toate cariile dentare noi, depistate la populaia examinat, pe care le etichetm ca uniti statistice i nu persoana care prezint caria dentar constituie unitatea statistic, n cazul stabilirii morbiditii pe contingente, prin afeciuni stomatologice, unitatea statistic o constituie persoana care cu ocazia examinrii prezint afeciuni stomatologice, n calcularea morbiditii generale nu persoana bolnav constituie unitatea statistic, ci cazul nou de mbolnvire.

Aceeai persoan poate prezenta, n decurs de un an, mai multe mbolnviri noi. Fiecare dintre aceste mbolnviri constituie uniti statistice distincte. De asemenea pentru ecare mbolnvire nou, care poate dura uneori o perioad mai lung de timp, persoana bolnav se poate prezenta de mai multe ori la medic, fr ca aceste consultaii s e etichetate ca mbolnviri noi i deci ca uniti statistice distincte. Stabilirea programului adunrii sau observrii materialului statistic Dup ce am fcut delimitarea lucrrii statistice n timp, spaiu i volum, este necesar s stabilim caracteristicile ecrei uniti statistice cercetate. Prin caracteristic (variabil) se nelege trstura sau nsuirea proprie ecrei uniti statistice. Exemplul 1. n cazul cercetrii morbiditii prin HTA ntr-o colectivitate se pot lua n considerare urmtoarele caracteristici (variabile): vrsta, sexul, localitatea de domiciliu, profesia, factorii de risc etc. Exemplul 2. n cazul cercetrii morbiditii stomatologice ntr-o anume colectivitate, se vor lua n considerare urmtoarele caracteristici: cazul nou de boal, vrsta, sexul, localitatea de domiciliu, natura mbolnvirii noi, profesia etc. Caracteristicile sau variabilele pot de tip cantitativ exprimate n uniti de msur ca: nlime, greutate, talie, perimetru toracic, n cazul dezvoltrii zice, glicemie, TA, temperatur, puls; i de tip calitativ cnd exprim o calitate ce nu poate msurat prin uniti de msur, de exemplu: sexul, culoarea tegumentelor, starea la externare a unor bolnavi (care poate vindecat, ameliorat, agravat). Aceste caracteristici calitative sau cantitative trebuie exprimate clar i precis, nct persoanele care particip la operaia de adunare a materialului statistic s nu e puse n situaia de a le da o interpretare subiectiv sau greit. A stabili caracteristicile unitilor statistice, ce vor adunate sau observate n cadrul efecturii lucrrii, nseamn a stabili programul operaiei de adunare a materialului statistic. Planul observrii sau adunrii materialului statistic Dup ce programul de adunare a materialului statistic a fost stabilit se trece la elaborarea planului de adunare a materialului statistic. Planul adunrii materialului statistic cuprinde date privitoare la meto-

124

BIOSTATISTICA

Metodologia general a cercetrii statistice

125

dologia adunrii materialului i date privitoare la organizarea adunrii materialului statistic. Datele metodologice ale adunrii materialului statistic se refer la datele pe care le-am discutat mai nainte i anume: stabilirea scopului i obiectul lucrrii sau cercetrii, delimitarea n timp, spaiu i volum a cercetrii, stabilirea unitii statistice, elaborarea programului adunrii materialului. Datele organizatorice ale planului se refer la problemele privitoare la documentarea n tema luat n studiu, la ntocmirea sau procurarea formularelor de nregistrare, la alegerea i instruirea personalului ce va participa la adunarea materialului statistic etc. Planul cercetrii este deci mai cuprinztor dect programul adunrii materialului, el incluznd i planul prelucrrii, al prezentrii i analizei materialului, n concordan cu ipoteza de lucru de la care am pornit. Subetapa stabilirii metodelor de adunare sau nregistrare a materialului statistic Metodele folosite pentru nregistrarea materialului statistic depind de faptul dac ne-am propus n cadrul datelor pregtitoare s lucrm pe univers sau pe eantion reprezentativ. Din acest punct de vedere metodele de nregistrare se mpart n dou grupe mari: Metode de nregistrare total Dac ne-am propus s lucrm pe univers deci pe ntreaga colectivitate, atunci metodele de nregistrare vor totale nregistrnd toate unitile statistice ce compun o colectivitate iar dac ne-am propus s lucrm pe eantion, deci numai pe o parte din colectivitate, atunci metodele folosite pentru nregistrarea materialului vor metode pariale. Metodele de nregistrare total pot la rndul lor: Totale continue, cnd unitile statistice se nregistreaz n totalitate dar n msura n care fenomenul are loc. Spre exemplu dac ne propunem s facem un studiu asupra fenomenului de natalitate i mortalitate, ntr-un anumit teritoriu sau ntr-o anumit colectivitate, atunci se nregistreaz toi nscuii vii sau toate decesele din teritoriul sau colectivitatea respectiv ns pe msur ce ele se produc. Aceste nregistrri sunt limitate n spaiu dar nu n timp. Totale periodice, cnd nregistrarea unitilor statistice dintr-o colectivitate sau dintr-un teritoriu se face n totalitate dar numai la anumite

intervale de timp. Aceste nregistrri sunt limitate att n timp ct i n spaiu. Ele redau aspecte statistice, la un moment dat, ale fenomenului studiat, spre deosebire de nregistrrile totale continue care redau dinamica fenomenului. Un exemplu de nregistrare total periodic o constituie recensmintele de populaie, care de obicei se efectueaz la intervale de 10 ani i cuprind populaia ntregii ri. Dei metoda de nregistrare total continu este superioar celei totale periodice, datorit volumului mare de munc, costului ridicat, necesitnd un mare numr de personal specializat, ea se aplic numai n situaii aparte. Metode de nregistrare parial Le utilizm atunci cnd ne propunem s efectum cercetarea pe o parte din colectivitate, pe eantion. Lucrm pe o parte din colectivitate folosind metode de nregistrare parial, atunci cnd e c nu cunoatem colectivitatea general, deci nu o putem aborda, e c volumul de munc este prea mare i necesit fonduri mari, timp ndelungat, personal numeros, baz material bogat i putem obine aceleai rezultate, aceleai concluzii, lucrnd numai pe o parte din unitile statistice ce compun colectivitatea. Printre metodele de nregistrare parial amintim: Estimaia este o metod de nregistrare parial care, pe baza unor sondaje fcute n snul colectivitii generale, luat n studiu, ncearc s caracterizeze, s trag concluzii de ordin general valabil pentru ntreaga colectivitate. Exemplul 1. Pentru a cunoate morbiditatea prin HTA ntr-o colectivitate se examineaz prin extragere aleatorie un numr limitat de cazuri (din toate grupele de vrst, de ambele sexe, de diferite profesii) reprezentnd un eantion din populaia general, iar rezultatele obinute se vor putea generaliza, estima, n colectivitatea general. Exemplul 2. Pentru a cunoate starea de morbiditate prin afeciuni stomatologice la elevii dintr-o colectivitate colar, se examineaz din punct de vedere stomatologic, prin sondaj, un numr de elevi din ecare clas a colii respective, iar rezultatele obinute n urma prelucrrii datelor, investigaiilor de specialitate, sunt generalizate, ca i cnd studiul sau examinarea s-ar extins asupra tuturor elevilor din respectiva colectivitate colar. De menionat este faptul c eantionul pe care s-a lucrat a trebuit s e reprezentativ att sub aspect cantitativ, ct i sub aspect ca-

126

BIOSTATISTICA

Metodologia general a cercetrii statistice

127

litativ, adic al celorlalte atribute ca: sex, grup de vrst, condiii de alimentaie, de locuin etc. Estimaia, pe baza unor sondaje mai mult sau mai puin numeroase fcute n colectivitate, aproximeaz frecvena unor fenomene n snul colectivitii fr a avea pretenia de exactitate (ea introduce ntotdeauna un risc i o eroare maxim admis). Cu ct numrul de investigai din eantion este mai mic cu att rezultatele sunt mai imprecise i cu ct numrul de cazuri din eantion este mai mare, rezultatele sunt mai exacte. Metoda eantionului sau selecia este metoda de nregistrare parial care, pe baza examinrii unei pri reprezentative din punct de vedere cantitativ (numr cazuri) i calitativ (atribute) din unitile statistice ce compun colectivitatea general, urmrete s caracterizeze ntreaga colectivitate din care a fost extras eantionul. Sub aspect cantitativ eantionul va determinat pe baza unor formule matematice ce vor prezentate la capitolul eantionaj, iar sub aspect calitativ variabilele vor stabilite n funcie de natura fenomenelor pe care le cercetm. Exemplul 1. Pentru a stabili incidena HTA ntr-o colectivitate vom examina un numr limitat de cazuri, n ceea ce privete TA i diferitele atribute sau variabile: sex, vrst, domiciliu, profesie, urmrindu-se o straticare a acestor cazuri n eantion asemntoare cu straticarea din populaia general. Exemplul 2. Dac ne propunem s cunoatem starea de morbiditate prin afeciuni stomatologice la populaia infantil dintr-un raion, nu vom proceda la examinarea activ de specialitate a ntregii populaii infantile, ci vom seleciona colectiviti reprezentative din raion (din mediul urban, din mediul industrial, din mediul rural, cu diferite forme de relief, cu nivel social-economic diferit, cu obiceiuri culinare specice, cu nivel sanitar diferit, de vrste diferite etc.) pe care, examinndu-le din punct de vedere stomatologic, vom putea stabili aspectele de morbiditate ce caracterizeaz ntreaga populaie infantil din raion. n anumite situaii, dictate de specicul bolii cercetate, cu anitate sau predilecie pentru anumite grupe de vrst, vom lua n studiu numai acele vrste la care maladia respectiv este mai frecvent. Spre exemplu, dac ne propunem s cunoatem morbiditatea prin afeciuni parodontale ntr-o colectivitate, eantionul pe care vom lucra nu va cuprinde populaia de toate vrstele ci cu precdere vrstele de 35-40 ani, ntruct incidena mbolnvirilor prin afeciuni parodontale e mai

crescut la aceste vrste, n asemenea situaie spunem c am examinat i nregistrat partea de baz a colectivitii. La fel procedm n cazul cercetrii morbiditii prin afeciuni cardio-vasculare etc. Monograa este o metod de nregistrare parial utilizat pentru studiul unei singure colectiviti (localitate, circumscripie, ntreprindere, coal) sau a unui singur fenomen (demograc, de morbiditate). Ea urmrete s cunoasc aspectele caracteristice ale colectivitii sau fenomenului respectiv, fr a le putea generaliza n populaia general. Fiind o metod descriptiv, monograa se mulumete doar s sesizeze aspectele caracteristice ale colectivitii sau fenomenului fr s le poat explica. De exemplu, monograa unei localiti descrie: problemele demograce, nivelul de trai, ocupaia populaiei, nivelul cultural, obiceiurile culinare ale populaiei, starea de sntate cu evidenierea problemelor de morbiditate i mortalitate, factorii de risc din colectivitate etc. Ea nu poate s explice relaia dintre aceste caracteristici ale populaiei din localitatea respectiv. Ancheta este o metod de investigaie parial a materialului statistic pe formulare adecvate problemei cercetate, n formularele de anchet datele se nscriu e de anchetator, i atunci vorbim de anchet direct, e de ctre persoana anchetat, i atunci vorbim de anchet indirect, n cazul anchetei indirecte exactitatea rspunsurilor depinde de nivelul de pregtire a celor anchetai. Ancheta de obicei succede monograei, ncercnd s aprofundeze unele aspecte sesizate de monograe. Fiind o metod de profunzime, ancheta se limiteaz la colectiviti mai restrnse (secia unei ntreprinderi, clasa unei coli etc.). n cazul n care ancheta stabilete rolul negativ al unor factori negativi din colectivitatea respectiv, ea se ncheie cu propuneri de remediere a acestora. Exemplul 1. Dac n colectivitatea n care s-a ntocmit monograa a rezultat c HTA este frecvent n snul colectivitii, atunci personalul medical, fcnd un studiu pe eantion, stabilete cauzele sau factorii de risc (alimentaie, solicitri la locul de munc, consum de alcool etc.) i propune msuri concrete care s duc la eliminarea acestora i la scderea incidenei HTA n colectivitatea respectiv. Exemplul 2. Dac monograa a scos n relief faptul c populaia prezint o dantur decitar, atunci ancheta respectiv caut s stabileasc pe un eantion cauzele acesteia i se ncheie cu recomandarea

128

BIOSTATISTICA

Metodologia general a cercetrii statistice

129

unor msuri concrete privind modul de alimentaie, condiiile de igien buco-dentar etc. Mijloace de nregistrare Adunarea i nregistrarea materialului statistic se face pe anumite formulare statistice numite mijloace de nregistrare. Coninutul mijloacelor de nregistrare trebuie s e clar, concis i s cuprind toate caracteristicile unitilor statistice de care avem nevoie n lucrarea pe care o efectum. Deci coninutul mijloacelor de nregistrare difer de la o lucrare la alta. El este dictat de scopul i obiectul lucrrii, unitatea statistic aleas i se stabilete odat cu elaborarea programului lucrrii. Aceste mijloace de nregistrare pot : Certicatele sunt formulare ce servesc pentru nscrierea unei singure uniti statistice, o singur dat. De exemplu: certicatul de natere, buletinul de identitate, certicatul de deces etc. Fiele servesc la nregistrarea unei singure uniti statistice dar nu o singur dat ci de mai multe ori, pe perioade de timp mai ndelungate. De exemplu: a copilului de 0-18 ani, de consultaie a adultului, de consultaie stomatologic, a gravidei sau foaia de observaie clinic n spitale. Listele sunt mijloace de nregistrare ce servesc pentru mai multe uniti statistice. Sunt sinonime cu tabelele. Ele nscriu unitile statistice pe cte un rnd al listei, iar diferitele caracteristici sau variabile ale unitilor statistice se nscriu o singur dat, n coloane. De exemplu dac ne propunem s examinm activ din punct de vedere al strii de sntate elevii dintr-o clas, folosim pentru nscrierea rezultatelor o list n care se nscriu pe rnduri, nominal, toi elevii examinai, iar n partea dreapt a ecrui nume, n coloane, diferite variabile: sex, vrst, afeciune etc. Registrele sunt mijloace de nregistrare ce cuprind mai multe liste de acelai fel. De exemplu registrul de consultaii medicale, de vaccinri, de eviden a gravidelor etc.

3.2. Prelucrarea materialului statistic Datele adunate sau observate se refer de cele mai multe ori la ecare unitate statistic n parte. Pentru a putea caracteriza ns colectivitatea luat n cercetare este necesar s supunem aceste date unei

operaii de prelucrare care const n aranjarea, vericarea, codicarea, sortarea i gruparea acestora n aa fel nct s permit o prezentare clar a materialului statistic. Dup locul n care se efectueaz prelucrarea deosebim: prelucrarea descentralizat care are loc la nivelul unitilor sanitare care au efectuat adunarea materialului statistic, iar dup aceea datele prelucrate sunt naintate forurilor superioare interesate n centralizarea datelor provenite de la unitile teritoriale; prelucrarea centralizat are loc la nivelul forurilor superioare care iniiaz cercetarea, pe baza formularelor de nregistrare a materialului trimise de unitile teritoriale. Prelucrarea centralizat se face la nivelul Centrului Naional de Management n Sntate. Acest mod de prelucrare are avantajul c se execut de ctre specialiti reuind o mai bun calitate a rezultatelor lucrrii. Etapa de prelucrare a materialului statistic cunoate mai multe subetape: Vericarea materialului statistic poate : Vericare cantitativ, care stabilete dac toate formularele de nregistrare sunt completate i dac s-a rspuns la toate rubricile corespunztoare caracteristicilor unitilor statistice prevzute n planul cercetrii. De exemplu dac ne propunem s cercetm morbiditatea ntr-o colectivitate colar, datele obinute n urma examinrii de specialitate a elevilor le vom nscrie n ele de consultaie ntocmite n acest sens. Fiele astfel completate pentru ecare elev n parte sunt supuse unei vericri cantitative care stabilete dac s-au nscris datele la toate caracteristicile elevilor examinai: vrst, sex, domiciliu, afeciuni medicale (HTA, infecii acute ale cilor respiratorii, boli diareice acute, otite), afeciuni stomatologice (carii dentare, pulpite, gangrene, extracii). Formularele care nu cuprind datele necesare la toate rubricile prevzute sunt nlturate, neputnd supuse operaiei de prelucrare propriu-zis. Vericarea calitativ urmrete s stabileasc dac datele nscrise n diferitele rubrici sunt exacte. Ea poate : logic cnd urmrete s stabileasc dac nu exist nepotriviri ntre vrst i diagnostic, ntre sex i diagnostic etc. Se ntmpl uneori ca diagnosticul unui bolnav de sex masculin (ex. Cancer de prostat) s e trecut din greeal pe formularul unei femei. Exist programe speciale de vericare logic a acestor neconcordane pe calculator.

130

BIOSTATISTICA

Metodologia general a cercetrii statistice

131

cifric atunci cnd urmrete s stabileasc dac datele nregistrate corespund realitii. Spre exemplu, pe baza anului naterii se poate calcula caracteristica de vrst a individului n anul n curs i verica astfel concordana acestor date. Codicarea materialului statistic Codicarea nu este altceva dect notarea prin cifre (numeric) sau litere (alfabetic), a diferitelor caracteristici ale unitilor statistice, n scopul uurrii prelucrrii i interpretrii rezultatelor obinute. Codicarea se folosete de obicei n cadrul lucrrilor de amploare, care cuprind un numr mare de uniti statistice. Spre exemplu n cadrul cercetrii morbiditii din teritoriul unui spital se pot codica cu litere localitile, iar diagnosticele de boal se codic numeric conform clasicrii i codicrii cauzelor de boal i deces revizia a-X-a OMS pe 999 cauze de mbolnvire. De exemplu, infarctul miocardic acut are codul 459, pneumonia viral are codul 506, caria dentar are codul 544 etc. Sortarea materialului statistic const n repartizarea unitilor statistice dup caracteristici individuale. Sortarea poate fcut manual sau cu ajutorul calculatoarelor electronice, mai ales n lucrrile mari cnd sunt nscrise mai multe caracteristici ale unitilor statistice sub forma unor chestionare, sortarea acestor caracteristici fcndu-se automat cu ajutorul calculatorului. Centralizarea datelor statistice urmeaz sortrii sau repartizrii unitilor statistice pe diferite caracteristici. Ea const n nsumarea caracteristicilor statistice i a unitilor statistice. Aceasta se poate face sub forma unor tabele care s cuprind rubrica total. Centralizarea poate simpl cnd la baza nsumrii st un singur criteriu (ex. centralizarea cazurilor noi de boal dintr-un teritoriu) sau grupat cnd la baza nsumrii unitilor statistice stau mai multe criterii (ex. centralizarea mbolnvirilor pe sexe, grupe de vrst, cauze de boal etc.). Gruparea materialului statistic const n aranjarea unitilor statistice, n funcie de diferitele caracteristici sau variabile, n grupe ct mai omogene, pentru a le putea scoate ct mai uor n eviden. Gruparea este operaia statistic ce permite trecerea de la aspectele particulare, individuale ale unitilor statistice la aspecte generale, comune, eseniale ale materialului cercetat. Aa, spre exemplu, dac ne propunem s cercetm morbiditatea prin HTA sau afeciuni stomatologice ntr-o colectivitate organizat

(coal, instituie), datele obinute n urma examinrii difer de la o unitate statistic la alta sub aspectul vrstei, sexului, profesiei, strii de sntate sau boal etc., neputndu-ne permite observarea a ceea ce este general, comun, caracteristic ntregii colectiviti. Repartizarea datelor pe diferite variabile: grup de vrst, sex, profesie, stare de sntate sau boal, mod de alimentare permite, n cadrul gruprii, observarea a ceea ce este general, esenial, oferindu-ne posibilitatea s ntrevedem concluziile ce se degaj n urma studiului efectuat. Criteriile sau caracteristicile de grupare a materialului statistic depind de scopul urmrit prin cercetarea ntreprins. Este ceea ce arma Claude Bernard: Cnd nu tim ceea ce cutm, nu vedem ceea ce am gsit. Spre exemplu dac nu cunoatem rolul suprasolicitrii nervoase n boala hipertensiv i nu stabilim acest criteriu n gruparea bolnavilor, sau dac nu cunoatem rolul sursei de ap potabil n inuenarea morbiditii n afeciuni stomatologice i nu grupm materialul statistic i dup acest criteriu, putem trece pe lng o concluzie esenial fr a o putea sesiza. Gruparea poate simpl cnd la baza repartizrii materialului statistic st un singur criteriu. Exemplul 1. Gruparea pe sexe a bolnavilor cu HTA (Tab. 32). Tabelul 32 Numrul de bolnavi cu HTA n funcie de sex
Sex M F TOTAL Nr. bolnavi cu HTA 30 20 50

Exemplul 2. Repartizarea bolnavilor cu afeciuni stomatologice pe cauze de boal (Tab.33). Tabelul 33 Numrul de bolnavi cu afeciuni stomatologice pe cauze de boal
Nr. crt. 1. 2. 3. 4. Afeciunea Caria dentar Pulpit Gangren Parodontopatii TOTAL Nr. mbolnviri 60 15 8 26 109

132

BIOSTATISTICA

Metodologia general a cercetrii statistice

133

Gruparea poate complex cnd la baza repartizrii materialului statistic stau dou sau mai multe criterii. Exemplul 3. Distribuia pe sexe i grupe de vrst a bolnavilor cu HA, n colectivitatea X anul Y(Tab.34). Tabelul 34 Repartizarea bolnavilor cu HTA n funcie de sex i grupe de vrst
Sex M F 0-15 2 3 Grupa de vrst 16-49 8 7 50-90 20 10 Total 30 20 50

Exemplul 4. Distribuia pe cauze i sexe a afeciunilor stomatologice n colectivitatea X anul Y (Tab.35). Tabelul 35 Repartizarea bolnavilor cu afeciuni stomatologice n funcie de sex n localitatea X, anul Y
Nr. crt. 1. 2. 3. 4. 5. Afeciunea Total Carie dentar Pulpit Gangren Parodontopatii Numr mbolnviri pe sexe Total M 100 45 60 25 25 17 8 6 16 6 F 55 35 8 2 10

cercetarea mortalitii pe ani de vrst, de la 1 la 80 de ani, ntruct mortalitatea nu difer de la un an de vrst la altul. Dar este important gruparea deceselor pe grupe de vrst de cte 5 ani sau de cte 10 ani, ntruct fenomenul cercetat mortalitatea general permite unele interpretri i concluzii n raport cu aceste grupe de vrst. Fiecare grup de valori sau clas are la rndul ei o limit inferioar, o limit superioar i un centru al clasei egal cu semisuma celor dou limite. Exemplul 5. Distribuia pe grupe de valori ale TA a bolnavilor cu HTA n colectivitatea X anul Y (Tab.36). Tabelul 36 Repartizarea bolnavilor cu HTA pe grupe de valori ale TA n colectivitatea X anul Y
Nr. crt. 1. 2. 3. Grupe de valori TA 160-169,9 170-179,9 180-189,9 TOTAL Centrul clasei 165 175 185 Frecvena 18 22 10 50

Exemplul 6. Distribuia pe grupe de vrst a bolnavilor cu afeciuni stomatologice n colectivitatea X anul Y (Tab.37). Tabelul 37 Repartizarea bolnavilor cu afeciuni stomatologice pe grupe de vrst n colectivitatea X anul Y
Nr. crt. 1. 2. 3. 4. Grupe de vrst 0-19 20-39 40-59 60-80 TOTAL Centrul clasei 10 30 50 70 Frecvena 79 38 42 64 223

Dup natura caracteristicii gruparea poate : n timp, cnd repartizarea materialului statistic are la baz anumite intervale de timp, de exemplu pe semestre (semestrul l, semestrul II) sau pe trimestre etc. n spaiu, cnd repartizarea materialului statistic se face n raport cu locul sau teritoriul unde s-a examinat populaia, de exemplu mediu rural i mediu urban. Limitele gruprii nu se stabilesc mecanic ci depind de natura fenomenului cercetat i scopul lucrrii, n principiu o grupare prea amnunit a materialului statistic duce la o frmiare ce ne mpiedic s observm ce este caracteristic, esenial. De asemenea dac o caracteristic are prea multe valori vom repartiza materialul statistic pe grupe de valori care se vor numi intervale de clas. De exemplu, ar inutil

De menionat c n cadrul gruprii trebuie s cunoatem exact valorile extreme maxim i minim ale caracteristicii i trebuie s stabilim intervale de clas egale iar limitele intervalelor sau claselor s e distincte pentru a nu crea confuzii cu ocazia repartizrii materialului statistic. De exemplu, dac dorim s distribuim elevii unei clase pe grupe de nlimi vom stabili nlimea maxim i minim a elevilor din clasa respectiv iar n interiorul intervalului respectiv vom delimita, la

134

BIOSTATISTICA

Metodologia general a cercetrii statistice

135

intervale egale, grupe de valori ale nlimii. Cel mai scund elev, avnd nlimea de 150 cm i cel mai nalt de 170 cm, n interiorul acestor valori extreme vom stabili grupe de valori ale nlimii din 5 n 5 cm, limitele grupelor de nlime ind i ele distincte. Exemplul 7. Distribuia pe grupe de nlimi a elevilor din clasa X n anul Y (Tab.38). Tabelul 38 Repartizarea elevilor pe grupe de nlimi din clasa X n anul Y
Nr.crt. 1. 2. 3. 4. Grupe de nlime cm 150-154,9 155-159,9 160-164,9 165-169,9 TOTAL Numr elevi 4 12 18 9 43

asumarea unui risc ( = 100-P) n efectuarea studiului, n biologie se lucreaz de obicei cu o probabilitate de 95%, deci cu un risc de 5%. Dou condiii trebuie asigurate n vederea unui studiu pe un eantion: reprezentativitatea eantionului i precizia studiului. Reprezentativitatea Este asigurat de alegerea aleatoare, ntmpltoare, a unitilor de selecie din baza de sondaj (univers), astfel nct ecare din elementele colectivitii generale (univers) s aib aceeai ans de a cuprinse n eantion. Prin aceast alegere aleatoare se va reproduce populaia general la nivel de eantion cu anumite erori. Aceste erori se numesc erori aleatoare i ele pot msurate i controlate de cercettor. Nerespectarea acestei condiii de extragere ntmpltoare a unitilor de selecie din baza de sondaj, din colectivitatea general, duce la apariia unui alt tip de erori, i anume erori sistematice (biais), care sunt imposibil de determinat de ctre cercettor. De exemplu: un studiu experimental pentru vericarea unui nou medicament, efectuat pe persoane care se prezint voluntar, va introduce astfel de erori sistematice, pentru c acestea sunt persoane cu structuri psihice modicate sau sufer de boala pentru care se testeaz medicamentul, deci nu vor putea reprezenta trsturile colectivitii generale. De asemenea, un studiu efectuat asupra morbiditii printr-o afeciune ntr-o secie clinic a unui spital nu poate reproduce structura morbiditii la nivelul unui raion sau al rii. Deci ele nu pot constitui eantioane reprezentative pentru teritoriul respectiv. Precizia Se refer la volumul eantionului. Aceasta presupune determinarea unui numr (n) minim de cazuri necesare pentru constituirea eantionului. Pentru determinarea acestuia, s presupunem c pornim de la o colectivitate general, baz de sondaj, univers, care are un volum de N cazuri i este caracterizat de indicatorul central (media ) i de dispersie (deviaie standard x). Din aceast populaie general extragem aleator un eantion de volum n1 i care va putea caracterizat de media , i abaterea standard 1. Din populaia general pot extrase i un al doilea eantion, de volum n2 i caracterizat de media i abaterea standard 2; al treilea eantion, de volum n3 i caracterizat prin media

Elaborarea indicatorilor Gruparea de obicei cuprinde cifre brute, valori absolute, care rareori pot interpretate ca atare. De aceea materialul statistic este supus n continuare unei prelucrri cu ajutorul metodelor de statistic matematic n vederea obinerii unor indicatori statistici ca: mrimi medii, mrimi relative, indici etc., ce vor permite aprecieri comparative, corecte i concluzii semnicative.

3.3. Eantionarea Prin eantionare (eantionaj) nelegem totalitatea tehnicilor i procedeelor statistice cu ajutorul crora se poate caracteriza o colectivitate (N) studiind o parte a acesteia. Se va studia un numr limitat de cazuri (n), care vor extrase aleator, ntmpltor, din ntreaga colectivitate. Elementele efectiv studiate constituie eantionul sau mostra; populaia din care provine eantionul poart numele de colectivitate general sau univers, baz de sondaj. Elementele individuale extrase din colectivitatea general, la care se studiaz caracteristicile sau nsuirile, i care compun eantionul, se numesc uniti de selecie. Scopul unui astfel de studiu pe eantion este de a nu studia ntreaga colectivitate general, ci o copie de dimensiuni mai mici a acesteia, iar caracteristicile obinute pe eantion s poat extrapolate cu o anumit probabilitate asupra populaiei generale. Aceast probabilitate (P) poate de 90%, 95%, 99%, dar niciodat de 100%, deci presupune

136

BIOSTATISTICA

Metodologia general a cercetrii statistice

137

i abaterea standard 3; .a.m.d. Mediile eantioanelor ( , , , ...) extrase din populaia general se vor comporta ca nite variabile aleatoare i se vor distribui n stnga i n dreapta mediei populaiei generale. Comparnd media primului eantion , cu media populaiei generale , se observ c ntre acestea exist o anumit diferen sau eroare, care poart numele de eroare maxim admis i se noteaz cu x. Se poate scrie deci relaia: = x unde: = media populaiei generale: = media eantionului l; x = eroarea maxim admis. Aceasta eroare maxim admis (x) depinde de: un coecient de probabilitate t, n funcie de riscul existent n studiu (exemplu: 5%) sau probabilitatea (P = 1-) cu care vom garanta rezultatele (P = 95% pentru = 5%); abaterea standard n populaia general (x); numrul de cazuri coninut n eantioane (n). Deci:

pentru caracteristici calitative:

De exemplu, pentru studiul unei afeciuni, boli, n populaie, P poate reprezentat de prevalen (%) bolii n populaia general. Dac n colectivitatea noastr, pe care am efectuat studiul, probabilitatea hipertensiunii arteriale a fost de 17%, dorind ca aceast probabilitate s o generalizm la un risc de =5% i x=0,8%, atunci numrul de persoane ce vor trebui examinate va :

Sau, dac ne propunem s generalizm incidena de 98% a afeciunilor stomatologice, cu un prag de semnicaie de 5% i o eroare maxim de 1%, stabilit pe un lot de populaie, atunci volumul eantionului va :

Introducnd n formula anterioar, se poate scrie:

Formulele de calcul al volumului eantionului, de mai sus, se refer la selecia simpl cu repetiie, deci n care, dup extragere, ecare unitate este reintrodus n colectivitatea general. Pentru selecia simpl fr repetiie se folosete formula:

Aceasta presupune, de altfel, c pentru un risc cu care proiectm sondajul, media populaiei generale se va situa ntr-un anumit interval, numit interval de ncredere. Numrul minim de cazuri necesar unui studiu pentru a nregistra o eroare inferioar sau cel mult egal celei standard se va calcula conform uneia dintre formulele urmtoare: pentru caracteristici cantitative:

Pentru selecia cu straticare se folosete formula:

n care N = mrimea colectivitii generale. Pentru a caracteriza fenomenele biologice sau medicale, sub aspectul legitilor care stau la baza producerii sau inuenrii lor, din motivele amintite, nu facem cercetri sau observaii pe univers, adic

138

BIOSTATISTICA

Metodologia general a cercetrii statistice

139

pe ntreaga populaie, pe colectivitatea general, ci pe pri reprezentative din colectivitate, din populaie, pe eantioane. Aprecierea reprezentativitii eantionului sub aspect calitativ, sub aspectul omogenitii deci, am vzut c se face cu ajutorul deviaiei standard, respectiv al coecientului de variaie. Aprecierea reprezentativitii eantionului sub aspect cantitativ, sub aspectul numrului de frecvene sau de uniti statistice, pe care fcnd cercetarea s putem generaliza rezultatele, se face cu ajutorul unor formule matematice pe care le vom prezenta n continuare. Alegerea prii din populaie sau din colectivitatea general reprezentativ din punct de vedere calitativ i cantitativ pe care fcnd observaia sau efectund cercetarea s putem ajunge la rezultate sau concluzii similare cu cele obinute pe ntreaga colectivitate, se numete eantionare. METODE DE EANTIONARE Alegerea frecvenelor sau unitilor statistice care alctuiesc eantionul trebuie fcut de aa manier, nct aceasta s ofere anse egale de selecionare tuturor unitilor, prile componente ale colectivitii generale s e proporional reprezentate, iar eantionul analog cu ntregul s reecte toate caracteristicile, atributele i aspectele colectivitii generale (populaiei). Alegerea poate : - ntmpltoare cnd alegerea unitilor statistice se efectueaz prin tragere la sori. n asemenea selecii trebuie asigurate anse egale ecrei uniti a colectivitii generale de a selecionate. - Mecanic atunci cnd selecia unitilor statistice se face respectnd un anumit criteriu. Spre exemplu, de pe o anumit list n care unitile statistice ale colectivitii au fost nscrise ntr-o anumit ordine (alfabetic, vrst, localitate etc.), se aleg unitile statistice ale eantionului din 5 n 5 sau din 10 n 10 uniti: - Straticat atunci cnd extragerea unitilor statistice se face pe grupe omogene (straturi) ce reect ntocmai structura pe aceleai grupe ale colectivitii generale. Spre exemplu, dac colectivitatea general este reprezentat de 65% aduli, 25% copii i 10% btrni, atunci i eantionul ales din colectivitatea general s aib proporional aceeai structur pe grupe de vrst a populaiei.

Tipuri de eantionare n funcie de natura schemelor de eantionaj abordate putem s clasicm eantionajele n eantionaje aleatoare i nealeatoare sau empirice. Din categoria eantionajelor aleatoare fac parte: - eantionaje simple (elementare) - eantionaje straticate - eantionaje n grupuri - eantionaje n trepte (faze) - eantionaje multifazice. n ceea ce privete eantionajul simplu (elementar), procedeul const n extragerea la sori a unitilor care vor compune eantionul (n general identice cu unitile de selecie din populaie) din baza de sondaj; procedeul presupune deci existena bazei de sondaj, adic o list sau un ier din care se extrag, ntr-o manier aleatorie, unitile de selecie. Baza de sondaj poate o list a tuturor nscuilor vii, a femeilor nsrcinate din ar sau dintr-un anumit teritoriu, o list a tuturor persoanelor spitalizate, o list a tuturor raioanelor, a comunelor, a familiilor dintr-un teritoriu etc. Eantionajul straticat se utilizeaz cnd n interiorul populaiei de referin unitile statistice se gsesc plasate pe categorii. Fiecare categorie este omogen din punct de vedere al coninutului intern, dar categoriile difer ntre ele. Aa este cazul populaiilor clasate dup caracteristicile vrst, mediu de provenien, diagnostic al bolnavilor externai, clasai pe secii sau grupuri de boli etc. Se adopt n acest caz o selecie proporional cu volumul stratului sau cu volumul optim cnd din unele straturi mai puin reprezentate se ia un numr sporit de uniti. Dac unitile statistice se gsesc plasate n grupuri asemntoare, ecare grup n parte avnd ns o compoziie eterogen (cazul familiei, gospodriei, dispensarului medical etc.) se consider ca unitate de selecie grupul (familia, respectiv gospodria) i nu individul, nregistrarea ulterioar a eantionului beneciind de un plus de operativitate i precizie, comparativ cu selecia simpl a unitilor individuale. Eantionajul n grupuri este un procedeu folosit cnd lipsete baza de sondaj iar constituirea ei este dicil i foarte costisitoare i n sfrit cnd dispersia teritorial a populaiei de investigat este exagerat. Se pornete de la faptul c populaia de studiat poate imaginar ca ind constituit din uniti de selecie ierarhizate.

140

BIOSTATISTICA

Metodologia general a cercetrii statistice

141

De exemplu nscuii vii sau gravidele aparin la familii, acestea aparin la o colectivitate care poate denit (cartier, comun) care la rndul lor aparin la orae sau raioane n cadrul unei ri. Eantionajul n trepte, este un procedeu n care unitile de selecie sunt ierarhizate ca n cadrul eantionajului n grupuri, diferena constnd n faptul c n timp ce n cadrul cuiburilor se realizeaz o singur extragere aleatorie, n eantionajul n trepte se efectueaz mai multe trageri la sori. Astfel, n exemplu, ara-raioane-comune-familie-noi nscui, urmtoarele extrageri sunt posibile: sondajul de gradul l raioane, rezultnd raioane selecionate, sondajul de gradul II comune, rezultnd comune selecionate la prima extragere, sondajul de gradul III familii, rezultnd familii selectate din comunele alese n selecia n treapta a II-a. Familiile selectate constituie o baz de sondaj, din care se va face o nou selecie, faza a IV-a, aceasta ind eantionul de investigat efectiv. Este recomandabil a se evita realizarea unui numr prea mare de extrageri pentru ca n eantionajul cu mai multe faze, ecare operaie de extragere antreneaz o eroare de eantionaj. n exemplul descris mai sus, se observ c mai multe baze de sondaj sunt necesare pentru ecare faz dar se evit necesitatea existenei unei liste a tuturor unitilor de observare pentru ara ntreag, de exemplu. Eantionajul multifazic este un procedeu care combin metodele anterior prezentate. El const n formarea unui eantion primar pentru a obine informaii cu caracter general urmat de constituirea unuia sau mai multor eantioane din eantionul primar pentru a obine informaii suplimentare, mai specice. Exist i alte metode empirice de eantionaj, mai mult sau mai puin utilizate, care au unele faciliti demne de avut n vedere, dar avnd o valoare tiinic mai redus, vor numai menionate. Este vorba de: metoda cotelor prin care se cere ecrui investigator numrul i caracteristicile persoanelor care trebuie s e intervievate metoda eantioanelor xe prin care se colecteaz periodic o serie de date din acelai eantion metoda eantioanelor tipice unde se consider, de exemplu, c o localitate este reprezentativ pentru situaia zonei. Determinarea efectivelor unui eantion Tehnicile de determinare a efectivelor eantioanelor pot complicate n cadrul unor tipuri de eantionaj. n aceste situaii se poate recurge

la 2 soluii. Prima const n utilizarea din plin a echipei de informaticieni mpreun cu tehnica de calcul din dotare, iar cea de-a doua se adreseaz la o serie de tabele prefabricate care dau pentru diferite tipuri de eantionaj, mrimea eantionului de studiu deja calculat, din literatura de specialitate. Dac baza de sondaj exist sau poate constituit i dispunerea unitilor de observare n baz este ntmpltoare exist 3 modaliti de alegere aleatorie: procedeul tragerii la sori cu/far restituire procedeul tabelelor de nr. ntmpltoare procedeul pasului mecanic. n condiiile prezentate mai sus i n funcie de tipul caracteristicii cel mai puin dispersat (ct mai omogen), volumul minim al eantionului poate calculat prin formulele prezentate n Tab.39. Tabelul 39. Calculul volumului eantionului
Nr. Tip de crt. eantionaj 1. Simplu cu repetiie Simplu fr repetiie Stratif. proporional Stratif. cu volum optim Volumul eantionului Caract. cantitativ* Caract. calitativ

2.

3.

4.

_________________________________

* Dac sunt necesare eantioanele de volume mai mari de 30 uniti de observare, n locul coecientului tay, se folosete U pentru care: U0,05= 1,96; U0,01= 2,57; U0,001=3,29

142

BIOSTATISTICA

Metodologia general a cercetrii statistice

143

Notaiile din tabelul 39 au semnicaiile urmtoare: n = volumul eantionului N = volumul populaiei de referin N1 = volumul stratului j; l j k Sx (j) = abaterea standard a caracteristicii n populaie, respectiv n stratul j; l j k p (pj) = proporia caracteristicii x (p) = eroarea maxim limit acceptat t = coecient ce caracterizeaz distribuia lui Student, pentru riscul dat i = grade de libertate. Aplicarea formulelor de determinare a volumului eantionului din tabelul nr. 39, necesit unele judeci i anume: se pornete de la dorina oricrui investigator ca volumul eantionului s e optim nelegnd prin aceasta c acest volum s nu e nici prea mare, nici prea mic. Se tie c: un eantion prea voluminos are, n general, o precizie bun, dar poate foarte costisitor sub aspect nanciar, al timpului, al personalului etc. un eantion de volum prea mic este mai ecient sub aspect economic dar poate conduce la rezultate cu o precizie mic, pe care nu le putem accepta; de aici n orice problem de calcul al volumului eantionului este nevoie de un compromis. Analiznd prima formul din tabelul 39, corespunztoare unui eantionaj simplu cu repetiie, se vede c dimensionarea volumului eantionului depinde de variabilitatea caracteristicii studiate (exprimat prin varianta Sx2), de precizia dorit (exprimat prin mrimea intervalului de ncredere x) ct i prin riscul acceptat n estimare (exprimat prin valoarea coecientului t). n ceea ce privete variabilitatea, aceasta nu poate inuenat pentru c ine de natura nsi a fenomenului biologic studiat; privind riscul acceptat n estimare () n orice studiu din domeniul biologicului sau al cercetrii medicale se ia invariabil =0,05 i atunci pentru dimensionarea optim a volumului eantionului (realizarea compromisului) s-au adus unele modicri, acceptate n practic, privind eroarea maxim ca msur a preciziei estimrii parametrilor din populaie prin parametrii corespunztori din eantion.

Prezentm n continuare n Tab.40 diferite variante obinute pentru valori ale erorii maxime, meninnd constante att variabilitatea fenomenului ct i probabilitatea (riscul ) de garantare a armaiilor.
Tabelul 40 Dimensionarea volumului eantionului n funcie de eroarea acceptat
Nr. crt. 1. 2. 3. 4. 5. 6. Eroarea maxim (P) 0,05 0,06 0,07 0,08 0,09 0,10 p2=p(1-p) 0,4x0,6 0,4x0,6 0,4x0,6 0,4x0,6 0,4x0,6 0,4x0,6 Risc () 0,05 0,05 0,05 0,05 0,05 0,05 Volumul eantionului 369 256 188 144 114 92

Datele din Tab. 40 se refer la o caracteristic de tip calitativ, de genul bolnav-sntos, alimentat, corespunztor-nealimentat, masculin-feminin etc. Dup cum a fost menionat, cnd baza de sondaj nu exist i populaia este organizat n uniti ierarhizate, pentru evaluarea volumului eantionului pot folosite o serie de tabele din literatura de specialitate care prezint numrul minim de grupuri ce trebuie selectate n funcie de diverse proporii ateptate i de volumul populaiei de referin. Exemplicm n Tab. 41 evaluarea numrului de grupuri necesare, pentru o eroare maxim ateptat de 0,05; calculele ind datorate lui W. Lutz, 1982. (Calculele sunt efectuate pe baza formulei corespunztoare unui eantionaj simplu cu repetiie). Exemplul l. Eantion pentru populaie. Se dorete realizarea unui eantion de populaie reprezentativ la nivel naional, necesar pentru efectuarea aceluiai studiu privind opiniile n legtur cu serviciile sanitare din Moldova n rndul beneciarilor de servicii de sntate. Pentru realizarea acestui obiectiv pot parcurse urmtoarele etape: - aa cum s-a menionat i n cadrul eantionajului pentru medici, teritoriul rii a fost mprit n 3 zone considerate tipice din punct de vedere geograc i al tradiiilor de existen ale populaiei; - din aceste zone pot alese, prin tragere la sori, 9 raioane plus municipiul Chiinu;

144

BIOSTATISTICA

Metodologia general a cercetrii statistice

145 Tabelul 41

se va adopta ca fraciune de eantionaj, valoarea de 5 0/0000 ceea ce a condus la un efectiv total minim al eantionului de 1200 persoane; acest efectiv poate conrmat printr-un calcul de determinare a volumului eantionului pentru o precizie de 3% i o probabilitate de lucru de 95% (=0,05); eantionul total poate distribuit la nivelul celor 9 raioane revenind n medie pentru ecare raion selectat n jur de 120 persoane; pentru municipiul Chiinu se va lua un numr mai mare de persoane; la nivelul ecrui raion se va avea n vedere distribuia aproximativ egal a populaiei n mediul urban i rural; aceasta nseamn c din totalitatea strzilor i/sau comunelor trebuie selectate strzile i comunele care vor intra n eantion; pentru obinerea celor aproximativ 60 de persoane din mediul urban i 60 din mediul rural, la nivelul ecrui raion selectat, sunt suciente selectarea a 3 strzi i 3 comune, iar din ecare strad/comun selectat vor alese la ntmplare prin metoda pasului mecanic sau prin folosirea unui tabel cu numere ntmpltoare, cate 10 familii; din familiile selectate, att din mediul urban ct i rural, operatorul de interviu va consemna datele din a de anchet pentru toate persoanele sau numai pentru persoanele adulte; prin nsumarea datelor se obine eantionul pentru copii, aduli, vrstnici, pe medii, la nivelul ecrui raion iar n nal eantionul la nivel naional.

Volumul eantionului pentru sondaj n grupuri*


Nr. total de grupe 0,05 formate 400 26 400 25 300 25 250 24 200 24 150 23 100 22 90 21 80 20 70 20 60 19 50 18 40 16 35 15 30 14 25 13 20 12 15 10 10 8 0,1 24 24 23 23 23 22 20 20 19 19 18 17 16 15 14 13 12 10 8 0,15 23 22 22 22 21 21 19 19 18 18 17 16 15 14 13 12 11 9 7 0,20 21 21 21 20 20 19 18 18 17 17 16 15 14 14 13 12 11 9 7 0,25 20 19 19 19 19 18 17 17 16 16 15 15 14 13 12 11 10 9 7 0,30 18 18 18 17 17 17 16 16 15 15 14 14 13 12 12 11 10 9 7 0,35 17 17 16 16 16 16 15 15 14 14 14 13 12 12 11 10 10 9 7 0,40 15 15 15 15 15 14 14 14 13 13 13 12 12 11 11 10 9 8 7 0,45 14 14 14 14 13 13 13 12 12 12 12 11 11 10 10 9 9 8 6 0,50 13 13 12 12 12 12 12 11 11 11 11 10 10 10 9 9 8 7 6

Dac aceste inconveniente nu ntotdeauna sunt prezentate, se pot imagina i alte scheme de selecie adecvate n care principiul aleatorului se poate mbina cu principiul seleciei dirijate sau al metodei cotelor cu unele avantaje practice, demne de luat n seam.

Deci, colectivitile dinamice sunt formate din uxuri de evenimente. Pentru o nelegere clar a relaiei dintre colectivitile statice i cele dinamice trebuie subliniat faptul c n ambele cazuri exist o mulime de elemente variabile; n cazul colectivitilor statice timpul i forma organizatoric sunt constante, iar n cazul celor dinamice, spaiul i forma organizatoric sunt constante. Unitile statistice reprezint elementele constitutive ale colectivitilor. Ca i colectivitile, unitile pot separate n statice i dinamice, n cazul celor statice unitile compun efectivul (de persoane, de bolnavi etc.). n cazul unitilor din colectivitile dinamice, unitile aparin aceleiai structuri organizatorice, dar n condiii diferite de timp.
* Dup W. Lutz Sampling: how to select people hauseholds places to study community health, I.E.A., 1982.

146

BIOSTATISTICA

Metodologia general a cercetrii statistice

147

Unitile statistice pot simple i complexe. Cele simple sunt elementele constitutive ale colectivitii (persoana, bolnavul etc.), iar cele complexe sunt rezultatul organizrii sociale i economice a colectivitii (familia, echipa, secia, anul de studiu etc.). Unitile statistice sunt uniti independente care pot studiate separat, pe subcolectiviti sau pe ntreaga colectivitate. Unitile colectivitii pentru care se culeg date n procesul cunoaterii se deosebesc de unitile de raportare, ce pot , de exemplu, instituii i altele, care potrivit legislaiei n vigoare informeaz sistematic asupra activitii unitilor aate n structura lor organizatoric. Unitile sunt purttoare ale unor trsturi variabile n timp i spaiu. Caracteristicile statistice, denumite i variabile statistice, reprezint criteriile pe baza crora se caracterizeaz unitile colectivitii. Aceste criterii pot nsuiri sau trsturi ale unitilor care denesc i delimiteaz ntre ele unitile colectivitii i care urmeaz s e nregistrate. Formele concrete de manifestare ale caracteristicilor la nivelul ecrei uniti a colectivitii se numesc variante sau valori. Caracteristicile statistice se difereniaz dup mai multe criterii. Dup coninutul lor pot : de timp, de spaiu i atributive. Caracteristicile de timp arat apartenena unitilor la un moment sau o perioad de timp. Caracteristicile de spaiu arat situarea n teritoriu a unitii. Se exprim prin cuvinte pe baza unui nomenclator al unitilor teritoriale. Toate celelalte sunt caracteristici atributive i servesc pentru denirea fenomenelor studiate. Dup modul de exprimare, ele se separ n: caracteristici calitative (exprimate prin cuvinte) i caracteristici cantitative (exprimate numeric), de exemplu, profesia i vrsta. Dup natura variaiei, cele numerice se mpart n caracteristici cu variaie continu i cu variaie discontinu sau discret. Cele cu variaie continu, de exemplu, vrsta, care poate lua orice valoare ntr-un interval dat i numrul de copii, ca variabil discret ce dimensioneaz familiile i care nu poate lua dect valori strict determinate n intervalul de valori nregistrate la un moment dat. De reinut c, n statisticile practice toate variabilele numerice se nregistreaz ca variabile discrete, de exemplu, vrsta n ani mplinii. Dup modul de manifestare la nivelul unitilor simple pot alternative manifestarea direct sau opus ei, de exemplu, urban-rural i

nealternative cu variante distincte numerice sau calitative, de exemplu, salariile i profesia. Dup modul de obinere i folosire a datelor pot primare obinute n procesul de culegere a datelor i cu care se caracterizeaz nivelul de dezvoltare atins de unitile simple i complexe i caracteristici derivate obinute prin aplicarea unui model de calcul. Datele statistice sunt caracterizri numerice ale unitilor, grupelor i colectivitii, obinute din observare i prelucrare. n statistic, datele sunt ntotdeauna mrimi concrete, caracterizate printr-o parte noional care denete coninutul calitativ, valoarea numeric i elementele de cuanticare (de timp, de spaiu etc.). Mesajul datelor l reprezint informaia. Datele ce caracterizeaz un fenomen sau proces economic sau social ce se repet cu regularitate se numesc indicatori statistici. Indicatorii statistici reprezint expresia numeric a unei determinri calitative obiective, obinut n urma efecturii unei cercetri statistice raportat la condiii specice de timp, spaiu i organizatorice. Indicatorul statistic exprim de regul, numeric, o categorie economic, medical etc. Exprimarea numeric a unei categorii presupune folosirea mai multor indicatori, ecare punnd n eviden anumite aspecte eseniale ale acesteia.

3.4. Prezentarea materialului statistic Prezentarea materialul statistic se poate face cu ajutorul tabelelor i cu ajutorul reprezentrilor grace.
3.4.1. Prezentarea prin tabele Prezentarea prin tabele constituie o metod comod, sintetic i sistematic: comod, pentru c rezultatele cercetrii sunt redate sub forma unor date cifrice, permind observarea cu uurin a aspectelor principale ale problemei cercetate; sintetic, pentru c datele cifrice redau aspectele eseniale ale fenomenului studiat; sistematic, pentru c ntre diferitele date cantitative sau calitative prezentate n tabel, exist o nlnuire logic uurnd nelegerea lor.

148

BIOSTATISTICA

Metodologia general a cercetrii statistice

149

Pentru ca un tabel s corespund cerinelor, el trebuie s ndeplineasc urmtoarele cerine: S aib un titlu care, printr-o fraz clar, s redea coninutul tabelului, locul i perioada de timp la care se refer, ca i modul n care au fost obinute datele. Datele titlului tabelului trebuie s rspund la 4 ntrebri: ce, unde, cnd, cum? Ce cuprinde tabelul, unde s-a efectuat cercetarea, cnd s-a efectuat cercetarea i cum au fost obinute datele la ntrebarea cum se rspunde de obicei printr-un asterix sub macheta tabelului. Exemplul 1. Distribuia pe sexe i grupe de valori ale HTA a bolnavilor cu HTA din localitatea X n anul Y (Tab. 42). Tabelul 42 Repartizarea pe sexe i grupe de valori ale TA a bolnavilor cu HTA din localitatea X n anul Y
Nr. crt. 1. 2. 3. Sex Total F. M. Total 50 32 18 160-169,9 28 20 8 Grupe de valori TA 170-179,9 180-189,9 15 7 8 4 7 3 200-209,9 ... -

ordine logic: crescnd la grupele de vrst i n ordinea gravitii (de la caria simpl la extracii), n cazul grupelor de afeciuni. Totalurile n tabelele statistice se nscriu de obicei n primul rnd i n prima coloan, n tabelele matematice totalurile se nscriu n ultimul rnd i n ultima coloan, n statistic ns avem uneori situaii n care tabelele sunt extinse depind dimensiunile att n lungime ct i n lime. Dac am nscrie totalurile n ultimul rnd i n ultima coloan a tabelului am putea observa mai greu cror caracteristici le corespund aceste totaluri. Atunci cnd nu dispunem de datele necesare pentru a le nscrie n csuele tabelului se trage o linie orizontal, semn al inexistenei datelor respective, iar atunci cnd nu cunoatem datele necesare nscrierii ntr-o csu a tabelului, dei ele exist, acest lucru se exprim prin cteva puncte succesive. TIPURILE DE TABELE STATISTICE Exist n general o mare diversitate de tabele statistice, de la cele mai simple, care au la baz un singur criteriu de clasicare, pn la cele mai complexe, avnd la baz mai multe caracteristici, depinznd att de natura materialului cercetat ct i de ingeniozitatea celui care le ntocmete. Este recomandabil ns s nu uitm lucrul cel mai important i anume faptul c tabelul trebuie s redea cu uurin esenialul. n scop didactic am mprit tabelele n 3 tipuri: tabele pentru clasicare dichotomic; tabele pentru distribuia de frecvene; tabele de corelaie. Tabelele pentru clasicarea dichotomic le utilizm n situaia n care cercetm fenomene care se caracterizeaz prin nsuiri sau caracteristici diametral opuse, excluzndu-se unul pe altul. A dichotomiza, n limba greac, nseamn a divide, a mpri n dou. Spre exemplu, populaia unei colectiviti, distribuit sau repartizat pe sexe, se mparte n dou pri: de sex masculin i de sex feminin; dup starea de sntate populaia poate sntoas sau bolnav; dup mediu se poate mpri n populaie rural i urban; dup reacia la tuberculin (IDR) poate pozitiv sau negativ la tuberculin etc. Exemplul 1. Distribuia elevilor din colectivitatea X n anul Y pe sexe, locul de domiciliu i prezena sau absena cariei dentare (Tab. 44).

Exemplul 2. Distribuia pe cauze, grupe de vrst i sex a mbolnvirilor stomatologice a elevilor liceului X anul Y (Tab.43). Tabelul 43 Repartizarea pe cauze, grupe de vrst i sex a mbolnvirilor stomatologice a elevilor liceului X anul Y
Numr elevi Nr. crt. 1. 2. 3. 4. Afeciunea Total 118 15 4 18 155 Grupe de vrst Sexul M F 54 64 7 8 3 1 10 8 74 81 15-16 Sexul M F 20 24 3 4 1 5 2 28 31 17-18 Sexul M F 18 21 3 2 2 1 3 24 26 19-20 Sexul M F 16 10 1 2 1 4 3 22 24

Caria simpl Pulpit Gangrena Extracii Total

Rndurile i coloanele tabelului trebuie s e logic aezate i s e notate corespunztor coninutului acestora. Spre exemplu, n tabelul 43 grupele de vrst ca i grupele de afeciuni sunt aezate ntr-o

150

BIOSTATISTICA

Metodologia general a cercetrii statistice

151

Tabelul 44 Distribuia elevilor pe sexe, locul de domiciliu i prezena sau absena cariei dentare din colectivitatea X n anul Y
TOTAL Sex R M 500 R F 200 U 50 150 300 U 100 Domiciliu 200 P A P A P A P A Carii dentare 150 50 60 40 100 50 30 20

Tabelul 45 Distribuia bolnavilor hipertensivi n raport cu grupa de vrst i valorile TA


Grupe de vrst 40-44 45-47 50-54 55-59 160-169,9 5 Valori TA 170-179,9 180-189,9 10 15 20 190-199,9

n cazul utilizrii unei astfel de prezentri nu trebuie s admitem mai mult de dou, maxim trei dichotomizri, ntruct prin supraaglomerare ele devin confuze, greu de urmrit i interpretat. Tabele pentru distribuia de frecvene le utilizm atunci cnd dorim s prezentm n tabele rezultatele gruprii dup anumite criterii. Tabele de corelaie le folosim pentru evidenierea corelaiei dintre dou fenomene ntre care n mod logic exist o legtur de dependen. Aceste tabele se caracterizeaz prin aceea c au dou variabile: una determinant (factorial) i cealalt determinat (rezultant), n cazul tabelului de corelaie valorile nscrise n csuele tabelului corespund n acelai timp unei anumite grupe de valori a primului fenomen determinant i unei anumite grupe de valori a celui de-al doilea fenomen determinat de primul. Ca atare cele dou variabile ale tabelului de corelaie trebuie s e mprite ntr-un numr egal de grupe de valori pentru ca ele s se coreleze perechi. Exemplul 2. ncercnd s stabilim dac ntre vrsta bolnavilor hipertensivi i valorile TA exist sau nu o legtur de dependen, utilizm un astfel de tabel de corelaie n care una din variabile (factorial) este reprezentat de grupa de vrst, iar cealalt (determinat sau rezultant) este reprezentat de grupele de valori ale TA (Tab. 45).

Se observ o legtur strns ntre creterea valorilor TA i naintarea n vrst, legtur care va msurat printr-un coecient de corelaie, care va studiat la capitolul respectiv. Exemplul 3. Dac dorim s stabilim ntr-o colectivitate dac ntre vrst i parodontopatie exist o legtur de dependen sau nu, utilizm un astfel de tabel de corelaie n care una din variabile (factorial) este reprezentat de grupele de vrst, iar cealalt variabil (determinat sau rezultant) este reprezentat de valori sau frecvene ale dinilor afectai (Tab. 46). Tabelul 46 Corelaia ntre grupele de vrst i numrul de dini afectai
Grupa de vrst 40-44 45-49 50-54 55-59 60-64 65-69 1-3 2 4-6 3 8 12 25 50 Nr. dini cu parodontit 7-9 10-12 13-15 16-19

Distribuia frecvenelor n raport cu grupele de vrst i numrul de dini afectai de parodontopatie reliefeaz faptul c ntre cele dou fenomene exist o legtur strns i direct de dependent ntruct pe msura naintrii n vrst numrul dinilor afectai este mai mare. 3.4.2. Reprezentarea grac a materialului statistic Tabelele, dei redau foarte exact aspecte cantitative ale unui fenomen cercetat, ind n acelai timp sintetice i sistematice, necesit totui o anumit pregtire de specialitate pentru a putea urmrite i

152

BIOSTATISTICA

Metodologia general a cercetrii statistice

153

nelese. Ca atare ele pot utilizate n lucrri de cercetare tiinic prezentate sub form de articole n reviste de specialitate care se adreseaz unui public cu pregtire corespunztoare. Ele redau mai mult aspecte statice ale fenomenului cercetat, ncrcarea tabelelor cu date referitoare la perioade lungi de timp ngreuneaz urmrirea i nelegerea acestora. Gracele, dei mai puin exacte dect tabelele, au o arie de utilizare mai larg ntruct sunt mai intuitive, putnd urmrite i nelese mai uor de ctre un public mai larg. Componentele principale ale unui grac Gracul este de fapt o hart care vorbete direct ochiului i este foarte ecient n crearea unei imagini n mintea receptorului. Construirea unui grac nseamn att tiin ct i art; nseamn cunoaterea gracelor de baz, modalitatea de realizare din punct de vedere tehnic i mai ales cum se combin elementele de baz pentru a crea o hart corespunztoare; alegerea tipului de reprezentare grac pentru situaii dicile, complexe ale evoluiei fenomenelor nseamn de fapt art. Persoana care realizeaz gracul i asum o responsabilitate mare pentru c un grac corect conduce la informare corect iar un grac gndit i construit incorect conduce la dezinformare (Anders Wallgren, Britt Wallgre, Rolf Persson, 1990). Atunci cnd un grac este privit, ochiul trebuie s nregistreze imediat caracteristicile principale precum i unele detalii; pentru aceasta persoana care construiete gracul trebuie s realizeze un echilibru ntre detaliu i ansamblu. Un grac stimuleaz receptorul s fac conexiuni i s observe imediat modelele care pot aprea n evoluia unui fenomen. Rolul gracului: - s orienteze utilizatorul n selectarea informaiilor importante din raportul statistic (gateway) - s dezvolte idei ulterioare i s le explice - s ncurajeze utilizatorul s priveasc n profunzime problema prezentat n raportul statistic - s ncurajeze compararea i analiza informaiilor Gracele sunt construite cu ajutorul unor elemente simple cum ar linii, arii, text etc. Toate aceste elemente simple trebuie combinate astfel nct gracul rezultat s aib sens i s poat citit cu uurin.

Persoana care are responsabilitatea reprezentrii grace trebuie s-i pun urmtoarea ntrebare: Care este tipul de grac potrivit pentru reprezentarea grac a datelor statistice? Alegerea depinde n primul rnd de problema pe care dorim s o punem n eviden prin reprezentarea grac. Nu exist o regul care s stabileasc o coresponden ntre un anumit tip de relaie ntre variabile i un anumit tip de grac. Trebuie luai n considerare diferii factori pentru ecare situaie n parte. Avem de ales uneori ntre: grace corespunztoare i necorespunztoare unei anumite situaii sau, ntre mai multe tipuri de grace potrivite aceleiai situaii Trebuie s decidem n primul rnd ce dorim s punem n eviden cu ajutorul acelui grac: evoluia n timp, variaiile, etc. Trebuie subliniate principalele caracteristici ale datelor i s inem cont de limitele impuse de acestea. Caracteristicile importante n acest context sunt: structura datelor tipul variabilelor caracteristicile msurtorilor. Principalele componente ale unui grac sunt( g. 8, g. 9): 1. suprafaa de reprezentare (chart area) 2. suprafaa gracului mrginit de axe i cadran (plot area) 3. aria gracului 4. legenda gracului 5. reeaua de axe liniile orizontale i verticale (gridlines) 6. etichetele corespunztoare axelor

154

BIOSTATISTICA

Metodologia general a cercetrii statistice

155

Fig. 8. Componentele principale ale unui grac

Suprafaa de reprezentare este mai mare dect cea a gracului. Include gracul i textul corespunztor acestuia astfel nct s constituie o unitate coerent. Suprafaa de reprezentare include: - titlul gracului (hrii) - axa vertical Y - eticheta atribuit axei Y - valoarea maxim - valorile scalei - marcajul care indic limita dintre valorile scalei (tick) - valoare minim - axa orizontal X - eticheta atribuit axei X - suprafaa ncadrat - curbe, coloane etc. - legenda - sursa Suprafaa gracului este suprafaa ocupat de grac fr titlu, valorile scalei etc. Suprafaa trebuie s e sucient de mare pentru a obine un grac vizibil. Gracele care conin multe detalii necesit o suprafa mai mare. Proporiile suprafeei sunt determinate pn la un anumit punct de date o serie cronologic mare se reprezint de obicei ntr-un dreptunghi. Ca regul, formatul orizontal este mult mai potrivit i o alegere bun este dat de proporia 1:1,6.

Fig. 9. Rata mortalitii populaiei pe medii n localitatea X pe anii 1990-1999.

Suprafaa de reprezentare este o suprafa imaginar ce conine ntregul grac incluznd titlul i textele explicative. n mod normal suprafaa de reprezentare nu este marcat n nici un fel, cu excepia cazului n care fundalului i se atribuie o alt culoare.

Uneori irul 1:1,2 1:2,2 este dat ca reper pentru a stabili raportul dintre cele dou laturi ale dreptunghiului format de axa vertical i cea orizontal.

156

BIOSTATISTICA

Metodologia general a cercetrii statistice

157

Aria gracului Aria gracului este o arie imaginar care conine desenul propriuzis (coloane, benzi, curbe etc.). Poate colorat ntr-o nuan deschis pentru a pune mai bine n eviden coninutul gracului. Reeaua de axe orizontale i verticale. n unele cri este denumit reea ajuttoare de reprezentare grac pentru a nu confundat cu reeaua rectangular format din sistemul coordonatelor carteziane. Reeaua de axe permite citirea gracului cu mai mult uurin i se pot aprecia cu aproximaie valorile. Axele orizontale se utilizeaz n cazul reprezentrii prin dreptunghiuri verticale, n timp ce axele verticale se utilizeaz n cazul reprezentrii prin dreptunghiuri orizontale. n ambele cazuri este mult mai uor de apreciat lungimea dreptunghiurilor. n diagramele n care reprezentarea este prin curbe se recomand utilizarea ambelor reele de axe. Reeaua de axe nu trebuie s e obstructiv i nu trebuie s distrag atenia de la datele reprezentate. Axele trebuie s e ct mai subiri. Dac fundalul este colorat atunci culoarea alb pentru axe este o alegere potrivit. Textul Toate informaiile necesare nelegerii gracului trebuie incluse n suprafaa de reprezentare astfel nct aceasta s e dominat de grac i nu de text. Textul trebuie s cuprind strictul necesar. Titlul i alte texte Titlul trebuie s descrie ntr-o form concis coninutul gracului. Din titlu trebuie s reias foarte clar: - grupul descris (femei ntre 25-29 ani) - variabilele implicate (cauza decesului) - anul la care se refer datele 2005 - tipul de date reprezentate (valori absolute, procente). Titlul trebuie: - s e uor de citit - s nceap cu informaia cea mai important Este recomandat ca titlul s apar deasupra gracului pentru a respecta o ordine natural n citirea lui. Alinierea titlului cu textul corespunztor axei Y confer unitate gracului i paginii de text n care este inserat acesta.

Centrarea titlului poate utilizat atunci cnd gracul este prezentat pe foile destinate retroproiectorului. Titlul poate scris cu alte caractere dect cele folosite pentru text. Legenda i etichetele trebuie scrise cu caractere mai mici dect cele folosite pentru titlu. Sursa Pentru ecare grac se menioneaz sursa de provenien a datelor, sursa trebuie precizat sub grac iar cuvntul surs este recomandat s e scris cu litere italice. Orice text trebuie scris pe orizontal indiferent dac se refer la axa vertical sau la curba reprezentat grac. Axe, scale, marcaje Axele sunt reprezentate prin linii drepte. Nu exist motive pentru utilizarea sgeilor. Pentru axa Y textul se plaseaz deasupra axei. Pentru axa X textul se plaseaz n partea dreapt sub ax. n cazul seriilor cronologice nu este necesar ca anii s e nsoii de cuvntul anul. Valoarea minim a axei Y este ntotdeauna 0. Valoarea maxim este aleas astfel nct s existe un mic spaiu ntre grac i valoarea maxim a scalei. n cazul n care avem mai multe grace unul lng altul trebuie pstrat aceeai scal. n acest fel comparaiile pot realizate n mod direct. Pentru a ajuta citirea gracului axele sunt marcate la intervale egale, iar marcajele sunt nsoite de valorile corespunztoare. Pentru a evita ncrcarea gracului, o parte din valorile scalei pot omise pstrndu-se marcajele. n general o singur ax vertical i o singur ax orizontal sunt suciente. n cazul seriilor cronologice foarte lungi, scala din stnga poate repetat n partea dreapt. Valorile scalei sunt alese astfel nct s se refere la un sistem numeric natural. Practica standard prevede ca dimensiunea intervalului pe scal s e 1, 2,..., 5, sau alternativ 10, 20,..., 50 etc.; pentru numere zecimale se folosete 0.1, 0.2,..., 0.5. Scalele construite de tipul 30, 60, 90 se citesc mai greu. Excepie fac scalele care reprezint procente. n acest caz valorile scalei 25, 50,75% sunt naturale. O alt excepie este atunci cnd valorile scalei sunt importante prin ele nsele, de exemplu grupele de vrst. Este recomandat s nu se reprezinte pe scal valorizri; se recomand folosirea categoriilor mii astfel, nct pe ax s se poat scrie 100, 200 etc., n loc de 100000, 200000.

158

BIOSTATISTICA

Metodologia general a cercetrii statistice

159

Legenda Aceleai principii se aplic att pentru arii ct i pentru curbe. Trebuie specicat ce reprezint ecare arie sau curb. n cazul ariilor, legenda poate scris direct pe aria respectiv sau n afara ei n partea dreapt. Reprezentarea ariilor n legend trebuie fcut n aceeai direcie cu reprezentarea din grac, de la stnga la dreapta sau de sus n jos. Pentru dreptunghiurile verticale sau orizontale grupate, trebuie s explicm ce reprezint ecare grup n parte. Legenda trebuie poziionat n suprafaa grac, sub grac, sau lateral n partea dreapt a gracului (varianta a, varianta b, varianta c). Pentru barele verticale grupate, legenda poate aezat orizontal n suprafaa grac, dedesubtul ei sau n partea dreapt. n cazul dreptunghiurilor orizontale, legenda este poziionat vertical e n suprafaa grac e n afara ei, e n partea dreapt.

Haurri/ culori Pentru a putea face comparaii cu uurin se recomand respectarea unor principii elementare n utilizarea culorilor i haurrilor.

Se recomand folosirea a cel mult 4 sau 5 tipuri de haurri.

n cazul curbelor, trebuie specicat n mod clar ce reprezint ecare curb. Legenda poate poziionat astfel: - sub suprafaa grac sau n partea dreapt a ei n cazul n care avem reprezentat un numr mare de curbe, pentru a nu ncrca gracul (varianta a); - deasupra lor atunci cnd sunt vizibil distincte i nu se intersecteaz (varianta b); - n afara suprafeei grace, n partea dreapt cnd sunt apropiate sau se intersecteaz (varianta c).

Se recomand accentuarea gradat a intensitii haurilor pornind de la partea superioar a gracului ctre partea inferioar.

160

BIOSTATISTICA

Metodologia general a cercetrii statistice

161

Nuanele trebuie s se disting cu uurin. Trebuie aranjate de la nuana cea mai deschis ctre cea mai nchis. Pot completate cu alb, iar n cazuri excepionale cu negru. Haurarea ariilor Liniile trebuie nclinate n aceeai direcie. Trebuie evitate - liniile verticale, deoarece creeaz un efect de lungire a coloanelor/benzilor - liniile orizontale, deoarece creeaz un efect de micorare a acestora. Cnd avem mai multe categorii, modelele trebuie s se diferenieze n mod vizibil. Dac exist o ordine ntre categorii, haurrile trebuie s arate acest lucru. Culorile: - trebuie aplicate cu economie culorile puternice ndeprteaz mesajul gracului, iar costurile de editare sunt ridicate; - este recomandat folosirea unei singure culori discrete i eventual a diferitelor nuane ale acesteia. Tipuri de linii Reprezentarea grac a unei singure serii cronologice se realizeaz printr-o curb continu de culoare neagr. Curba trebuie s e sucient de groas pentru a nu se confunda cu reeaua de axe dar nu

foarte groas. Ca dimensiuni potrivite se recomand 0,5 mm pentru curb i 0,1 mm pentru reeaua de axe. Pentru reprezentarea n acelai grac a mai multor curbe trebuie s folosim tipuri diferite de linii pentru a le putea distinge. Teoretic exist un numr mare de combinaii de linii i puncte; Practic este dicil de folosit mai mult de 4-5 (varianta a, varianta b). De asemenea, putem folosi curbe de dimensiuni diferite. Cea mai subire trebuie s e diferit de reeaua de axe, iar cea mai groas nu trebuie s e prea groas. n cazul n care curbele nu se intersecteaz i sunt vizibil distincte se poate folosi un singur model. n cazul n care curbele se intersecteaz este necesar utilizarea mai multor modele astfel nct utilizatorul s nu e obligat s stabileasc ce poriuni aparin aceleiai curbe pe baza intuiiei.

Simbolurile Seriile cronologice sunt alctuite din observaii unite prin linii. Uneori observaiile corespunztoare ecrei perioade (lun, an) pot marcate prin simboluri.

Simbolurile au un rol important n cartograme. n aceste cazuri trebuie s e simple cercuri sau ptrate, n general guri geometrice simple de dimensiuni relativ mici. Tehnicile de baz n construirea unui grac Elementul de baz de la care se pornete n construirea unui grac este sistemul de coordonate (sistem de referin). Sistemul de coor-

162

BIOSTATISTICA

Metodologia general a cercetrii statistice

163

donate uzual const n linii aezate n unghi drept i numite sistem de coordonate cartezian. Sistemul de coordonate din gura 10 este bidimensional dar, ideea poate generalizat pentru trei sau mai multe axe (dimensiuni). n mod tradiional dreapta vertical este numit ordonat (sau axa Y) i dreapta orizontal este numit abscis (axa X). Acest sistem de coordonate mparte planul n patru cadrane. Originea sau punctul 0 este punctul unde se intersecteaz axele i ncepe scala numeric. Valorile din partea superioar a axei Y sunt pozitive, n timp ce valorile din partea inferioar sunt negative. Valorile din partea stng a axei X sunt negative iar valorile din partea dreapt sunt pozitive. n general, statistica folosete pentru reprezentarea grac a informaiilor cadranul unul i foarte rar cadranul unu mpreun cu cadranul patru. De exemplu majoritatea indicatorilor sociali sunt pe o scal pozitiv, ceea ce determin utilizarea mai frecvent a cadranului unu, celelalte cadrane ind prin convenie omise. Fiecrui punct A din cadran i se asociaz perechea de valori (x, y). Intersecia celor dou axe indic nivelul fenomenului ntr-o anumit perioad a evoluiei sale.

Din punct de vedere al tehnicii de construire gracele pot grupate n mod neconvenional n dou tipuri de grace: 1. Grace fundamentale, de baz (histograma, poligonul, ogiva, diagrama linear) 2. Grace speciale (diagrama prin coloane, piramida populaiei/vrstelor, gracele de structur care utilizeaz cercul (pie chart), hri statistice, cartograme cu diferite simboluri, grace semilogaritmice etc.) 1. Grace fundamentale Seriile de variaie pot reprezentate prin urmtoarele tipuri de diagrame de distribuie: histograma, poligonul, ogiva i diagrama liniar, printre aceste tipuri se vor descrie histograma i diagrama linear care sunt frecvent utilizate n cercetarea din domeniul sntii. Histograma Histograma este o reprezentare grac, prin dreptunghiuri alturate, a distribuiei frecvenelor sau procentelor. Ea se utilizeaz cnd autorul gracului dorete s arate frecvena pentru o variabil continu (de exemplu vrsta). Histograma poate descrie i distribuia procentual. Frecvena cazurilor (sau procentajul) pentru ecare categorie este reprezentat de un dreptunghi. Aria dreptunghiului este proporional cu frecvena cazurilor din categoria respectiv. Aria dreptunghiului = Baza nlimea Scala categoriilor variabilei este reprezentat pe axa X prin distane egale. Scala frecvenelor este reprezentat pe axa Y prin distane egale corespunztoare frecvenelor egale. Axa Y ncepe ntotdeauna din punctul 0 pentru a evita problemele ce ar putea s apar n compararea bazelor. Axa X ncepe ns din orice punct convenabil (inferior) de pe ax. Obiectivul este acela de a obine o gur cu aria total egal cu frecvena total N (sau procentul total 100%). Exemplul 1. n Tab. 46 sunt prezentate datele necesare pentru construirea unei histograme.

Fig.10. Sistemul de coordonate cartezian.

164

BIOSTATISTICA

Metodologia general a cercetrii statistice

165

Tabelul 46 Frecvena n cadrul ecrei categorii a persoanelor investigate (%)


Ani de colarizare 4 ani 5 ani 6 ani 7 ani 8 ani Distribuia frecvenelor 21 53 69 47 33 N = 223 Frecvena n cadrul ecrei categorii a persoanelor investigate (%) 9,4 23,8 30,9 21,1 14,8 100,0%

Histograma utilizeaz valori absolute sau relative. Tehnica este aceeai, dar pe axa Y sunt reprezentate valori absolute sau relative n funcie de situaie. Pe axa X este reprezentat variabila pe care o msurm (intervalul de clas), iar pe axa Y este reprezentat frecvena pentru ecare interval de clas; nlimea dreptunghiului este proporional cu numrul de persoane din categoria respectiv.

vrsta

Fig.11. Histograma.

Unele variaii ale histogramei de baz sunt folosite pentru a reecta anumite caracteristici ale datelor. Spre exemplu, dac variabila este nominal dreptunghiurile din histogram pot separate astfel nct s vizualizeze separat i distinct categoriile. De obicei acest grac mai este numit i diagrama prin coloane iar dreptunghiurile au limile egale.

Pentru variabilele ordinale, unde nu sunt denite distane egale dreptunghiurile pot avea spaii ntre ele pentru a evidenia acest lucru (n particular dac variabila este discret i mai puin n cazul n care este continu). n acest caz, histograma poate de tip scar i d impresia de ordonare a categoriilor (marcajul este n interiorul ecrei coloane). Pentru variabilele ordinale exist tradiia de a lua o lime standard, dei distanele nu sunt denite. Acest lucru duce la evitarea distorsiunilor aparente ce pot s apar datorit variaiei limilor. Histograma este potrivit n cazul variabilelor de tip interval de variaie, discrete. Dac variabilele sunt de tip continuu exist alte tipuri de grace mai potrivite (exemplu, poligonul frecvenelor). Poligonul frecvenelor Poligonul frecvenelor sau al procentelor este o gur nchis ce unete punctele dintre centrele de interval i frecvenele lor. Este o alternativ la histogram. O alt modalitate de reprezentare grac este distribuia cumulativ a frecvenelor sau procentelor. Acest tip de grac arat frecvena, respectiv procentele cazurilor situate sub marginea superioar a ecrei clase succesive. Diagrama liniar (cronogram sau historiogram) Reprezint forma specic pentru reprezentarea seriilor dinamice, cronologice. Este utilizat pentru descrierea evoluiei n timp a unui fenomen (natalitate, fertilitate, mortalitate etc.). Diagrama liniar prezint valoarea anumitor variabile dependente (reprezentate pe axa Y) pentru ecare categorie a variabilei independente (reprezentate pe axa X). Punctele de pe grac sunt unite printr-o linie dreapt, iar gura nu este nchis cu axa X. Aria de sub curb nu are un neles particular aa cum se ntmpl n cazul histogramei sau a poligonului. n acest tip de grac ochiul urmrete uor curba de evoluie i sesizeaz imediat modicrile care s-au produs n timp n evoluia fenomenului observat. Este frecvent utilizat n monitorizarea strii de sntate a unei comuniti (natalitate, mortalitate, morbiditate). Fig. 12 este un exemplu de diagram liniar. Variabila independent este timpul reprezentat pe axa X iar variabila dependent este rata (reprezentat pe axa Y).

166

BIOSTATISTICA

Metodologia general a cercetrii statistice

167

Acest tip de grac este util atunci cnd una dintre variabile (de pe axa X) este continu, este deci, variabil de tip interval (exemplu vrsta i timpul). Se poate folosi i o diagram prin coloane n cazul n care variabilele de pe axa X sunt nominale sau ordinale. n acest caz barele verticale sunt mai indicate pentru comparri. Pentru seriile cronologice urmrirea vizual a coloanelor n scopul observrii evoluiei este mai dicil. n diagrama linear curbele pentru seriile cronologice sunt mult mai uor de urmrit i n acelai timp ofer o descriere (un desen) a evoluiei n timp a fenomenului observat.

2. Grace speciale Diagrama prin coloane Este cea mai simpl form de grac. Acest tip de diagram este utilizat atunci cnd se urmrete: - reprezentarea mai multor fenomene n acelai loc i n acelai timp, sau - acelai fenomen n mai multe locuri dar n acelai timp (ex. rata de mortalitate general pe raioane n anul 2006). Diagrama prin coloane este uor de reprezentat grac i uor de citit. Se utilizeaz atunci cnd dorim s reprezentm valori distincte ale variabilelor variabile calitative sau discrete. Pentru ilustrarea acestui lucru coloanele sunt separate de spaii. Sunt utilizate pentru reprezentarea grac a frecvenelor absolute sau a frecvenelor relative, a sumelor sau a mediilor. Pe axa X sunt reprezentate variabilele, n timp ce pe axa Y sunt reprezentate frecvenele. Utilizarea procentelor permite mult mai bine compararea mulimilor de date de dimensiuni diferite. Coloanele trebuie s e mai late dect spaiile dintre ele, iar spaiile trebuie s e bine denite, astfel nct gracul de tip coloan s nu poat confundat cu o histogram (varianta a este corect)

Fig 12. Incidena prin maladiile tractului gastrointestinal n Republica Moldova, 1997-2006 (la 10000 locuitori).

Atenie - Axa Y trebuie s e din lungimea axei X (sau de aceeai lungime). - ntotdeauna axele frecvenelor sau ale procentelor ncep de la punctul 0 sau de la origine. Axele scorurilor pot ncepe de la orice scor convenabil pentru a obine o diagram clar. - Fii siguri c diferenele numerice egale sunt reprezentate prin distane zice egale pe toate scalele. - Etichetarea corect a gracului includerea scalelor, sursa datelor, titlul explicativ, note explicative, etc. Evitai confuziile: nu reprezentai mai multe grace diferite utiliznd aceleai sistem de axe.

Reeaua de axe este util pentru comparaii i pentru citirea aproximativ a valorilor. Dac axele reelei sunt n numr prea mare gracul este greu de citit, iar dac sunt n numr prea mic prezena lor nu se justic (varianta e i varianta f). Din punct de vedere al orientrii barele pot : - verticale - orizontale

168

BIOSTATISTICA

Metodologia general a cercetrii statistice

169

varianta d

varianta e

varianta f

Diagrama prin bare orizontale n acest tip de grac, pe axa X sunt reprezentate frecvenele, n timp ce pe axa Y sunt reprezentate variabilele. Barele orizontale sunt preferate n locul barelor verticale n dou situaii: - variabilele au iruri lungi de caractere (de exemplu bolile aparatului digestiv) varianta a - numr mare de valori a variabilei (de exemplu sunt trecute 30 de raioane) varianta b Pentru un numr mare de valori ale variabilei nu este sucient spaiu pe axa X pentru a reprezenta dreptunghiurile cu valorile corespunztoare.

Problemele de reprezentare a dreptunghiurilor ncep de la 6-8 valori ale variabilei. Criuleni

Sngerei

Pentru a pune n eviden coninutul gracului se vor respecta cteva principii. Ordonarea barelor - ordonarea adecvat a valorilor variabilei ofer un grac mai bun - pentru o variabil calitativ exist o libertate n ordonarea valorilor sale - aranjarea valorilor n ordinea descresctoare a frecvenelor creeaz un interes mai mare - neordonarea valorilor confer o imagine haotic Gruparea barelor este recomandat n dou situaii: - pentru a descrie simultan dou sau mai multe categorii - diferite categorii sunt reprezentate n acelai sistem de axe. Pentru diferenierea categoriilor se folosesc haurri sau culori diferite i se ataeaz gracului o legend. Se recomand s nu se reprezinte mai mult de dou-trei categorii, un numr mai mare va face dicil nelegerea gracului (de exemplu: masculin, feminin; urban, rural; salariat, patron, lucrtor pe cont propriu). Dac exist un numr mai mare de categorii se vor folosi mai multe grace cu coloane obinuite. Coloanele grupate sunt reprezentate e pe vertical e pe orizontal. Cele dou grace produc efecte diferite, chiar dac aria are aceeai dimensiune n ambele cazuri. n cazul coloanelor orizontale, axa procentelor este lung, astfel nct diferenele dintre valori pot observate mai clar. O alternativ la coloanele grupate o reprezint coloanele suprapuse parial (overlapping bars). Avantajul n acest caz este dat de economisirea spaiului, iar reprezentarea grac devine mai interesant. Exist totui riscul ca suprapunerea s fac gracul greu de neles sau s conduc la nenelegeri (varianta b) Se recomand n cazul n care: - toate valorile unei categorii sunt mai mici dect valorile celeilalte categorii (varianta a) - exist posibilitatea de a reprezenta categoria cu valori mai mici n fa cu o culoare mai deschis (varianta a)

170

BIOSTATISTICA

Metodologia general a cercetrii statistice

171

O alternativ de grupare a coloanelor o reprezint coloanele aranjate sub form de piramid, stivuite (stacked charts). Este cunoscut sub denumirea de diagram de structur prin dreptunghiuri (Fig. 13). Dreptunghiurile sunt reprezentate unul deasupra celuilalt. n acest caz, suprafaa dreptunghiului care reprezint ntreaga colectivitate (100%) este divizat n pri proporionale cu ponderea specic a ecrei componente care alctuiete ntregul. Se recomand un numr relativ mic de componente (variabile). Pentru valoarea ecrei variabile, nlimea coloanei corespunde cu frecvena total a categoriei respective. Cu precizie, poate citit numai dimensiunea categoriei de la baz; celelalte categorii pot apreciate cu aproximaie. Haurrile sau culorile diferite indic divizarea totalului n categoriile componente. Coloane suprapuse vs. coloane stivuite - ambele reprezint situaii similare - alegerea se limiteaz la ceea ce dorim s subliniem cel mai mult - n cazul coloanelor suprapuse este uor s compari ntre ele categorii diferite dar mai dicil s nelegi ce se ntmpl la nivelul ntregii categorii - n cazul coloanelor stivuite ansamblul este vizibil, n timp ce dimensiunea ecrei categorii este secundar. Aceeai informaie poate reprezentat din dou puncte de vedere utiliznd dou tipuri de grace.

Fig.13. Ponderea uxurilor de migraie n migraia total.

Fig. 14. Frecvena uxurilor de migraie n migraia total.

Exemplul 2: (Fig. 13 i Fig. 14). n reprezentarea din Fig. 13 se observ c ponderea uxului de migraie rural-urban a fost de trei ori mai mare n 1990 dect n 1998. Ponderea ecrei categorii este comparat cu ntregul.

172

BIOSTATISTICA

Metodologia general a cercetrii statistice

173

n Fig. 14 se observ distribuia uxului de migraie pe diverse categorii. Diagrama de structur care utilizeaz ca reprezentare cercul (pie chart) Aceasta este tipic pentru reprezentarea distribuiei procentelor n cazul variabilelor calitative i constituie o alternativ la diagrama prin coloane (Fig. 15). Acest tip de grac permite s se stabileasc n ce raport se gsesc grupele din cadrul colectivitii fa de colectivitatea n ansamblul ei (proporia bolilor aparatului digestiv din totalul bolilor).

Fig. 15. Structura deceselor pe cauze medicale n Republica Moldova, 2006 (%).

Caracteristicile acestei diagrame sunt: - totalul ariei reprezint 100% iar 1% corespunde la 3,6 grade; - n aria cercului se scriu procentele i nu gradele; - diagrama se citete n sensul acelor de ceasornic ncepnd cu punctul care poate asociat orei 12; - cercul nu trebuie s aib mai mult de 5-6 sectoare; - culorile trebuie s e atribuite ncepnd cu cea mai nchis pn la cea mai deschis; - cum aceast diagram ofer o vedere de ansamblu, ultima categorie trebuie s e altele i culoarea sau haurrile nu trebuie s e dominante.

Dac dorim s comparm mai multe grupuri de date folosind aceast diagrama, atunci vom construi o diagram pentru ecare grup n parte. Aria ecrui cerc va proporional cu dimensiunea grupului. n acest fel putem compara att dimensiunile grupurilor ct i distribuiile procentuale din cadrul ecrui grup simultan. Diagrama prin benzi Diagrama prin benzi reprezint o alternativ a histogramei. n acest tip de grac dreptunghiurile sunt foarte nguste i capt aspectul de benzi. Benzile sunt orizontale. Se poate alege ntre numere i procente. Sunt dou modaliti de reprezentare a procentelor: - procentele pot procente din total brbai i separat procente din total femei - procente din totalul populaiei Un exemplu de diagram prin benzi este piramida vrstelor (population pyramid) Piramida vrstelor descrie populaia unei ri sau regiuni pe sexe i grupe de vrst. Const din dou histograme orizontale, una pentru brbai i una pentru femei. Histogramele sunt aezate n oglind pentru a se face compararea ntre sexe, n populaia unei ri/regiuni. Pe axa orizontal putem reprezenta att valori absolute ct i procente. Lungimea benzilor este proporional cu valorile reprezentate iar limea lor este aceeai pentru toate benzile. Tehnica este utilizat i n alte situaii, de exemplu: - pentru a reprezenta proporia de fumtori n diferite grupuri de vrst la brbai i respectiv la femei - status marital etc. Hri statistice Hrile statistice ocup un loc special n reprezentarea variaiilor spaiale (geograce) a diverselor fenomene sau probleme sociale de sntate. Dintre acestea, n sistemul de sntate sunt frecvent utilizate cartogramele, care reprezint o combinare dintre grac i hart (Fig. 16). Cartogramele exprim distribuia nivelelor unui fenomen ntr-o arie geograc (ar, raioane, regiuni). Diferenele dintre proporii, rate, medii etc., sunt puse uor n eviden prin colorarea/haurarea diferit a ariilor geograce. Permite compararea valorilor dintre diferitele zone n acelai timp; compararea pune n eviden att zonele cu valorile cele

174

BIOSTATISTICA

Metodologia general a cercetrii statistice

175

mai ridicate, ct i zonele cu valorile cele mai sczute. Se obine o vizualizare spaial a informaiilor despre fenomenul observat (fertilitate, mortalitate etc.)

se stabilete un cod de culori sau haurri prin care vor exprimate valorile corespunztoare ecrui interval de mrime; - se coloreaz sau se haureaz ecare zon conform grupului de valori din care face parte; - n legend se va explica codul utilizat. n domeniul sntii publice s-a dezvoltat, n ultimii ani, conceptul de HEGIS (Health Environment Geographic Information System) care are la baz GIS (Geographic Information Systems). Aranjarea gracelor n raportul statistic n procesul de elaborare a raportului statistic, obiectivele autorului au un rol major. Aceleai date pot reprezentate n moduri diferite conform mesajului pe care autorul dorete s-l transmit. Exemplul 3. Mai jos este prezentat acelai indicator rata de inciden prin ciroz hepatic din dou perspective diferite conform inteniilor autorului. n varianta a, scopul este de a prezenta evoluia ratei de inciden pe o anumit perioad relevant de timp, 5 ani. n varianta b, mesajul este complet diferit i corespunde unui alt scop compararea ratei de inciden pe 5 ani. Deoarece este vorba de o serie temporal mesajul transmis de aceste date se refer la evoluie. Diferena se poate observa n modul n care sunt organizate gracele i din explicaiile prezentate n text. n varianta a, evoluia este subliniat de reprezentarea anilor pe axa orizontal. Acesta este modul obinuit de reprezentare a datelor temporale. De asemenea pentru a evidenia evoluia, anii sunt sortai n ordine cresctoare. Textul asociat descrie evoluia n ansamblu i subliniaz neregularitile remarcabile. n varianta b, inteniile autorului sunt complet diferite, (obiectivul este compararea). Pentru comparaii sunt necesare schimbri structurale. n varianta b anii sunt reprezentai pe axa vertical eliminnd impresia de evoluie. Aceast schimbare este important pentru perceperea gracului, deoarece eliminnd diferenele false, mesajul devine mai clar.

Fig. 16. Clasicarea raioanelor dup nivelul inrmitii motorii cerebrale, anul X().

n tehnica de construire a unei cartograme paii importani sunt: - se grupeaz pe intervale de mrime valorile fenomenului observat;

176

BIOSTATISTICA

Metodologia general a cercetrii statistice

177

Varianta a: un singur obiectiv evoluia

Varianta b: un singur obiectiv compararea

Fig. 17. Rata de inciden prin ciroz hepatic n Republica Moldova, 2000-2004 (la 100 mii locuitori).

Interpretare: Varianta a Tendina incidenei este de cretere din 2000 pn n 2004, observndu-se un nivel mai sczut n 2000 i 2002. Varianta b n perioada 2000-2004 nivelul cel mai sczut al ratei de inciden prin ciroz hepatic s-a nregistrat n 2000 iar cel mai ridicat n 2004. n varianta b anii sunt tratai ca variabile nominale n loc de variabile ordinale i astfel, sortate n ordine cresctoare dup valorile variabilelor. Aceast reordonare are dou efecte pozitive: pe de o parte, distruge imaginea evoluiei, deoarece anii nu sunt prezentai n succesiune i pe de alt parte, permite o mai bun comparare a valorilor. La rndul lui textul asociat este diferit de cel din varianta a n locul descrierii modului n care are loc evoluia ratei de inciden, se menioneaz numai anii cei mai buni i cei mai slabi. Aceast diferen este important pentru autor, mai ales atunci cnd dorete s transmit mai multe mesaje. Exist situaii n care dou obiective pot combinate pentru a reprezentate grac. n acest caz reprezentarea grac ine cont n primul rnd de obiectivul principal. O prezentare grafic greit are consecine mai grave dect inexistena ei. Anders Wallgren Lista de vericare (Check-list) nainte de a ncepe construirea gracului Care este grupul int? Care este rolul gracului? Ce tip de grac trebuie ales? Cum trebuie prezentat gracul? Ct de mare trebuie s e gracul? Este reprezentarea grac cea mai bun alegere de prezentare a informaiilor? Dup ce construirea gracului a fost nalizat Este gracul uor de citit? Poate gracul interpretabil (interpretat greit)? Sunt potrivite forma i mrimea gracului? Este integrat gracul corect n text ? Se recomand testarea gracului: se solicit unei persoane care are caracteristicile grupului int citirea i interpretarea gracului. For-

Ani

178

BIOSTATISTICA

Metodologia general a cercetrii statistice

179

mulai ntrebri despre grac astfel nct s nelegei cum este el perceput de persoana aleas.

3.5. Analiza i interpretarea materialului statistic Datele statistice, obinute n cadrul operaiei de adunare i prelucrare a materialului statistic, necesare efecturii unei lucrri tiinice, sunt de obicei date brute sau mrimi absolute. Operaia de prelucrare continu cu unele operaii de nee n care datele brute sunt transformate n mrimi relative sau mrimi medii. Sub aceast form de indicatori statistici, deci raportate la aceeai baz, datele obinute pot supuse unor operaii de comparare, corelare, abstractizare i generalizare, ceea ce ne permite o interpretare ct mai realist a materialului cercetat. Dup ce materialul statistic a fost prelucrat i datele obinute sub form de valori absolute, relative sau medii, au fost prezentate n tabele sau grace, urmeaz etapa de analiz i interpretare a materialului statistic. Aceast operaie const dintr-o serie de aprecieri, comparaii i corelaii a rezultatelor obinute. Aprecierea tendinelor n timp Valorile nregistrate de noi n raport cu timpul (an, semestru, trimestru, luni) pot mai mari sau mai mici, pozitive sau negative, n funcie de modicarea unor factori care pot contribui la determinarea sau inuenarea evoluiei fenomenului cercetat, ntr-un sens sau altul. Folosind aceste aprecieri comparative putem sesiza rolul pozitiv sau negativ pe care factorii respectivi (factori de risc sau de protecie) l-au exercitat asupra fenomenului cercetat. Exemplul 1. Cercetnd morbiditatea prin HTA ntr-o colectivitate i determinnd anumite valori ale acesteia, pentru a vedea n ce msur recomandrile fcute pentru eliminarea factorilor de risc au fost eciente, comparm valorile gsite de noi n momentul examinrii cu valorile morbiditii prin HTA n aceeai colectivitate cu 5 sau 10 ani n urm. Dac valorile gsite de noi ale morbiditii (sub raportul indicelui de inciden sau prevalen) sunt mai reduse dect cele nregistrate cu 5 sau 10 ani n urm, deci s-au redus de la o prevalen de 18% spre exemplu la o valoarea a indicelui de prevalen de 12%, nseamn c msurile recomandate, n timp, pentru reducerea factorilor de risc (alimentari, efort zic, stres) au fost eciente.

Exemplul 2. Cercetnd morbiditatea prin afeciuni stomatologice ntr-o colectivitate industrial care lucreaz n mediu cu vapori de mercur, trebuie s comparm valorile morbiditii stomatologice gsite de noi n momentul examinrii cu valorile pe care aceast morbiditate le-a nregistrat cu 5 sau 10 ani n urm i cu condiiile de munc existente n perioada respectiv de timp. Aprecierea tendinelor fenomenelor n spaiu Rezultatele obinute n cercetarea noastr trebuie apreciate apoi comparativ cu rezultatele pe care ali cercettori le-au obinut n colectiviti spaial diferite cu condiii de munc i de trai similare sau diferite. Aprecierea rezultatelor obinute de noi n raport cu rezultatele nregistrate n colectiviti diferite n care exist factori de risc mai numeroi, ne permite s reliefm rolul factorilor de risc n determinarea sau inuenarea acestei patologii. Spre exemplu dac n colectivitatea A examinat de noi, valorile prevalenei prin HTA sunt de 12% iar n colectivitatea B, cu condiii similare cu cele ale colectivitii A, nregistrm valori ale prevalenei de 18% nseamn c munca de prevenire i combatere a unor factori de risc existeni n colectivitatea B las de dorit. Dac exist condiii geograce, social-economice, comportamentale diferite, iar asistena medical este de aceeai calitate, diferena valoric poate pus pe seama unor factori de risc insucient cunoscui i stpnii, n felul acesta putem sesiza i evalua rolul pe care unii factori climatici, socialeconomici, culturali, igienico-sanitari, de asisten medical etc. l exercit n determinarea sau inuenarea strii de sntate a populaiei. Corelarea rezultatelor obinute cu factorii de risc care sunt n msur s inueneze fenomenul cercetat. Asemenea factori pot factori naturali ai mediului zic extern (clima, altitudinea, condiii hidrologice, microclimat, ap, aer etc.) factori biologici, factori social-economici (locuin, alimentaie, obiceiuri, mentaliti, condiii de munc etc.). n urma operaiei de corelare se poate stabili msura n care unul dintre factorii de risc inueneaz, ntr-o mai mare sau mai mic msur, starea de morbiditate printr-o anumit afeciune i totodat se poate face o ierarhizare a acestora stabilindu-se i ordinea de inuenare a acestora. Dup ce am efectuat, n cadrul operaiei de analiz i interpretare, aprecieri, comparaii i corelaii ale rezultatelor obinute n raport cu complexul de factori de mediu extern, socio-economici, biologici, ce ar

180

BIOSTATISTICA

181

putut contribui la determinarea sau inuenarea, ntr-un sens sau altul a fenomenului cercetat, se trece la formularea de concluzii. Exemplul 3. Dac n colectivitatea A factorul de risc pentru HTA nu inueneaz semnicativ valorile TA, iar n colectivitatea B valorile crescute ale TA se coreleaz cu o solicitare nervoas de lung durat i cu o alimentaie neraional se impune o schimbare a ritmului de lucru n ntreprinderea respectiv i corectarea modului de alimentaie ale angajailor Exemplul 4. Dac morbiditatea prin stomatit mercurial a crescut fa de valorile anilor trecui, ind mai mare dect morbiditatea unor colectiviti cu condiii asemntoare, rezult c au existat deciene n supravegherea strii de sntate a colectivitii respective. Lucrarea se ncheie cu capitolul propuneri. ntruct orice lucrare cu caracter aplicativ, pe care o efectum, urmrete un scop practic, este resc ca ea s se ncheie cu acest capitol de propuneri, n cadrul acestui capitol propunerile elaborate trebuie s e ct mai concrete, s e uor aplicabile, viznd totodat i cile de rezolvare a problemelor. Exemplul 5. n cazul frecvenei crescute a bolii hipertensive n colectivitatea B se vor face propuneri de modicare a proceselor tehnologice cu automatizarea unor operaii solicitante, se vor indica micropauze la anumite intervale de timp, se va institui un program de educaie pentru sntate n vederea instituirii unui regim alimentar raional etc. Exemplul 6. Pentru reducerea cazurilor de stomatit mercurial se vor lua msuri cu caracter tehnic, menite s limiteze concentraia vaporilor de mercur n aerul atmosferic, la locul de munc, se vor indica msuri de depistare activ prin consultaii periodice active, de tratament prompt i ecient al cazurilor recent depistate, de educaie sanitar a muncitorilor expui, cu accent pe msurile de igien individual, bucodentar etc.

BIBLIOGRAFIE
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Albert, J. M., Yun, H. (2001). Statistical advances in AIDS therapy trials. Statistical Methods in Medical Research 10:85100. Andersen, P. K., Klein, J. P., Knudsen, K. M., Tabanera y Palacios, R. (1997). Estimation of variance in Coxs regression model with shared gamma frailties. Biometrics 53:14751484. Babiker, A. G., Cuzick, J. (1994). A simple frailty model for family studies with covariates. Statistics in Medicine 13:16791692. Bailar JC III. The promise and problems of meta-analysis. New England Journal of Medicine 337:559-560,1997. Bjorling, L. E., Hodges, J. S. (1997). Rule-based ranking schemes for antiretroviral trials. Statistics in Medicine 16:11751191. Bloom BS, et al. A reappraisal of hepatitis B virus vaccination strategies using cost-effectiveness analysis. Annals of Internal Medicine 118:298306,1993. Borzak S, Kidker PM. Discordance between metaanalyses and large-scale randomized controlled trials: examples from the management of acute myocardial infarction. Annals of Internal Medicine 123:873-877,1995. Buyse, M., Molenberghs, G. (1998). Criteria for the validation of surrogate end-points in randomized experiments. Biometrics 54:10141029. Carr, A., Samaras, K., Thorisdottir, A., Kaufmann, G. R., Chisholm, D. J., Carsenten, B. (1996). Regression models for interval censored survival data: application to HIV infection in Danish homosexual men. Statistics in Medicine 15:21772189. Clayton, D., Cuzick, J. (1985). Multivariate generalizations of the proportional hazards model. Journal of the Royal Statistical Society A 148:82117. Clemens JD, et al. The BCG controversy: a methodological and statistical reappraisal. Journal of the American Medical Association 249:2362-2369, 1983. Daniels,M. J., Hughes,M. D. (1997). Meta analysis for the evaluation of potential surrogate markers. Statistics in Medicine 16:19651982. DeGruttola, V., Fleming, T. R., Lin, D. Y., Coombs, R. (1997). Validating surrogate markers are we being naive? Journal of Infectious Diseases 175:237246. Delta Coordinating Committee (1996). Delta: a randomised double-blind controlled trial comparing combinations of zidovudine plus didanosine or zalcitabine with zidovudine alone in HIV-infected individuals. Lancet 348:283291. Delta Coordinating Committee and Virology Group (1999). An evaluation of HIV RNA and CD4 cell count as surrogates for clinical outcome. AIDS 13: 565573. DeMasi, R. A., Babiker, A. G. (1998). Nonparametric estimation of the proportion of treatment effect explained by a surrogate marker. Presented at the 1998 ENAR conference, April 1, 1998.

16. 17.

182

BIOSTATISTICA

BIBLIOGRAFIE

183

18. Dempster, A. P., Laird, N.M., Rubin, D. R. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society B 39:138. 19. Efron, B. (1988). Logistic regression, survival analysis and the Kaplan Meier curve. Journal of the American Statistical Association 83:414425. 20. Ellenberg, S. S., Finkelstein, D. M., Schoenfeld, D. A. (1992). Statistical issues arising in AIDS clinical trials (with discussion). Journal of the American Statistical Association 87:562583. 21. Fieller, E. C. (1940). The biological standardisation of insulin. Journal of the Royal Statistical Society 7:S1S15. 22. Finkelstein, D. M., Schoenfeld, D. A., Stamenovic, E. (1997). Analysis of multivariate failure time data from an AIDS clinical trial. Statistics in Medicine 16:951961. 23. Finkelstein, D. M. (1986). A proportional hazards model for interval-censored failure time data. Biometrics 42:845854. 24. Foulkes, M. A. (1998). Advances in HIV/AIDS statistical methodology over the past decade. Statistics in Medicine 17:125. 25. Freedman, L. S., Graubard, B. I., Schatzkin, A. (1992). Statistical validation of intermediate endpoints for chronic diseases. Statistics in Medicine 11:167178. 26. Gehan, E. A. (1965). A generalized two-sampleWilcoxon test for doubly censored data. Biometrika 52:620653. 27. Hughes, M. D. (2000). Analysis and design issues for studies using censored biomarker measurements with an example of viral load measurements in HIV clinical trials. Statistics in Medicine 19:31713191. 28. Jekel IF, et al. Inuence of the prevalence of infection on tuberculin skin testing programs. Public Health Reports 84:883-886,1969. 29. Journot, V., Chene, G., Joly, P., Saves, M., Jacqmin-Gadda, H., Molina, J.-M., Salamon, R., the ALBI Study Group (2001). Viral load as a primary outcome in Human Immunodeciency Virus trials: a review of statistical analysis methods. Controlled Clinical Trials 22:639658. 30. Kay, R. (1984). Multistate survival analysis: An application in breast cancer. Methods of Information in Medicine 23:157162. 31. Klein, J. P., Moeschberger, M. L. (1997). Survival analysis: techniques for censored and truncated data. New York: Springer-Verlag. 32. Klein, J. P. (1992). Semiparametric estimation of random effects using the Cox model based on the EM algorithm. Biometrics 48:795806. 33. Kulinskaya E.V., Satarov G.A. Testing the Hypotesis about the Quality of Classication in the Data-Analysis System Clams // Statistical Data Analysis. Abstracts f International Conference. Soa, 1990. 34. Munink M, et al. Decision Making in Health and Medicine: Integrating Evidence and Values. Cambridge: Cambridge University Press, 2001. 35. Murean P. Manual de metode matematice n analiza strii de sntte. Bucureti, 1989, 574 pag.

36. Newcombe, R. G. (1988). Explanatory and pragmatic estimates of the treatment effect when deviations from allocated treatment occur. Statistics in Medicine 7:11791186. 37. OBrien, P. C. (1984). Procedures for comparing samples with multiple endpoints. Biometrics 40:10791087. 38. Pickles, A., Crouchley, R. (1995). A comparison of frailty models for multivariate survival data. Statistics in Medicine 14:14471461. 39. Prentice, R. L., Williams, B. J., Peterson, A. V. (1981). On the regression analysis of multivariate failure time data. Biometrika 68:373379. 40. Raab, G. M., Parpia, T. (2001). Random effects models for HIV marker data: Practical approaches with currently available software. Statistical Methods in Medical Research 10:101116. 41. Robins, J. M., Greenland, S. (1994). Adjusting for differential rates of prophylaxis therapy for PCP in high-dose versus low-dose AZT treatment arms in an AIDS randomized trial. Journal of the American Statistical Association 89:737749. 42. Smith, P. J., Thompson, T. J., Jereb, J. A. (1997). A model for interval-censored tuberculosis outbreak data. Statistics in Medicine 16:485496. 43. Sonnenberg FA, Beck JR. Markov models in medical decision making: a practical guide. Medical Decision Making 13:322-338,1993. 44. Sun, J. (1997). Regression analysis of interval-censored failure time data. Statistics in Medicine 16:497504. 45. Survival Analysis: State of the Art. Boston: Kluwer Academic Publishers, pp. 99120. 46. Thall, P. F., Cheng, S. C. (1999). Treatment comparisons based on twodimensional safety and efcacy alternatives in oncology. Biometrics 55:746753. 47. Touloumi, G., Pocock, S. J., Babiker, A. G., Darbyshire, J. H. (1999). Estimation and comparison of rates of change in longitudinal studies with informative drop-outs. Statistics in Medicine 18:12151233. 48. Touloumi, G., Pocock, S. J., Babiker, A. G., Darbyshire, J. H. (2002). Impact of missing data due to selective drop-outs in cohort studies and clinical trials. Epidemiology 13:347355. 49. Tubert-Bitter, P., Bloch, D. A., Raynauld, J. P. (1995). Comparing the bivariate effects of toxicity and efcacy of treatments. Statistics in Medicine 14:11291141. 50. Volberding, P. A., Lagakos, S. W., Koch, M. A., Pettinelli, C. B., et al. (1990). 51. Walker, A. S., Babiker, A. G., Darbyshire, J. H. (2000). Analysis of multivariate failure-time data from HIV clinical trials. Controlled Clinical Trials 21:7593. 52. Walker, A. S. (1999).The analysis of multivariate failure time data with application to multiple endpoints in trials in HIV infection. Unpublished PhD thesis, University College, London.

184

BIOSTATISTICA

BIBLIOGRAFIE

185

53. Wang, S. T., Klein, J. P., Moeschberger, M. L. (1995). Semi-parametric estimation of covariate effects using the positive stable frailty model. Applied Stochastic Models and Data Analysis 11:121133. 54. Wei, L. J., Glidden, D. V. (1997). An overview of statistical methods for multiple failure time data in clinical trials. Statistics in Medicine 16:833839. 55. Wei, L. J., Lin, D. Y., Weissfeld, L. (1989). Regression analysis of multivariate incomplete failure time data by modelling marginal distributions. Journal of the American Statistical Association 84:10651073. 56. Weinstein MC, Fineberg HV. Clinical Decision Analysis. Philadelphia: Saunders, 1980. 57. White, I. R., Babiker, A. G., Walker, A. S., Darbyshire, J. H. (1999). Randomization-based methods for correcting for treatment changes: examples from the Concorde trial. Statistics in Medicine 18:26172634. 58. .., .., .. . .: , 1974. 59. . .: , 1985. 60. .., B.., .., .., A.. , //, 1977. . 17. ,7. 61. ..; H.. . .: , 1983. 62. .. . : , 1985. 63. .., ... ... .., ... .. -3 //. 1977. .17. 6, 7. 64. .., . .. . . .: , 1984. 65. .., . . .: , 1976. 66. E.. CLAMS IBM // . . . . .: , 1980. 67. ., .. CLAMS IM PC //. . Te. . : , 1990. 68. .., .., .. // . 1976. 3.

69. .. , . .: , 1982. 70. A.. . : - , 1982. 71. A.. //[2]. 72. A.. //. . . .: , 1985. 73. A.. //. 1 . , , . . 1. .: , . , 1988. 74. A.. // . .8. .: , 1982. 75. .., .. // I . - - (8- 1985 ., ). : , 1986. 76. .. , - // 1984 . . . .: , 1986. 77. .. //- - . .: , 1987. 78. .. // . .: , 1983. 79. .. // . . , 1985. .: , 1987. 80. .. // . .: , 1980. 81. .. // . .: , 1983. 82. .. - // . . , 1985. .: , 1987. 83. .. - . .: , 1979.

186

BIOSTATISTICA

84. .., .. // . .: , 1977. 85. .. // . 1982. 7. 86. .. // . .: , 1982. 87. .. // . : . . -, 1991. 88. .. // . .: , 1977. 89. H.., .., .. //. . ) . Te. . , 1977. 90. .B. //[2]. 91. . . . . .: , 1987. 92. .. . : , 1986. 93. .. - // . .: , 1984. 94. .. . . .: , 1979. 95. .., .. . .: , 1982. 96. A.M. - // . .: , 1980.

S-ar putea să vă placă și