Elemente de Statistică Medicală

MIȘA (PÎNDICHI) CORNELIA
ANUL I MISMF
REFERAT PROGRAM MASTERAT
ELEMENTE DE STATISTICĂ UTILIZATE ÎN SĂNĂTATEA

PUBLICĂ ŞI MANAGEMENT.
Last (1988) defineşte statistica ca ştiinţa recoltării şi analizării datelor care

sunt supuse variaţiei randomizate.
Apărută din necesitatea cunoaşterii realităţii sub diversitatea aspectelor
sale de manifestare, statistica urmăreşte exprimarea din punct de vedere
cantitativ a fenomenelor şi proceselor de interes, utilizând pentru aceasta metode
de descriere numerică, alături de analiza calitativă a fenomenelor studiate.
Cercetarea statistică are ca obiect de studiu populaţiile (colectivităţi
statistice) iar la nivelul acestora, anumite caracteristici de interes (numite şi
variabile) care se observă şi măsoară la nivel de individ (unitate statistică).
Utilizarea metodelor statistice în medicină se datorează faptului că
medicină, prin introducerea tehnologiilor înalte, a devenit o ştiinţă cantitativă ce
permite măsurarea, cuantificarea şi compararea fenomenelor iar pe de altă parte
analiza fenomenelor de interes medical nu se poate realiza prin studiul întregii
populaţii (populaţii exhaustive) ci pe eşantioane reprezentative fiind necesare
tehnicile de inferenţă statistică în scopul generalizării rezultatelor.
Domenii de utilizare a biostatisticii în domeniul medicinii, a sănătăţii

publice şi managementului serviciilor sanitare:
1. evaluarea stării de sănătate a colectivităţilor;
2. studiul procesului de cauzalitate (determinism) şi a relaţiei doză efect;
3. diagnostic medical: analiza şi estimarea ponderii factorilor de risc în
etiologia bolilor şi a stării de sănătate;
4. experimente clinice randomizate;
5. elaborarea algoritmului de lucru în cercetarea clinică sau de laborator
(cercetarea experimentală);
6. elaborarea şi evaluarea intervenţiilor, etc.
Termeni utilizaţi în biostatistică inclusiv în sănătatea publică:

1. Colectivitatea statistică reprezintă totalitatea elementelor care au
caracteristici comune şi care formează obiectul analizei statistice (ex.
Populaţia unui sat, oraş, regiuni, nr. de hematii circulante, nr. de
bacterii de pe o cultură microbiană, etc.).
2. Colectivitatea statistică generală (populaţia) exprimă totalitatea
elementelor de un anumit tip existente în realitate sau teoretice;
3. Colectivitatea statistica parţială este constituită din totalitatea
unităţilor de observare existente şi care pot intra în studiu;
4. Colectivitatea statistică parţial constituită aleator (eşantion, mostră)
reprezintă elementelor extrase întâmplător dintr-o populaţie, după
criterii bine stabilite, în scopul determinării caracteristicilor populaţiei
respective utilizând instrumentele biostatisticii;
5. Colectivitate statistică parţială, constituită nealeator este partea
extrasă dintr-o populaţie după unul sau mai multe criterii neutilizându-
se elementele tehnicilor de eşantionare aleatoare;
6. unitatea statistică (unitatea de observare) este reprezentată de fiecare
element component al colectivităţii statistice;
7. caracteristica (variabila) este una din însuşirile de interes medical
prin care se manifestă unitatea de observaţie şi exprimă acea însuşire
comună unităţilor unei populaţii, însuşire ce poate fi observată,
măsurată şi înregistrată putând prezenta valori diferite pe scala aleasă;
8. Caracteristicile cantitative sunt însuşirile măsurabile ale unităţilor de
observare şi care pot fi exprimate prin unităţi de măsură (ex. Unităţile
din sistemul internaţional de măsură);
9. Caracteristicile cantitative continue sunt acele însuşiri măsurabile ce
pot lua orice valoare numerică din domeniul zecimal sau ordinal (ex.
Talia, greutatea, tensiunea arterială, uremia, etc.);
10.Caracteristicile cantitative discontinue (discrete) sunt reprezentate
de acele însuşiri care pot fi exprimate numai sub forma numerelor
întregi;
11.Variabila statistică este caracteristica ce prezintă proprietatea de a
varia în timp şi spaţiu condiţionată de factorii care acţionează asupra
populaţiei aflate în studiu;
12.Varianta (xi) este valoarea concretă sub care este înregistrată o
caracteristică;
13.Frecvenţă (fi ~ nf) este numărul de repetiţii sub care se înregistrează
aceeaşi variantă;
14.Seria statistică (repartiţia statistică) reprezintă şirul de valori
numerice ale unei caracteristici, ordonate după un anumit criteriu,
funcţie de şirul valorilor altei caracteristici. Repartiţiile statistice sunt
definite cu ajutorul legilor de repartiţie (ex. legea distribuţiei normale);
15.Parametrul statistic este valoarea reprezentativă dedusă dintr-un
calcul numeric aplicat unei repartiţii statistice (media, dispersia, etc.);
16.Indicatorul statistic este mărimea statistică cu ajutorul căruia se poate
caracteriza un fenomen de interes medical sub raportul structurilor
interdependenţelor sau modificărilor în timp sau spaţiu.
17. Indicele statistic este valoarea numerică relativă ce rezultă din
compararea valorilor unui indicator statistic , fie la momente diferite,
fie în spaţii diferite sau pentru categorii diferit constituite în raport cu o
caracteristică oarecare
Etape principale în studiul statistic:

1. Fixarea obiectivului, scopului şi premiselor (ipotezei) studiului;
2. Documentarea aprofundată asupra aspectelor luate în studiu.
3. Alegerea metodelor de cercetare şi prelucrare;
4. Efectuarea investigaţiei (observarea şi măsurarea evenimentelor);
5. Înregistrarea informaţiilor obţinute (după verificarea cantitativ a şi
calitativă);
6. Prelucrarea informaţiilor (codificare);
7. Tabelarea datelor şi realizarea graficelor;
8. Analiza, sinteza şi evaluarea datelor observate.
De aceea de la începutul unui studiu statistic trebuie definite:

- populaţia ţintă;
- eşantionul;
- caracteristicile de interes (de măsurat şi înregistrat).
Pentru că, din motive obiective, studiul nu se poate realiza ,de regulă, la
nivelul întregii populaţii, statistica a dezvoltat teoria (şi metodele) selecţiei (a
eşantionajului).
Caracteristicile de interes pentru cercetarea unui fenomen la nivelul unei
populaţii, numite şi variabile, sunt definite cu ajutorul teoriei scalării în vederea
măsurării şi înregistrării lor.
Calitatea prelucrării datelor înregistrate, deci şi a rezultatelor obţinute
depinde de modul cum au fost selectate metodele scalării variabilelor şi a
selecţiei eşantioanelor.
I.4.1. Teoria selecţiei.

Se bazează pe teoria probabilităţilor în vederea extragerii din populaţia
supusă cercetării a unui număr suficient de indivizi pentru a se constitui un
eşantion reprezentativ din investigarea căruia să deducem care este repartiţia de
frecvenţă a întregii populaţii pentru variabila studiată.
Din definiţia de mai sus se desprind două aspecte importante:
1. determinarea volumului eşantionului:
2. reprezentativitatea eşantionului (tehnici de eşantionaj).
Metode de determinare a volumului eşantionului reprezentativ.

Stabilirea mărimii eşantionului reprezentativ se face pe baza acceptării
unui compromis raţional între a opta pentru eşantioane de volum mare, care
asigură reprezentativitatea ridicată şi eşantioane de volum mic dar care sunt mai
economice.
Mărimea unui eşantion este dictată de :
 mărimea populaţiei de referinţă;
 gradul de variaţie a populaţiei de referinţă;
 forma de organizare a populaţiei studiate;
 importanţa cercetării efectuate care generează nivelul de
probabilitate.
Ca o regulă generală, dacă se stabileşte apriori un prag de semnificaţie a
(Pv), se impune ca abaterile dintre media populaţiei de referinţă şi media
eşantioanelor (care se pot genera) să respecte inegalitatea:
(m - x) £ a
unde "a" reprezintă eroarea limită admisă (absolută sau relativă) există mai
multe tehnici de stabilire a volumului optim (minim) a eşantionului.
1. In cazul în care se cunoaşte distribuţia în populaţie a caracteristicii

studiate (din studii prealabile), se iau în calcul:
- eroarea limită cu care să se lucreze (Dx);
- nivelul de semnificaţie Pv.
t2 2
formula de calcul propusă: n=
t2 2
x2 +
N
unde:
t = factorul de probabilitate corespunzător lui Pv de 1,96;
s = deviaţia standard
Dx = eroarea limită admisă de 0.05.
Această formulă este greu de definit fiind necesară pentru stabilirea lui s
efectuarea unui microstudiu prealabil.
2. În situaţia unei caracteristici alternative (dihotomice) se utilizează

formula:
t2pq
n=
t2pq
x2 +
N
unde:
- p = probabilitatea de apariţie a primei forme de manifestare;
- q = probabilitatea de manifestare a celeilalte forme de manifestare.
3. O formulă de calcul care ţine cont numai de eroarea de

reprezentativitate (propusă de Tara Yamone) este:
n = N / 1 + er2 N.
unde er2 reprezintă eroarea de reprezentativitate.
4. Dacă se cunoaşte abaterea medie pătratică se poate utiliza formula

propusă de Mills:
n = 9NV2/ 9D2 + 9V2;

unde:
D = eroarea relativă care poate fi luată după rigurozitatea pe care o
impune cercetarea (5-15%)
N = volumul colectivităţii generale;
V = dispersia relativă, egală cu abaterea medie pătratică împărţită la
numărul de cazuri.
5. Există în literatura de specialitate o serie de tabele care simplifică mult

determinarea volumului eşantionului , tabele propuse de mai mulţi autori cum ar
fi:
- tabelele elaborate de Neal W. Chilton şi John W. Fertig
- tabelul elaborat de Internaţional Epidemiological Asociaţion (I.E.A.),
recomandat de OMS în special în studiul morbidităţii.
- tabel elaborat de I.E.A. pentru selecţii aleatoare pe bază de cuiburi.
6. Formulele şi tabelele lui Schlesselmann sunt foarte importante în

cercetările epidemiologice de tip caz-control după care se poate stabili fie
eşantionul minim, fie intensitatea relaţiei de cauzalitate în cazul unui eşantion
dat.
7. Similare cu tabele de mai sus sunt tabelele lui Fliess care permit
cunoaşterea volumului eşantionului reprezentativ în vederea acceptării sau
respingerii ipotezei zero.
Tehnici de realizare a eşantioanelor

In practica statistică, după procedeul utilizat în constituirea eşantionului,
distingem două tipuri de sondaje:
1. nealeatoare sau prin "alegere raţională"; sunt mai puţin costisitoare,
sunt mai practice dar sunt mult mai puţin exacte.
2. aleatoare sau probabilistice.

In cadrul sondajelor aleatoare sunt incluse acele procedee bazate pe
modele de construire a eşantioanelor în care alegerea unităţilor din populaţie se
face în mod aleator (întâmplător), fiecare unitate având o probabilitate cunoscută
şi diferită de zero de a accede în cadrul eşantionului.
Se pot utiliza numeroase procedee de eşantionare. În cadrul aceluiaşi plan
de eşantionare se poate folosi una sau mai multe metode probabilistice sau
neprobabilistice din anumite considerente practice.
Utilizarea eşantioanelor aleatoare prezintă unele avantaje, sunt

operativitate, permit înregistrarea concomitentă a mai multor caracteristici,
volum de muncă redus, dar cel mai important îl reprezintă calitatea de
reprezentativitate.
Reprezentativitatea permite generalizarea datelor obţinute la

populaţia generală prin tehnici specifice de inferenţă statistică.
Tehnici de realizare a eşantioanelor aleatoare:

- tragerea la sorţi;
- utilizarea tabelelor de numere aleatoare;
- utilizarea pasului de numărare.
Aceste tehnici se aplică bazei de sondaj (populaţiei studiate) pentru care
trebuie să existe o listă completă, actualizată şi exactă.
Tipuri de eşantioane.
1. Eşantionare aleatoare simplă; utilizează tabelul cu numere aleatoare

sau tragerea la sorţi.
2. Eşantionarea sistemică sau mecanică; utilizează pasul de numărare.
3. Eşantionarea stratificată constă în împărţirea, în prealabil, a
populaţiei pe starturi, după unul sau mai multe criterii, pentru a realiza creşterea
şansei de obţinere a unei reprezentativităţi mai ridicate. inferenţa se poate aplica
şi la nivelul straturilor cât şi la nivelul întregului eşantion.
4.Eşantionarea cu probabilităţi inegale. Acest tip de eşantionaj se
utilizează atunci când unităţile populaţiei, în raport cu una sau mai multe
caracteristici, au valori ce diferă semnificativ, iar aplicarea eşantionării cu
probabilităţi egale duce la o eficienţă scăzută a estimaţiilor făcute.
5. Eşantionarea pe "grappe" (pe cuiburi), se utilizează când dispersia
teritorială a populaţiei de investigat este prea mare sau când lipseşte o bază de
sondaj.
Se caracterizează prin faptul că nu se mai extrag unităţi independente ci
grupuri de unităţi eterogene (pachete; grappe, cuiburi) din populaţiile care sunt
organizate sub forma unei ierarhii.
Este recomandat ca mărimea cuibului să fie cât mai mică, numărul
cuiburilor mici cât mai mare iar eterogenitatea cuiburilor să fie cât mai mare.
6. Eşantionarea în mai multe trepte (multistadial).
Este o metodă de eşantionare care se desfăşoară în mai multe etape
succesive şi se aplică tot pentru o populaţie organizată ierarhic, pe mai multe
niveluri. practic se constituie pentru fiecare nivel una sau mai multe baze de
sondaj, cuprinzând unităţile elementare de nivelul imediat următor.
7. Eşantionarea în mai multe faze (multifazic) este o generalizare a
eşantionării stratificate (tipice) şi se utilizează din următoarele considerente:
- creşterea operativităţii şi reducerea cheltuielilor;
- de la o fază la alta se reduce numărul unităţilor din eşantion cu creşterea
corespunzătoare a obiectivelor pe care le propune cercetarea;
- se pot cuantifica non-răspunsurile.
I.4.2. Teoria scalarii.

Are ca scop definirea unei scale de măsurare (acordarea de valori) pentru
fiecare caracteristică luată în studiu în aşa fel încât să se poată utiliza operatori
algebrici în prelucrarea valorilor individuale pentru obţinerea indicatorilor
(măsurilor) de sinteză.
Caracteristicile investigate pot fi, după modul în care se măsoară,
calitative sau cantitative. Există astfel:
1. Scale pentru variabile (caracteristici) calitative, care cuprind:

- a. scala nominală (sex, stare civilă, etc.), prin care se acordă simboluri
unor obiecte (nu există noţiune de distanţă sau ordine). Toate tipologiile
sunt clasificări nominale
- dihotomice (poate lua numai o formă din maxim două);
- polichotomice (poate lua o formă din mai multe alternative)
- b. scala ordinală (calitatea I., a-II-a) introduce o ordine prin atribuirea
unui anumit nivel (rang)
2. Scale pentru variabile (caracteristici) cantitative, care cuprind

a. scala de interval (temperatura măsurată pe scara Celsius),
măsoară ordinea şi adaugă o distanţă între obiecte (între categorii)
dar nu oferă informaţii despre punctul de origine şi distanţa dintre
ele.
Se caracterizează prin aceea că raportul între două valori este lipsit
de semnificaţie şi defineşte doar distanţa dintre două măsurători;
b. scala de raport, de proporţii (vârsta, greutatea, etc.) prin care

se poate măsura fiecare punct funcţie de punctul de origine existând
un punct zero care semnifică absenţa a ceva. Asigură conţinutul cel
mai mare de informaţie întrucât permite şi raportul între două
măsurători.
Exprimarea cantitativă a unei caracteristici permite deci exprimarea

valorică a acestora prin unităţi de măsură. Din acest punct de vedere
caracteristicile cantitative pot fi considerate :
 continue, când pot lua orice valoare numerică, inclusiv fracţiuni

zecimale; (talia, greutatea, T.A.);
 discontinue (discrete), când valorile iau forma numai a numerelor întregi.
In practică o variabila poate fi exprimată atât sub formă cantitativă cât şi

calitativă dar trebuie specificat că trecerea de la exprimarea cantitativă continuă
de pe o scală de raport printr-o exprimare calitativă pe scală calitativă se face cu
pierdere de informaţie.
Etapele ulterioare în studiul statistică a datelor obţinute cuprinde:

1. efectuarea observaţiilor;
2. înregistrarea datelor;
3. ordonarea, gruparea datelor (tabelarea, realizarea de grafice);
4. caracterizarea sintetică a fenomenelor;
5. analiza şi interpretarea lor (estimarea şi inferenţa datelor).
Înregistrarea datelor presupune:

- verificarea cantitativă şi calitativă a observaţiilor pentru a reduce
cât mai mult posibil erorile care pot fii nesistematice, întâmplătoare (greu de
eliminat) sau erorile sistematice (uneori voite, sau generate de instrumentul de
măsurat).
- codificarea tipurilor de observaţii
Ordonarea (gruparea) datelor presupune împărţirea datelor obţinute

după caracteristici cantitative sau calitative. Gruparea poate fi:
- simplă (după o singură caracteristica);
- complexă (după mai multe caracteristici);
- repetitivă (scindarea sau reunirea grupelor).
Tabelarea informaţiilor se realizează prin aşezarea lor sub forma
tabelelor (alcătuite din rânduri şi coloane, cuprinzând celule).
Tipuri de tabele:
- simple;
- enumerative;
- dinamice;
- cronologice;
- de grupare (pentru o singură caracteristică)
- combinate (pentru două caracteristici);
- de corelaţie (două sau mai multe caracteristici legate cauzal).
După tipul caracteristicii:

1. tabelarea caracteristicilor cantitative presupune:
- ordonarea datelor;
- variantele găsite se aşează în mod crescător;
- în dreptul lor se specifică numărul observaţiilor găsite pentru varianta
respectivă;
- rezultă o serie de distribuţie a frecvenţelor (serie de varianţă simplă;
- dacă seria de variaţie este lungă se poate utiliza gruparea datelor pe
grupe, (clase, intervale) şi se obţine o serie de variaţie pe clase.
Rezultă din analiza unei serii de distribuţie:

- frecvenţa absolută;
- frecvenţa relativă;
- frecvenţa cumulată (absolută sau relativă);
2. tabelarea caracteristicilor calitative presupune simpla dispunere

în ordine crescătoare a observaţiilor.
I.4.3. Caracterizarea sintetică, statistică a fenomenului studiat la nivel
de eşantion.
În această etapă se utilizează două tipuri de indicatori:
1. Indicatori de tendinţă centrală, care se calculează în mod distinct

pentru variabilele cantitative şi cele calitative, reprezentaţi de medie, mediană,
modul, cuantile, şi exprimă modul în care valorile observate tind să se grupeze
în jurul anumitor valori observate.
2.Indicatori de împrăştiere (dispersie) care indică tendinţa valorilor

observate de a se abate (îndepărta) de la valorile medii calculate pentru
respectiva serie de distribuţie.
1. Indicatorii de tendinţă centrală sunt reprezentaţi de:
A. Pentru variabilele cantitative:
a. Media care poate să ia mai multe aspecte:

- media aritmetică
- simplă (suma valorilor observate /numărul de observaţii);
- ponderată (se calculează pentru valorile ordonate într-o serie de
variaţie). Reprezintă valoarea faţă de care suma abaterilor variantelor din
seria de variaţie este nulă
(x p = åxi fi/ åfi)
- media armonică (se utilizează în calculul valorii medii în cazul mai
multor mărimi relative)
Marm. = å X / (å1/x ')X.
- media cronologică (se calculează în cadrul unei serii de valori care
reprezintă variaţia în timp)
Mcr.= (X1/2 + X2 + X3 +...+ XN /2) / (N - 1);
- media geometrică. Se utilizează în cazul coeficienţilor de creştere

medie a unei serii cronologice logaritmice, sau în cazul seriilor cu creştere
progresivă (cu oraţie din ce în ce mai mare)
b. Mediana. Se utilizează în cazul variabilelor cantitative şi a

seriilor omogene. Mediana este o valoare observată care împarte seria de valori
în două părţi egale.
Me = (N + 1) / 2.
c. Modul (dominanta), reprezintă valoarea observată
corespunzătoare celei mai mari frecvenţe întâlnite în seria de distribuţie.
d. Cuantilele (centile, etc.) exprimă diviziuni ale unei distribuţii în
subgrupuri egale şi ordonate.
B. Pentru variabilele calitative.

Se utilizează calcularea proporţiei (numărul de observaţii de un anumit fel
/ numărul total de observaţii):
- pentru caracteristicile alternative (a sau b): pa = a /a+b;
- pentru caracteristicile nealternative (a, b, c, ,n.): pa = a / n
2. Indicatori de dispersie (de împrăştiere).
Aceşti indicatori măsoară tendinţa de abatere a valorilor de la valorile

medii.
A. Pentru caracteristicile cantitative:
1. amplitudinea seriei (gama, range); exprimă intervalul (distanţa)
dintre valoarea maximă şi valoarea minimă a seriei.
2. gama semicuantilă; reprezintă gama celor două cuantile din
mijlocul seriei.
3. varianţa; este valoarea calculată care exprimă media aritmetică a
pătratului abaterilor dintre valorile observate şi media lor aritmetică:
Sx2 = [å(xi -xm)2 fi] / åfi;
4. derivaţia standard (abaterea standard, deviaţia tip) reprezintă

rădăcina pătrată a variantei şi exprimă media abaterilor varianţei faţă de media
aritmetică a seriei:
Sx = + \/ Sx2
5. coeficientul de variaţie reprezintă raportul procentual dintre deviaţia

standard şi valoarea medie a eşantionului:
C.V% = (Sx / x) 100.
6. deviaţia standard a eşantionului (eroarea standard a mediei):
S
S.E. = √n
Nu se utilizează pentru a sumariza variabilitatea în cadrul eşantionului, ci
exprimă nivelul la care pot varia indicatorii de tendinţă centrală în eşantioanele
extrase din aceiaşi populaţie.
B. Pentru caracteristicile calitative:
1. variaţia se calculează după formula:
Sp2 = p(1-p) = pq
2. deviaţia standard:
Sp = √ pq
Evaluarea (estimarea) şi inferenţa datelor.
I. Intervalele de încredere (de confidenţă) permite să se aprecieze cât de

aproape este estimarea făcută pe seama datelor obţinute la nivelul eşantionului
faţă de valorile populaţiei de bază.
1. Intervalul de încredere reprezintă un interval de valori (gamă, range)

construit în jurul estimării, care interval va avea o probabilitate specifică de a
include adevăratele valori ale populaţiei.
2. nivelul de încredere (de confidenţă) reprezintă tocmai această
probabilitatea specifică.
3. Limitele intervalului de încredere se calculează utilizând:
- deviaţia standard a populaţiei (s)
- media estimată x a eşantionului
- dimensiunea eşantionului n.
- probabilitatea specifică de a include adevăratele valori ale
populaţiei
(95% = 1.96).
- se calculează limita superioară şi limita inferioară:
lim.(sup;inf) = x+ 1.96 s /\/ n
Interpretare:
Cu o probabilitate de 95%, valorile din populaţia generală se vor regăsi
între limitele superioară şi inferioară a intervalului de încredere astfel calculat.
Inferenţă statistică. Testarea ipotezei (decizia statistică).
Sunt testele care determină cât de probabil este ca diferenţele observate

între date (populaţie, eşantioane, loturi) să fie datorate în întregime erorilor sau
întâmplării.
Ipoteza nulă (zero) afirmă că orice diferenţă observată se datorează în
întregime erorilor de eşantionaj (întâmplării).
Valoarea P (Pv) reprezintă probabilitatea ca diferenţe cel puţin la fel de
mari ca cele constatate în datele observate să se datoreze în întregime (vor
surveni) ca urmare a întâmplării.
Cercetătorul stabileşte o valoare a lui P ( de obicei nu mai mică de 95%)
care reprezintă valoarea predeterminată a lui Pv care reprezintă nivelul de
semnificaţie a testului.
Analiza se face prin modul în care Pv calculat se poziţionează faţă de Pv
predeterminat.
Dacă valoarea calculată a lui Pv este sub nivelul de semnificaţie, ipoteza
zero se respinge, adică este improbabil (dar nu imposibil) ca diferenţele
observate să se datoreze doar întâmplării (diferenţe cel puţin la fel de mari se pot
găsi doar într-o populaţie mică de eşantioane din totalul posibil de eşantioane
care se pot extrage din populaţia de bază).
Rezultă că valorile estimate pot caracteriza populaţia de bază (la un
anumit nivel de semnificaţie).
Se pot alege şi alte nivele de semnificaţie a testului pentru care ipoteza
zero să fie respinsă (99% - 0.01; mai rar 90% - 0.1)
Pentru calcularea valorii P se utilizează testele "Z". Acestea permit

calcularea valorii P pe baza caracteristicilor populaţiei de bază şi a
caracteristicilor observate în eşantion:
Xm = media eşantionului:
m = media cunoscută în populaţia de bază (generală);
s = deviaţia standard cunoscută în populaţia generală;
n = dimensiunea eşantionului.
Z = Xm - m / (s / \/n)
Valorii lui "z" i se asociază, tabelar, o valoare a lui P care reprezintă
tocmai valoarea lui P calculat.
Statistic semnificativ (semnificativ statistic sau rezultat semnificativ
statistic) înseamnă acel rezultat care a dus la respingerea ipotezei zero, adică
diferenţa dintre două grupuri este semnificativă statistic.
Valoarea lui P (valoarea testului) este influenţată de :
- puterea asocierii;
- dimensiunea eşantionului.
Adică o valoare mic a lui P poate să corespundă unei puteri mici de
asociere şi o diferenţă între două grupuri poate să nu aibă semnificaţie statistică
dacă dimensiunea eşantionului nu este suficient de mare.
Este important de subliniat că ipoteza zero nu este niciodată adevărată
sau falsă, ci ea este acceptată sau respinsă la un nivel de semnificaţie
Un alt grup de test utilizate în acelaşi scop sunt testele "t". aceste se aplică
de obicei la eşantioanele de volum mic.
Acestea, testează dacă media populaţiei este egală cu o valoare
predeterminată, atunci când deviaţia standard a populaţiei nu este cunoscută ( se
cunoaşte numai deviaţia standard a eşantionului):
t = Xm -m / s \/n.
Se utilizează pentru:
- a testa dacă două eşantioane independente sunt statistic diferite;
(eşantioane extrase din aceiaşi populaţie sau din două populaţii cu aceiaşi
varianţă)
- situaţia când deviaţia standard a populaţiei nu este cunoscută şi este
estimată pe baza deviaţiei standard a eşantionului.
- testarea regresiei liniare;
- testarea semnificaţiei coeficientului de corelaţie.
III. Erorile de tip I (a) şi de tip II (b).
Ipoteza analizată poate fi acceptată sau respinsă cu un anumit grad de

probabilitate (semnificaţie).
Eroarea de tip I(a) reprezintă probabilitatea de a respinge ipoteza zero
atunci când ea este de fapt adevărată.
Eroarea de tip II (b) reprezintă probabilitatea de a accepta ipoteza zero
atunci când ea este de fapt falsă.
Puterea testului statistic reprezintă probabilitatea de a respinge ipoteza
zero atunci când ea este falsă şi este egal cu 1 minus probabilitatea unei erori de
tip I(a)
Puterea testului depinde de:
- dimensiunea eşantionului; (direct proporţional),
- nivelul de semnificaţie ales.
IV. Analiza relaţiei dintre două variabile.
Relaţia de cauzalitate este studiată, de obicei, pe seama stabilirii

nivelului de independenţă între două variabile, una considerată independentă
(expunere, factor de risc) iar cealaltă considerată dependentă (rezultat, boală)
Si în această situaţie se porneşte de la ipoteza zero care afirmă că între
distribuţiile celor două variabile nu există nici o legătură, adică că frecvenţa de a
se găsi într-o categorie a variabilei dependente este aceiaşi pentru toate
categoriile variabilelor independente.
In practică se utilizează mai frecvent următoarele trei metode:
1. testul c2;
2 corelaţia;
3. regresia.
1. Testul chi pătrat (c2)
Acest tip de test examinează ipoteza zero, pentru variabilele de tip

categoric care sunt trecute în tabelul de contingenţă "2x2"(care deja a mai fost
prezentat.).
Formula de calcul cel mai frecvent utilizată este:
c2 = (½ab -bc½ - n/2)2 n / (a+b) (a+c) (c+d) (b+d);
Nivelul de semnificaţie al testului statistic minim acceptat este de 0.05,

căruia îi corespunde un c2 tabelar de 3.84.
In cazul în care valoarea calculată a lui c2 este mai mare de 3.84, ipoteza
zero se respinge la nivelul de semnificaţie de 5%.
2.Testele de corelaţie
Cu ajutorul testelor de corelaţie se estimează gradul în care două variabile

se modifică împreună.
Estimarea se exprimă prin coeficienţi de corelaţie.
Toţi coeficienţii de corelaţie utilizaţi, indiferent de tehnica de calcul
utilizată au o gamă de valori cuprinsă între +1 şi -1 cu următoarea semnificaţie:
+1 = corelaţie perfect pozitivă;
0 = nici o corelaţie;
-1 = corelaţie perfect negativă
Tipuri de coeficienţi:
1. Coeficientul Pearson (coeficient de corelaţie momentană)
2. Coeficientul Spearman.
3. Coeficientul Kendall (de corelaţie rang-ordin)
3. Testele de regresie
Regresia reprezintă stabilirea unui model matematic care să exprime (şi

grafic) relaţia dintre două variabile sau o variabilă dependentă şi mai multe
variabile independente.
Cel mai utilizat model este cel de regresie liniară în care modelul
matematic este ecuaţia unei linii drepte care se adaptează cel mai bine la datele
disponibile.
Alte modele de analiză matematică:
- regresia polinomiala;
- regresia logistică;
- hazardurile proporţionale.
Punerea în aplicare a tuturor acestor metode statistice este foarte mult
uşurată, în prezent de tehnica de calcul foarte puternică , care se sprijină şi pe
softuri performante şi adaptate cum ar fi EPI.INFO. 5.0, SPSS, etc.
Importantă este respectarea metodologiei cercetării şi interpretarea
rezultatelor obţinute prin prelucrarea electronică.

Elemente de Statistică Medicală

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Elemente de Statistică Medicală

Încărcat de

Drepturi de autor:

Formate disponibile

MIȘA (PÎNDICHI) CORNELIA

REFERAT PROGRAM MASTERAT

ELEMENTE DE STATISTICĂ UTILIZATE ÎN SĂNĂTATEA

Last (1988) defineşte statistica ca ştiinţa recoltării şi analizării datelor care

Domenii de utilizare a biostatisticii în domeniul medicinii, a sănătăţii

Termeni utilizaţi în biostatistică inclusiv în sănătatea publică:

Etape principale în studiul statistic:

De aceea de la începutul unui studiu statistic trebuie definite:

I.4.1. Teoria selecţiei.

Metode de determinare a volumului eşantionului reprezentativ.

1. In cazul în care se cunoaşte distribuţia în populaţie a caracteristicii

2. În situaţia unei caracteristici alternative (dihotomice) se utilizează

3. O formulă de calcul care ţine cont numai de eroarea de

unde er2 reprezintă eroarea de reprezentativitate.

4. Dacă se cunoaşte abaterea medie pătratică se poate utiliza formula

n = 9NV2/ 9D2 + 9V2;

5. Există în literatura de specialitate o serie de tabele care simplifică mult

6. Formulele şi tabelele lui Schlesselmann sunt foarte importante în

Tehnici de realizare a eşantioanelor

2. aleatoare sau probabilistice.

Utilizarea eşantioanelor aleatoare prezintă unele avantaje, sunt

Reprezentativitatea permite generalizarea datelor obţinute la

Tehnici de realizare a eşantioanelor aleatoare:

1. Eşantionare aleatoare simplă; utilizează tabelul cu numere aleatoare

I.4.2. Teoria scalarii.

1. Scale pentru variabile (caracteristici) calitative, care cuprind:

2. Scale pentru variabile (caracteristici) cantitative, care cuprind

b. scala de raport, de proporţii (vârsta, greutatea, etc.) prin care

Exprimarea cantitativă a unei caracteristici permite deci exprimarea

 continue, când pot lua orice valoare numerică, inclusiv fracţiuni

In practică o variabila poate fi exprimată atât sub formă cantitativă cât şi

Etapele ulterioare în studiul statistică a datelor obţinute cuprinde:

Înregistrarea datelor presupune:

Ordonarea (gruparea) datelor presupune împărţirea datelor obţinute

După tipul caracteristicii:

Rezultă din analiza unei serii de distribuţie:

2. tabelarea caracteristicilor calitative presupune simpla dispunere

În această etapă se utilizează două tipuri de indicatori:

1. Indicatori de tendinţă centrală, care se calculează în mod distinct

2.Indicatori de împrăştiere (dispersie) care indică tendinţa valorilor

1. Indicatorii de tendinţă centrală sunt reprezentaţi de:

A. Pentru variabilele cantitative:

a. Media care poate să ia mai multe aspecte:

- media geometrică. Se utilizează în cazul coeficienţilor de creştere

b. Mediana. Se utilizează în cazul variabilelor cantitative şi a

B. Pentru variabilele calitative.

2. Indicatori de dispersie (de împrăştiere).

Aceşti indicatori măsoară tendinţa de abatere a valorilor de la valorile

Sx2 = [å(xi -xm)2 fi] / åfi;

4. derivaţia standard (abaterea standard, deviaţia tip) reprezintă

5. coeficientul de variaţie reprezintă raportul procentual dintre deviaţia

C.V% = (Sx / x) 100.

6. deviaţia standard a eşantionului (eroarea standard a mediei):

Evaluarea (estimarea) şi inferenţa datelor.

I. Intervalele de încredere (de confidenţă) permite să se aprecieze cât de

1. Intervalul de încredere reprezintă un interval de valori (gamă, range)

Inferenţă statistică. Testarea ipotezei (decizia statistică).

Sunt testele care determină cât de probabil este ca diferenţele observate

Pentru calcularea valorii P se utilizează testele "Z". Acestea permit

III. Erorile de tip I (a) şi de tip II (b).

Ipoteza analizată poate fi acceptată sau respinsă cu un anumit grad de

IV. Analiza relaţiei dintre două variabile.

Relaţia de cauzalitate este studiată, de obicei, pe seama stabilirii