Sunteți pe pagina 1din 11

I.4. Elemente de statistică utilizate în sănătatea publică şi management.

Last (1988) defineşte statistica ca ştiinţa recoltării şi analizării datelor care sunt supuse
variaţiei randomizate.
Apărută din necesitatea cunoaşterii realităţii sub diversitatea aspectelor sale de
manifestare, statistica urmăreşte exprimarea din punct de vedere cantitativ a fenomenelor şi
proceselor de interes, utilizând pentru aceasta metode de descriere numerică, alături de analiza
calitativă a fenomenelor studiate.
Cercetarea statistică are ca obiect de studiu populaţiile (colectivităţi statistice) iar la
nivelul acestora, anumite caracteristici de interes (numite şi variabile) care se observă şi
măsoară la nivel de individ (unitate statistică).
Utilizarea metodelor statistice în medicină se datorează faptului că medicină, prin
introducerea tehnologiilor înalte, a devenit o ştiinţă cantitativă ce permite măsurarea,
cuantificarea şi compararea fenomenelor iar pe de altă parte analiza fenomenelor de interes
medical nu se poate realiza prin studiul întregii populaţii (populaţii exhaustive) ci pe eşantioane
reprezentative fiind necesare tehnicile de inferenţă statistică în scopul generalizării rezultatelor.

Domenii de utilizare a biostatisticii în domeniul medicinii, a sănătăţii publice şi


managementului serviciilor sanitare:
1. evaluarea stării de sănătate a colectivităţilor;
2. studiul procesului de cauzalitate (determinism) şi a relaţiei doză efect;
3. diagnostic medical: analiza şi estimarea ponderii factorilor de risc în etiologia bolilor
şi a stării de sănătate;
4. experimente clinice randomizate;
5. elaborarea algoritmului de lucru în cercetarea clinică sau de laborator (cercetarea
experimentală);
6. elaborarea şi evaluarea intervenţiilor, etc.

Termeni utilizaţi în biostatistică inclusiv în sănătatea publică:


1. Colectivitatea statistică reprezintă totalitatea elementelor care au caracteristici
comune şi care formează obiectul analizei statistice (ex. Populaţia unui sat, oraş,
regiuni, nr. de hematii circulante, nr. de bacterii de pe o cultură microbiană, etc.).
2. Colectivitatea statistică generală (populaţia) exprimă totalitatea elementelor de un
anumit tip existente în realitate sau teoretice;
3. Colectivitatea statistica parţială este constituită din totalitatea unităţilor de
observare existente şi care pot intra în studiu;
4. Colectivitatea statistică parţial constituită aleator (eşantion, mostră) reprezintă
elementelor extrase întâmplător dintr-o populaţie, după criterii bine stabilite, în scopul
determinării caracteristicilor populaţiei respective utilizând instrumentele biostatisticii;
5. Colectivitate statistică parţială, constituită nealeator este partea extrasă dintr-o
populaţie după unul sau mai multe criterii neutilizându-se elementele tehnicilor de
eşantionare aleatoare;
6. unitatea statistică (unitatea de observare) este reprezentată de fiecare element
component al colectivităţii statistice;
7. caracteristica (variabila) este una din însuşirile de interes medical prin care se
manifestă unitatea de observaţie şi exprimă acea însuşire comună unităţilor unei
populaţii, însuşire ce poate fi observată, măsurată şi înregistrată putând prezenta
valori diferite pe scala aleasă;
8. Caracteristicile cantitative sunt însuşirile măsurabile ale unităţilor de observare şi
care pot fi exprimate prin unităţi de măsură (ex. Unităţile din sistemul internaţional de
măsură);
9. Caracteristicile cantitative continue sunt acele însuşiri măsurabile ce pot lua orice
valoare numerică din domeniul zecimal sau ordinal (ex. Talia, greutatea, tensiunea
arterială, uremia, etc.);

1
10. Caracteristicile cantitative discontinue (discrete) sunt reprezentate de acele
însuşiri care pot fi exprimate numai sub forma numerelor întregi;
11. Variabila statistică este caracteristica ce prezintă proprietatea de a varia în timp şi
spaţiu condiţionată de factorii care acţionează asupra populaţiei aflate în studiu;
12. Varianta (xi) este valoarea concretă sub care este înregistrată o caracteristică;
13. Frecvenţă (fi ~ nf) este numărul de repetiţii sub care se înregistrează aceeaşi
variantă;
14. Seria statistică (repartiţia statistică) reprezintă şirul de valori numerice ale unei
caracteristici, ordonate după un anumit criteriu, funcţie de şirul valorilor altei
caracteristici. Repartiţiile statistice sunt definite cu ajutorul legilor de repartiţie (ex.
legea distribuţiei normale);
15. Parametrul statistic este valoarea reprezentativă dedusă dintr-un calcul numeric
aplicat unei repartiţii statistice (media, dispersia, etc.);
16. Indicatorul statistic este mărimea statistică cu ajutorul căruia se poate caracteriza
un fenomen de interes medical sub raportul structurilor interdependenţelor sau
modificărilor în timp sau spaţiu.
17. Indicele statistic este valoarea numerică relativă ce rezultă din compararea
valorilor unui indicator statistic , fie la momente diferite, fie în spaţii diferite sau pentru
categorii diferit constituite în raport cu o caracteristică oarecare

Etape principale în studiul statistic:


1. Fixarea obiectivului, scopului şi premiselor (ipotezei) studiului;
2. Documentarea aprofundată asupra aspectelor luate în studiu.
3. Alegerea metodelor de cercetare şi prelucrare;
4. Efectuarea investigaţiei (observarea şi măsurarea evenimentelor);
5. Înregistrarea informaţiilor obţinute (după verificarea cantitativ a şi calitativă);
6. Prelucrarea informaţiilor (codificare);
7. Tabelarea datelor şi realizarea graficelor;
8. Analiza, sinteza şi evaluarea datelor observate.

De aceea de la începutul unui studiu statistic trebuie definite:


- populaţia ţintă;
- eşantionul;
- caracteristicile de interes (de măsurat şi înregistrat).

Pentru că, din motive obiective, studiul nu se poate realiza ,de regulă, la nivelul întregii
populaţii, statistica a dezvoltat teoria (şi metodele) selecţiei (a eşantionajului).
Caracteristicile de interes pentru cercetarea unui fenomen la nivelul unei populaţii, numite
şi variabile, sunt definite cu ajutorul teoriei scalării în vederea măsurării şi înregistrării lor.
Calitatea prelucrării datelor înregistrate, deci şi a rezultatelor obţinute depinde de modul
cum au fost selectate metodele scalării variabilelor şi a selecţiei eşantioanelor.

I.4.1. Teoria selecţiei.


Se bazează pe teoria probabilităţilor în vederea extragerii din populaţia supusă cercetării
a unui număr suficient de indivizi pentru a se constitui un eşantion reprezentativ din investigarea
căruia să deducem care este repartiţia de frecvenţă a întregii populaţii pentru variabila studiată.
Din definiţia de mai sus se desprind două aspecte importante:
1. determinarea volumului eşantionului:
2. reprezentativitatea eşantionului (tehnici de eşantionaj).

Metode de determinare a volumului eşantionului reprezentativ.


Stabilirea mărimii eşantionului reprezentativ se face pe baza acceptării unui compromis
raţional între a opta pentru eşantioane de volum mare, care asigură reprezentativitatea ridicată şi
eşantioane de volum mic dar care sunt mai economice.
Mărimea unui eşantion este dictată de :

2
 mărimea populaţiei de referinţă;
 gradul de variaţie a populaţiei de referinţă;
 forma de organizare a populaţiei studiate;
 importanţa cercetării efectuate care generează nivelul de probabilitate.
Ca o regulă generală, dacă se stabileşte apriori un prag de semnificaţie a (Pv), se
impune ca abaterile dintre media populaţiei de referinţă şi media eşantioanelor (care se pot
genera) să respecte inegalitatea:
(m - x) £ a

unde "a" reprezintă eroarea limită admisă (absolută sau relativă) există mai multe tehnici de
stabilire a volumului optim (minim) a eşantionului.

1. In cazul în care se cunoaşte distribuţia în populaţie a caracteristicii studiate (din studii


prealabile), se iau în calcul:
- eroarea limită cu care să se lucreze (Dx);
- nivelul de semnificaţie Pv.
2 s2
t
formula de calcul propusă:
n=
t2 s2
Dx2 +
N
unde:
t = factorul de probabilitate corespunzător lui Pv de 1,96;
s = deviaţia standard
Dx = eroarea limită admisă de 0.05.
Această formulă este greu de definit fiind necesară pentru stabilirea lui s efectuarea unui
microstudiu prealabil.

2. În situaţia unei caracteristici alternative (dihotomice) se utilizează formula:

t2pq
n=
t2pq
Dx2 +
N
unde:
- p = probabilitatea de apariţie a primei forme de manifestare;
- q = probabilitatea de manifestare a celeilalte forme de manifestare.

3. O formulă de calcul care ţine cont numai de eroarea de reprezentativitate (propusă de


Tara Yamone) este:

n = N / 1 + er2 N.

unde er2 reprezintă eroarea de reprezentativitate.

4. Dacă se cunoaşte abaterea medie pătratică se poate utiliza formula propusă de Mills:

n = 9NV2/ 9D2 + 9V2;


unde:
D = eroarea relativă care poate fi luată după rigurozitatea pe care o impune cercetarea
(5-15%)
N = volumul colectivităţii generale;

3
V = dispersia relativă, egală cu abaterea medie pătratică împărţită la numărul de cazuri.

5. Există în literatura de specialitate o serie de tabele care simplifică mult determinarea


volumului eşantionului , tabele propuse de mai mulţi autori cum ar fi:
- tabelele elaborate de Neal W. Chilton şi John W. Fertig
- tabelul elaborat de Internaţional Epidemiological Asociaţion (I.E.A.), recomandat de
OMS în special în studiul morbidităţii.
- tabel elaborat de I.E.A. pentru selecţii aleatoare pe bază de cuiburi.

6. Formulele şi tabelele lui Schlesselmann sunt foarte importante în cercetările


epidemiologice de tip caz-control după care se poate stabili fie eşantionul minim, fie intensitatea
relaţiei de cauzalitate în cazul unui eşantion dat.

7. Similare cu tabele de mai sus sunt tabelele lui Fliess care permit cunoaşterea
volumului eşantionului reprezentativ în vederea acceptării sau respingerii ipotezei zero.

Tehnici de realizare a eşantioanelor


In practica statistică, după procedeul utilizat în constituirea eşantionului, distingem două
tipuri de sondaje:

1. nealeatoare sau prin "alegere raţională"; sunt mai puţin costisitoare, sunt mai practice
dar sunt mult mai puţin exacte.

2. aleatoare sau probabilistice.


In cadrul sondajelor aleatoare sunt incluse acele procedee bazate pe modele de
construire a eşantioanelor în care alegerea unităţilor din populaţie se face în mod aleator
(întâmplător), fiecare unitate având o probabilitate cunoscută şi diferită de zero de a accede în
cadrul eşantionului.
Se pot utiliza numeroase procedee de eşantionare. În cadrul aceluiaşi plan de
eşantionare se poate folosi una sau mai multe metode probabilistice sau neprobabilistice din
anumite considerente practice.

Utilizarea eşantioanelor aleatoare prezintă unele avantaje, sunt operativitate, permit


înregistrarea concomitentă a mai multor caracteristici, volum de muncă redus, dar cel mai
important îl reprezintă calitatea de reprezentativitate.

Reprezentativitatea permite generalizarea datelor obţinute la populaţia generală


prin tehnici specifice de inferenţă statistică.

Tehnici de realizare a eşantioanelor aleatoare:


- tragerea la sorţi;
- utilizarea tabelelor de numere aleatoare;
- utilizarea pasului de numărare.
Aceste tehnici se aplică bazei de sondaj (populaţiei studiate) pentru care trebuie să
existe o listă completă, actualizată şi exactă.

Tipuri de eşantioane.

1. Eşantionare aleatoare simplă; utilizează tabelul cu numere aleatoare sau tragerea la


sorţi.
2. Eşantionarea sistemică sau mecanică; utilizează pasul de numărare.
3. Eşantionarea stratificată constă în împărţirea, în prealabil, a populaţiei pe starturi,
după unul sau mai multe criterii, pentru a realiza creşterea şansei de obţinere a unei
reprezentativităţi mai ridicate. inferenţa se poate aplica şi la nivelul straturilor cât şi la nivelul
întregului eşantion.

4
4.Eşantionarea cu probabilităţi inegale. Acest tip de eşantionaj se utilizează atunci
când unităţile populaţiei, în raport cu una sau mai multe caracteristici, au valori ce diferă
semnificativ, iar aplicarea eşantionării cu probabilităţi egale duce la o eficienţă scăzută a
estimaţiilor făcute.
5. Eşantionarea pe "grappe" (pe cuiburi), se utilizează când dispersia teritorială a
populaţiei de investigat este prea mare sau când lipseşte o bază de sondaj.
Se caracterizează prin faptul că nu se mai extrag unităţi independente ci grupuri de
unităţi eterogene (pachete; grappe, cuiburi) din populaţiile care sunt organizate sub forma unei
ierarhii.
Este recomandat ca mărimea cuibului să fie cât mai mică, numărul cuiburilor mici cât mai
mare iar eterogenitatea cuiburilor să fie cât mai mare.
6. Eşantionarea în mai multe trepte (multistadial).
Este o metodă de eşantionare care se desfăşoară în mai multe etape succesive şi se
aplică tot pentru o populaţie organizată ierarhic, pe mai multe niveluri. practic se constituie pentru
fiecare nivel una sau mai multe baze de sondaj, cuprinzând unităţile elementare de nivelul
imediat următor.
7. Eşantionarea în mai multe faze (multifazic) este o generalizare a eşantionării
stratificate (tipice) şi se utilizează din următoarele considerente:
- creşterea operativităţii şi reducerea cheltuielilor;
- de la o fază la alta se reduce numărul unităţilor din eşantion cu creşterea
corespunzătoare a obiectivelor pe care le propune cercetarea;
- se pot cuantifica non-răspunsurile.

I.4.2. Teoria scalarii.


Are ca scop definirea unei scale de măsurare (acordarea de valori) pentru fiecare
caracteristică luată în studiu în aşa fel încât să se poată utiliza operatori algebrici în prelucrarea
valorilor individuale pentru obţinerea indicatorilor (măsurilor) de sinteză.
Caracteristicile investigate pot fi, după modul în care se măsoară, calitative sau
cantitative. Există astfel:

1. Scale pentru variabile (caracteristici) calitative, care cuprind:


- a. scala nominală (sex, stare civilă, etc.), prin care se acordă simboluri unor obiecte
(nu există noţiune de distanţă sau ordine). Toate tipologiile sunt clasificări nominale
- dihotomice (poate lua numai o formă din maxim două);
- polichotomice (poate lua o formă din mai multe alternative)
- b. scala ordinală (calitatea I., a-II-a) introduce o ordine prin atribuirea unui anumit nivel
(rang)

2. Scale pentru variabile (caracteristici) cantitative, care cuprind


a. scala de interval (temperatura măsurată pe scara Celsius), măsoară ordinea
şi adaugă o distanţă între obiecte (între categorii) dar nu oferă informaţii despre
punctul de origine şi distanţa dintre ele.
Se caracterizează prin aceea că raportul între două valori este lipsit de
semnificaţie şi defineşte doar distanţa dintre două măsurători;

b. scala de raport, de proporţii (vârsta, greutatea, etc.) prin care se poate


măsura fiecare punct funcţie de punctul de origine existând un punct zero care
semnifică absenţa a ceva. Asigură conţinutul cel mai mare de informaţie întrucât
permite şi raportul între două măsurători.

Exprimarea cantitativă a unei caracteristici permite deci exprimarea valorică a acestora


prin unităţi de măsură. Din acest punct de vedere caracteristicile cantitative pot fi considerate :

 continue, când pot lua orice valoare numerică, inclusiv fracţiuni zecimale; (talia,
greutatea, T.A.);

5
 discontinue (discrete), când valorile iau forma numai a numerelor întregi.

In practică o variabila poate fi exprimată atât sub formă cantitativă cât şi calitativă dar
trebuie specificat că trecerea de la exprimarea cantitativă continuă de pe o scală de raport printr-
o exprimare calitativă pe scală calitativă se face cu pierdere de informaţie.

Etapele ulterioare în studiul statistică a datelor obţinute cuprinde:


1. efectuarea observaţiilor;
2. înregistrarea datelor;
3. ordonarea, gruparea datelor (tabelarea, realizarea de grafice);
4. caracterizarea sintetică a fenomenelor;
5. analiza şi interpretarea lor (estimarea şi inferenţa datelor).

Înregistrarea datelor presupune:


- verificarea cantitativă şi calitativă a observaţiilor pentru a reduce cât mai mult
posibil erorile care pot fii nesistematice, întâmplătoare (greu de eliminat) sau erorile sistematice
(uneori voite, sau generate de instrumentul de măsurat).
- codificarea tipurilor de observaţii

Ordonarea (gruparea) datelor presupune împărţirea datelor obţinute după caracteristici


cantitative sau calitative. Gruparea poate fi:
- simplă (după o singură caracteristica);
- complexă (după mai multe caracteristici);
- repetitivă (scindarea sau reunirea grupelor).

Tabelarea informaţiilor se realizează prin aşezarea lor sub forma tabelelor (alcătuite din
rânduri şi coloane, cuprinzând celule).
Tipuri de tabele:
- simple;
- enumerative;
- dinamice;
- cronologice;
- de grupare (pentru o singură caracteristică)
- combinate (pentru două caracteristici);
- de corelaţie (două sau mai multe caracteristici legate cauzal).

După tipul caracteristicii:


1. tabelarea caracteristicilor cantitative presupune:
- ordonarea datelor;
- variantele găsite se aşează în mod crescător;
- în dreptul lor se specifică numărul observaţiilor găsite pentru varianta respectivă;
- rezultă o serie de distribuţie a frecvenţelor (serie de varianţă simplă;
- dacă seria de variaţie este lungă se poate utiliza gruparea datelor pe grupe, (clase,
intervale) şi se obţine o serie de variaţie pe clase.

Rezultă din analiza unei serii de distribuţie:


- frecvenţa absolută;
- frecvenţa relativă;
- frecvenţa cumulată (absolută sau relativă);

2. tabelarea caracteristicilor calitative presupune simpla dispunere în ordine


crescătoare a observaţiilor.

6
I.4.3. Caracterizarea sintetică, statistică a fenomenului studiat la nivel de eşantion.

În această etapă se utilizează două tipuri de indicatori:

1. Indicatori de tendinţă centrală, care se calculează în mod distinct pentru variabilele


cantitative şi cele calitative, reprezentaţi de medie, mediană, modul, cuantile, şi exprimă modul în
care valorile observate tind să se grupeze în jurul anumitor valori observate.

2.Indicatori de împrăştiere (dispersie) care indică tendinţa valorilor observate de a se


abate (îndepărta) de la valorile medii calculate pentru respectiva serie de distribuţie.

1. Indicatorii de tendinţă centrală sunt reprezentaţi de:

A. Pentru variabilele cantitative:

a. Media care poate să ia mai multe aspecte:


- media aritmetică
- simplă (suma valorilor observate /numărul de observaţii);
- ponderată (se calculează pentru valorile ordonate într-o serie de variaţie). Reprezintă
valoarea faţă de care suma abaterilor variantelor din seria de variaţie este nulă
(x p = åxi fi/ åfi)
- media armonică (se utilizează în calculul valorii medii în cazul mai multor mărimi
relative)
Marm. = å X / (å1/x ')X.
- media cronologică (se calculează în cadrul unei serii de valori care reprezintă variaţia
în timp)
Mcr.= (X1/2 + X2 + X3 +...+ XN /2) / (N - 1);

- media geometrică. Se utilizează în cazul coeficienţilor de creştere medie a unei serii


cronologice logaritmice, sau în cazul seriilor cu creştere progresivă (cu oraţie din ce în ce
mai mare)

b. Mediana. Se utilizează în cazul variabilelor cantitative şi a seriilor omogene.


Mediana este o valoare observată care împarte seria de valori în două părţi egale.
Me = (N + 1) / 2.
c. Modul (dominanta), reprezintă valoarea observată corespunzătoare celei mai
mari frecvenţe întâlnite în seria de distribuţie.

d. Cuantilele (centile, etc.) exprimă diviziuni ale unei distribuţii în subgrupuri


egale şi ordonate.

B. Pentru variabilele calitative.


Se utilizează calcularea proporţiei (numărul de observaţii de un anumit fel / numărul total
de observaţii):
- pentru caracteristicile alternative (a sau b): pa = a /a+b;
- pentru caracteristicile nealternative (a, b, c, ,n.): pa = a / n

2. Indicatori de dispersie (de împrăştiere).

Aceşti indicatori măsoară tendinţa de abatere a valorilor de la valorile medii.


A. Pentru caracteristicile cantitative:
1. amplitudinea seriei (gama, range); exprimă intervalul (distanţa) dintre
valoarea maximă şi valoarea minimă a seriei.
2. gama semicuantilă; reprezintă gama celor două cuantile din mijlocul seriei.

7
3. varianţa; este valoarea calculată care exprimă media aritmetică a pătratului
abaterilor dintre valorile observate şi media lor aritmetică:

Sx2 = [å(xi -xm)2 fi] / åfi;

4. derivaţia standard (abaterea standard, deviaţia tip) reprezintă rădăcina


pătrată a variantei şi exprimă media abaterilor varianţei faţă de media aritmetică a seriei:

Sx = + \/ Sx2

5. coeficientul de variaţie reprezintă raportul procentual dintre deviaţia standard şi valoarea


medie a eşantionului:

C.V% = (Sx / x) 100.

6. deviaţia standard a eşantionului (eroarea standard a mediei):

S
S.E. =
n
Nu se utilizează pentru a sumariza variabilitatea în cadrul eşantionului, ci exprimă nivelul
la care pot varia indicatorii de tendinţă centrală în eşantioanele extrase din aceiaşi populaţie.

B. Pentru caracteristicile calitative:


1. variaţia se calculează după formula:

Sp2 = p(1-p) = pq

2. deviaţia standard:
Sp = pq

Evaluarea (estimarea) şi inferenţa datelor.

I. Intervalele de încredere (de confidenţă) permite să se aprecieze cât de aproape este


estimarea făcută pe seama datelor obţinute la nivelul eşantionului faţă de valorile populaţiei de
bază.

1. Intervalul de încredere reprezintă un interval de valori (gamă, range) construit în jurul


estimării, care interval va avea o probabilitate specifică de a include adevăratele valori ale
populaţiei.
2. nivelul de încredere (de confidenţă) reprezintă tocmai această probabilitatea
specifică.
3. Limitele intervalului de încredere se calculează utilizând:
- deviaţia standard a populaţiei (s)
- media estimată x a eşantionului
- dimensiunea eşantionului n.
- probabilitatea specifică de a include adevăratele valori ale populaţiei
(95% = 1.96).
- se calculează limita superioară şi limita inferioară:
lim.(sup;inf) = x+ 1.96 s /\/ n

Interpretare:
Cu o probabilitate de 95%, valorile din populaţia generală se vor regăsi între limitele
superioară şi inferioară a intervalului de încredere astfel calculat.

8
Inferenţă statistică. Testarea ipotezei (decizia statistică).

Sunt testele care determină cât de probabil este ca diferenţele observate între date
(populaţie, eşantioane, loturi) să fie datorate în întregime erorilor sau întâmplării.
Ipoteza nulă (zero) afirmă că orice diferenţă observată se datorează în întregime erorilor
de eşantionaj (întâmplării).
Valoarea P (Pv) reprezintă probabilitatea ca diferenţe cel puţin la fel de mari ca cele
constatate în datele observate să se datoreze în întregime (vor surveni) ca urmare a întâmplării.
Cercetătorul stabileşte o valoare a lui P ( de obicei nu mai mică de 95%) care reprezintă
valoarea predeterminată a lui Pv care reprezintă nivelul de semnificaţie a testului.
Analiza se face prin modul în care Pv calculat se poziţionează faţă de Pv predeterminat.
Dacă valoarea calculată a lui Pv este sub nivelul de semnificaţie, ipoteza zero se
respinge, adică este improbabil (dar nu imposibil) ca diferenţele observate să se datoreze doar
întâmplării (diferenţe cel puţin la fel de mari se pot găsi doar într-o populaţie mică de eşantioane
din totalul posibil de eşantioane care se pot extrage din populaţia de bază).
Rezultă că valorile estimate pot caracteriza populaţia de bază (la un anumit nivel de
semnificaţie).
Se pot alege şi alte nivele de semnificaţie a testului pentru care ipoteza zero să fie
respinsă (99% - 0.01; mai rar 90% - 0.1)

Pentru calcularea valorii P se utilizează testele "Z". Acestea permit calcularea valorii P pe
baza caracteristicilor populaţiei de bază şi a caracteristicilor observate în eşantion:
Xm = media eşantionului:
m = media cunoscută în populaţia de bază (generală);
s = deviaţia standard cunoscută în populaţia generală;
n = dimensiunea eşantionului.

Z = Xm - m / (s / \/n)
Valorii lui "z" i se asociază, tabelar, o valoare a lui P care reprezintă tocmai valoarea lui P
calculat.
Statistic semnificativ (semnificativ statistic sau rezultat semnificativ statistic)
înseamnă acel rezultat care a dus la respingerea ipotezei zero, adică diferenţa dintre două
grupuri este semnificativă statistic.
Valoarea lui P (valoarea testului) este influenţată de :
- puterea asocierii;
- dimensiunea eşantionului.
Adică o valoare mic a lui P poate să corespundă unei puteri mici de asociere şi o
diferenţă între două grupuri poate să nu aibă semnificaţie statistică dacă dimensiunea
eşantionului nu este suficient de mare.
Este important de subliniat că ipoteza zero nu este niciodată adevărată sau falsă, ci
ea este acceptată sau respinsă la un nivel de semnificaţie

Un alt grup de test utilizate în acelaşi scop sunt testele "t". aceste se aplică de obicei la
eşantioanele de volum mic.
Acestea, testează dacă media populaţiei este egală cu o valoare predeterminată, atunci
când deviaţia standard a populaţiei nu este cunoscută ( se cunoaşte numai deviaţia standard a
eşantionului):

t = Xm -m / s \/n.
Se utilizează pentru:
- a testa dacă două eşantioane independente sunt statistic diferite; (eşantioane extrase
din aceiaşi populaţie sau din două populaţii cu aceiaşi varianţă)
- situaţia când deviaţia standard a populaţiei nu este cunoscută şi este estimată pe baza
deviaţiei standard a eşantionului.
- testarea regresiei liniare;

9
- testarea semnificaţiei coeficientului de corelaţie.

III. Erorile de tip I (a) şi de tip II (b).

Ipoteza analizată poate fi acceptată sau respinsă cu un anumit grad de probabilitate


(semnificaţie).
Eroarea de tip I(a) reprezintă probabilitatea de a respinge ipoteza zero atunci când ea
este de fapt adevărată.
Eroarea de tip II (b) reprezintă probabilitatea de a accepta ipoteza zero atunci când ea
este de fapt falsă.
Puterea testului statistic reprezintă probabilitatea de a respinge ipoteza zero atunci
când ea este falsă şi este egal cu 1 minus probabilitatea unei erori de tip I(a)
Puterea testului depinde de:
- dimensiunea eşantionului; (direct proporţional),
- nivelul de semnificaţie ales.

IV. Analiza relaţiei dintre două variabile.

Relaţia de cauzalitate este studiată, de obicei, pe seama stabilirii nivelului de


independenţă între două variabile, una considerată independentă (expunere, factor de risc) iar
cealaltă considerată dependentă (rezultat, boală)
Si în această situaţie se porneşte de la ipoteza zero care afirmă că între distribuţiile celor
două variabile nu există nici o legătură, adică că frecvenţa de a se găsi într-o categorie a
variabilei dependente este aceiaşi pentru toate categoriile variabilelor independente.
In practică se utilizează mai frecvent următoarele trei metode:
1. testul c2;
2 corelaţia;
3. regresia.

1. Testul chi pătrat (c 2)

Acest tip de test examinează ipoteza zero, pentru variabilele de tip categoric care sunt
trecute în tabelul de contingenţă "2x2"(care deja a mai fost prezentat.).
Formula de calcul cel mai frecvent utilizată este:

c 2 = (½ab -bc½ - n/2)2 n / (a+b) (a+c) (c+d) (b+d);

Nivelul de semnificaţie al testului statistic minim acceptat este de 0.05, căruia îi


corespunde un c2 tabelar de 3.84.
In cazul în care valoarea calculată a lui c2 este mai mare de 3.84, ipoteza zero se
respinge la nivelul de semnificaţie de 5%.

2.Testele de corelaţie

Cu ajutorul testelor de corelaţie se estimează gradul în care două variabile se modifică


împreună.
Estimarea se exprimă prin coeficienţi de corelaţie.
Toţi coeficienţii de corelaţie utilizaţi, indiferent de tehnica de calcul utilizată au o gamă de
valori cuprinsă între +1 şi -1 cu următoarea semnificaţie:
+1 = corelaţie perfect pozitivă;
0 = nici o corelaţie;
-1 = corelaţie perfect negativă
Tipuri de coeficienţi:
1. Coeficientul Pearson (coeficient de corelaţie momentană)

10
2. Coeficientul Spearman.
3. Coeficientul Kendall (de corelaţie rang-ordin)

3. Testele de regresie

Regresia reprezintă stabilirea unui model matematic care să exprime (şi grafic) relaţia
dintre două variabile sau o variabilă dependentă şi mai multe variabile independente.
Cel mai utilizat model este cel de regresie liniară în care modelul matematic este ecuaţia
unei linii drepte care se adaptează cel mai bine la datele disponibile.
Alte modele de analiză matematică:
- regresia polinomiala;
- regresia logistică;
- hazardurile proporţionale.

Punerea în aplicare a tuturor acestor metode statistice este foarte mult uşurată, în
prezent de tehnica de calcul foarte puternică , care se sprijină şi pe softuri performante şi
adaptate cum ar fi EPI.INFO. 5.0, SPSS, etc.
Importantă este respectarea metodologiei cercetării şi interpretarea rezultatelor obţinute
prin prelucrarea electronică.

11

S-ar putea să vă placă și