Documente Academic
Documente Profesional
Documente Cultură
Biostatistica 1
Biostatistica 1
Metodologia statistică
1
3. Istoricul apariţiei şi etapele de dezvoltare ale statisticii.
Istoric
Pentru a pune în evidenţă rolul statisticii ca instrument de cunoaştere a particularităţilor de volum, structură
şi dinamică a fenomenelor şi proceselor sociale, din punct de vedere istoric, apariţia şi dezvoltarea statisticii
moderne îşi are rădăcinile în trei fenomene separate:
1. nevoile guvernelor ţărilor de a calcula date privind cetăţenii şi activităţile ţărilor;
2. dezvoltarea teoriei probabilităţilor;
3. apariţia şi extinderea utilizării calculatoarelor.
În timpul civilizaţiei sumeriene, egiptene, greci şi romane, datele erau obţinute în scopul primar al
taxării şi înrolării în armată. Se consemnează forme incipiente de evidenţă a terenurilor, a numărului
şi mişcării naturale a populaţiei.
În Imperiul Roman se efectuau înregistrări periodice ale populaţiei, se întocmeau registre vamale,
fiscale şi cadastrale.
În Evul Mediu, instituţiile bisericeşti strângeau adesea şi păstrau informaţii, înregistrări privind
naşterile, decesele şi căsătoriile.
Are loc delimitarea evidenţei statistice de evidenţa contabilă. Evidenţele statistice, chiar dacă se
rezumau la simple consemnări de fapte, ofereau datele necesare pentru informarea organismelor
statului, referitoare la aspectele fiscale, militare şi administrative.
Aparţine perioadei când în Anglia apare o statistică deosebită, cunoscută sub numele de „aritmetică
politică”.
Aceasta se ocupa cu analiza, prin procedee matematice de prelucrare a datelor culese, cu
desprinderea regularităţilor şi chiar cu formularea previziunilor.
John Graunt pune în evidenţă legităţi ale populaţiei şi fenomenelor demografice.
Wiliam Petty (părintele economiei politice moderne) a utilizat metode cantitative de studiere a
fenomenelor sociale şi economice.
Edmund Halley s-a preocupat de estimarea numărului populaţiei, a elaborat prima tabelă de
mortalitate şi a introdus conceptul de durată probabilă de viaţă.
Etapa probabilistică
2
Denumirea de aritmetică politică se substituie cu denumirea de statistică şi capătă o nouă dimensiune
prin introducerea calculelor probabiliste.
Se formulează legea numerelor mari şi are loc desprinderea altor regularităţi şi legităţi statistice.
Printre reprezentanţii de seamă a acestei faze amintim: J. Bernoulli, P.S. Laplace, K.F. Gauss, S.D.
Poisson, A. Ciuprov etc.
3
Presupune efectuarea unor experimente în condiţii create special în laborator sau în teren, unde se studiază modul în
care se modifică diferite fenomene şi caracteristici ale acestora
Metoda psihologică
Presupune studierea diverselor aspecte psihologice legate de memorie, gîndire, senzaţii, percepţii, caracter,
temperament, etc. Utilizând diverse metode specifice psihologiei, inclusiv testarea psihologică
Metode de colectare a informaţiei
Recensământul
Analiza anuarelor, rapoartelor şi a diverselor forme statistice
Analiza surselor bibliografice, a monografiilor
Observarea directă
Chestionarul sau ancheta statistică
Interviul
Testul
5. Totalitatea statistică. Tipurile de totalităţi statistice. Cerinţe faţă de totalitatea statistică selectivă.
Definiţia: totalitatea statistica reprezintă un număr de elemente
(unităţi de observare) omogene, luate împreună în baza unui factor
comun în anumită perioadă de timp şi spaţiu.
4
, fi ecare al 10-lea;
etc.
Calea aceasta de selectare, deşi răspândită, este anevoioasă de
înfăptuit. Avantajul constă numai în simplitatea selectării eşantionului,
în timp ce exactitatea rezultatelor cercetării poate avea erori mari, fi indcă
nu se ţine cont de frecvenţa reală de răspândire a fenomenului, de
dispersia lui în spaţiu;
5
întregi: numărul de copii pe care îi are o familie, numărul
de persoane dintr-o familie, număr de medici, număr de paturi,
număr de vizite, etc.
• în funcţie de conţinutul caracteristicii:
- caracteristici de timp (anul naşterii);
- caracteristici de spaţiu (localitatea de domiciliu);
- caracteristici atributive, în care variabila reprezintă un atribut,
altul decât spaţiul ori timpul – cele calitative şi cantitative.
• în funcţie de modul de obţinere şi caracterizare a fenomenului:
- caracteristici primare (obţinute, de regulă, în etapa de colectare a
datelor statistice prin măsurare sau numărare);
- caracteristici derivate, obţinute în procesul prelucrării datelor statistice.
• în funcţie de modul de infl uenţă asupra fenomenului:
- caracteristici factoriale;
- caracteristici rezultative.
Indicatori statistici
Indicatorul statistic este expresia numerică a unor fenomene, procese,
activităţi sau categorii economice şi sociale, defi nite în timp, spaţiu
şi structură organizatorică.
Deosebim următoarele funcţii ale indicatorilor statistici:
• funcţia de măsurare;
• funcţia de comparare;
• funcţia de analiză;
• funcţia de sinteză;
• funcţia de estimare;
• funcţia de verifi care a ipotezelor şi de testare a semnifi caţiei
unor indicatori statistici calculaţi.
Indicatorii statistici pot fi prezentaţi prin valori absolute, relative şi
medii.
Către valorile relative pot fi atribuite rata, raportul şi proporţia.
conţinutul caracteristicii
6
A--După modul de exprimare
Atributive (calitative, nominative): genul bolnavului, profesia, diagnoza, etc.
Caracteristici de spaţiu
Caracteristici de persoană
Caracteristici cu variaţie discontinuă care pot lua numai valori întregi (numărul de copii în
familie, num. de medici, num. de paturi etc. )
Caracteristici derivate
Date statistice
Analiza datelor statistice se face în funcţie de:
- timp;
- loc;
- persoană.
Caracteristica de timp ne permite să stabilim:
• modifi cări pe termen scurt;
• modifi cări ciclice;
• modifi cări seculare (pe termen lung);
• poate fi aranjată în tabele şi grafi ce.
Prin caracteristica de loc se descrie unitatea geografi că. Pentru
prima dată această descriere a fost efectuată de către John Snow în
an. 1854 când în Londra a avut loc erupţia de holeră.
7
Caracteristica de persoană ne permite să facem analiza datelor
acumulate după vârstă, sex, etnie, etc.
Date statistice
Analiza datelor statistice se face în funcţie de:
- timp;
- loc;
- persoană.
Caracteristica de timp ne permite să stabilim:
• modifi cări pe termen scurt;
• modifi cări ciclice;
• modifi cări seculare (pe termen lung);
• poate fi aranjată în tabele şi grafi ce.
Scale de masurare
Scala nominala = valorile sunt puse pe categorii. Exemple:
Sexul : M / F = scala binara
Clasificarea anemiilor :
Microcitice (in deficienta de fier)
Megaloblastice (in deficienta de vit. B12)
Normocitice (in boli cronice)
8
• funcţia de estimare;
• funcţia de verifi care a ipotezelor şi de testare a semnifi caţiei
unor indicatori statistici calculaţi.
Indicatorii statistici pot fi prezentaţi prin valori absolute, relative şi
medii.
Către valorile relative pot fi atribuite rata, raportul şi proporţia.
Rata ne arată cât de repede evenimentul (naşteri, îmbolnăviri, decese)
apare în populaţie.
Componentele ratei sunt:
• Numărător: numărul de evenimente observate;
• Numitor: populaţia în care evenimentele au loc;
• Timpul specifi cat când au loc evenimentele;
• De obicei un multiplicator transformă rata dintr-o fracţie incomodă
sau decimală într-un număr întreg.
Tipurile de rate sunt:
• brute; • speciale (specifi ce);
• standardizate.
Exemplu: rata brută a mortalităţii
Numărul deceselor, indiferent de cauză,
într-o populaţie, într-o perioadă specifi că
x 10n
Numărul de persoane cu risc de a muri
de-a lungul perioadei
Exemplu: rata mortalităţii din cauze specifi ce
Numărul de decedaţi, dintr-o cauză anume
într-o populaţie, într-o perioadă specifi că de timp
x 10n
Numărul de persoane cu risc de a muri
din acea cauză de-a lungul perioadei
Exemplu “Rata” caz-fatalitate (RCF) – proporţia cazurilor unei condiţii
specifi ce fatale într-o perioadă specifi că de timp.
Sinonimele pentru rată sunt: frecvenţă, nivel, răspândire, intensitate.
Raportul permite compararea unei populaţii cu alta.
Raportul este un număr împărţit la altul.
Exemplu: raport dintre bărbaţi şi femei, naşteri şi avorturi, nr. de
medici şi asistente medicale. În aceste cazuri nu este necesară o relaţie
specifi că între numărător şi numitor. Raportul poate fi prezentat
astfel x : y sau ,
unde: „x” – numărul de paturi, nr. de medici,
„y” – numărul de populaţie.
Proporţia ne arată ce fracţiune a populaţiei este afectată. Caracteristicile
lor de bază sunt:
• coefi cientul a 2 numere;
• numărătorul este inclus în numitor;
• proporţia întotdeauna deviază între 0 şi 1 sau între 0 şi 100%.
Exemplu de proporţie:
În anul 2006 în Republica Moldova au fost recunoscuţi ca invalizi 7695
bărbaţi şi 6005 femei. Care este procentul femeilor din numărul total?
Indicatorii de proporţie nu pot fi comparaţi.
9
Raporturile permit compararea unei populaţii cu alta
1-Raportul
• Un număr împărţit la altul
X
k
X:Y Y · 10
2-Proporţia
• Coeficientul a 2 numere
3-Rata
Este o formă specială a Proporţiei, care include specificare în timp
Numărătorul este numărul de persoane “supuşi riscului” într-o anumită perioada de timp
Este folosită pentru a exprima frecvenţa cu care are loc un eveniment într-o populaţie definită
• standardizate.
Exemplu: rata brută a mortalităţii
Numărul deceselor, indiferent de cauză,
într-o populaţie, într-o perioadă specifi că
x 10n
Numărul de persoane cu risc de a muri
de-a lungul perioadei
Exemplu: rata mortalităţii din cauze specifi ce
10
Numărul de decedaţi, dintr-o cauză anume
într-o populaţie, într-o perioadă specifi că de timp
x 10n
Numărul de persoane cu risc de a muri
din acea cauză de-a lungul perioadei
• Coeficientul a 2 numere
• Numărătorul ESTE INCLUS în numitor
• Proporţia întotdeauna deviază între 0 şi 1 sau între 0 şi 100%
Sinonime:
cotă,
pondere,
structură,
o parte din întreg,
indice extensiv.
X
X:Y Y · 10 k
11
din anumite zile şi ore. Iar acest lucru ne permite să planificăm repartiţia mijloacelor serviciului pentru
satisfacerea necesităţilor populaţiei.
Deci. probabilitate se numeşte măsura de posibilitate a apariţiei unor fenomene întâmplătoare în
condiţiile concrete date. Probabilitatea, de obicei, se înseamnă prin litera "p".
Probabilitatea de apariţie a unui fenomen poate fi estimată prin două procedee:
- clasic, sau abordare a priori - dacă fenomenul se produce în „h" posibilităţi din „n" experimente,
atunci probabilitatea acestui fenomen va fi „h/n";
- frecvenţa empirică, sau abordare a posteriori - când experimentul se repetă de mai multe ori - „n'\ iar
fenomenul se produce cu o frecvenţă de acum fixată „h" (precum în exemplul cu adresările la
serviciul de urgenţă). Aici probabilitatea apariţiei fenomenului va fi ..h/n".
Conform definiţiei clasice a probabilităţii, adoptate de P.S. Laplace, probabilitatea apariţiei în
totalitatea parţială a unui fenomen „p" se determină prin raportul fenomenelor deja apărute „m" la
numărul tuturor cazurilor posibile „n":
m
P=—n
Drept contraprobabilitate a evenimentului determinăm alternativa - probabilitatea lipsei
fenomenului, însemnată prin litera „q": n - m m
q = --- = 1 ----= 1 - p sau q = \ - p ; p + q - \
n n
Din formulă reiese că suma probabilităţilor prezenţei fenomenului cu contra- probabilitatea lui
este egală cu unitatea, iar în procente cu 100%.
16. Legea cifrelor mari şi aplicarea ei. Eroarea reprezentativă „m” şi eroarea limită admisă „Δ”.
Legea cifrelor mari are două aplicaţii importante pentru determinarea totalităţilor selective:
1. Pe măsura majorării numărului de observaţii rezultatele cercetării obţinute pe baza totalităţii
selective tind să reproducă datele totalităţii integrale.
2. La atingerea unui anumit număr de observări în totalitatea selectivă rezultatele cercetării vor fi
maximal apropiate de cele posibile pe baza totalităţii integrale.
- Statistic este demonstrat faptul că în caz de o totalitate selectivă mare (n >30) cu probabilitatea
de 95% ponderea fenomenului „PI" va fi diferită faţă de cea din totalitatea integrală „P" cu „2m"; cu
probabilitatea de 99.7% diferenţa „PI - P" nu
- .................................................... va depăşi „3m". Cifrele 1, 2, 3 n, cu care se înmulţeşte valoarea
erorii „m",
Cu majorarea coeficientului „t" creşte probabilitatea cu care vom putea spune că diferenţa ponderilor
căpătate din ambele totalităţi este situată în intervalul: „A = tm", unde „Д" reprezintă eroarea limită
admisă pentru studiul dat. Deci.
P = Py ± A
12
18. Definirea teoriei selecţiei. Tipurile de selecţie. Selecţia aleatorie sau randomizată simplă. Selecţia
mecanică, tipică, în cuiburi.
Mecanică (sistemică)
Fiecare unitate de observaţie are şanse egale să fie aleasă
Selecţia eşantionului se face în baza cazurilor de evidenţă care sunt puse în ordine alfabetică sau
localităţile sunt aranjate după hartă şi se selectează fiecare a 4-a, a 6-a sau a 10-a
În acest mod se obţine o selecţie teritorială uniformă ( eşantionul cuprinde 5 - 10% din totalitatea
integrală)
Tipică (stratificată)
(proporţională cu mărimea eşantionului integral)
Unităţile de observaţie se grupează după anumite semne în grupuri tipice (de exemplu: vârstă, sex
sau după frecvenţa fenomenului)
Din fiecare grup, pe cale aleatorie sau mecanică, este selectat un anumit număr de unităţi astfel ca
raportul după semne în eşantion să fie acelaşi ca şi în totalitatea integrală
Din totalitatea integrală se selectează nu unităţi individuale, dar serii (microzone), localităţi sau
familii care sunt examinate în întregime
13
prelucrării statistice pot fi evidenţiate trăsăturile şi tendinţele esenţiale din evoluţia fenomenelor şi
proceselor medico -sociale.
• Prelucrarea primară a datelor statistice culese cuprinde operaţiile de clasificare, grupare, centralizare,
agregare, calcul de caracteristici derivate, precum şi construirea de tabele, serii şi grafice statistice.
•
CLASIFICAREA ŞI GRUPAREA DATELOR STATISTICE
• Unităţile colectivităţii observate sunt repartizate în clase cu caracter omogen.
• Această operaţie permite restrângerea volumului mare de date iniţiale şi evidenţiază structura
colectivităţii analizate.
• Prin grupare se pierde o parte din informaţia iniţială, în schimb se înlesneşte cunoaşterea
proprietăţilor esenţiale ale colectivităţii şi înţelegerea legăturilor dintre caracteristicile utilizate.
Clasificarea trebuie să respecte mai multe reguli:
• a) completitudinea – toate unităţile statistice să fie incluse în clasele formate în urma
clasificării;
• b) omogenitatea – a include într-o clasă numai elemente de acelaşi tip;
• c) unicitatea – fiecare element să aparţină unei singure clase;
• d) continuitatea variaţiei – să nu existe clase cu frecvenţă nulă în cazul variabilelor cu variaţie
continuă.
• Amplitudinea variaţiei (A) se stabileşte ca diferenţă între valoarea maximă (xmax) şi valoarea
minimă (xmin) înregistrată de caracteristica respectivă:
A = xmax – xmin
• Mărimea intervalului de grupare (h) se determină pe baza raportului dintre amplitudinea variaţiei
(A) şi numărul de grupe (k) ales:
h = A/k
• Intervalele de grupare se definesc prin precizarea limitei inferioare şi superioare.
Determinarea primului interval de grupare porneşte de la valoarea minimă a caracteristicii (limita
inferioară) la care se adaugă mărimea intervalului de grupare, obţinându-se limita superioară.
14
20. Seria statistică de variaţie. Particularităţile seriei de variaţie.
Seria statistică de variaţie este şirul de valori numerice ale caracteristicii,
ordonate crescător sau descrescător în funcţie de mărimea
acestora.
Seria statistică reprezintă corespondenţa a două şiruri, cel al valorilor
variantelor (x) şi cel al frecvenţelor (f), motiv pentru care se mai
numeşte şi serie de distribuţie/serie de frecvenţe. Suma frecvenţelor
variantelor corespunzătoare corespunde cu numărul de cazuri cercetate
(Σf = n).
Seriile statistice de variaţie pot fi de două categorii: simple şi grupate.
Când fi ecărei valori a caracteristicii îi corespunde o singură frecvenţă
vorbim de o serie statistică simplă, iar când fi ecărei valori îi corespund
mai multe frecvenţe vorbim de o serie statistică grupată.
Unii autori defi nesc seria statistică în modul următor: simplă – de
regulă se formează în cazul unui număr mic de cazuri cercetate – ≤
30 şi grupată – care se formează în cazul unui număr mare de cazuri
cercetate – > 30.
• Media este un indicator al tendinţei centrale care arată nivelul la care ar fi ajuns caracteristica
dacă în toate cazurile individuale factorii esenţiali şi neesenţiali ar fi acţionat constant.
• Este valoarea tipică pentru reprezentarea unei colectivităţi, dar este posibil să nu coincidă cu
nici una din valorile individuale înregistrate de caracteristică în colectivitatea respectivă.
Indicatorii medii sunt mărimi tipice, caracteristice, ce definesc un fenomen variabil.
• Pentru ca indicatorii medii să aibă conţinut real şi să fie reprezentativi pentru colectivitatea analizată
este necesar să fie îndeplinite câteva condiţii:
• omogenitatea colectivităţii;
• volum suficient de mare de date individuale;
• forma adecvată a indicatorului.
Media aritmetică simplă este valoarea medie care se obţine prin divizarea sumei valorilor
individuale dintr-o colectivitate omogenă, la numărul total al cazurilor studiate
15
Media aritmetică ponderată este valoarea medie care se obţine din suma produsului valorilor dintr-
o colectivitate omogenă, cu frecvenţele corespunzătoare, divizată la numărul total al cazurilor
studiate..
Media aritmetică simplă este valoarea medie care se obţine prin divizarea sumei valorilor individuale
dintr-o colectivitate omogenă, la numărul total al cazurilor studiate.
Media aritmetică ponderată este valoarea medie care se obţine din suma produsului valorilor dintr-o
colectivitate omogenă, cu frecvenţele corespunzătoare, divizată la numărul total al cazurilor studiate.
1) Definiţia dată mediei aritmetice este valabilă numai dacă valorile individuale înregistrate sunt
numerice. Pentru o serie cu valori nenumerice nu se poate calcula media aritmetică;
2) Mărimea mediei aritmetice calculate este unică; o serie nu posedă mai multe medii aritmetice distincte;
3) Mărimea mediei aritmetice poate sau nu să coincidă cu vreo valoare individuală înregistrată;
4) Media are întotdeauna valoarea cuprinsă între valoarea minimă din serie (Xmin) şi valoarea maximă
(Xmax);
5) Suma abaterilor valorilor individuale de la media lor este întotdeauna egală cu zero (adică distanţele
faţă de centru se balansează, se compensează reciproc);
16
în care se găseşte valoarea frecvenţei ce împarte seria în două
jumătăţi egale.
Formula de calcul:
Unde:
xMe – limita inferioară a intervalului median;
Σf – frecvenţele valorilor variantelor;
fcm – frecvenţele cumulate până la intervalul median;
h – mărimea intervalului median;
fMe – frecvenţa intervalului median;
Cum se stabileşte intervalul median?
Pe şirul frecvenţelor cumulate crescător, intervalul care corespunde
primei frecvenţe cumulate mai mare decât este intervalul
median.
Cuantilele sunt indicatorii care descriu anumite poziţii particulare
din cadrul seriilor de distribuţie. Conceptul de cuantilă indică o divizare
a distribuţiei observaţiilor într-un număr oarecare de părţi. Frecvent se
utilizează următoarele cuantile:
- mediana sau cuantila de ordin 2 (r = 2);
- cuartilele sau cuantilele de ordinul 4 (r = 4);
- decilele sau cuantilele de ordinul 10 (r = 10);
- centilele sau cuantilele de ordinul 100 (r = 100).
Cuantilele de ordin superior se calculează în cadrul distribuţiilor cu
număr mare de grupe sau clase de valori individuale.
1) Analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendinţei centrale şi
verificarea reprezentativităţii acestora;
2) Compararea în timp şi (sau) spaţiu a mai multor serii de distribuţie după caracteristici
independente şi (sau) interdependente;
3) Selectarea obiectivă a factorilor semnificativi de influenţă după care se structurează unităţile unei
colectivităţi statistice;
17
b. indicatori sintetici (dispersia, abaterea medie pătratică, coeficientul de
variaţie)
A x m a x x m in
A% 100 100
x x
Dispersia ( 2 )
Se calculează ca media aritmetică a pătratelor abaterilor valorilor individuale de la tendinţa
centrală
Pentru o serie simplă formula dispersiei este:
2 = d2n
Pentru o serie de distribuţie pe frecvenţe formula dispersiei este:
2 = d2fn
Deviaţia standard este cel mai util şi mai important indicator de dispersie. Ea pune în evidenţă
intervalul valoric, în jurul mediei, în care s-au distribuit valorile individuale ale fenomenului studiat.
O deviaţie standard cu valoare mică, pune în evidenţă strânsă o distribuţie strânsă a valorilor
frecvenţelor fenomenului cercetat în jurul mediei, deci evidenţiază un eşantion omogen.
18
Coeficientul de variaţie este rapotul procentual dintre valoarea deviaţiei standard şi media
aritmetică.
Formula de calcul:
Cv = ± ( X )100
Coeficientul de variaţie arată cât la sută din medie reprezintă deviaţia standard. Astfel,
exprimând procentual pe , scăpăm de influenţa unităţii de măsură, putând compara între ele, sub
aspectul omogenităţii, câte eşantioane dorim.
Cu cît valoarea procentuală a coeficientului de variaţie este mai mică, cu atât eşantionul
cercetat este mai omogen.
Se consideră că:
A--un coeficient de variaţie cu valori sub ± 10% indică o variaţie mică,
B--un coeficient de variaţie cu valori cuprinse între ± 10% şi ± 20% indică o variaţie medie
C--Valorile peste ± 20% ale coeficientului de variaţie indică o variaţie mare.
D--nivelul de 35 - 40% este considerat limită maximă admisibilă pentru coeficientul de
variaţie.
• Distribuţia perfect simetrică se caracterizează prin egalitatea dintre medie, mediană şi modul.
Frecvenţele se distribuie simetric la dreapta şi la stânga valorii centrale, care are frecvenţa maximă.
Graficul are formă “ de clopot ”
• Asimetria pozitivă este caracteristică acelor colectivităţi în care predomină valorile mici ale
caracteristicii, de unde rezultă următoarea relaţie de inegalitate:
Mo < Me < X .
Pentru acest tip de distribuţie de frecvenţe, media reprezintă mai bine valorile mici ale seriei,
care sunt predominante; dimpotrivă, valorile mari sunt mult distanţate faţă de medie.
• Asimetria negativă este specifică seriilor de distribuţie de frecvenţe în care predomină valorile
mari ale caracteristicii, astfel încât:
x < Me < Mo
În acest caz, media este semnificativă pentru valorile mari ale caracteristicii; termenii cu valori
mici ai seriei statistice nu sunt bine reprezentaţi.
• Distribuţiile de frecvenţe care sunt numai uşor asimetrice verifică următoarea legătură între
medie, mediană şi modul:
Mo = x −3⋅( x − Me ).
19
• Indică cu cât a greşit cercetătorul, calculând indicatorii relativi într-o cercetare parţială, faţă
de rezultatele pe care el le-ar fi obţinut într-o cercetare integrală
• eP = ±√ p x q : n,
• eP = ±√ p x q : (n-1), n ≤ 120
• p – indicatorul relativ
• q - diferenţa dintre înmulţitorul, faţă de care s-a calculat indicele (100, 1000, 10000
etc.) şi valoarea indicatorului
• n - numărul de cazuri luate în observaţie
! Dacă înmulţim eP cu 10 aflăm certitudinea indicatorului relativ. Produsul nu trebuie
să depăşească indicatorul.
20
(M1– M2) (P1 - P2)
• t= t=
√ ESM12
+ ES M2 2
√ ESP12 + ES P22
Acest „t” se numeşte „t - calculat”.
33. Metode non-parametrice de testare a ipotezelor: Testul χ², testul Fisher, Wilcoxon,
testele Anova.
21
Din această cauză, orice termen al seriei depinde de nivelurile
precedente şi infl uenţează mărimile următoare ale termenilor seriei.
Având în vedere aceste particularităţi ale seriilor cronologice, analiza
lor trebuie precedată de verifi carea comparabilităţii valorilor individuale
înregistrate pentru fenomenul analizat. Pentru a asigura comparabilitatea
termenilor seriei cronologice este necesar ca componenţa
seriei să fi e identică pentru întreaga perioadă de timp, valorile seriei să
fi e exprimate în aceleaşi unităţi de măsură, iar intervalele de timp între
valori să fi e egale
Ajustarea seriei cronologice. Seria cronologică nu întotdeauna este alcătuită din niveluri care se
schimbă continuu spre diminuare sau creştere. Uneori nivelurile reprezintă o diversitate de oscilaţii,
care fac imposibilă identificarea legităţilor de bază caracteristice fenomenului studiat. în astfel de
22
cazuri, pentru a depista tendinţa dinamică sau legităţile de manifestare a fenomenului, este nevoie de
ajustarea seriei cronologice.
Metode de ajustare a seriilor cronologice: majorarea infernalului, nivelarea seriei cu ajutorul
mediei de grup şi nivelarea seriei cu ajutorul mediei glisante. Ajustarea nivelurilor seriilor
cronologice se face, însă, numai după analiza cauzelor, care se explică prin oscilarea acestor nivele.
Majorarea intervalului se face prin sumarea datelor pentru un şir de perioade megieşe (tabelul 4).
Precum se vede din tabel, numărul de îmbolnăviri de anghină în fiecare lună oscilează, mărindu-se
sau micşorându-se. Efectuând majorarea intervalelor prin sumarea nivelurilor după trimestrele anului,
observăm o legitate sezonieră determinantă: cel mai mare nivel de îmbolnăviri se înregistrează în
perioada de vară spre toamnă.
23
Se exprimă în unităţi sau procente. Valori mai mari de 1 sau 100%
ale acestui indicator arată creşteri faţă de perioada bază de comparaţie.
Valorile sub 1 sau 100% semnifi că scădere, reducere.
2) Ritmul de dinamică (ritmul sporului) – R. Arată cu cât s-a modifi -
cat procentual (a crescut sau a scăzut) mărimea fenomenului întro
anumită perioadă de timp faţă de o perioadă de referinţă fi xă
sau mobilă. Se determină scăzând 100% din indicele de dinamică
corespunzător (cu bază fi xă sau mobilă). Poate fi calculat şi prin
următoarele modalităţi:
- cu bază fi xă se calculează ca raportul procentual al sporului absolut
cu bază fi xă la nivelul ales bază de comparaţie (nivelul iniţial).
- cu bază mobilă se calculează ca raportul procentual al sporului
absolut cu bază mobilă la nivelul precedent.
3) Valoarea absolută a unui procent din ritmul de dinamică (de spor) –
A. Arată mărimea absolută a modifi cării ce revine pe un procent din
ritmul dinamicii sau exprimă câte unităţi de măsură revin unui procent
din ritmul dinamicii. Se calculează sub forma unui raport între
modifi carea absolută şi ritmul modifi cării şi se exprimă în unitatea
de măsură a caracteristicii.
Variante de calcul:
- cu bază fi xă se calculează ca raportul modifi cării absolute cu
bază fi xă la ritmul dinamicii cu bază fi xă. Are aceeaşi valoare
pentru toată perioada analizată.
- cu bază mobilă se calculează ca raportul modifi cării absolute cu
bază mobilă la ritmul dinamicii cu bază mobilă.
24
perioadă de timp la alta.
METODE DE STANDARDIZARE:
• Metoda directă
• Metoda tangenţială
• Metoda indirectă
25
METODA DIRECTĂ DE STANDARDIZARE
• În cazul utilizării acestei metode drept standard este structura populaţiei
• Esenţa metodei constă în eliminarea factorilor ce influenţează mărimea
indicatorilor obţinuţi
ETAPELE :
1. Calculul indicatorilor intensivi (rata) sau medii (pentru fiecare grupă – pe sexe,
vârstă, durata de spitalizare, termenul de internare etc.) şi generali pentru fiecare
totalitate
2. Selectarea şi calculul standardului
3. Calculul “valorilor aşteptate” pentru fiecare grupă de standard
4. Calculul indicatorilor standardizaţi
5. Compararea totalităţilor după indicatorii intensivi sau medii generali şi indicatorii
standardizaţi. Concluzii
În statistică, pentru studierea legăturilor multiple ce au loc între diferite fenomene, se foloseşte noţiunea de
funcţie f , care constă în faptul că fiecărei valori a variabilei independente (X), numită argument, îi corespunde
valoarea altei variabile numită funcţie (Y).
Tipuri de corelaţii
corelaţii funcţionale sau matematice
corelaţii statistice sau stohastice.
Corelaţiile funcţionale
sunt perfecte, rigide, exprimând legătura de la cauză la efect între fenomene.
ele sunt studiate în cadrul ştiinţelor exacte, unde legătura de la cauză la efect se exprimă sub formă de lege.
În cazul lor unei valori determinate a unei variabile independente X (argument) îi corespunde strict o valoare
a variabilei dependente Y (funcţie).
26
se evidenţiază mai greu
În cazul lor, fiecărei valori numerice a variabilei X corespund nu una ci mai multe valori a variabilei Y, adică
o totalitate statistică a acestei valori, care se grupează în jurul mediei Yx.
CORELOGRAMA
Existenţa sau inexistenţa unei corelaţii între fenomene se poate evidenţia aproximativ cu ajutorul
reprezentărilor grafice. În acest caz, folosim un grafic cu două scări, ordonată şi abscisă, pe care înscriem
valorile variantelor celor două fenomene x şi y.
Se realizează astfel „norul de puncte”.
Dacă norul de puncte se va dispune fuziform, oblic de jos în sus şi de la stânga la dreapta, între cele două
fenomene există o corelaţie directă. Creşte un fenomen, creşte şi cel de al doilea, cu care se corelează, sau
ambele fenomene scad, evoluând în aceeaşi direcţie.
Dacă norul de puncte se dispune fuziform, oblic de sus în jos şi de la stânga la dreapta, între cele două
fenomene există o corelaţie inversă.
Dacă punctele se dispun pe toată reţeaua grafică, neavând nici o tendinţă de a se grupa, înseamnă că între
fenomene nu există nici o legătură de dependenţă, fenomenele evoluând independent unul faţă de celălalt.
În cazul acesta, dreapta care trece prin mijlocul punctelor este paralelă fie cu ordonata, fie cu abscisa.
Formula de calcul:
27
În cazul în care dorim să stabilim legătura de dependenţă între fenomenele cercetate pe eşantioane mici,
utilizăm coeficientul de corelaţie al rangurilor, propus de Spearman (1904).
Acest coeficient se notează cu litera greacă (ro) şi se determină după formula propusă de Spearman:
6 Σd2
=1–
n – (n2 – 1)
în care:
Exemple:
1. Timpul trecut din momentul accesului de pancreatită acută (x) şi numărul complicaţiilor postoperatorii (y)
2. Legătura de corelaţie între copiii cu deficienţă mintală (la 100 mii copii) şi invaliditatea copiilor (la 100
mii copii)
28
sau
în care:
Rgxy = coefi cientul de regresie a lui x în funcţie de y. El exprimă, cantitativ,
cu cât creşte sau scade fenomenul x când y creşte sau
scade cu o unitate de măsură;
Rgyx = coefi cientul de regresie a lui y în funcţie de x. El exprimă, cantitativ,
cu cât creşte sau scade fenomenul y când x creşte sau
scade cu o unitate de măsură;
rxy = coefi cientul de corelaţie liniară Bravais-Pearson;
δx = deviaţia standard a fenomenului x;
δy = deviaţia standard a fenomenului y.
epidemiologie
Cuvîntul provine de la cuvinte greceşti epi – despre, demos – popor, logos - ştiinţa. Astfel epidemiologia
este ştiinţa, care studiaza procese la nivel populaţional.
Epidemiologia este ştiinţa medicală care se ocupă cu studiul distribuţiei şi determinanţilor stărilor
sau evenimentelor legate de sănătate în anumite populaţii, cu aplicarea rezultatelor acestui studiu în
controlul problemelor de sănătate” (J. Last, 1988)
epidemiologie
Epidemiologia este studiul distribuţiei determinanţilor stărilor şi evenimentelor legate de sănătate în
anumite populaţii, precum şi aplicarea rezultatelor studiului în controlul problemelor de sănătate.( J. Last,
1988)
Ce este epidemiologia?
este o disciplină ştiinţifică, uneori denumită “ disciplină de bază a sănătăţii publice”
Ea are la bază multiple metode de cercetare ştiinţifică pentru analiza cauzelor şi factorilor ce duc la
apariţia fenomenelor de sănătate
29
Variabilă – factor de risc
Variabilă predictoare
Variabilă independentă
Posibil factor cauzal
REZULTAT
Eveniment important al stării de sănătate
Boală , accident
Variabilă răspuns
Variabilă dependentă
Variabila de efect, de consecinţă
FACTOR DE RISC
Orice condiţie care poate să fie descrisă şi dovedită că se asociază unei frecvenţe crescute a bolii
FACTOR DE PROTECŢIE
Orice factor care prin prezenţa sa asigură o stare de sănătate mai bună unei populaţiei ( ex.: factori
comportamentali, factori de mediu, medicamente, vaccinuri etc.)
FACTOR INDIFERENT
Factor despre care cel puţin până în prezent nu se cunoaşte că s-ar asocia cu starea de sănătate sau starea de
boală a unei populaţii
RISCUL
Este o probabilitate care exprimă în cifre frecvenţa apariţiei unei boli la o populaţie a cărei expunerea este
definită
RELAŢIA EXPUNERE – BOALĂ
Fumatul – cancerul de plămâni
Obezitate – boală de cord
Venit mic – malnutriţie
Alcool – traumatism rutier
POPULAŢIA LA RISC
Populaţia purtătoare a factorilor de risc
Populaţia susceptibilă de a dezvolta o anumită boală
EPIDEMIE
Apariţia unui număr de evenimente cu o frecvenţă superioară frecvenţei aşteptate
ASOCIEREA EPIDEMIOLOGICĂ
ESTE RELAŢIA DINTRE FACTORII DE RISC ŞI MALADIE
51. Elaborarea design-ului unei cercetări științifice: aspecte cheie. Selectarea tipului de studiu.
30
Materialul primar pentru studiile descriptive
Anchetele de informare
- Anchetele de tip transversal – cunoaşterea structurii la momentul dat a fenomenelor cercetate.
- Anchete de tip longitudinal – studiul în dinamică a fenomenelor
Design-ul studiului
Este inclus în metodologia cercetării.
Se realizează în baza obiectivelor.
Include: unitatea examinată, baza de studiu, metodele de colectare a datelor, genul cercetării, volumul
eşantionului şi metoda de selecţie a eşantionului reprezentativ.
Definiție
“Epidemiologia este ştiinţa medicală care se ocupă cu studiul distribuţiei şi determinanţilor stărilor sau
evenimentelor legate de sănătate în anumite populaţii, cu aplicarea rezultatelor acestui studiu în controlul
problemelor de sănătate”
53. Esenţa şi importanţa studiilor descriptive. Obiectivele studiilor descriptive. Metodele şi surse de
colectare a datelor într-un studiu descriptiv.
Determinarea eşantionului SD
Z
n p (1 p ) ( )2
d
unde: d – distanţa (sau toleranţa) – cît de aproape de proporţia care ne interesează dorim să fie valoarea
exprimată (de ex. În limitele a 0.05)
P – proporţia sau cea mai bună estimare despre valoarea proporţiei cercetate.
α – (1-nivelul de încredere)
Determinarea eşantionului SD
Nt 2 pq
n
n – volumul eşantionului reprezentativ ;
Ndexprobabilitate,
t – factorul
2
t 2care pqpoate fi egal cu 1,96 sau 3 pentru o probabilitate de 95% sau 99%
respectiv;
p şi q – probabilitatea şi contraprobabilitatea de apariţie (sau neapariţie) a fenomenului cercetat. În
cazurile când nu avem date despre fenomenul cercetat, se constată că „n” este maxim când produsul
31
„pq” este maxim, or, ţinând seama de faptul că 0 ≤ p ≤ 1 şi q = 1 – p produsul este maxim, atunci
când p = q = 0,5.;
∆ – eroarea limită admisă
N – volumul colectivităţii generale.
Obiectivele studiilor descriptive:
Să prezinte “tabloul bolii” cât mai precis posibil, pentru a permite elaborarea unui program de
sănătate.
Să studieze un fenomen de sănătate a cărui etiologie nu este bine cunoscută şi să elaboreze ipoteze
asupra etiologiei bolii şi a factorilor de risc, care vor fi ulterior verificate prin studii analitice.
Să permită fundamentarea planificării sanitare şi evaluarea serviciilor de sănătate.
Să evalueze tendinţele de evoluţie a stării de sănătate a unei populaţii cu posibilitatea comparării
între diferite ţări sau între diferite teritorii ale unei ţări, în acelaşi interval de timp.
32
descrie modelele de apariţie a bolilor sau de expunere la factorii de risc în funcţie de persoană,
loc şi timp şi se limitează la descrierea fenomenului de boală în populaţie
Definitia--Este un studiu care descrie situaţia dată într-o populaţie la un moment dat sau în
dinamică.
Avantajele
Se efectuează uşor
Sunt relativ mai puţin costisitoare
Permit colectarea de date despre factorii potenţiali de risc importanţi, ca vârsta, rasa, sexul şi situarea
geografică. Aceste date pot fi folosite pentru a compara prevalenţa şi pentru elaborarea ipotezelor
pentru studiile analitice ulterioare.
Pot dezvălui modele le de apariţie a bolii şi tendinţele în timp.
Oferă o bază pentru planificarea, furnizarea şi evaluarea serviciilor medicale pentru o populaţie dată.
Creează puţine probleme de natură etică.
Dezavantajele
Nu testează ipotezele etiologice.
Nu există un grup formal pentru comparare, de aceea nu există nici o metodă corectă de apreciere
dacă prevalenţa dată de studiu este mai mare sau mai mică decât s-ar fi aşteptat.
Relaţia temporală dintre problema de sănătate cercetată şi expunerile potenţiale nu poate fi uşor
determinată.
Nu permit evaluarea cauzalităţii.
55. Esenţa studiilor de cohortă. Obiectivele, direcţia şi secvenţialitatea studiilor de cohortă. Ipoteza
cercetării.
Reprezintă forma cea mai riguroasă a studiilor epidemiologice ne-experimentale. Este un studiu epidemiologic
analitic observaţional de tip longitudinal, în care subiecţii sunt clasificaţi în funcţie de prezenţa sau absenţa
expunerii la factorii de risc, fiind urmăriţi de-a lungul unei perioade de timp.
Permite evaluarea incidenţei unei afecţiuni, stabilirea unei relaţii cauză-efect între factorul de risc şi boală,
evaluarea cu precizie maximă a timpului de latenţă şi a riscului relativ.
Obiectivul acestui studiu este de a compara rata incidenţei (IR) unei boli într-o populaţie supusă unui factor de
risc cu cea a unei populaţii care nu a fost expusă acţiunii factorului de risc luat în consideraţie.
Studiul de cohortă poate fi de tip retrospectiv (istoric) sau de tip prospectiv.
In cadrul studiilor de conhorta se cunoaste de la inceput daca pacientii au fost expusi unui tratament sau unui
factor etiologic sau de protectie. Pacientii sunt impartiti in doua grupuri: expusi si neexpusi si sunt urmariti ani
de zile sau chiar decenii pt a vedea cati membrii ai fiecarui grup dezvolta o anumita boala sau asupra carora
33
actioneaza factorul de protectie. Dezavantajul acestui tip de studiu este nesiguranta alegerii bune a grupurilor
sau neexistentei unui alt factor care poate influenta rezultatul.
Selectarea grupului: un grup comunitar de o anumita varsta sau sex, un grup expus la un factor de ris: fumatori,
femei care folosesc anticonceptionale, elevi, un grup de persoane supuse unui tratam anterior.
Date de interes: caract ale grupului, date despre expunere care au leg cu ipotezele studiului, date despre rezultate
ce au relevanta pt ipotezele studiului.
Metode de colectare a datelor: interviul, fisa medicala, examene medicale sau de laborator.
59. Esenţa, obiectivele şi particularităţile studiilor caz - control. Ipoteza cercetării. Dificultăţi în
realizare și diagrama de flux.
34
Obiective:
1. De a dovedi existenţa sau inexistenţa unei asociaţii epidemiologice;
2. De a verifica dacă o ipoteză epidemiologică este adevărată sau falsă.
Direcţia investigaţiei este retrospectivă, se porneşte de la efect spre cauză.
==particularităţi
Subiecţii sunt selectaţi pe baza bolii, începe cu boala;
Se caută înapoi istoricul expunerii;
Direcţia întotdeauna înapoi, de la B --- spre E;
Temporalitatea este retrospectivă, boala a apărut deja când începe studiul.
Diagrama de flux
35
==Studiile caz-control sunt utile pentru studierea problemelor de sănătate care apar rar
==Sunt utile pentru studierea problemelor de sănătate care au o perioadă de latenţă mare
==Sunt mai ieftine decât studiile de cohortă
==Sunt utile pentru a caracteriza efectele unor factori potenţiali de risc asupra problemei de sănătate studiate
DEZAVANTAJELE
Modelul este “înapoi”.
Nu sunt potrivite pentru Expunerile rare.
Nu permit o estimare directă a riscurilor şi a forţei de asociere.
De obicei, nu pot măsura incidenţa bolii.
Imprecizia relaţiei de timp dintre Expunere şi Rezultat.
Tendinţa spre erori de selecţie şi repetare.
==Deoarece cazurile şi persoanele de control pot fi selectate din două populaţii separate, este dificil de a se
==asigura că ele sunt comparabile în ceea ce priveşte factorii de risc externi şi alte surse de eroare
==Datele despre expunere sunt colectate din documentaţia medicală sau de la pacienţi după apariţia bolii
==Studiile caz-control nu pot fi folosite pentru a determina ratele de incidenţă
==Studiile caz-control nu pot fi folosite pentru determinarea altor posibile efecte ale expuneri asupra
sănătăţii. Prin definiţie, în studiile caz-control studiază doar un singur efect
36
Etape şi faze într-un studiu clinic randomizat
I etapă – studii preclinice, în vitro şi pe animale
II etapă – studiile clinice, pe oameni :
• Faza 1. Evaluarea iniţială a voluntarilor (30-100 subiecţi); evaluarea siguranţei tratamentului
şi toleranţei la acesta
• Faza 2. Evaluarea eficacităţii tratamentului (100-200 subiecţi)
• Faza 3. Evaluarea tratamentului nou la un număr mai mare de voluntari (500-1500);
majoritatea sunt studii clinice comparative
• Faza 4. Cercetarea efectelor tratamentului pe termen lung; sunt efectuate după ce tratamentul
este aprobat pentru utilizare generală
66. Prezentarea datelor statistice prin tabele şi grafice. Tipuri de tabele. Reguli pentru tabele.
37
b-combinate
C. Titlul este de obicei separat de corpul tabelului prin linii sau spaţii.
În tabelele mici nu este necesar să se traseze linii verticale care să separe coloanele.
D. Dacă datele nu sunt originale trebuie menţionată sursa lor în nota din subsol.
67. Componentele principale ale unui grafic. Tipuri de diagrame și exemple de indicatori specifici.
GRAFICE SPECIALE
Diagramele sunt metode de prezentare a informaţiei statistice cu simboluri
TIPURILE
38
• Diagramele bazate pe lungimi
- cu bare (verticale, orizontale)
- pictograme
• Diagramele de proporţii:
- cu bare
- cu discuri
• Diagramele cu coordonate geografice.
cartogramele
• Diagramele speciale.
39