Sunteți pe pagina 1din 18

MINISTERUL SANATATII AL REPUBLICII MOLDOVA

UNIVERSITATEA DE STAT DE MEDICINA SI FARMACIE


NICOLAE TESTEMITANU

Catedra Medicina Sociala si Management Sanitar


Nicolae Testemitanu
A P R O B
Sef catedra
Medicina Sociala si Management
Sanitar Nicolae Testemitanu,
d.h.s.m., prof. universitar,
Dumitru Tintiuc
Proces verbal nr.1 din 13.01.2015

Testarea matematica a formulelor de calcul al


esantionului reprezentativ

Nota de curs

Chisinau, 2015
1

Autori:
Leonid Margine, conferentiar universitar; Andrei Usatii, conferentiar universitar;
Tudor Grejdeanu, profesor universitar; Spinu Dorin, membru al cercului stiintific;
Diaconu Ana, membru al cercului stiintific.

Responsabil editor:
Dumitru Tintiuc, doctor habilitat in medicina, profesor universitar.

Recenzenti:
Raisa Puia, doctor in stiinte fizico-matematice, conferentiar universitar;
Vladislav Badan, asistent universitar.

Metodologia propusa si aplicat in aceasta recomandare metodica poate servi n


calitate de material didactic pentru instruirea universitar i postuniversitar a cadrelor
medicale, inclusiv pentru perfecionarea programelor de studii destinate studenilor,
rezidenilor, masteranzilor,doctorantilor si conductorilor instituiilor medicale. Rezultatele
studiului sunt folosite in cadrul Catedrei Medicina Sociala si Management Nicolae
Testemitanu. Ea ofera posibilitatea persoanelor ce vor sa se implice intr-un studiu stiintific
de a intelege si a utiliza in cercetari diferite formule de calcul a esantionului reprezentativ,
tinand cont de avantajele si dezanvatajele lor.

E-mail : sanatatepub@usmf.md

Testarea matematica a formulelor de calcul al


esantionului reprezentativ
Cuprins
Introducere.....................................................................................................................(4)
Capitolul I. Date generale.......................................................................................................(5)
Capitolul II. Deductia matematica a formulelor de baza pentru calcularea volumului
esantionului reprezentativ........................................................................................................(6)
2.1 Prezentarea formulelor mai des utilizate in biostatistica ......................................(6)
2.2 Deductia matematica a formulelor de calcul a esantionului reprezentativ .......(7)
2.2.1 Deductia formulei lui Cochran................................................................(9)
2.2.2 Deductia formulei lui Muresan.............................................................(10)
Capitolul III. Confirmarea matematica a veridicitatii valorii de 384 unitati statistice a
volumului esantionului reprezentativ....................................................................................(12)
3.1 Criterii de independenta fata de incidenta fenomenului cercetat.........................(13)
3.2 Criterii de independenta fata de volumul totalitatii statistice .............................(14)
Concluzii...............................................................................................................................(17)
Bibliografie...........................................................................................................................(18)

Introducere
Actualitatea temei:
In ultimul timp specialistii in biostatistica tot mai des se confrunta cu situatia cand
cercetatorii stiintifici de diferite specialitati intalnesc dificultati in calcularea corecta a
volumului esantionului reprezentativ, ceea ce in continuare duce la comiterea unor erori in
studierea si calcularea indicatorilor statistici, emiterea ipotezelor false, concluzii incorecte si
recomandari neargumentate. Mai tragica este situatia atunci cand cercetatorul, consultind un
specialist in biostatistica la finele studiului, depisteaza ca s-a comis o eroare clara la etapa
initiala a studiului , prin calculul incorect al volumului esantionului reprezentativ, astfel, in
zadar irosind energie, timp, sanatate si resurse financiare.
Scopul:
Testarea matematica a formulelor de calcul al esantionului reprezentativ si
evidentierea avantajelor si dezavantajelor acestor formule, cit si confirmarea matematica a
veridicitatii valorii de 384 unitati statistice a esantionului reprezentativ.
Obiective
1) Review al literaturii de specialitate referitor la formulele de calcul al volumului
esantionului reprezentativ;
2) Deductia matematica a formulelor de baza pentru calcularea volumului esantionului
reprezentativ
3) Avantajele si dezavantajele formulelor de calcul a esantionului reprezentativ ;
4) Confirmarea matematica a veridicitatii valorii de 384 unitati statistice a esantionului
reprezentativ.
Materiale si metode :
Materialele didactice utilizate in aceasta recomandare metodica includ sursele
bibliografice unde sunt descrise si utilizate formulele de baza pentru calcularea volumului
esantionului reprezentativ: formula lui Cochran William Gemmell, formula lui Taro Yamane
si formula recomandata de Petru Muresan.
Metodele :
istorica evolutia si utilizarea in timp a formulelor de calcul a volumului esantionului
reprezentativ;
biostatistica metoda care studiaza fenomenele din natura legate de dinamica
proceselor biologice si utilizeaza in calcule formulele mentionate anterior;
matematica - utilizarea formulelor matematice:
-alcatuirea unei functii;
-deductia formulelor de calcul a volumului esantionului reprezentativ.
Importanta stiintifica:
Efectuarea unei cercetari stiintifice care presupune calculul volumului esantionului
reprezentativ necesita o implicare substantiala de timp, energie si desigur resurse financiare.
4

Astfel de studii decurg in mai multe etape, si comiterea erorilor, mai ales la inceputul
cercetarii, are consecinte grave.Acesta recomandare metodica ofera posibilitatea
cercetatorilor stiintifici, studentilor, managerilor, cadrului profesoral de a intelege si utiliza in
cercetari diferite formule de calcul a esantionului reprezentativ, tinand cont de avantajele si
dezanvatajele lor.Acest studiu ofera cercetatorilor si cifra de 384 unitati statistice luate in
studiu, in cazul totalitatilor statistice mai mari de 100 000 unitati, sau atunci cand nu se
cunoaste volumul totalitatii statistice.
Valoarea aplicativa:
Metodologia propusa si aplicat in aceasta recomandare metodica poate servi n
calitate de material didactic pentru instruirea universitar i postuniversitar a cadrelor
medicale, inclusiv pentru perfecionarea programelor de studii destinate studenilor,
rezidenilor, masteranzilor,doctorantilor si conductorilor instituiilor medicale. Rezultatele
studiului sunt folosite in cadrul Catedrei Medicina Sociala si Management Nicolae
Testemitanu.
Cuvinte cheie: esantion(n) , totalitate statistica (N) , incidenta fenomenului (p) , lipsa
fenomenului (q), coeficientul testului de semnificatie (t), eroarea maxima admisa ().

CAPITOLUL I
DATE GENERALE
De-a lungul istoriei sale biostatistica a incadrat nume care au contribuit esential la
dezvoltarea acesteia. Pentru prima data formula de calcul a volumului esantionului
reprezentativ a fost elucidata de catre Cochran William Gemmell (1909-1980). Nascut in
Scotia, Cochran castiga o bursa si isi continua studiile la Universitatea din Cambridge,
facultatea de Matematica, matematica aplicata si statistica. Activitatea profesionala si-a
desfasurat-o in Statele Unite ale Americii, ca profesor la mai multe universitati, inclusiv
Harvard. Dedicatia pentru statistica si-a manifestat-o prin mai multe lucrari stiintifice de talie
internationala si carti redactate. In una din ele, Sampling Techniques, prezentata in mai
multe editii in perioada anilor 1953-1963, releva formula pentru calcularea volumului
esantionului reprezentativ specifica pentru totalitati statistice mari si bazata pe
particularitatile acesteia.[1]
Formula lui Cochran este preluata si promovata in spatiul URSS de catre igienistii
A.M.Merkov in ( ) aparuta in 1974 si de catre
A.F.Serenko si V.V Ermakova in
din 1984.
Ilustrul statistician sovietic A. M. Merkov a fost unul dintre primii care a observat
potentialul aplicarii statisticii in practica medicala. Inca la mijlocul secolului trecut el spunea
ca bazele statisticii, precum si principiile lor de aplicare, trebuie sa fie cunoscute tuturor
specialistilor medicali, pentru ca, in acest fel, ei sa fie capabili sa conduca o cercetare
stiintifica, sa analizeze datele statistice si sa le interpreteze in mod corect. Concluziile
5

formulate in acest fel urmau sa formeze o harta a directiilor dinamicii morbiditatii populatiei,
in baza careia urmau a fi aplicate masuri profilactice. Totusi, el a observat ca in ciuda faptului
ca erau publicate un sir de lucrari despre utilitatea statisticii in practica sanitara, majoritatea
cadrelor medicale nu puteau sa aplice metodele statistice asupra datelor obtinute in practica
lor de zi cu zi. Contributia lui majora in domeniul sanitariei sovietice a fost elaborarea cartii
( ), care prezinta o metodologie explicita de
aplicare a tehnicilor statistice in practica medicala si sanitara.[10]
Ideea de a aplica principiile statistice in practica sanitara a fost preluata si de alti
specialisti sovietici, dintre care s-a evidentiat A.F. Serenko. In editia a II-a a cartii
el descrie metodologia statistica
ca o componenta indispensabila a studiilor epidemiologice. Eforturile lui au fost concentrate
spre cresterea unui sir de generatii de cadre medicale capabile a aplica metodologia statistica
in practica medicala. Acesta a contribuit la dezvoltarea cu pasi mari a igienei in tot spatiul
sovietic[11].
Un alt mare nume in istoria biostatisticii este Taro-Yamane (1923- 1979). In
monografia sa Statistics: An Introductory Analysis 1967, alaturi de alte elemente statistice
prezinta o alta formula de calcul a volumului esantionului reprezentativ bazata pe totalitatea
statistica.[7,13]
E imbucurator faptul ca printre cei mai ilustri savanti in istoria biostatisticii mondiale
un loc insemnat il ocupa un nume romanesc- medicul Petru Muresan (1916-2006) care timp
de 30 de ani a condus Centrul de Calcul i Statistic Sanitara, a organizat sistemul naional
de statistic de sntate, numeroase anchete de profil, anchetele strii de sntate a populaiei
din Romnia pe eantioane cu reprezentativitate naional, viznd circa 100 boli cronice.
[3, 4].
In 1989 P. Muresan a editat monografia Manual de metode matematice n analiza
strii de sntate , unde recomanda utilizarea formulei de calcul a esantionului
reprezentativ, tinand cont atat de particularitatile totalitatii statistice (p,q),cat si volumul
acesteia (N) . [4]

CAPITOLUL II
DEDUCTIA MATEMATICA A FORMULELOR DE BAZA PENTRU
CALCULAREA VOLUMULUI ESANTIONULUI REPREZENTATIV
2.1 Prezentarea formulelor mai des utilizate in biostatistica
In ultimii ani tot mai multe studii utilizeaza metoda randomizata de control a
rezultatelor. S-au efectuat studii asupra veridicitatii acestei metode si s-a observat ca deciziile
incorecte asupra ipotezei nule, in marea lor parte, se datoreaza unui volum insuficient al
esantionului[9, 13].

Am luat in consideratie formulele cele mai des utilizate in biostatistica in calcularea


volumului esantionului reprezentativ.
Cochran, W. G in manualul sau propune urmatoarea formula:
=

2 (1)
2

unde n volumul esantionului reprezentativ; t coeficientul testului de


semnificatie; p incidenta fenomenului; - eroarea maxim admisa.[1]
Nota. A. Serenko si V. Ermakova inlocuiesc lipsa fenomenului (1 ) prin
contraprobabilitatea producerii fenomenului (). Astfel formula capata urmatoarele forme:

=
=

2
2
2 2
2

, pentru valori calitative;


, pentru valori cantitative. [11]

O alta formula este cea a lui Taro-Yamane, care nu tine cont de incidenta fenomenului
si lipsa acestuia , ci numai de volumul totalitatii statistice (N) si eroarea maxim admisa:
=

1+2

unde n volumul esantionului reprezentativ, N totalitatea statistica, - eroarea


maxim admisa. [8]
Mult mai potrivita studiilor biostatistice este formula recomandata de P. Muresan,
care reprezinta o sinteza a ambelor formule, tinind cont atit de volumul totalitatii statistice, cit
si de incidenta si lipsa fenomenului:

2 1
2

1 + 2

unde n volumul esantionului reprezentativ; t coeficientul testului de


semnificatie; p incidenta fenomenului; N totalitatea statistica; - eroarea
maxim admisa, 1 - p probabilitatea lipsei fenomenului. [4]
2.2 Deductia matematica a formulelor de calcul a esantionului reprezentativ
In urma analizei statistice a unui esantion se obtin indicatorii statistici de interes:
media , devierea standard, eroarea standard, s.a. . In cadrul unui studiu stiintifc, ideea
esantionarii corecte prevede ca indicatorii sintetici (devierea standard, eroarea standard) care
urmeaza a fi obtinuti sa apartina unor limite prestabilite care asigura reprezentativitatea.
Criteriile de reprezentativitate sunt: valoarea minima a coeficientului testului de semnificatie
t, si eroarea maxim admisa . [5, 6]
Este clar ca indicatorul de baza obtinut este media esantionului. In studiile cu caracter
biologic, media reprezinta rezultatul interactiunii factorului analizat cu subiectii studiului la
general. Natura interactiunii dintre factor si subiecti poate fi diferita. Astfel, daca factorul are
un impact real si asemanator asupra tuturor subiectilor media obtinuta va fi reprezentativa.
Daca factorul nu are efect asupra subiectilor, sau daca efectul observat variaza considerabil
de la un subiect la altul in realitate variatiile pot depinde de un factor cu totul diferit. In acest
caz media obtinuta poate sa nu fie reprezentativa. [5, 6]
7

Pentru a demonstra ca media este reprezentativa se calculeaza si se analizeaza


devierea standard. Devierea standard (SD) reprezinta variatia totala a unei caracteristici
studiate induse de cauze atit esentiale, cat si intamplatoare, astfel permite sa apreciem gradul
de omogenitate a variabilelor din seria de variatie.
SD= 2 =

( )2

unde media esantionului, variabilele seriei statistice analizate, n numarul


de cazuri.
Pentru ca rezultatele obtinute sa fie veridice statistic, intervalul de incredere 3
(legea a 6) trebuie sa acopere cel putin 95% din totalitatea valorilor obtinute. [8]

Fig. 1. Graficul distributiei normale a variabilelor intr-o serie de variatie


Prin intermediul devierii standard putem calcula eroarea standard a mediei ().
Anume acest parametru statistic reprezinta acel indice pe langa media statistica care acorda
validitate studiului efectuat, deoarece in baza erorii standard a mediei putem calcula
intervalul de incredere [5]. Eroarea standard arata cu cit se poate gresi cercetatorul calculind
valoarea medie intr-un esantion fata de media totalitatii statistice generale, intru cit media pe
esantion este putin probabil sa fie egala cu media pe intreaga totalitate statistica. Aceasta
diferenta nu poate fi calculata decit daca am putea calcula ambele medii, deaceea se seteaza o
valoare limita a acestei diferente, eroarea limita admisa. Deci este mai rational sa venim cu
un interval in care s-ar afla media generala, decit sa-i presupunem o valoare exacta.Intervalul
de incredere reprezinta acel interval in jurul standard a mediei esantionului unde se presupune
ca s-ar afla media generala. Fiecarui interval de incredere ii este specific un anumit nivel de
semnificatie , care constituie valorile considerate nereprezentative[9].
Intervalul de incredere este descris de formula ; + , unde media
esantionului, - eroarea limita admisa. Eroarea limita admisa se calculeaza dupa urmatoarea
formula:
= , unde - eroarea standard a mediei; t coef. testului de semnificatie[7].

Eroarea standard a mediei ( ) se calculeaza in baza indicatorilor obtinuti la analiza


statistica a esantionului, adica depinde de seria de variatie obtinuta in cadrul esantionului,
deci este o caracteristica a acestuia.
Coeficientul testului de semnificatie ( t ) depinde de valoarea nivelului de semnificatie
, iar legatura dintre acestea este data de curba distributiei normale Gauss-Laplace. In
general, fiecarui nivel de semnificatie ii corespunde o anumita valoarea a coeficientului
testului de semnificatie t. In studiile stiintifice, valoarea maxima acceptata a lui (adica
numarul relativ al valorilor nereprezentative) este 5%, ceea ce, pentru un esantion cu un
numar mai mare de 120 de unitati statistice, corespunde unui coeficient t = 1.96, precum este
prezentat in figura de mai jos (fig.2). [5, 6, 7, 9]

Fig. 2. Graficul dependentei coeficientului testului de semnificatie t de nivelul de


semnificatie
Eroarea maxima admisa ( ), dupa cum ii sugereaza numele, este o valoare arbitrara
pe care si-o seteaza cecetatorul. Pentru studiile acceptate de comunitatea stiintifica, trebuie
sa nu depaseasca 5%.
Deci, un esantion reprezentativ ar fi acela care la un nivel de semnificatie =0.05
(ceea ce ar corespunde unui nivel al testului de semnificatie t = 1.96) i-ar reveni o eroare
maxima admisa = 0.05. Daca acestor 2 indicatori le atribuim valori constante care ar
asigura reprezentativitatea, atunci se poate de aflat o valoare limita reprezentativa a erorii
standard.
2.2.1 Deductia formulei lui Cochran
Dupa cum am mentionat mai sus = .

Pentru variabile cantitative (valori medii)


eroarea standard ( ) are urmatoarea
formula:
=

Pentru variabile calitative (indicatori relativi)


eroarea standard ( ) are urmatoarea
formula:
=

(1)

unde p incidenta fenomenului in totalitatea


statistica; n volumul esationului

unde - devierea standard, n volumul


esationului.
9

Substituind in formula de mai sus obtinem:


2

= =

= = (

1
)

Sa presupunem ca stim distribuitia valorilor in populatia statistica in functie de


factorul studiat, adica valorile (pentru variabilele cantitative) si a lui p (pentru variabilele
calitative) sunt cunoscute. Asa cum celorlalti indicatori le-am atribuit valori constante care sa
asigure reprezentativitatea, in baza formulelor obtinute mai sus putem afla valoarea minima a
volumului esantionului reprezentativ n. Pentru aceasta efectuam transformarile ce urmeaza.
Ridicand ambele parti la patrat obtinem:
2
2

. =

= 2

2 (1 )
2

Extragem n:
=

2 2
2

Am obtinut formula lui Cochran.


Exemplu
La testarea unui vaccin reactiile imunobiologice pozitive s-au manifestat in 20% din
cazuri. Aflati volumul reprezentativ al esantionului pentru studierea acestui fenomen.
Rezolvare. Folosind formula lui Cochran aflam volumul reprezentativ al esantionului in
functie de incidenta fenomenului, = 0.2, pentru criteriile minime de reprezentativitate,
= 1.96 , = 0.05:
=

2 (1)
2

1.962 0.20.8
0.05 2

= 245.86 246 unitati

Se observa clar ca valoarea conform formulei lui Cochran nu depinde de volumul


totalitatii statistice (N), ci numai de particularitatile ei ( valoarea p probabilitatea aparitiei
fenomenului). Astfel, in practica aceasta formula este utila atunci cind volumul totalitatii
statistice nu este cunoscut de catre cercetatori, si pentru calcularea volumului esantionului
reprezentativ este necesar doar cunoasterea incidentei fenomenului (cum se va demonstra in
continuare, acest criteriu tot poate fi exclus), nivelului admis de semnificatie (caruia ii
corespunde un coeficient al testului de semnificatie specific) si eroarea maxim admisa
[6, 7].
2.2.2 Deductia formulei lui P. Muresan
Formula recomandata de P. Muresan se bazeaza pe legea cifrelor mari a lui
P. Cebisev, conform careia pentru un numar suficient de cazuri examinate intr-o totalitate
partial, rezultatul obtinut se apropie cu o exactitate suficienta de rezultatele care s-ar fi
observat la examinarea totalitatii statistice. [14]

10

Eroarea standard in formula lui Cochran este caracteristica esantionului si


independenta de volumul totalitatii statistice din care acesta a fost extras. Pentru a obtine o
eroare standard care ia in consideratie si volumul totalitatii statistice se aplica factorul de
corectie pentru populatii finite (FPC finite population correction) [2].
=

, unde N volumul totalitatii statistice, n - volumul esantionului.

Astfel, eroarea standard ia forma [16]:


=

(1 )

Prin transformari asemanatoare celor de mai sus calculam volumul esantionului


reprezentativ considerind si volumul totalitatii statistice:
(1 )

= =
Ridicand la patrat obtinem:
2 = 2

(1 )

Prin urmatoarele transformari ajungem la volumul esantionului reprezentativ:


2 = 2 (1 )

2 1 = 2 (1 )
1

2 1 = 2 1 2 1

2 1 + 2 1 = 2 1
2 1 2 1
=

= 2 1

2 1
2 1 2 1

Luind in consideratie ca N de obicei are valori suficient de mari se poate de neglijat


procedeul de scadere de la numitor si formula ia urmatoare forma:
2 1
= 2
2 1
Astfel am obtinut formula lui Muresan.
Exemplu
Incidenta unei boli intr-un oras cu 20 000 locuitori este de 10%. Care este esantionul
minim reprezentativ pentru realizarea unui studiu in acest caz?

11

Rezolvare. Asa cum este dat volumul totalitatii statistice ( = 20 000 ) si incidenta
fenomenului ( 10%, adica = 0.1 ) pentru aflarea volumului esantionului folosim formula
lui Muresan:
1.962 0.10.920 000

= 20 0000.05 2 +1.960.10.9 = 137,34 137 de unitati.

Mai jos vom demonstra ca formula lui Muresan poate fi considerata o continuare a
formulei lui Cochran. Daca corectam formula lui Cochran in functie de volumul totalitatii
statistice obtinem formula lui Muresan [15]:

=
=
+

2 (1)
2
2 (1)
2

2 2 1
2 1
= 2
= 2
2
2
1 + 2
+ [ 1 + ]

unde n volumul recalculat al esantionului in functie de totalitatea statistica;


n volumul esantionului conform formulei lui Cochran; N- totalitatea statistica.
Se observa ca formula lui Taro-Yamane reprezinta un caz particular al formulei
recomandata de P. Muresan, in care 2 1 = 1, adica t=1.96 , p= 0.5 si q= 0.5 , de
unde 1.962 0.5 0.5 1
1

= 1+2 =

1+2

Desigur ca aplicarea formulelor lui Taro-Yamane si a lui Muresan este mai


avantajoasa, dar e posibila doar in cazul cunoasterii volumului totalitatii statistice. Avantajul
consta in faptul ca obtinem un volum al esantionului reprezentativ mai restrins, eliminind
necesitatea studierii unor cazuri suplimentare, ce duce la economii de timp si de buget, atit de
valoroase pentru clinicianul cercetator.

CAPITOLUL III
CONFIRMAREA MATEMATICA A VERIDICITATII VALORII DE 384
UNITATI STATISTICE A VOLUMULUI ESANTIONULUI
REPREZENTATIV
In cele ce urmeaza vom demonstra ca exista o valoare a esantionului care este
reprezentativa pentru toate conditiile si orice situatie.
Trebuie sa mentionam ca cu cit volumul esantionului este mai mare cu atit precizia
datelor obtinute este mai mare. Noi, insa, cautam acea valoare minima a esantionului care
satisface conditiile de precizie, adica criteriile de reprezentativitate propuse : 0.05 ,
0.05.

12

Chiar si la cerinte egale ( si constante), orice volum al esantionului poate fi


reprezentativ , fie el 10 unitati, 50 , 100 sau 500. Totul depinde de caracteristicele totalitatii
statistice: volumul acesteia si frecventa fenomenului cercetat.
Astfel, pentru a demonstra ca volumul minim al esantionului reprezentativ este de fapt
o valoare constanta trebuie sa demonstram independenta sa de cele 2 variabile determinante :
volumul totalitatii statistice (N) si incidenta fenomenului cercetat (p).
3.1 Criterii de independenta fata de incidenta fenomenului cercetat

Fig.3. Graficul dependentei valorii ( ) de


In figura 3 este reprezentat graficul functiei = (1 ) pentru 0; 1 . Se
observa ca graficul functiei are o forma convexa, deci are un punct de maxim.
Pentru a calcula aceasta valoare se presupune functia = 1 . Valoarea
critica locala a se va obtine in cazul cind = 0.
= 2 + = 2 + 1 = 0 =

1
= 0.5 = 0.5 =
2

= 0.5 0.5 = 0.25.


Adica, (1 ) va fi maxim pentru o incidenta a fenomenului de 50% si va avea o
valoare de 0.25.
Pentru confirmarea valorii obtinute substituim valorile numerice in formula lui
Cochran si obtinem:
2 (1 ) 1.962 0.5 0.5
=
=
= 384.
2
0.052
ceea ce confirma volumul minim al esantionului reprezentativ de 384 unitati statistice.[12]
Prin doua exemple vom demonstra ca daca incidenta fenomenului difera de 50%
atunci volumul esantionului va fi mai mic de 384 unitati.
Exemplul 1
La testarea unui medicament nou s-a observat efectele vizate ale acestuia sau
manifestat in 20% din cazuri. Aflati volumul reprezentativ al esantionului pentru studierea
acestui fenomen. Confirmati sau infirmati reprezentativitatea valorii de 384 unitati.
Rezolvare. Folosind formula lui Cochran aflam volumul reprezentativ al esantionului in
functie de incidenta fenomenului pentru criteriile minime de reprezentativitate:

13

1.962 0.20.8
0.05 2

= 245.86 246 de unitati

Numarul 246 < 384, ceea ce confirma ca un esantion format din 384 de unitati nu doar este
reprezentativ, ci va oferi si date mult mai precise.
Exemplul 2
La testarea unui medicament nou s-a observat efectele vizate ale acestuia sau
manifestat in 60% din cazuri. Aflati volumul reprezentativ al esantionului pentru studierea
acestui fenomen. Confirmati sau infirmati reprezentativitatea valorii de 384 unitati.
Rezolvare. Folosind formula lui Cochran aflam volumul reprezentativ al esantionului in
functie de incidenta fenomenului pentru criteriile minime de reprezentativitate:
=

1.962 0.60.4
0.05 2

= 368.79 369 de unitati

Numarul 369 < 384, ceea demonstreaza si in acest caz ca un esantion format din 384 de
unitati este deasemenea reprezentativ.

In baza acestor exemple se poate de asemenea de observat ca, cu cit incidenta


fenomenului se afla mai departe de valoarea de 50%, cu atit volumul esantionului
reprezentativ va fi mai mic si cu cit incidenta fenomenului cercetat se afla mai aproape de
valoarea de 50% cu atit volumul esantionului reprezentativ se apropie de 384 de unitati (in
corespundere cu graficul din fig. 3).
Valoarea de 384 de unitati este reprezentativa pentru orice incidenta a fenomenului,
pentru criteriile minime de reprezentativitate ( 0.05 , 0.05).
Aceasta afirmatie implica si situatia cind nu cunoastem care e incidenta fenomenului
in totalitatea statistica. Asa cum valoarea de 384 de unitati este reprezentativa independent de
incidenta fenomenului, putem cu incredere sa folosim un asemenea volum de esantion intr-un
studiu stiintific, fara cunoasterea in prealabil a incidentei fenomenului.
3.2 Criterii de independenta fata de volumul totalitatii statistice
Folosind metode matematice putem demonstra ca, pentru totalitati statistice destul de
mari, formula recomandata de P. Muresan si Taro-Yamane ia aceleasi valori ca si formula lui
Cochran, adica devine independenta de volumul totalitatii statistice:
2 1

Formula = 2

1 + 2

reprezinta de fapt o functie .

Pentru valori mari ale lui N obtinem :


lim = lim

2 1

2 1 + 2

2 (1)
2

Demonstram in continuare aceasta independenta prin calcularea volumului esantionului


reprezentativ cu cifre concrete (tab. 1, fig 4).

14

Tab.1.Volumele calculate ale esantionului reprezentativ


Totalitatea
statistica (N)
1 000
5 000
10 000
50 000
100 000
500 000

Volumul
esantionului dupa
formula Muresan
277.54 278
356.75 357
369.95 370
382.23 382
383.69 384
383.89 384

Volumul
esantionului dupa
formula Cochran
384.16 384
384.16 384
384.16 384
384.16 384
384.16 384
384.16 384

In tabelul de mai sus am calculat volumele esantioanelor de studii in dependenta de


volumele totalitatilor statistice pentru 0.05 , 0.05, = 0.5. Se observa diferite valori
ale volumului esantionului reprezentativ calculate prin formula P.Muresan.La o valoare a
totalitatii statistice de 100 000 unitati statistice si mai mult volumul esantionului capata
aceleasi valori ca si volumul calculat prin formula Cochran, si anume de 384 unitati statistice.

Fig.4. Tendinta limita a volumului esantionului reprezentativ


Formula recomandata de P.Muresan este reprezentata in schema cu o linie intrerupta
de culoare albastra. Formula Cochran reprezentatat de o linie continua de culoare rosie. Se
observa tendinta limita a ambelor linii spre valoarea 384.
Pentru totalitatile statistice mai mici de 100 000 de unitati volumele esantioanelor sunt
mai mici de 384. Pentru totalitati statistice mai mari de 100 000 observam volumul
esantionului nu depaseste nicidecum aceasta valoare. Astfel, pentru conditiile limita de
reprezentativitate propuse ( 0.05 , 0.05, = 0.5) un volum de 384 de unitati este
reprezentativ indiferent de marimea totalitatii statistice.
Sa analizam reprezentativitatea valorii de 384 de unitati pe urmatoarele exemple:
Exemplul 1
Incidenta unei boli intr-un oras cu 10 000 locuitori este de 10% ( = 0.1 ). Care este
esantionul minim reprezentativ pentru realizarea unui studiu in acest caz? Este volumul
esantionului de 384 de cazuri reprezentativ in acest caz?
15

Rezolvare. Asa cum este dat volumul totalitatii statistice pentru aflarea volumului
esantionului este mai rezonabil sa folosim formula lui Muresan:
1.962 0.10.910000

= 10000 0.05 2 +1.960.10.9 = 63,28 63 de unitati.


Numarul 63<384, ceea ce inseamna ca un esantion de 384 unitati cu atit mai mult este
reprezentativ in acest caz.
Exemplul 2
Intr-o localitate cu o populatie de 200 000 se realizeaza un studiu asupra unei boli a
carei incidente nu se cunoaste. Care este esantionul minim reprezentativ pentru realizarea
unui studiu in acest caz? Este volumul esantionului de 384 de cazuri reprezentativ in acest
caz?
Rezolvare. Asa cum este dat volumul totalitatii statistice, dar nu se cunoaste incidenta bolii,
se foloseste formula lui Muresan cu valoarea = 0.5:
1.962 0.50.5200000

= 200000 0.05 2 +1.960.50.5 = 383.78 384 de unitati


Numarul 384=384, ceea ce inseamna ca un esantion de 384 de unitati este reprezentativ si in
acest caz.

16

Concluzii
1. Prin testarea matematica, am demonstrat ca formulele de baza folosite in biostatistica
pentru calcularea volumului esantionului reprezentativ sunt veridice, rezultind una din
alta, si pot fi folosite prioritar in dependenta de particularitatile obiectului de studiu.
2. Cind cunoastem incidenta fenomenului in totalitatea statistica, dar nu cunoastem
volumul ei, e rezonabil sa folosim formula lui Cochran.
3. Cind cunoastem volumul totalitatii statistice, si acesta este mai mic de 100 000
unitati, e rezonabil sa folosim formula recomandata de P. Muresan. In cazul in care nu
se cunoate incidenta fenomenului cercetat se foloseste valoarea = 0.5.
4. Este important ca cercetatorul sa cunoasca in prealabil datele bibliografice ale
literaturii de specialitate privind incidenta fenomenului studiat prin calcularea unei
valori mai mici a volumului esantionului reprezentativ, pentru a optimiza cheltuielile
de timp si resurse intr-un studiu stiintific.
5. Asa cum cerintele internationale pentru un studiu stiintific denota un nivel de
semnificatie 0.05 si o eroare maxim admisa 0.05, in cazul in care nu se
cunoaste atat incidenta fenomenului cat si volumul totalitatii statistice incluse, in
studiu e rezonabil a folosi un volum al esantionului de 384 de unitati, care este
reprezentativ pentru oricare totalitati statistice conform rigorilor mentionate.

17

Bibliografie
1. Cochran W. G. Sampling Techniques, New York: John Wiley and Sons, 1963
2. Isserlis L. "On the value of a mean as calculated from a sample". Journal of the Royal
Statistical Society (Blackwell Publishing) 81 (1): 7581
3. Muresan P. Statistica medico-sanitara, 1959
4. Muresan P.Manual de metode matematice n analiza strii de sntate, 1989
5. Sullivan L. M. Essentials of Biostatistics in Public Health, 2011
6. Tintiuc D., Grosu Iu. Sanatate publica si management. Chisinau, 2007
7. Tintiuc D. Biostatistica si metodologia cercetarii stiintifice. Chisinau, 2011
8. Yamane T. Statistics: An Introductory Analysis. New York: Harper and Row, 1967
9. ,
, 1989
10. Me A.M., .E.. ( ) , 1974
11. A.., E ..
, 1984
12. http://www.seap.usv.ro/~valentinh/capitol%203.pdf
13. http://www.marketingsondaje.ro/04determinare_volum.php
14. http://ro.wikipedia.org/wiki/Legea_numerelor_mari
15. http://www.amstat.org/about/statisticiansinhistory/index.cfm?fuseaction=biosinfo&Bi
oID=21
16. http://courses.wcupa.edu/rbove/Berenson/10th%20ed%20CDROM%20topics/section7_3.pdf

18