Sunteți pe pagina 1din 6

Recomandri cu privire la dimensionarea eantioanelor n cercetrile psihologice Conf. dr. M.

Popa

Una dintre cele mai frecvente ntrebri pe care (i) le pun studenii sau tinerii aflai n faza de proiectare a unei lucrri de cercetare este ct de mare trebuie s fie eantionul?. Din pacate, nu exist un rspuns simplu i nici foarte precis la aceast ntrebare. Mrimea eantionului decurge, nainte de toate, din constrngerile situaiei de cercetare. Atunci cnd tema cercetrii vizeaz situaii rare (de exemplu, studii pe gemeni univitelini; modificri neuropsihice la pacieni cu leziuni cerebrale cu o anumit localizare; subieci care practic profesii speciale etc.) volumul eantionului este n mod inevitabil mic, ceea ce nu nseamn c trebuie s renunm la cercetare. Excluznd situaiile n care suntem constrni de raritatea subiecilor care ntrunesc condiiile de studiu, dimensionarea eantionului se face pe baza a dou criterii fundamentale: tipul testului statistic ce urmeaz a fi utilizat i obiectivele analizei statistice.

1. Volumul eantionului recomandat n diferite procedurilor statistice Recomandrile de mai jos au un caracter practic, dar se bazeaz pe dou concepte fundamentale ale statisticii infereniale: mrimea efectului (mrimea diferenei sau intensitatea asocierii dintre variabile) i puterea testului (probabilitatea de a obine un rezultat statistic semnificativ). Tendina actual n cercetarea tiinific este de a se depi optica simplist a deciziei statistice prin limitarea la pragul alfa1. Reputatul statistician i psihometrician Jacob Cohen, ntr-un articol intitulat Things I Have Learnd (So Far) (1990) i aduce aminte cum a nvat, n facultate, c pentru a compara dou grupuri trebuie utilizate eantioane de 30 de subieci, orice eantion mai mic de 30 fiind considerat eantion mic. Mai trziu, cnd a descoperit analiza de putere, a constatat c atunci cnd se compar dou grupuri de cte 30 de subieci fiecare, pentru un prag alfa=0.05, probabilitatea ca o diferen avnd o mrime medie a efectului s ating pragul de semnificaie, este de 0.47! Cu alte cuvinte, din 100 de cercetri, abia n 47 de situaii (mai puin dect dac decizia ar fi luat aleator) s-ar obine un rezultat care s nu fie doar semnificativ, dar s i aib o mrime a efectului (relevan) cel puin medie. Iar dac volumul eantionului este de numai 20 de subieci, atunci probabilitatea respectiv se reduce la 0.33! n mod evident, numrul subiecilor are un impact direct asupra puterii testului, adic asupra capacitii acestuia de a detecta diferene reale. Mrimea efectului, la rndul ei, se refer la intensitatea asocierii (diferenei) dintre variabilele cercetrii (Kraemer & Thiemann, 1987). Ceea ce rezult de aici este faptul c alegerea mrimii eantionului, n contextul diferitelor modele de cercetare, este un fapt care trebuie tratat cu mult atenie, dac dorim s asigurm cercetrilor noastre consisten sub aspectul puterii i al mrimii efectului. Desigur, ar fi de preferat ca aceste dou aspecte s fac obiectul unor evaluri cantitative speciale dar, din pcate, majoritatea pachetelor de programe statistice nu ofer astfel de proceduri. n practic, o modalitate mulumitoare de rezolvare a acestei probleme este dimensionarea corespunztoare a eantioanelor, cu copul de a asigura atingerea unor valori acceptabile pentru puterea testelor statistice. n acest sens, o incursiune n literatura statistic (Wolins, 1982; Kraemer & Thiemann; 1987; Wilkinson, 1999) ne ofer o serie de recomandri utile.

Pentru aprofundarea acestor aspecte teoretice se poate consulta cursul de la adresa: http://popamarian.googlepages.com/sp_06_erori_putere_efect_2006.pdf

a. Volumul celulelor (grupurilor) pentru testele utilizate n detectarea diferenelor dintre medii Toate testele statistice care detecteaz diferenele dintre grupuri se bazeaz pe o anume distribuie de eantionare. Ca urmare, numrul subiecilor din fiecare eantion are o legtur direct cu mprtierea distribuiei de eantionare (eroarea standard). Cu ct mai muli subieci n eantion, cu att mprtierea distribuiei de eantionare este mai mic i ansa de a descoperi o diferen semnificativ este mai mare (ceea ce nseamn i o putere a testului mai mare). Dar puterea nu este legat numai de mrimea eantionului, ci i de mrimea efectului. Pe msur ce mrimea efectului crete, crete i puterea testului. De exemplu, dac dorim s testm efectul unei psihoterapii dup dou edine, cnd efectul este mic, testul statistic va avea putere mic, adic va avea anse mai reduse s releve un efect semnificativ dect, s zicem, dup 12 edine, cnd efectul terapeutic va fi mai pronunat. Testul t pentru eantioane independente, pentru eantioane dependente, analiza de varian (ANOVA one-way sau factorial), la fel ca i analiza de varian multivariat (MANOVA), sunt concepute pentru testa semnificaia diferenelor dintre mediile unor grupuri. Pentru a menine un nivel acceptabil pentru puterea testului, fiecare dintre grupurile comparate trebuie s aib un volum minimal, pentru a avea suficient putere n detectarea diferenelor i, n acelai timp, o nivel mediuridicat al mrimii efectului (VanVoorhis & Morgan, 2001). n acest scop, se consider c 30 de subieci n fiecare celul (definit prin categoriile variabilei independente) sunt suficieni pentru a garanta o putere de 0.8, ceea ce este un nivel minim pentru un studiu obinuit (J. Cohen, 1988). Concret, pentru a avea o putere acceptabil a testului: - Atunci cnd sunt comparate mediile a dou grupuri independente, se vor utiliza cel puin 60 de subieci (minim 30 pentru fiecare grup). Se observ c n cazul unei cercetri bazate pe un model intra-subiect, n care acelai grup este msurat n dou (sau mai multe) situaii diferite, este suficient un eantion de minim 30 de subieci pentru asigurarea unei puteri acceptabile. Acesta este unul dintre avantajele modelului intra-subiect. - Atunci cnd este utilizat testul ANOVA pentru o variabil independent cu trei valori, eantionul cercetrii trebuie s fie compus din cel puin 3x30=90 de subieci. Dac numrul de subieci din fiecare grup se reduce la 7, iar numrul grupurilor este de cel puin trei, atunci puterea testului scade la 0.5, iar mrimea efectului este tot de 0.5. n cazul n care avem 14 subieci n fiecare grup comparat, pentru cel puin trei grupuri i o mrime a efectului de 0.5, ne putem baza pe o putere a testului de 0.8. n legtur cu testele de comparaie a mediilor se atrage atenia, n primul rnd, c atunci cnd sunt comparate mai puine grupuri este mai important s existe mai muli subieci n fiecare grup. n al doilea rnd, cu ct mrimea efectului la care ne putem atepta este mai mic, cu att numrul subiecilor trebuie s creasc, pentru garantarea unei valori corespunztoare a puterii testului (Aron & Aron, 1999). n fine, n cazul analizei de varian multivariate (MANOVA) este important s existe mai multe cazuri dect variabile independente n fiecare celul definit de valorile variabilei independente (Tabachnick & Fidell, 1996).

b. Mrimea eantionului atunci cnd se studiaz asocierea variabilelor Dei calcularea mrimii eantionului n astfel de situaii face obiectul unor formule complexe, regula empiric general este de a nu utiliza eantioane mai mici de 50 de subieci n cazul analizei de corelaie sau de regresie simpl. n cazul corelaiei i regresiei multiple, n care sunt mai multe variabile independente (criteriu), Green (1991) sugereaz ca volumul eantionului cercetrii s fie >50+8m, unde m este numrul variabilelor independente, pentru corelaii multiple i > 104+m, pentru regresia multipl. Concret, pentru o analiz de corelaie multipl cu patru variabile se vor utiliza 50+8x4=82 subieci, iar pentru o regresie cu 4 variabile criteriu, se va asigura un eantion de minim 104+4=108 subieci. Atunci cnd se urmrete att testarea corelaiei ct i a regresiei se recomand eantioane mai mari dect acestea.

n acelai context sunt recomandate i alte reguli empirice, astfel: - Pentru 5 sau mai muli predictori (sau variabile multiplu corelate) numrul participanilor va depi numrul predictorilor cu cel puin 50. Altfel spus, totalul participanilor trebuie s fie mai mare numrul predictorilor cu cel puin 50 (Harris, 1985); - Pentru ecuaiile de regresie cu ase sau mai muli predictori se impune un minim de 10 participani pentru fiecare predictor dar, dac situaia o permite, i mai bine este ca s existe n jur de 30 de subieci pentru fiecare variabil. Cohen i Cohen (1975) demonstreaz c n cazul unei regresii cu un singur predictor care are o corelaie cu variabila predictor de 0.30, sunt necesari 124 subieci pentru a menine o putere de 0.80. Cu cinci predictori i o corelaie multipl de 0.30, aceeai putere este atins pe un eantion de 187 subieci. O atenie special se va acorda simetriei variabilei dependente, deoarece n cazul existenei unei asimetrii, mrimea ateptat a efectului este mic i, implicit, puterea testului este mai mic i ea (Tabachnick & Fidell, 1996). c. Volumul eantionului pentru testul chi-ptrat O regul de siguran este ca n nici una din celulele tabelului de coresponden frecvena teoretic s nu fie mai mic de 5, iar volumul total al eantionului s nu fie mai mic de 20. n cazul testului chi-ptrat, spre deosebire de alte teste statistice, creterea numrului subiecilor nu are un impact asupra valorii critice de respingere a ipotezei de nul. Totui, volumul eantionului are un efect asupra puterii testului. Existena unor frecvene teoretice (ateptate) ntr-una sau mai multe celule ale tabelului de coresponden limiteaz considerabil puterea testului. De asemenea, valori reduse ale frecvenelor ateptate cresc nivelul erorii de tip I. Acesta este i motivul pentru care se recomand un eantion de cel puin 20 de subieci (Howell, 1997). Testul chi-ptrat este utilizat pentru testarea gradului de independen (asociere) dintre variabile categoriale. Ca urmare, nici un subiect nu trebuie s contribuie cu mai mult de o singur valoare. La rndul lor, gradele de libertate au un anumit impact asupra puterii testului. Cu ct numrul celulelor tabelului de coresponden crete (ceea ce conduce la creterea gradelor de libertate), se reduc frecvenele teoretice din celulele tabelului de coresponden i, implicit, are loc o reducere a puterii (Cohen, 1988). i totui, atunci cnd se ateapt o mrime important a efectului, se consider c poate fi tolerat i o valoare mai mic pentru puterea testului, implicit un volum mai redus al eantionului (minim 8).

2. Volumul eantionului n funcie de obiectivele analizei statistice Redm mai jos recomandrile European Federation of Psychological Associations (EFPA, 2006) cu privire la volumul eantioanelor utilizate n evaluarea testelor psihologice ca instrumente profesionale. Aceste recomandri vizeaz armonizarea practicilor de liceniere a testelor psihologice i asigurarea unui standard profesional ct mai ridicat pentru activitatea de evaluare psihologic. Unele dintre situaiile descrise mai jos se regsesc i n situaii de cercetare, atunci cnd sunt utilizate instrumente nou create2.

Recomandri de acelai gen pot fi gsite i n Sistemul de evaluare a metodelor psihologice standardizate adaptat de Comisia Metodologic a Colegiului Psihologilor din Romnia dup modelul olandez (Arne Evers), accesat pe 15.03.2007, la adresa: http://www.copsi.ro/COLEGIU/COMISII/metodologie/DOCUMENTE/Anexa_3_.doc Am preferat recomandrile EFPA deoarece ele sunt asumate de toate rile europene afiliate la EFPA (Romnia urmnd s fie afiliat n perioada urmtoare).

a. Dimensiunile eantionului pentru calcularea etaloanelor psihologice: Not:

Limitele vor fi adaptate n funcie de tipul etalonului. Dac se refer la populaia general atunci volumul eantionului va trebui sa fie mare. Dac etalonul este calculat pe o populaie ocupaional specific, atunci volumul eantionului poate fi adecvat. Pentru cele mai multe scopuri, un ention mai mic de 150 de subieci este prea mic, deoarece frecvena valorilor spre limitele distribuiei va fi foarte mic. Aprecierea eantionului Inadecvat Adecvat Mare Foarte mare Volum eantion mai mic de 150 subieci 150-300 subieci 300-1000 peste 1000 subieci

b. Dimensiunea eantionului pentru studii de validitate de construct Not : Validitatea de construct include crelaii ale scalelor cu instrumente similare. Recomandrile pentru coeficienii de validitate de construct trebuiesc interpretai n mod flexibil. Atunci cnd avem dou nstrumente foarte asemntoare, trebuie s ne ateptm la corelaii de 0.6 sau mai mult, pentru ca validitatea s fie considerat adecvat. Atunci cnd instrumentele vizeaz caracteristici mai puin asemntoare, sau sunt administrate la intervale mari de timp, corelaii mai mici de 0.6 pot fi considerate adecvate. Atunci cnd corelaiile sunt mai mari de 0.90, se va lua n considerare c cele dou instrumente msor acelai construct psihologic i dou constructe diferite, ceea ce ridic problema dac ele aduc informaii diferite n raport cu obiectivul msurrii. Recomandrile pentru dimensiunea eantionului sunt bazate pe analiza de putere a eantioanelor necesare pentru a surprinde mrimi ale efectului moderate. Validitatea predictiv i concurent se refer la studii bazate pe criterii din viaa real (nu pe scoruri obinute cu alte instrumente) care sunt corelate cu scorurile la test. Studiile predictive se refer de obicei la situaii n care evaluarea a fost efectuat ntr-un moment calitativ diferit de momentul msurrii criteriului (de ex., pentru selecia de personal, durata dintre evaluarea criteriului i a predictorului nu este esenial, dac cele dou msurri reflect adecvat caracteristicile msurate). Apreciere inadecvat adecvat mai mult dect adecvat Volumul eantionului mai mic de 100 subieci 100-200 subieci peste 200 subieci

Mediana i amplitudinea corelaiilor dintre test i alte teste similare: Not:

Dac instrumental este compus dintr-o singur scal, valorile de mai jos se aplic acesteia. Daca instrumentul este compus din mai multe scale, valorile de mai jos se refer la mediana distribuiei valorilor tuturor scalelor. Dac mediana nu este posibil s fie calculat, se va lua n considerare cea mai bun estimare a tendinei centrale a valorilor. Valorile foarte mari sau foarte mici vor fi comentate n mod distinct. Limitele sunt orientative.

inadecvat: r < 0.55 adecvat : 0.55 < r < 0.65 bun : 0.65 < r < 0.75 excelent : r > 0.75

c. Dimensiunea eantionului pentru studii de validitate de criteriu (prognostic) Apreciere Inadecvat Adecvat mai mult dect adecvat Volumul eantionului mai mic de 100 subieci 100-200 subieci peste 200 subieci

Mediana i amplitudinea corelaiilor dintre test i alte teste similare: inadecvat: r < 0.2 adecvat : 0.2 < r < 0.35 bun : 0.35 < r < 0.50 excelent : r > 0.50

d. Dimensiunea eantionului pentru studii de fidelitate (consistena intern) Not:

Recomandrile se bazeaz pe necesitatea de a avea un nivel redus al erorii standard a estimrii fidelitii. Recomandrile sunt fcute n legtur cu dou contexte diferite: utilizarea instrumentelor n situaii de decizie (clasificarea subiecilor n categorii); i utilizarea pentru evaluri individuale. n cel de-al doilea caz coeficientul de fidelitate trebuie s fie mai ridicat dect n primul caz. Ali factori trebuiesc, de asemenea, luai n considerare: dac scala se utilizeaz singur sau mpreun cu alte scale (instrument compozit). n cazul scalelor compozite, accentual va fi pus pe scorul compozit i nu pe sub-scalele instrumentului. Apreciere inadecvat adecvat mai mult dect adecvat Volumul eantionului mai mic de 100 subieci 100-200 subieci peste 200 subieci

Mediana coeficienilor inadecvat: r < 0.7 adecvat : 0.7 < r < 0.79 bun : 0.80 < r < 0.89 excelent : r > 0.90 e. Dimensiunea eantionului n studii de stabilitate test-retest Apreciere inadecvat adecvat mai mult dect adecvat Volumul eantionului mai mic de 100 subieci 100-200 subieci peste 200 subieci

Mediana coeficienilor Inadecvat : r < 0.6 Adecvat : 0.6 < r < 0.69 Bun : 0.7 < r < 0.79 Excelent : r > 0.80

f.

Dimensiunea eantionului n studii de fidelitate de echivalen Apreciere inadecvat adecvat mai mult dect adecvat Volumul eantionului mai mic de 100 subieci 100-200 subieci peste 200 subieci

Mediana coeficienilor Inadecvat : r < 0.6 Adecvat : 0.6 < r < 0.69 Bun : 0.7 < r < 0.79 Excelent : r > 0.80 Concluzii Recomandrile sintetizate mai sus ofer un cadru empiric, suficient pentru orientarea n situaiile n care nu apelm la analize cantitative riguroase de dimensionarea eantioanelor. Aa cum se poate observa, nu exist o recomandare unic de fixare a dimensiunii eantionului, potrivit pentru orice situaie i orice tip de test statistic. n toate cazurile, cu ct eantionul este mai mic, cu att scade ansa de a ajunge la un rezultat statistic semnificativ, n condiiile unei mrimi rezonabile a efectului. n acelai timp, ns, nu este de dorit nici utilizarea unor eantioane extrem de mari, deoarece n acest caz, riscm s obinem un rezultat semnificativ statistic, dar total nerelevant din punct de vedere practic sau al mrimii efectului.

Referine bibliografice
Aron, A., & Aron, E. N. (1999). Statistics for psychology (2nd ed.). Upper Saddle River, NJ: Prentice Hall. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale NJ: Erlbaum. Cohen, J. (1990). Things I have learned (so far). American Psychologist, 45, 1304-1312. Cohen, J., & Cohen, P. (1975). Applied multiple regression/correlation analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum. EFPA, 2006, Review Model For The Description And Evaluation Of Psychological Tests, Test Review Form And otes For Reviewers; (www.efpa.be; accesat la 7 nov. 2006) Green, S. B. (1991). How many subjects does it take to do a regression analysis? Multivariate Behavioral Research, 26, 499-510. Howell, D. C. (1997). Statistical methods for psychology (4th ed.). Belmont, CA: Wadsworth. Harris, R. J. (1985). A primer of multivariate statistics (2nd ed.). New York: Academic Press. Kraemer, H. C., & Thiemann, S. (1987). How many subjects? Statistical power analysis in research. Newbury Park, CA: Sage. Tabachnick, B. G., & Fidell, L. S. (1996). Using multivariate statistics (3rd ed.). New York: HarperCollins.Wilkinson, L., & Task Force on Statistical Inference, APA Board of Scientific Affairs. (1999). Statistical methods in psychology journals: Guidelines and explanations. American Psychologist, 54, 594-604. VanVoorhis, C. W., & Morgan, B. L. (2001). Statistical Rules of Thumb: What We Don't Want to Forget About Sample Sizes [Electronic Version]. Psi Chi Journal 6. Retrieved 15.03.2007 from http://www.psichi.org/pubs/issue.asp?issue_id=41. Wilkinson, L., & Task Force on Statistical Inference (1999). Statistical Methods in Psychology Journals: Guidelines and Explanations. American Psychologist(54), 594-604. Wolins, L. (1982). Research mistakes in the social and behavioral sciences. Ames: Iowa State University Press

S-ar putea să vă placă și