Sunteți pe pagina 1din 2

Analiza bivariat: cum alegem ntre un test parametric i unul

nonparametric
Alegerea testului adecvat se face:
- funcie de datele pe care vrem s le colectm (tipurile de variabile)
- funcie de scopul nostru.
Alegerea cea mai dificil este n cazul variabilelor numerice (atunci cnd datele reprezint
rezultatele unor msurtori), putand alege ntre dou familii de teste:
- parametrice - se bazeaza pe presupunerea c datele provin dintr-o populaie
cu distribuie normal, Gaussian, iar testele cel mai des folosite sunt testul t
(Student) i analiza varianei (ANOVA).
- nonparametrice sunt testele pentru aplicarea crora nu e nevoie de nici o
presupunere asupra distribuiei sunt numite teste nonparametrice, iar acestea
aranjeaz n ordine valorile variabilei i apoi face comparaii ntre grupuri
(vezi capitolul trecut).
Testele Wilcoxon, Mann-Whitney i Kruskall-Wallis sunt nonparametrice (se mai numesc
i teste care nu depind de distribuie).
Uneori, este foarte simplu s alegem ntre un test parametric i unul nonparametric.
Vom alege un test parametric atunci cnd suntem siguri c eantionul nostru se trage dintro populaie care urmrete o distribuie Gaussian.
Vom alege, dimpotriv, un test nonparametric, n una din urmtoarele situaii:
a) Variabila este ordinal, iar populaia este clar nonGaussian. Exemple: anul de
studiu la facultate, scorul Apgar al nou-nscuilor, un scor analog vizual pentru durere, scale
Lickert, scoruri de calitatea vieii compuse din adunarea mai multor item-uri etc.
b) Unele valori ale variabilei sunt nafara scalei, adic prea mari sau prea mici
pentru a putea fi msurate. Chiar dac populaia este Gaussian, este imposibil s foloseti teste
parametrice pentru astfel de date. n schimb, analiza lor cu teste nonparametrice este foarte
simpl: acordm acestor valori nite valori arbitrare, fie foarte mici, fie foarte mari, iar cum testele
nonparametrice ine cont numai de ordine, nu i de valoarea n sine, nu conteaz dac nu tim
exact valorile.
c) Variabila este cantitativ, numeric, dar tim sigur c distribuia nu este
Gaussian (exist, n acest caz, posibilitatea de a obine o distribuie Gaussian i deci a face
analiza cu teste parametrice dup o transformare a valorilor logaritm, reciproc, radical etc).
d) Variabila cantitativ are distribuie Gaussian, dar dispersia difer mult ntre
cele dou grupuri.
De multe ori, ns, este dificil s-i dai seama dac distribuia valorilor unei anumite
variabile este normal (Gaussian):
- dac eantionul este mare (cel puin 100), uitandu-ne la distribuia valorilor, se
vede dac este sau nu Gaussian, pentru a ti ce fel de test s alegi.
- dac, ns, eantionul este mic, este dificil de apreciat dac distribuia este
Gaussian sau nu prin inspecie (histogram) iar testele statistice (Kolmogorov-Smirnov) nu au
destul putere pentru a face diferena.
- ne putem uita i pe date similare din alte studii. Ceea ce conteaz este distribuia
valorilor populaiei, nu eantionului. Pentru a vedea dac o populaie este Gaussian, trebuie s
analizm toate datele disponibile, nu numai datele din studiul la care lucrm.

Cnd nu sunt siguri, unii utilizeaz un test parametric (deoarece nu sunt siguri c
prezumia de normalitate a fost violat), iar alii aleg un test nonparametric (deoarece nu sunt
siguri c distribuia este Gaussian). Cred ca a doua variant este mai corect.
ntrebarea este n ce msur are importan ce fel de test, parametric sau nonparametric,
alegem, i sunt patru posibiliti:
- dac eantionul este mare (cel puin 24/30 de date n fiecare grup, cifra difer ntre crile
de statistic), este mai uor de spus dac eantionul provine dintr-o populaie Gaussian dar nu are
mare importan, putem folosi orice tip de test, deoarece rezultatul este acelai (rezult acelai p).
- dac eantionul este mic, distribuia nu este Gaussian i utilizm un test parametric, p-ul
obinut nu este corect.
- dac eantionul este mic, distribuia este Gaussian i utilizm un test nonparametric,
valorile p sunt mai mari (testele nonparametrice au putere statistic mult mai mic pe eantioane
mici).
Aadar, n cazul eantioanelor mari nu sunt probleme. Mai mult, dac eantionul este >
100 i nu exist valori extreme, cu influen disproporionat asupra analizei statistice, se pot
utiliza teste parametrice fr grij.
Dilema apare atunci cnd eantionul este mic: pe de o parte, este greu de spus dac provin
din populaii cu distribuie normal, i tocmai aici acest lucru este foarte important, pentru c
testele nonparametrice nu sunt puternice (pe aceleai date, cu unul parametric ai obine un p mai
mic dect cu unul nonparametric), iar cele parametrice nu sunt robuste.

S-ar putea să vă placă și