C9 - Teste Parametrice & Comparare

Curs statistica medicala
P value reprezinta probabilitatea de aparitie a unei erori observate din intamplare. Arata semnificatia statistica a testului Testeaza ipoteza nula (null hypothesis) - H 0 H0 = nu exista nici o diferenta intre valorile observate si cele stiute (asteptate) H1 = ipoteza alternativa (exista diferenta) Diferenta Exista (respinge H0) Exista(H1) Nu exista (H0) *= decizia corecta
*1- = puterea studiului Tipul I de eroare =
Nu exista (nu respinge H0) Tipul II de eroare =
Tipul I de eroare () = respinge o ipoteza adevarata Tipul II de eroare () = accepta o ipoteza falsa Semnificatia statistica relevanta clinica P value = 0.05 semnificativ statistic P value = 0.01 inalt semnificativ P value = 0.001 foarte inalt semnificativ P value < 0.001
Statistici ce testeaza diferenta Teste parametrice (pentru valori normal distribuite = simetrice): t-Student CHI2 ANOVA Teste non-parametrice (pentru valori ce nu sunt normal distribuite = asimetrice) Mann-Whitney U - compara rangul valorilor : Concepte privind utilizarea testelor statistice implicand 2 variabile Variabila independenta Variabila dependenta Metoda Nominala Nominal(binara) Numerica Nominal (>2 valori) Nominala Numerica Numerica Numerica CHI2 t-Student test Regresie ANOVA "one-way"
Testul t-Student Test parametric ce compara mediile a 2 grupuri din aceeasi populatie [cand SD real al populatiei nu este cunoscut si SD esantionului este cunoscut (si utilizat)] Numai daca datele sunt normal distribuite ! n > 30 distributia t ~ distributia z t = (m ) / SE; SE = SD / n m media esantionului, media populatiei, t valoarea critica (scorul t) pentru distributie Distributia t are = 0, > 1 si este simetrica, n < 30 Distributia standard (SD) depinde de gradele de libertate (df = degrees of freedom) df = n-1 Paired two sample for means t-Stat > t-Critical exista diferenta semnificativa intre date
******************************************
Probabilitatea unui eveniment Pi = xi/n ; Pi [0,1] ; Pi = 1, i = 1,n xi numarul aparitiilor rezultatului (evenimentului) n numarul total de evenimente (de incercari) Ex.: moneda, zarul Regula aditionala (pentru evenimente reciproc exclusive) : P(x V y) = P(x) + P(y) Regula multiplicarii (pentru evenimente independente) : P(x ^ y) = P(x) P(y)
Probabilitatea de distributie si tipuri de distributie Distributia binomiala (trial tip Bernoulli) : P = 0.5 Pentru variabile binare (0 sau 1) Reprezinta probabilitatea a X numar de aparitii in n trialuri (incercari) independente, cand exista o constanta de probabilitate de succes la fiecare incercare (trial) P(x) = Cnx x (1- )n-x = [n! / (n-x)!x!] x(1- )n-x Distributia tip Poisson : Pentru variabile discrete (valori bine determinate = numere naturale) P(x) = (x e-) / x! e = 2.718 (numarul lui Euler) = media si varianta in distributia de tip Poisson (m = v) Varianta = SD2 Distributia de tip Gauss (in clopot) : Pentru variabile continui (orice valoare reala dintr-un interval); f : R R f(x) = (1/22)exp[-1/2(x-)2/2] = 0, = 1 f(x) = (1/2)exp[-1/2(x2)] distributie tip z (distributie normala standard, n > 30 cazuri) = 0, > 1 distributie tip t (n < 30 cazuri)
Analiza bivariat: cum alegem ntre un test parametric i unul nonparametric

Dup cum am mai spus nainte, alegerea testului adecvat se face, pe de o parte, n funcie de datele pe care vrem s le colectm (tipurile de variabile), iar pe de alta n funcie de scopul nostru. Alegerea cea mai dificil este n cazul variabilelor numerice (atunci cnd datele noastre reprezint rezultatele unor msurtori), deoarece putem alege ntre dou familii de teste, cele parametrice i cele nonparametrice. Primele se bizuie pe presupunerea c datele provin dintr-o populaie cu distribuie normal, Gaussian, iar testele cel mai des folosite sunt testul t (Student) i analiza varianei (ANOVA). Testele pentru aplicarea crora nu e nevoie de nici o presupunere asupra distribuiei sunt numite teste nonparametrice , iar acestea aranjeaz n ordine valorile variabilei i apoi face comparaii ntre grupuri (vezi capitolul trecut). Testele Wilcoxon, Mann-Whitney i Kruskall-Wallis sunt nonparametrice (se mai numesc i teste care nu depind de distribuie). Uneori, este foarte simplu s alegem ntre un test parametric i unul nonparametric.
Vom alege, clar, un test parametric atunci cnd suntem siguri c eantionul nostru se trage dintr-o populaie care urmrete o distribuie Gaussian. Vom alege, un test nonparametric, n una din urmtoarele situaii: - Variabila este ordinal, iar populaia este clar nonGaussian. Exemple: anul de studiu la facultate, scorul Apgar al nou-nscuilor, un scor analog vizual pentru durere, scale Lickert, scoruri de calitatea vieii compuse din adunarea mai multor item-uri etc. - Unele valori ale variabilei sunt nafara scalei, adic prea mari sau prea mici pentru a putea fi msurate. Chiar dac populaia este Gaussian, este imposibil s foloseti teste parametrice pentru astfel de date. n schimb, analiza lor cu teste nonparametrice este foarte simpl: acordm acestor valori nite valori arbitrare, fie foarte mici, fie foarte mari, iar cum testele nonparametrice ine cont numai de ordine, nu i de valoarea n sine, nu conteaz dac nu tim exact valorile. - Variabila este cantitativ, numeric, dar tim sigur c distribuia nu este Gaussian (exist, n acest caz, posibilitatea de a obine o distribuie Gaussian i deci a face analiza cu teste parametrice dup o transformare a valorilor logaritm, reciproc, radical etc). - Variabila cantitativ are distribuie Gaussian, dar dispersia difer mult ntre cele dou grupuri. De multe ori, ns, este dificil s-i dai seama dac distribuia valorilor unei anumite variabile este normal (Gaussian): - Dac eantionul este mare (cel puin 100), nu trebuie dect s te uii la distribuia valorilor i se vede clar dac este sau nu Gaussian, pentru a ti ce fel de test s alegi. Dac, ns, eantionul este mic, este dificil s-i dai seama dac distribuia este Gaussian sau nu prin inspecie (histogram), iar testele statistice (Kolmogorov-Smirnov) nu au destul putere pentru a face diferena. - Ne putem uita i pe date similare din alte studii. Ceea ce conteaz este distribuia valorilor populaiei, nu eantionului. Pentru a vedea dac o populaie este Gaussian, trebuie s analizm toate datele disponibile, nu numai datele din studiul la care lucrm. Cnd nu sunt siguri, unii utilizeaz un test parametric (deoarece nu sunt siguri c prezumia de normalitate a fost violat), iar alii aleg un test nonparametric (deoarece nu sunt siguri c distribuia este Gaussian). Dup prerea mea, a doua variant este mai corect. ntrebarea este n ce msur are importan ce fel de test, parametric sau nonparametric, alegem, i sunt patru posibiliti: 1. Dac eantionul este mare (cel puin 24/30 de date n fiecare grup, cifra difer ntre crile de statistic), este mai uor de spus dac eantionul provine dintr-o populaie Gaussian, dar nu are mare importan, putem folosi orice tip de test, deoarece rezultatul este acelai (rezult acelai p). ` 2. Dac eantionul este mic, distribuia nu este Gaussian i utilizm un test parametric, pul obinut nu este corect. 3. Dac eantionul este mic, distribuia este Gaussian i utilizm un test nonparametric, valorile p sunt mai mari (testele nonparametrice au putere statistic mult mai mic pe eantioane mici). Aadar, n cazul eantioanelor mari nu sunt probleme. Mai mult, dac eantionul este > 100 i nu exist valori extreme, cu influen disproporionat asupra analizei statistice, se pot utiliza teste parametrice fr grij. 4. Dilema apare atunci cnd eantionul este mic: pe de o parte, este greu de spus dac provin din populaii cu distribuie normal, i tocmai aici acest lucru este foarte important, pentru c testele nonparametrice nu sunt puternice (pe aceleai date, cu unul parametric ai obine un p mai mic dect cu unul nonparametric), iar cele parametrice nu sunt robuste. * * *

C9 - Teste Parametrice & Comparare

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

C9 - Teste Parametrice & Comparare

Încărcat de

Drepturi de autor:

Formate disponibile

Curs statistica medicala

*1- = puterea studiului Tipul I de eroare =

Nu exista (nu respinge H0) Tipul II de eroare =

Analiza bivariat: cum alegem ntre un test parametric i unul nonparametric

S-ar putea să vă placă și