Sunteți pe pagina 1din 4

Curs statistica medicala

P value reprezinta probabilitatea de aparitie a unei erori observate din intamplare. Arata semnificatia statistica a testului Testeaza ipoteza nula (null hypothesis) - H 0 H0 = nu exista nici o diferenta intre valorile observate si cele stiute (asteptate) H1 = ipoteza alternativa (exista diferenta) Diferenta Exista (respinge H0) Exista(H1) Nu exista (H0) *= decizia corecta

*1- = puterea studiului Tipul I de eroare =

Nu exista (nu respinge H0) Tipul II de eroare =

Tipul I de eroare () = respinge o ipoteza adevarata Tipul II de eroare () = accepta o ipoteza falsa Semnificatia statistica relevanta clinica P value = 0.05 semnificativ statistic P value = 0.01 inalt semnificativ P value = 0.001 foarte inalt semnificativ P value < 0.001

Statistici ce testeaza diferenta Teste parametrice (pentru valori normal distribuite = simetrice): t-Student CHI2 ANOVA Teste non-parametrice (pentru valori ce nu sunt normal distribuite = asimetrice) Mann-Whitney U - compara rangul valorilor : Concepte privind utilizarea testelor statistice implicand 2 variabile Variabila independenta Variabila dependenta Metoda Nominala Nominal(binara) Numerica Nominal (>2 valori) Nominala Numerica Numerica Numerica CHI2 t-Student test Regresie ANOVA "one-way"

Testul t-Student Test parametric ce compara mediile a 2 grupuri din aceeasi populatie [cand SD real al populatiei nu este cunoscut si SD esantionului este cunoscut (si utilizat)] Numai daca datele sunt normal distribuite ! n > 30 distributia t ~ distributia z t = (m ) / SE; SE = SD / n m media esantionului, media populatiei, t valoarea critica (scorul t) pentru distributie Distributia t are = 0, > 1 si este simetrica, n < 30 Distributia standard (SD) depinde de gradele de libertate (df = degrees of freedom) df = n-1 Paired two sample for means t-Stat > t-Critical exista diferenta semnificativa intre date

******************************************

Probabilitatea unui eveniment Pi = xi/n ; Pi [0,1] ; Pi = 1, i = 1,n xi numarul aparitiilor rezultatului (evenimentului) n numarul total de evenimente (de incercari) Ex.: moneda, zarul Regula aditionala (pentru evenimente reciproc exclusive) : P(x V y) = P(x) + P(y) Regula multiplicarii (pentru evenimente independente) : P(x ^ y) = P(x) P(y)

Probabilitatea de distributie si tipuri de distributie Distributia binomiala (trial tip Bernoulli) : P = 0.5 Pentru variabile binare (0 sau 1) Reprezinta probabilitatea a X numar de aparitii in n trialuri (incercari) independente, cand exista o constanta de probabilitate de succes la fiecare incercare (trial) P(x) = Cnx x (1- )n-x = [n! / (n-x)!x!] x(1- )n-x Distributia tip Poisson : Pentru variabile discrete (valori bine determinate = numere naturale) P(x) = (x e-) / x! e = 2.718 (numarul lui Euler) = media si varianta in distributia de tip Poisson (m = v) Varianta = SD2 Distributia de tip Gauss (in clopot) : Pentru variabile continui (orice valoare reala dintr-un interval); f : R R f(x) = (1/22)exp[-1/2(x-)2/2] = 0, = 1 f(x) = (1/2)exp[-1/2(x2)] distributie tip z (distributie normala standard, n > 30 cazuri) = 0, > 1 distributie tip t (n < 30 cazuri)

Analiza bivariat: cum alegem ntre un test parametric i unul nonparametric


Dup cum am mai spus nainte, alegerea testului adecvat se face, pe de o parte, n funcie de datele pe care vrem s le colectm (tipurile de variabile), iar pe de alta n funcie de scopul nostru. Alegerea cea mai dificil este n cazul variabilelor numerice (atunci cnd datele noastre reprezint rezultatele unor msurtori), deoarece putem alege ntre dou familii de teste, cele parametrice i cele nonparametrice. Primele se bizuie pe presupunerea c datele provin dintr-o populaie cu distribuie normal, Gaussian, iar testele cel mai des folosite sunt testul t (Student) i analiza varianei (ANOVA). Testele pentru aplicarea crora nu e nevoie de nici o presupunere asupra distribuiei sunt numite teste nonparametrice , iar acestea aranjeaz n ordine valorile variabilei i apoi face comparaii ntre grupuri (vezi capitolul trecut). Testele Wilcoxon, Mann-Whitney i Kruskall-Wallis sunt nonparametrice (se mai numesc i teste care nu depind de distribuie). Uneori, este foarte simplu s alegem ntre un test parametric i unul nonparametric.

Vom alege, clar, un test parametric atunci cnd suntem siguri c eantionul nostru se trage dintr-o populaie care urmrete o distribuie Gaussian. Vom alege, un test nonparametric, n una din urmtoarele situaii: - Variabila este ordinal, iar populaia este clar nonGaussian. Exemple: anul de studiu la facultate, scorul Apgar al nou-nscuilor, un scor analog vizual pentru durere, scale Lickert, scoruri de calitatea vieii compuse din adunarea mai multor item-uri etc. - Unele valori ale variabilei sunt nafara scalei, adic prea mari sau prea mici pentru a putea fi msurate. Chiar dac populaia este Gaussian, este imposibil s foloseti teste parametrice pentru astfel de date. n schimb, analiza lor cu teste nonparametrice este foarte simpl: acordm acestor valori nite valori arbitrare, fie foarte mici, fie foarte mari, iar cum testele nonparametrice ine cont numai de ordine, nu i de valoarea n sine, nu conteaz dac nu tim exact valorile. - Variabila este cantitativ, numeric, dar tim sigur c distribuia nu este Gaussian (exist, n acest caz, posibilitatea de a obine o distribuie Gaussian i deci a face analiza cu teste parametrice dup o transformare a valorilor logaritm, reciproc, radical etc). - Variabila cantitativ are distribuie Gaussian, dar dispersia difer mult ntre cele dou grupuri. De multe ori, ns, este dificil s-i dai seama dac distribuia valorilor unei anumite variabile este normal (Gaussian): - Dac eantionul este mare (cel puin 100), nu trebuie dect s te uii la distribuia valorilor i se vede clar dac este sau nu Gaussian, pentru a ti ce fel de test s alegi. Dac, ns, eantionul este mic, este dificil s-i dai seama dac distribuia este Gaussian sau nu prin inspecie (histogram), iar testele statistice (Kolmogorov-Smirnov) nu au destul putere pentru a face diferena. - Ne putem uita i pe date similare din alte studii. Ceea ce conteaz este distribuia valorilor populaiei, nu eantionului. Pentru a vedea dac o populaie este Gaussian, trebuie s analizm toate datele disponibile, nu numai datele din studiul la care lucrm. Cnd nu sunt siguri, unii utilizeaz un test parametric (deoarece nu sunt siguri c prezumia de normalitate a fost violat), iar alii aleg un test nonparametric (deoarece nu sunt siguri c distribuia este Gaussian). Dup prerea mea, a doua variant este mai corect. ntrebarea este n ce msur are importan ce fel de test, parametric sau nonparametric, alegem, i sunt patru posibiliti: 1. Dac eantionul este mare (cel puin 24/30 de date n fiecare grup, cifra difer ntre crile de statistic), este mai uor de spus dac eantionul provine dintr-o populaie Gaussian, dar nu are mare importan, putem folosi orice tip de test, deoarece rezultatul este acelai (rezult acelai p). ` 2. Dac eantionul este mic, distribuia nu este Gaussian i utilizm un test parametric, pul obinut nu este corect. 3. Dac eantionul este mic, distribuia este Gaussian i utilizm un test nonparametric, valorile p sunt mai mari (testele nonparametrice au putere statistic mult mai mic pe eantioane mici). Aadar, n cazul eantioanelor mari nu sunt probleme. Mai mult, dac eantionul este > 100 i nu exist valori extreme, cu influen disproporionat asupra analizei statistice, se pot utiliza teste parametrice fr grij. 4. Dilema apare atunci cnd eantionul este mic: pe de o parte, este greu de spus dac provin din populaii cu distribuie normal, i tocmai aici acest lucru este foarte important, pentru c testele nonparametrice nu sunt puternice (pe aceleai date, cu unul parametric ai obine un p mai mic dect cu unul nonparametric), iar cele parametrice nu sunt robuste. * * *

S-ar putea să vă placă și