Sunteți pe pagina 1din 41

Bioestadstica Aplicada I

NMRCD Programa GEIS UPCH FASPA ABE Per

Sexta clase:

Mtodos paramtricos y no paramtricos


Medias, varianza y correlacin

Pruebas para variables continuas

Bioestadstica Aplicada

Porqu usamos pruebas no paramtricas?:


Porque no siempre se cumplen todos los supuestos requeridos por las pruebas de hiptesis tradicionales (paramtricas): Distribucin normal Tamao de muestra grande Varianzas iguales (?) Si la distribucion de la poblacion es sesgada (Por lo que la media no es buen indicador de tendencia central)
Bioestadstica Aplicada

Cmo se aplican estas pruebas:

Aplicar una transformacin a los datos originales, convertindolos en rangos, valores positivo o negativo, etc. Con los datos transformados, calcular un estadstico en base a los datos (a veces tambin se calcula su promedio y error estndar) Con el estadstico y los parmetros calculados, realizar una prueba de hiptesis de acuerdo a una cierta distribucin paramtrica (Normal, Jicuadrado, Binomial, etc.)

Bioestadstica Aplicada

Transformaciones de datos

Si los datos tienen una distribucin sesgada, en ocasiones pueden transformarse para eliminar los sesgos
En algunos casos se puede emplear un test paramtrico despus de la transformacin

Bioestadstica Aplicada

Ejemplo:
Si trabajamos con parasitemia, con frecuencia tendremos que aplicar una transformacin

Log

Bioestadstica Aplicada

Comando gladder:

Bioestadstica Aplicada

Anlisis con variables numricas:


Anlisis
Describir un grupo

Paramtrico
, 2

No paramtrico
Mediana, rango intercuartil
Prueba Wilcoxon

Comparar un grupo T Student de una a un valor muestra

Comparar medias en 2 grupos


Comparar medias en 2 grupos apareados Comparar medias en 3 o mas grupos Correlacin entre dos variables
Bioestadstica Aplicada

T Student de dos muestras


T Student apareada ANOVA Pearson (lineal)

Mann-Whitney
Prueba Wilcoxon

Kruskal-Wallis Spearman (monotnica)

Comparacin de una muestra contra una constante

Se piensa que la edad de inicio del consumo de cigarrillos es la adolescencia

Puntualmente se plantea que el consumo se inicia a los 15 aos Si la distribucin es sesgada o la muestra es pequea, una prueba paramtrica sobre la media puede ser poco relevante

Bioestadstica Aplicada

histogram p59, fraction


.2 Fraction .05 0
0

.1

.15

20 40 qu edad tena ud. cuando fum cigarrillos por primera vez?

60

Bioestadstica Aplicada

Prueba T Student de una muestra

Bioestadstica Aplicada

Aunque no es necesario, hagamos la prueba no paramtrica:

Bioestadstica Aplicada

Prueba signrank (Wilcoxon):

Ho: Mediana de la diferencia = 0 p59 15 = 0 p59 = 0 Asume una distribucin uniforme alrededor de cero
Compara puntajes esperados con observados

Bioestadstica Aplicada

Comparacin entre dos muestras independientes

Se piensa que la edad de inicio del consumo de cigarrillos vara entre varones y mujeres
Si la distribucin es sesgada, una prueba paramtrica sobre la media puede ser poco relevante

Si los tamaos de muestra son pequeos (n < 30), el TLC no se cumplir y la prueba T podra llevar a conclusiones errneas

Bioestadstica Aplicada

Prueba T Student (paramtrica):


Ho: varones = mujeres Ha: varones mujeres

Bioestadstica Aplicada

Igualdad de varianzas:

La prueba T de Student de grupos independientes difiere si las varianzas difieren entre los grupos, debiendo agregarse la opcin unequal
Para evaluar si las varianzas son comparables o no se utiliza el comando sdtest

Bioestadstica Aplicada

Prueba de Varianzas (sdtest)


Ho: 2varones = 2mujeres Ha: 2varones 2mujeres

Bioestadstica Aplicada

T Student con varianzas diferentes:

Bioestadstica Aplicada

Prueba de Mann-Whitney:

Equivalente no paramtrico a una prueba de hiptesis de promedios para dos muestras


Determina si una variable tiene valores mas altos en una poblacin que en otra. NO COMPARA LOS PROMEDIOS!!! Util si el tamao de muestra es pequeo o la distribucin es demasiado sesgada

Bioestadstica Aplicada

Qu son los puntajes correlativos?


60 0 20 40

.5

Varones
1

1.5 inf_sexo

Mujeres
2

2.5

Bioestadstica Aplicada

Prueba de Mann-Whitney:
Ho: Fumarvarones = Fumarmujeres

Ha: Fumarvarones Fumarmujeres

Bioestadstica Aplicada

Interpretacin

Se estn comparando valores o la distribucin, no los promedios


Si en un grupo los puntajes observados son mayores a los esperados, ese grupo tiene mayores valores

Bioestadstica Aplicada

Comparacin de dos grupos apareados

Es una sola muestra, en verdad, en la que se han medido dos valores Se puede calcular la diferencia entre los valores y sera una prueba de una sola muestra Qu comienza primero, alcohol o tabaco? Prueba no paramtrica til si es muestra pequea o distribucin muy sesgada

Bioestadstica Aplicada

Prueba T Student apareada:


Ho: fumar = tomar Ha: fumar tomar

Bioestadstica Aplicada

Prueba signrank (Wilcoxon):

Bioestadstica Aplicada

Anlisis de Varianza:
Prueba paramtrica para determinar si hay diferencias en el promedio de una variable cuantitativa (inicio fumar) entre tres o ms poblaciones (estratos sociales). Supuestos:

Distribucin normal en todas las poblaciones (no es necesario si el tamao de muestra es grande)
Varianzas comparables entre poblaciones Observaciones (muestras) independientes

Bioestadstica Aplicada

Comparacin de Varianzas:

Se usa en el ANOVA para determinar si hay diferencias entre promedios de varias muestras
Tambin se usa ANOVA en el anlisis de regresin, siendo un caso particular del ANOVA Utiliza la prueba estadstica F

Bioestadstica Aplicada

Las hiptesis:

Hiptesis nula, Ho: X-inicioAlto = X-inicioMedio = X-inicioBajo Hiptesis alternativa, Ha: Existen diferencias en la edad de inicio de fumar promedios de al menos dos estratos sociales

Bioestadstica Aplicada

Bioestadstica Aplicada

Prueba de Kruskal-Wallis:

Extensin de la prueba de Mann-Whitney a mas de dos poblaciones Equivalente no paramtrico del anlisis de varianza TAMPOCO COMPARA PROMEDIOS: determina si una poblacin tiene valores diferentes (mas altos o mas bajos) que las otras poblaciones

Bioestadstica Aplicada

Los puntajes correlativos:


60 0
.5

20

40

1.5

2 estrato social

2.5

3.5

Bioestadstica Aplicada

En Stata:

Bioestadstica Aplicada

Determinando pares diferentes:

Bioestadstica Aplicada

Correlacin r de Pearson

Mide el grado de asociacin lineal entre dos variables numricas


-1 <= r <= 1, r = 0 indica independencia Se calcula en stata con el comando pwcorr Requiere muestras grandes, distribuciones cruzadas no sesgadas

Bioestadstica Aplicada

Las hiptesis:

Hiptesis nula (Ho): rfumar - tomar = 0 Hiptesis alternativa (Ha): rfumar - tomar 0

Bioestadstica Aplicada

scatter p59 p89


60 p59b 20 0
0

40

10

20

p89b

30

40

50

Bioestadstica Aplicada

Resultados:

Bioestadstica Aplicada

Correlacin de puntajes (Spearman):

Equivalente no paramtrico a la prueba de correlacin lineal de Pearson. Se aplica cuando la correlacin no es lineal, la muestra es pequea o existen valores muy extremos

Determina si dos variables cuantitativa u cualitativa-ordinal estn correlacionadas positiva (una crece y la otra tambin) o negativamente (una crece y la otra disminuye)
Al igual que las pruebas de Mann-Whitney y Kruskal-Wallis, tambin utiliza datos por rangos

Bioestadstica Aplicada

Las hiptesis:

Hiptesis nula, Ho: -puntajesfumar - tomar = 0 Hiptesis alternativa, Ha: - puntajesfumar - tomar 0

Bioestadstica Aplicada

Resultados:

Bioestadstica Aplicada

Que debemos llevar a casa hoy:

Alternativas disponibles cuando no se cumplen las condiciones para usar pruebas parmetricas

Como aplicar e interpretar las pruebas de Wilcoxon, Mann-Whitney, Kruskal-Wallis y Spearman


Limitaciones de las pruebas no paramtricas

Bioestadstica Aplicada

S-ar putea să vă placă și