Sunteți pe pagina 1din 55

Haga clic para modificar el estilo de subttulo del patrn

CURSO DE ESTADSTICA BSICA

4/18/12

ESQUEMA DEL CURSO


ESTADSTICA BSICA DISEO DE EXPERIMENTOS ESTADSTICA DESCRIPTIVA
ESTIMACI N TIPOS DE VARIABL ES TABLAS Y GRFIC AS PUNTUA L POR INTERVAL OS

INFERENCIA ESTADSTICA
CONTRASTE DE HIPTESIS MTODOS PARAMTRICO S
TSTUDENT ANOVA FISHER PEARSON

MTODOS NO PARAMTRICO S
U-MANN WHITNEY K-W TABLAS DE CONTINGEN CIA

MEDIDAS DE POSICIN CENTRAL Y DE DISPERSIN

4/18/12

SESIN

INFERENCIA ESTADSTICA

1 Tablas de contingencia 2 Contraste de hiptesis 3 Medidas de asociacin


4/18/12

Denominamos variables cualitativas a aquellas cuyo resultado es un valor o categora de entre un conjunto finito de respuestas
P O R E J E M P L O4/18/12

El sexo, el estado civil o el grupo sanguneo son variables cualitativas

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

Para analizar la relacin de dependencia o independencia entre dos variables cualitativas es necesario estudiar su distribucin conjunta o tabla de contingencia Tabla de contingencia: Tabla de doble entrada donde en cada casilla figura el nmero de individuos que posee esas caractersticas
4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

EJEMPLOS

Estudiar la relacin entre

El sexo y el hbito de fumar El grupo sanguneo y la posibilidad de rechazar un trasplante La prctica de ejercicio y el riesgo de infarto

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

OBJETIVOS Las tablas de contingencia tienen dos objetivos fundamentales:


1.- Organizar la informacin, cuando est referida a factores

2.- Analizar si existe alguna relacin de dependencia o independencia entre los niveles de las variables objeto de estudio
El hecho de que dos variables sean independientes significa que los valores de una de ellas no estn influidos por la otra 4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

CMO SE CONSTRUYE UNA TABLA DE CONTINGENCIA?


Una tabla de contingencia se presenta de la siguiente forma
HOMBRE SI NO MARGINAL n11 n21 n.1 MUJER n12 n22 n.2 MARGINAL n1. N2. n..

nij=n observaciones de la fila i y la columna j Frecuencia: Nmero de veces que se presenta un valor dado de una 4/18/12 observacin

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

EJEMPLO
Para contrastar la hiptesis El sexo influye en el hbito de fumar, podemos construir la siguiente tabla de contingencia
HOMBRE SI NO MARGINAL 65 43 108 MUJER 58 67 125 MARGINAL 123 110 233

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

TIPOS DE TEST UTILIZADOS

Para identificar relaciones entre variables cualitativas se utiliza el test estadstico de la Chicuadrado Para las tablas 2x2 se utiliza el test de Fisher

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

TIPOS DE TEST UTILIZADOS


En los ejemplos anteriores Influye el sexo en el hbito de fumar? Tienen ms posibilidades los de un cierto grupo sanguneo de rechazar un trasplante?

La hiptesis que plantearemos ser:


H0: independencia H1: dependencia

El resultado nos permitir afirmar con un nivel de confianza que nosotros determinaremos si los niveles de una variable influyen en los niveles de la otra
4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

RAZONAMIENTO
El razonamiento para contrastar si existe o no asociacin entre dos variables cualitativas se basa en: calcular cul seran los valores de frecuencia esperados para cada una de las celdas en el caso de que efectivamente las variables fuesen independientes y compararlos con los valores realmente observados

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?
Si no existe valores mucha diferencia entre ambos

no hay razones para dudar de que las variables sean independientes

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?
Una vez que hayamos hecho los clculos, obtendremos un nivel de significacin

Si es p<0.05 rechazamos la hiptesis nula y decimos que las variables son dependientes Si es p>0.05 no podramos rechazar H0 porque la probabilidad de equivocarnos sera muy alta

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

PROBLEMAS La Chi-cuadrado est influenciada por el tamao muestral


Si la muestra es excesivamente grande ser ms fcil que rechacemos la hiptesis nula de independencia cuando a lo mejor podran ser independientes

A mayor nmero de casos analizados el valor de la Chi-cuadrado tiende a aumentar

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

PROBLEMAS
En cada celda de la tabla deber existir un mnimo de 5 observaciones esperadas Se agrupan filas o columnas (excepto tablas 2x2) Si no fuera as Se elimina la fila que da la frecuencia <5
4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

PROBLEMAS
Para el ejemplo anterior El sexo influye en el hbito de fumar
HOMBRE SI 12 MUJER 32 MARGINAL 44

NO

18

10

28

OCASIONALMENTE

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

PROBLEMAS

Y si la tabla es de 2x2?

Se aplica la correccin de Yates

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

PROBLEMAS
La Chi-cuadrado permite contrastar la hiptesis de independencia pero

en el caso de que se rechace dicha hiptesis no dice nada sobre la fuerza de la asociacin entre las variables estudiadas

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

Las MEDIDAS DE ASOCIACIN distinguen entre que las variables sean ordinales o nominales

Las MEDIDAS DE ASOCIACIN NOMINALES slo informan del grado de asociacin existente pero no de la direccin

Las MEDIDAS DE ASOCIACIN ORDINALES aportan informacin sobre la direccin de la relacin, pudiendo tomar tanto valores positivos como negativos

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

Se pueden encontrar los intervalos de confianza para los riesgos relativos, lo cual alcanza la misma finalidad que la prueba de significancia, segn contenga el 1 o no

Los intervalos de confianza para riesgos relativos cada vez son ms utilizados para las publicaciones en revistas mdicas

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

MEDIDAS DE ASOCIACIN ORDINALES


Valores altos de una se corresponden con valores altos de la otra y al contrario Valores altos de una se corresponden con valores bajos de la otra y al contrario

VALORES POSITIVOS

Existe una relacin directa entre las variables Existe una relacin inversa entre las variables

VALORES NEGATIVOS

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

RESIDUOS
C M O P S A E R C A A Q L U C U4/18/12 S I L Diferencia entre la frecuencia observada y esperada en cada casilla Son muy tiles para interpretar las relaciones que se observan en la tabla Indican que la diferencia entre las frecuencias es elevada cuando su valor es superior a 1.96 inferior a -1.96

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

RESIDUOS
Un valor del residuo tipificado en una casilla Hay ms casos (si es positivo) o menos (si es negativo) de los que debera haber en esa casilla si las variables fueran independientes, por lo que las variables son dependientes La diferencia es pequea por lo que las variables son independientes

Mayor a 1.96 en valor absoluto

Comprendid o entre 1.96


4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

USO EXCESIVO
Debido a que la prueba Chi-cuadrado es fcil de entender y calcular, en ocasiones se utiliza cuando es ms apropiado otro mtodo
P O R E J E M P L O

Cuando se analizan dos grupos y las caractersticas de inters se miden en escala numrica L O Aplicar la prueba t-Student Convertir la escala numrica en una ordinal o incluso binaria

L C O O 4/18/12 R

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

USO EXCESIVO - EJEMPLO


Se desea conocer los pacientes de una intervencin que tienen mayor probabilidad de padecer complicaciones que otros

Los investigadores queran saber si existe relacin entre la edad y la probabilidad de tener complicaciones

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

USO EXCESIVO - EJEMPLO MTODO DE TRABAJO:


1

Se recogen datos de pacientes que sufrieron complicaciones y de otros pacientes que no las sufrieron Los investigadores formaron una tabla de contingencia 2x2 y agruparon la edad en 45 o >45 Emplearon la prueba de chi-cuadrado para la independencia y los resultados indicaron que no haba relacin entre la edad y la presencia de complicaciones

4/18/12

M A L!

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

USO EXCESIVO - EJEMPLO DNDE EST EL ERROR? En la seleccin arbitraria de los 45 aos como punto de corte para la edad Y en usar una prueba de forma incorrecta
4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

USO EXCESIVO

Cuando las variables numricas se analizan con mtodos diseados para variables categricas u ordinales, se pierde la mayor especificidad de las mediciones numricas Antes de hacerlo hay que investigar si las categoras son correctas

4/18/12

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

McNEMAR

Una variante de las tablas longitudinales es medir una misma variable dicotmica (tratamiento-no tratamiento, rechazo-no rechazo) en dos momentos temporales distintos C O N S E J 4/18/12 O

Resulta especialmente til para medir el cambio

1 TABLAS DE CONTINGENCIA

2 CONTRASTE DE HIPTESIS

3 MEDIDAS DE ASOCIACIN

McNEMAR
CMO SE TRABAJA?

Se toma una medida de una variable dicotmica, se aplica el tratamiento (o se deja pasar el tiempo) y se vuelve a tomar una medida de la misma variable en los mismos sujetos Se contrasta la hiptesis de igualdad de proporciones antes y despus
4/18/12

SESIN 6

REGRESIN
6.1 Correlacin 6.2 Regresin Lineal Simple
4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

DEFINICIN DE CORRELACIN Se considera que dos variables cuantitativas estn relacionadas entre s cuando los valores de una de ellas varan de forma sistemtica conforme a los valores de la otra.

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON El coeficiente de correlacin de Pearson es un ndice estadstico que permite definir de forma ms concisa la relacin entre las variables Es una medida de la relacin lineal entre dos variables medidas con escala numrica

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON Su resultado es un valor que flucta entre -1 y +1 Relacin perfecta en sentido +1 positivo
0

Cuanto ms cercanos a 0 sean los valores significar una relacin ms dbil o incluso ausencia de relacin Relacin perfecta en sentido negativo

-1
4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

El valor del coeficiente de correlacin est muy influenciado por los valores extremos, igual que la desviacin estndar. Por tanto la correlacin no describe bien la relacin entre dos variables cuando cada una de ellas tiene valores extremos En estos casos debe hacerse una transformacin de los datos o usarse la correlacin de Spearman
4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

Finalmente, correlacin no es igual a causa Correlacin = Causa El juicio de que una caracterstica causa otra debe justificarse con argumentos, no slo con el coeficiente de correlacin

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON Segn su valor variables ser:


1 0,9 0,8

la

relacin

entre

las

Perfecta Excelente Buena Regular

0,5
4/18/12

Mala

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN
Un DIAGRAMA DE DISPERSIN ofrece una idea bastante aproximada sobre el tipo de relacin existente entre dos variables Un DIAGRAMA DE DISPERSIN tambin puede utilizarse como una forma de cuantificar el grado de relacin lineal existente entre dos variables

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN
El DIAGRAMA DE DISPERSIN permite formarse una primera impresin sobre el tipo de relacin existente entre variables Intentar cuantificar esa relacin tiene inconvenientes porque la relacin entre dos variables no siempre es perfecta o nula

Normalmente ni lo uno ni lo otro


4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

MODELOS DE REGRESIN Una vez que sabemos que dos variables estn relacionadas

Cmo averiguar qu tipo de relacin tienen? Para esto regresin


4/18/12

utilizamos

los

modelos

de

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

CONCEPTO DE REGRESIN
Q U E S P ? A R A Q U 4/18/12 S La regresin como tcnica estadstica analiza la relacin de dos o ms variables contnuas La regresin se utiliza para inferir datos a partir de otros y hallar una respuesta a lo que pueda suceder

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

La correlacin es independiente de la escala pero no la regresin


La correlacin entre estatura y peso es la misma sin importar que la estatura se mida en metros o centmetros La ecuacin de regresin entre el peso y la estatura depende de las unidades que utilicemos

DIFERENCIA ENTRE CORRELACIN Y REGRESIN:

EJEMPLO

SIN EMBARGO 4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

SIMILITUDES ENTRE CORRELACIN Y REGRESIN:

La pendiente de la lnea de regresin tiene el mismo signo que el coeficiente de correlacin


OJO! La correlacin y la regresin slo describen relaciones lineales. Si los coeficientes de correlacin y las ecuaciones de regresin se calculan a ciegas, sin examinar las grficas, los investigadores pasarn por alto relaciones muy estrechas pero no lineales

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

VARIABLES DE LA REGRESIN
Las variables del modelo de regresin deben ser cuantitativas Dada la robustez de la regresin es frecuente encontrar incluidas como variable independiente variables nominales transformadas La variable dependiente debe ser siempre cuantitativa
Robustez: un estadstico se dice que es robusto cuando es vlido aunque no se cumpla alguno de sus supuestos 4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

TIPOS DE REGRESIN
Se pueden encontrar distintos tipos de regresin
1 2 3

Regresin Lineal Regresin Mltiple Regresin Logstica

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL
Consideremos una variable aleatoria respuesta Y, relacionada con otra variable que llamaremos explicativa X Supongamos una muestra de n individuos para los que se conocen los valores de ambas variables Hacemos una representacin grfica: en el eje X la variable explicativa en el Y la respuesta

Y X n

Variable aleatoria Variable explicativa Muestra

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL
O Encontrar una recta que se ajuste a la nube de B puntos J E T I A partir de esa recta podemos usar los valores de X para V predecir los de Y O Normalmente se utiliza el mtodo de los mnimos cuadrados que minimiza la distancia de las observaciones a la recta
4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

REPRESENTACIN GRFICA

Una recta tiene muy simple:

una

ecuacin

Y=a+b b X
a

Habra que calcular los coeficientes a,b.

b a
4/18/12

es la pendiente de la recta es el punto en que la recta corta el eje vertical

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL
Conociendo los valores de estos dos coeficientes podramos reproducir la recta y describir con ella la relacin entre las variables Adems de representar la recta con su frmula tambin es til disponer de alguna informacin sobre el grado en que la recta se ajusta a la nube de puntos

4/18/12

1 CORRELACIN

2 REGRESIN LINEAL SIMPLE

BONDAD DEL AJUSTE


Una medida de ajuste muy aceptada es el coeficiente de determinacin R2 Cuadrado del coeficiente de correlacin lineal

Se trata de una medida estandarizada que toma valores entre 0y1


R2=0. 86

La recta explica un 86% de la variabilidad de Y en funcin de X

4/18/12