Sunteți pe pagina 1din 60

LA BIOINFORMTICA COMO PUENTE ENTRE LA GENTICA Y SUS APLICACIONES INDUSTRIALES Y BIOMDICAS

Estudios de Asociacin Gen Candidato Manuel Calaza

Diseo del experimento Seleccin de SNPs Antes de evaluar la asociacin Cmo decidir y medir la asociacin Despus de los primeros anlisis

Diseo del experimento

Diseo del experimento

Consideraciones sobre las colecciones de muestras Consideraciones sobre los marcadores a seleccionar y la potencia estadstica del estudio

Sobre las colecciones de muestras

Es fundamental disponer de colecciones de muestras clnicamente uniformes y correctamente caracterizadas. Es importante que la coleccin de controles no diera de la coleccin de casos en cuestiones como edad, sexo, origen geogrco, factores ambientales, caractersticas tnicas, etc.

Sobre los marcadores a seleccionar y la potencia estadstica del estudio


Los SNPs pueden seleccionarse siguiendo distintas estrategias:

Utilizando informacin poblacional previa para seleccionar el menor conjunto de SNPs que contengan la mayor variabilidad gentica posible en la regin de inters. Utilizando informacin y predicciones de funcionalidad de los SNPs de la regin de inters. O las dos cosas simultneamente.

Sobre los marcadores a seleccionar y la potencia estadstica del estudio

En todo caso, es recomendable ser cautelosos en la seleccin de los SNPs y no considerar, por ejemplo, SNPs con MAF < 5%
(variantes poco frecuentes que pueden recuperarse con un anlisis de haplotipos denidos por SNPs de mayor frecuencia)

Una vez seleccionados los SNPs, si conocemos la MAF en una poblacin de referencia, hemos establecido un nivel de signicacin y un tamao para el efecto que pretendemos obtener, podemos estudiar la potencia estadstica del experimento.

Sobre los marcadores a seleccionar y la potencia estadstica del estudio


OR=1.5 MAF controles=0.2 P<0.05

1100 casos y 1100 controles 1500 casos y 1500 controles 2000 casos y 2000 controles 3800 casos y 3800 controles

50% 63% 73% 95%

Seleccin de SNPs

Seleccin de snps con caractersticas funcionales


Son varias las posibilidades de que un SNP pueda alterar el normal funcionamiento de un gen: nsSNPs Splicing alternativo Creacin o destruccin de sitios de unin de factores de transcripcin Alteracin de secuencias conservadas

NCBI dbSNP

Seattle SNPs

PupaSuite
Podemos emplear herramientas bioinformticas para evaluar las caractersticas funcionales de un gen o una regin cromosmica.

HapMap

HapMap Phase II

270 muestras de 4 poblaciones: CEU: 30 tros de residentes en Utah con ascendencia en norte y oeste de Europa (Centre d'Etude du Polymorphisme Humain, 1980) CHB: 45 chinos Han de Pekn JPT: 45 japoneses del entorno Tokio YRI: 30 tros de Yoruba de Ibadan (Nigeria)

HapMap Phase III


label ASW* CEU* CHB CHD GIH JPT LWK MEX* MKK* TSI YRI* population sample African ancestry in Southwest USA Utah residents with Northern and Western European ancestry from the CEPH collection Han Chinese in Beijing, China Chinese in Metropolitan Denver, Colorado Gujarati Indians in Houston, Texas Japanese in Tokyo, Japan Luhya in Webuye, Kenya Mexican ancestry in Los Angeles, California Maasai in Kinyawa, Kenya Toscans in Italy Yoruba in Ibadan, Nigeria # samples 90 180 90 100 100 91 100 90 180 100 180 1.301 QC+ Draft 1 71 162 82 70 83 82 83 71 171 77 163 1.115

* Population is made of family trios

HapMap Phase II

HapMap Phase III

Hapmap es una base de datos orientada a la diversidad poblacional, al desequilibrio de ligamiento entre SNPs y a la estructura haplotpica del genoma.

Medidas de desequilibrio de ligamiento: D y r2


Son medidas entre pares de SNPs que nos dan dos informaciones muy importantes:
La D mide el nivel de heredabilidad conjunta de los dos polimorsmos. La r2 mide el nivel de redundancia estadstica que supone analizar los dos SNPs. D la usaremos para determinar la regin entorno al gen que se transmite haplotpicamente junto con l. r2 la usaremos para seleccionar en esa regin un subconjunto de SNPs suciente para englobar toda la variabilidad haplotpica.

Medidas de desequilibrio de ligamiento: D y r2

Haploview

Antes de evaluar la asociacin

Antes de evaluar la asociacin


Control de calidad sobre el genotipado:

A nivel del genotipador (persona o servicio) A nivel del analizador:

Descartar SNPs o muestras responsables de que la distribucin de los fallos de genotipado no sea claramente uniforme o aleatoria Reconsiderar SNPs con frecuencias allicas muy diferentes de las que tienen en la poblacin de referencia. Descartar SNPs sin HWE Evaluar la heterogeneidad de los subgrupos de controles respecto a lo genotipos obtenidos

Antes de evaluar la asociacin HWE A (p) A (p) AA p2 Aa pq a (q) Aa pq aa q2

a (q)

Una desviacin signicativa de la tabla observada respecto de la esperada en el grupo de controles, habitualmente puede ser indicativo de errores de genotipado

Antes de evaluar la asociacin

Diagrama de Finetti

Antes de evaluar la asociacin

Heterogeneidad entre los subgrupos de controles:

Las diferencias en frecuencias entre los grupos de controles son tan signicativas como las que pretendemos ver entre casos y controles. (WTCCC) Las distribuciones haplotpicas en los distintos subgrupos de controles presentan diferencias signicativas (test exacto de diferenciacin de poblaciones Arlequin)

Antes de evaluar la asociacin

Antes de evaluar la asociacin

Antes de evaluar la asociacin

Antes de evaluar la asociacin

Cmo decidir y medir la asociacin

Cmo decidir y medir la asociacin


Asumiendo un modelo allico, todo se reduce al anlisis de tablas de contingencia 2x2

casos Alelo raro Alelo Comn a c

controles b d

Cmo decidir y medir la asociacin

Dos herramientas clsicas:


Pearsons Chi cuadrado test para evaluar la signicacin estadstica de la diferencia entre las distribuciones en casos y en controles Odds ratio e Intervalo de Conanza para medir la magnitud de la diferencia detectada

Pearsons Chi cuadrado test


Test de hiptesis sobre la hiptesis de independencia de las variables afectacin y alelo del SNP casos Alelo raro Alelo comn a c a+c controles b d b+d a+b c+d n=a+b+c+d

Tabla observada

Pearsons Chi cuadrado test


Tabla esperada asumiendo independencia entre las variables

Tabla observada y tabla esperada


casos Alelo raro Alelo comn a (a+b)*(a+c)/n c (c+d)*(a+c)/n a+c controles b (a+b)*(b+d)/n d (c+d)*(b+d)/n b+d a+b

c+d n=a+b+c+d

Pearsons Chi cuadrado test

Odds ratio e Intervalo de Conanza


Un intervalo de conanza del 95% es el que contiene el valor de la OR que se obtendra el 95% de las veces que se repita el mismo experimento sobre muestras del mismo tamao tomadas de la misma poblacin.

Ln(OR)

Cmo decidir y medir la asociacin


En ocasiones, el anlisis de alelos (equivalente al modelo aditivo) no es el mejor modelo gentico para explicar la asociacin. Se pueden considerar modelos recesivos y dominantes como alternativas ms usuales. Aditivo AA Aa aa 0 1 2 recesivo 0 0 1 dominante 0 1 1

Cmo decidir y medir la asociacin

Si las colecciones de muestras con las que trabajamos presenta un origen heterogneo (no desde el punto de vista de los SNPs a analizar, que tambin, si no desde el punto de vista geogrco, clnico, etc.) debemos considerar el empleo de estrategias de tipo meta-anlisis. Cuando estn disponibles los recuentos de alelos en casos y controles en cada uno de los subgrupos de muestras, el anlisis de Maentel-Haenszel es el ms utilizado (acompaado del test de heterogeneidad de efectos de Breslow-Day) frente a la alternativa de unirlo todo sin ms.

Cmo decidir y medir la asociacin

Todas estas consideraciones se han hecho asumiendo cada SNP como variables estadsticamente independientes, cuando en realidad es muy improbable que lo sean. Es necesario considerar estrategias de anlisis multivariante y asumir un cierto grado de dependencia entre los SNPs (que viene dado por la r2 que hay entre ellos): Regresin Logstica Anlisis de Haplotipos

Despus de los primeros anlisis

Anlisis de haplotipos:

Despus de los primeros anlisis

Anlisis de haplotipos:
Permite descubrir alelos no genotipados que presentan diferencias entre casos y controles Permite separar efectos protectores y de susceptibilidad independientes Permite explicar la asociacin de unos SNPs por compartir haplotipo con el SNP genuinamente explicativo (asociacin por desequilibrio de ligamiento).

Supongamos un conjunto de 8 SNPs seleccionados en un bloque de LD que contiene la secuencia de un gen Refseq. El anlisis de alelos aporta los siguientes resultados:

En la distribucin de haplotipos, los alelos se codican como 0=comn y 2=raro

Despus de los primeros anlisis

Regresin Logstica:
Permite evaluar de forma sistemtica multitud de modelos Permite evaluar interacciones epistticas entre SNPs de acuerdo con un modelo preestablecido Permite evaluar la contribucin individual de cada SNP a un modelo concreto Presenta limitaciones a la hora de diferenciar varios efectos

S-ar putea să vă placă și