Sunteți pe pagina 1din 29

1 Los avances en la Genmica del Cncer [0:00:00] Sean Sanders: Hola y bienvenidos a la ciencia de hoy / AAAS viven seminario.

Mi nombre es Sean Sanders y yo soy el editor comercial en la revista Science. Diapositiva 1 El tema para el seminario de hoy es "Genmica del Cncer avances". El cncer es a menudo se caracteriza por la desregulacin o la desregulacin de la normal controlar las vas para el crecimiento celular y / o apoptosis. A pesar de que muchos avances, la investigacin genmica tradicional haba sido obstaculizado en ocasiones por las limitaciones tecnolgicas o de costo excesivo. Con la prxima generacin plataformas de genmica, los cientficos estn ahora en condiciones de costoeficacia del ensayo genomas individuales de cncer y las caracterizan en trminos de la mundial cambios genticos, epigenticos y de la transcripcin. A fondo caracterizacin de estos eventos y las relaciones entre ellos se conducir a una mejor comprensin de los mecanismos de tumorignesis, metstasis, y la respuesta teraputica. En este seminario oportuna, nuestro panel de distinguidos cientficos compartirn sus ltimos avances en el cncer genmica y ofrecer sus puntos de vista sobre el camino a seguir para esta importante rea de la investigacin. En la actualidad el estudio, me acompaan el Dr. Sean Grimmond del Instituto de Biociencia Molecular de la Universidad de Queensland en Australia. Luego, tenemos el Dr. John McPherson, del Instituto de Ontario para el cncer La investigacin en Toronto, Canad. Y nuestro invitado de hoy tercero es el Dr. David Wheeler, de Baylor College of Medicine en Houston, Texas. Un recordatorio para todos ver que para ver una versin ampliada de cualquier de las diapositivas, slo tienes que hacer clic en el botn de aumentar las diapositivas encuentra por debajo de la ventana de la diapositiva de la consola web. Tambin puede descargar una copia en PDF de todas las diapositivas mediante el uso de las diapositivas de descarga botn. Si usted unirse a nosotros en vivo, puede enviar una pregunta a la mesa redonda en cualquier momento simplemente escribiendo en el cuadro de pregunta a un pregunta sobre el fondo izquierda de la consola de ver por debajo de la pantalla de vdeo y haga clic en el botn de enviar. Voy a hacerlo lo mejor posible, como de costumbre, para llegar a la mayor cantidad de la preguntas como sea posible. Por favor, sea breve y al grano.

Por ltimo, me gustara dar las gracias a Applied Biosystems, una divisin de la Vida Technologies Corporation para su patrocinio de seminario de hoy. Diapositiva 2 Ahora, es mi gran placer de presentar nuestro primer orador en la actualidad. Profesor Asociado Sean Grimmond complet su doctorado al Universidad de Queensland en Australia antes de hacer su post-doctorado formacin en la Unidad MRC de Gentica de mamferos, en Oxford en el Reino Unido 2 Unido. Despus de pasar tiempo en el Instituto Queensland de Medicina Investigacin en Brisbane, Australia, se traslad a la Universidad de Queensland en 2001, donde actualmente es Investigador Principal en El Instituto de Biociencia Molecular de Australia y lleva Internacional Consorcio para la Genmica del Cncer en el programa de investigacin de pncreas y cncer de ovario. El foco central de la investigacin del Dr. Grimmond se captura informacin genmica, transcriptmica, y epigenmicas de sistemas de modelos y estados patolgicos, y la definicin de los eventos moleculares subyacentes el control de la diferenciacin celular, la organognesis, y el cncer. En los ltimos aos aos, el laboratorio del Dr. Grimmond ha sido pionero en los enfoques para el estudio del ARNm de los mamferos y transcriptomes microARN en un solo nucletido resolucin a travs de la secuenciacin de escala multigigabase. Bienvenido, Dr. Grimmond. El Dr. Sean Grimmond: Gracias, Sean. Diapositiva 3 S. Entonces, qu voy a presentar hoy aqu es realmente una revisin de una aspecto de cmo la secuenciacin de prxima generacin que realmente ha revolucionado un los aspectos de la genmica. Y voy a estar hablando en realidad de cmo se est llevando aplicada al estudio del transcriptoma. Y si pensamos en la ltima dcada, hemos visto realmente transcriptmica siendo la herramienta de la premier para dar sentido al que subyace a la gentica de los estados biolgicos y patolgicos. Y ha sido realmente de gran alcance en el que nos da los biomarcadores que se puede correlacionar, especialmente con los gustos de los fenotipos de cncer. Diapositiva 4 En el caso de transcriptmica cncer, los mtodos basados en la secuencia realmente estn llevando a cabo estudios muy similares a lo que habamos realizado con matrices. Y realmente puede romper en tres reas. El primero es el proceso de estudio de la actividad de lugar o de hecho mide tan slo la actividad de la cadena a travs de todo el genoma. El segundo aspecto es que la secuencia

enfoques nos permiten medir la expresin de la transcripcin especfico. Y ahora puede hacer esto de una forma mucho ms sensible y de una manera mucho ms especfica de lo que podemos con cualquier enfoque basado en arreglos. Y entonces, la tercera rea importante es el contenido de la secuencia. Por lo tanto, no slo estamos mirando a la la actividad de estos loci, podemos ahora mirar para los eventos patolgicos que pueden estar sucediendo en esta secuencia. Por lo tanto, estamos hablando de los eventos de splicing. Estamos hablando de las mutaciones que tal vez se correlacionaba con una enfermedad. Diapositiva 5 As que, primero a destacar por eso que estamos haciendo la transicin de microarrays para secuenciado los enfoques basados, estoy mostrando aqu en este de diapositivas, dos grficos de dispersin. La parte superior se muestra la comparacin de dos clulas 3 lneas utilizando microarrays de perfiles. El panel inferior muestra la misma Las muestras se compararon por ARN-ss. Y las manchas rojas y verdes que podemos ver que corresponden a los genes expresados diferencialmente en cada muestra. Y una cosa s podemos ver es que los genes que son etiqueta gris en la parte inferior izquierda paneles de cada uno de los dispersin las parcelas son los genes que estn realmente en nuestros lmites de deteccin. [0:04:56] Diapositiva 6 Ahora bien, si en realidad empieza a comparar lo que sucede cuando se toma el los genes que se detectaron en el experimento de microarrays, y mirarlos en el experimento perfil del ARN. Por lo tanto, tenemos los genes que estaban identificados en el panel de arriba a la izquierda y ahora mira cmo se llevara a cabo en el panel opuesto, encontramos que los genes de la matriz, incluso la limitada Deteccin por array, ahora estn en la misma clase de rango medio a alto nivel deteccin rango de la ARN-ss. Y por el contrario, los genes que estaban siendo detectar con seguridad en el ARN-ss en la parte inferior izquierda del panel son a menudo en el nivel de ruido que veramos en el experimento de microarrays. As, la lnea de fondo aqu es que estamos detectando los genes hasta un 40% ms cuando utilizar el enfoque de ARN-ss, y tambin estamos haciendo esto en un anlisis cuantitativo de la moda. Por lo tanto, si utilizamos estos datos de la secuencia, podemos decidir cun

sofisticado se queremos ser. Slo podemos medir la actividad de los genes, sino que tambin puede bajar y mirar el nivel de transcripcin individual. Y voy a describir cmo que est siendo llevado a cabo en este momento. Diapositiva 7 En la diapositiva aqu, lo que podemos ver es un diagrama de cerca de cuatro expedientes procedente de un locus. Y tradicionalmente, si tuviramos que medir esto con un microarrays, podramos tener una sonda slo para el extremo 3 'que slo lo hara medir tres o cuatro de estas transcripciones. Diapositiva 8 Si furamos un poco ms sofisticado, se podra empezar a hacer las sondas que podran identificar secuencias nicas exonic. Pero, de hecho, lo que hacemos con un enfoque basado en la secuencia es que buscamos las secuencias de diagnstico o nico por cada transcripcin de aqu, ya se trate de secuencias de exonic o de unin de la secuencias de estos exones. Diapositiva 9 Y si realmente se mide la frecuencia con que esas etiquetas se asignan a estas regiones, donde estos dos exones se juntan, podemos medir esa expresin de la transcripcin especfico. Por lo tanto, si pensamos en tomar un paso ms, ahora podemos ver la expresin de genes como una matriz, sino tambin en un contexto genmico. Diapositiva 10 4 En el panel de fondo aqu, que te estoy mostrando slo los picos rojos a lo largo del grfico de las tapas de varias de las transcripciones que pueden venir de este lugar. Nosotros puede ver en las etiquetas de secuencias que se emparejan los exones. Y lo que podamos Tambin analizamos el uso de esta combinacin de exn para definir el empalme real variantes que puede estar all. Diapositiva 11 Slo para dar un ejemplo, slo busca en una lnea celular en un lugar aqu para receptor del factor 1, la lnea de fondo en la parte inferior es el de larga duracin transcripcin. Hay una fuerte evidencia de la transcripcin, tanto desde el exn la cobertura y la utilizacin de la unin exn que la transcripcin de larga duracin es expresado. Diapositiva 12

Diapositiva 13 Pero si realmente a travs y se burlan de esta informacin, tambin podemos encontramos una fuerte evidencia de las isoformas de la variante que se expresan. En este caso, un menor transcripcin, que tiene un receptor seuelo secretada. Y, de hecho, un variante de empalme, que tambin genera un receptor seuelo segundo. As, este lugar es en realidad lo que tres protenas diferentes cuando est activo en este contexto. Por lo tanto, algo que no se captura normalmente con matrices. Diapositiva 14 El poder de ser capaz de detectar esta variante es realmente expresin impulsada por nuestra capacidad de identificar el uso de exn. Y este panel que muestra aqu es slo cmo vamos a hacer eso en estos das. En el lado izquierdo, podemos ver que si tomamos todos los eventos previamente definidos de splicing alternativo de la gustos de los AST y cDNAse, ahora nuestras bases de datos pblicas, que puede compensar un buen panel de eventos de diagnstico que corresponden a longitud completa transcripciones. Tambin somos capaces de tomar recientemente, todos los exones de cada locus y aunque comienzan a acumularse en las combinaciones de silicio. Y de esta manera, podemos buscar eventos nuevos. Por lo tanto, estamos pensando en lo que podra ser tericamente posible con los exones conocidos, y de dejar que ver si podemos encontrar evidencia de esos tipos que se unen. La tercera forma es buscar en realidad para los exones completamente nuevos. Por lo tanto, esperamos para grupos de tags, y luego ver cmo se puede conectar a otros exones de los genes vecinos. Y slo para poner de relieve los beneficios de estos mtodos, el ms conocido la complejidad nos da una medida de transcripciones conocidas. El terico los enfoques y el transcriptoma enfoque de descubrimiento son en realidad muy til para buscar aberrantes de empalme y de hecho la posibilidad de detectar fusiones de genes. Y ah es donde se ha producido una anomala cromosmica 5 reordenamiento, lo que conduce a la generacin de una transcripcin que nunca volvera a ver en una clula normal. Diapositiva 15 Tambin debo decir que cuando hemos generado estos datos tambin tenemos secuencia de contenidos. Por lo tanto, si pasamos por y caracterizar ese contenido,

tambin es posible para nosotros para identificar las mutaciones. Y para darle una ejemplo aqu de mostrar cmo bamos a hacer eso. Cuando se pensar acerca de la secuenciacin del transcriptoma, tenemos una cobertura muy profunda de muchos de los genes cuando estn expresados en un gran nmero de copias por clula. Y si se generan alrededor de cien millones se lee de un experimento, y buscamos las etiquetas nicas que corresponden a la exonic secuencias, y nos encontramos con variantes de la secuencia, podemos apilar los de arriba juntos y hacer una llamada acerca de si existe o no una variante dentro de que muestra. Una vez que esas variantes se han identificado, podemos ir a travs y ver cmo afectan a la fase de lectura abierta. Y entonces le toca a la tarea de tratar de determinar si ese cambio no es sinnimo o en efecto que la insercin o delecin es probable que sea patgeno o la creacin de un verdadera mutacin. Y mucho de ese trabajo es realmente ahora en curso en el que tiene que tratar de clasificar estas mutaciones cuando podemos definir ahora realmente bastante rpido como para que aquellas variantes se puede expresar y cules quiz enfermedad. [0:10:15] As, por ltimo, me gustara decir que mientras que el ARN mensajero del transcriptoma ha demostrado ser mucho ms complicada que una transcripcin por gen, estamos viendo que el transcriptoma se est abriendo a nuevas reas. Hay RNAs no codificantes. Hay tambin una poblacin de ARN muy pequea que sabemos que podra controlar los genes diana. Y en el caso del microARN, estamos trabajando activamente en esto en el cncer, as exactamente por la mismas razones, biomarcadores, as como los genes que a lo mejor la biologa de conduccin. Diapositiva 16 La diapositiva que acabo de que aqu se presenta es el de mostrar el tipo medio de los resultados que obtendramos de un experimento por el cual la secuencia de secuenciacin la pequea poblacin de ARN, se encontrar cerca del 45% de las etiquetas de la la muestra se corresponden con los microRNAs. Si nos fijamos en la parte superior derecha del panel, esto es slo para resaltar el tamao distribuciones que veremos de microRNAs de estos experimentos. La mayora de las etiquetas de ser entre 21 a 22 pares de bases de longitud. Y una vez hemos identificado esas etiquetas, podemos pasar a utilizar para identificar a Los marcadores que se corresponden con un tejido especfico, un estado

especfico. Y, de hecho, podemos empezar a modelar en realidad microARN individuales y tratar de llegar a lo que apunta a que podra golpear. 6 Y la parte inferior derecha del panel se corresponde con el oncomere clsica, 17-5p, donde estamos mirando sus objetivos y si estn o no expresa dentro de una muestra en particular. Por lo tanto, estamos trabajando activamente en la examinar estos y hacer atlas de estas en nuestros tumores tambin. Diapositiva 17 Slo para terminar, yo dira que toda esta secuencia transcriptoma est demostrando a ser extremadamente poderoso, tanto en el estudio de la actividad del gen, sino tambin transcriptoma descubrimiento. Diapositiva 18 Diapositiva 19 Podemos usar esto para estudiar el contenido de la secuencia, as que rpidamente puede tener una idea en las mutaciones expresadas. Y realmente, este tipo de transcriptmica tambin puede se aplica a la fraccin microARN de clulas. Sean Sanders: Muy bien. Muchas gracias, Dr. Grimmond. Diapositiva 21 Por lo tanto, vamos a mover hacia la derecha, junto a nuestro siguiente orador, y es que hoy en da El Dr. John McPherson. Diapositiva 22 Poco despus de terminar sus estudios posdoctorales en la Universidad de California, en Irvine, el Dr. McPherson alcanzado una posicin de la facultad y el establecido, como co-director, el National Human Genome Research Center El cromosoma 5 del genoma del Centro en 1993. Tres aos ms tarde, el Dr. McPherson se traslad a la Universidad de Washington, el Centro de Secuenciacin del Genoma donde, como Co-Director, l y sus colegas tuvieron un papel importante en la el Genoma Humano Proyecto de secuenciacin, incluyendo a muchos pioneros mapas a gran escala y las tecnologas de secuenciacin. En 2003, el Dr. McPherson se uni al Centro de Secuenciacin del Genoma Humano en el Baylor College of Medicine en Houston, Texas, donde estableci una gran rendimiento de secuenciacin de tuberas, dirigido especialmente a la investigacin genomas del cncer. Ahora en el Instituto de Ontario para la Investigacin del Cncer en es director de la genmica del cncer, el Dr. McPherson est llevando a su equipo a que OICR uno de los centros de secuenciacin de los mejores 10 del mundo.

Bienvenido, Dr. McPherson. El Dr. John McPherson: Gracias, Sean. Diapositiva 23 En la primera diapositiva, que acabo de esbozar los programas de la OICR. Slo para hacer que el punto de que, si bien hoy en da, estamos sobre todo va a estar hablando sobre la genmica del cncer y la bioinformtica, que es parte de un todo paquete a fin de lograr frutos a la clnica. Diapositiva 24 7 La prxima generacin de plataformas tienen ciertas ventajas, no slo - en el muy parte inferior hay, que producen grandes cantidades de datos, simplemente sin precedentes cantidades de datos que usted ver. Pero tambin tienen algunas ventajas en el la tubera por adelantado. Una biblioteca es todo lo que necesita miles de secuencias y miles de transcripciones. En aras del tiempo, yo no voy a ir a travs de la causa de todos estos puntos de tenemos una ventana muy limitado aqu y queremos llegar a su preguntas. Pero ya vers a medida que avanzamos que esto es realmente cambiar la forma en estamos haciendo la investigacin. Diapositiva 25 Estos perfiles de algunas de las plataformas, las plataformas comerciales que son derecho disponible y tipo de donde estn. Esto es - en su mayora, voy a estar hablando de la Applied Biosystems / slidas y los Illumina / GAII. La 454 instrumentos tambin aparece all con algunos de sus capacidades actuales. En promedio, estos son a corto leer los instrumentos. Breve lee ser de 50 a 100 pares de bases, aunque, el 454 puede hacer ms que eso con menos de lectura nmeros. Pero slo hay gran cantidad de lecturas. Tenga en cuenta que las escalas en esto son las escalas de registro. Y esto est cambiando dramticamente. Al final de la ao, creo, todos estos nmeros se van a duplicar o triplicar. Diapositiva 26 La pregunta que me preguntan mucho es si, ya sabes, debe ir para ya no lee o lee ms. Y, creo, que uno de los puntos que quiero hacer hoy es que es muy importante pensar en el experimento que usted est haciendo. Ya no lee los costos cada vez que aumenta el rendimiento tiene algn costo para l tambin, pero menos probable. Y, creo, usted tiene que realmente pensar en el contexto del experimento.

Por ejemplo, Sean habl sobre la secuencia de microARN. Son de corta secuencias y, obviamente, a continuacin, no hay razn para hacer lecturas largas. Es un esfuerzo intil. Por lo tanto, que la plataforma y el nmero de lecturas y lo que la longitud que queremos es realmente una cuestin de diseo experimental. [0:15:00] Diapositiva 27 Esto muestra lo que tenemos en el OICR en estos momentos. Tenemos siete de los GAIIs y tenemos siete de los 3s SOLiD. Eso es 21 celdas de flujo en total. En su mxima capacidad, esto es alrededor de 800 mil millones de bases por mes. Es mucho ms de datos. Y tenemos 1.2 petabytes de almacenamiento para que los ncleos y para 1600 analizar eso. Diapositiva 28 Las aplicaciones se muestran aqu que estamos involucrados pulg Bastante todo lo que se hizo anteriormente en la genmica es ahora mucho portado a estas aplicaciones de prxima generacin. Ustedes van a or hablar de 8 secuenciacin del genoma completo de David. La variacin estructural, voy a comentar un poco. Usted ha odo hablar transcriptomes y yo tambin tocar epigenmica. Diapositiva 29 Por lo tanto, antes de hablar de variantes estructurales, hoy en da en las preguntas y ahora cuando hablamos de mate-pares y pares de extremos, hay una - que utilizamos - un Mucha gente los utiliza indistintamente. Slo para hacer una distincin, pares de los extremos es donde est la secuenciacin de los extremos opuestos de una sola fragmento de ADN. Mate-parejas se hacen tomando fragmentos ms grandes, circularizacin estos, la captura de los extremos, para luego secuenciar los. As, se obtiene un mayor alcance hacia fuera. Diapositiva 30 Lo que se usa para los? Si la secuencia de un genoma y luego utilizar estas compaero de los pares, por ejemplo, y luego asignarlos de nuevo a una referencia, se le conseguir - en la parte superior izquierdo, vers que tendrs un perfil de tamaos de los fragmentos slo a partir de la construccin de la biblioteca. Y lo que te interesa en esas reas son de color naranja, los valores atpicos. Los que parecen ser demasiado pequeo para su tamao de los fragmentos media o demasiado grande. Y los que deben ser distribuidos aleatoriamente en el genoma. Pero si usted ve un grupo de ellos, en el fondo, se enumeran los tipos

de las cosas que puedes encontrar. Si estn muy juntos, representara un insercin. Si estn demasiado separadas, una delecin, las inversiones, y tambin translocaciones. Diapositiva 31 Otro aspecto que quiero hablar es de la captura de regiones especficas del genoma. Me refiero a ella como la seleccin directa. En los aos 90, esto se hizo con fragmentos de biotina de BAC y cDNAs tirando hacia fuera y es esta realmente el mismo principio. Pero para escuchar su pronunciacin conoce como seleccin de hbridos, particin del genoma dependiendo de la compaa. Hay una especie de dos sabores y una es la captura en un soporte slido. Este es el uso de microarrays en los oligos que se adjuntan a la microarrays son especficos de la regin que est buscando. Se hibridar el DNA y luego eluir que fuera. Por lo tanto, es como un experimento CGH array, excepto eluir que fuera y la secuencia del ADN. La otra es que usted puede hacer esto en una solucin con sondas y este es el Agilent SureSelect enfoque. Y voy a dar algunos ejemplos de ambos. Diapositiva 32 Esto se muestra una regin 600 kb. Por lo tanto, este se dirige a una regin en el 8q24. El azul es la profundidad de lectura que se obtuvo a travs de la regin. El tiempo barra roja es la regin que estamos buscando y los espectculos ms cortos de color rojo de barras donde las sondas son capaces de ser desarrolladas. En la parte inferior hay, usted ver 9 el contenido de repeticin. Y de vez en cuando, donde hay una repeticin, no se puede disear una sonda. Diapositiva 33 Acabamos de zoom en una regin de este. Se puede ver que lo que he trazado ahora es slo la Tm de los oligos para mostrar dnde se encuentran. Y hay una justo en el medio. Es un oligo solo por s mismo. Y usted puede ver hubo material capturado. Por lo tanto, es un mtodo muy eficaz para obtener la cobertura de esta regin especfica. No capta toda la regin en muchos genomas, este es un ejemplo de un genoma humano, de nuevo debido a las repeticiones. Diapositiva 34 Usando el sistema de Agilent SureSelect, usted puede hacer algo - este es el InSolution capturar. Puede hacer cosas similares. Esto realmente est dirigido a exones en este caso. Se trata de un solo gen. Y la oscuridad - las barras negras

representan el gen cubierta. Se puede ver que cada exn se representa y bien cubierto. Diapositiva 35 Solo para tocar epigonomics. Muchas personas estn familiarizadas con el chip-chip y esto es utilizar la propiedad intelectual de la cromatina para derribar las regiones del genoma que estn asociados con diversas protenas. En este caso, estoy mostrando - este es un modificacin de las histonas. Usted puede entrecruzar el ADN de las histonas, aislar el ADN hacia abajo con los anticuerpos, y luego liberar el ADN. Y por lo general, que fue puesto en un microarray, pero ahora, slo puede secuenciar directamente. Y la ventaja es que es la salida de estos secuenciadores. Usted obtener una cobertura de tal manera que no deja de ser un ejercicio de escrutinio. Y entonces usted asignarlos al genoma. Diapositiva 36 Y esto es slo un ejemplo. Los Estados no importan aqu. Esto es slo una clula la lnea en dos estados diferentes. En la parte superior est mirando a cierta histona modificacin. Y se puede ver entre los dos estados con slo mostrar donde el mapa de ADN para, se puede ver que hay una diferencia. Y dependiendo de lo que marca que usted est buscando aqu, si tienen una significado de la expresin permisiva o no permisivo. Diapositiva 37 Quiero mencionar el Consorcio Internacional del Genoma del Cncer. Esta es una grupo de laboratorios internacionales que se estn reuniendo para tratar de reducir algunos de la redundancia y contar con normas ms uniformes para la recoleccin datos. El objetivo general de la asociacin es mirar alrededor de 50 diferentes tipos de tumores y alrededor de 500 muestras por tumor. Y para ponerlo en contexto con el tumor y el normal y algo as como hacer 50.000 humana proyectos genoma. Diapositiva 38 10 Esta diapositiva representa a los grupos que participan en la actualidad que tienen intensificado y se uni al consorcio. Sean se encuentra en el grupo australiano all y haciendo pncreas. Y se puede ver que tambin estamos haciendo pncreas. Esta claro que no pretende ser una apropiacin de tierras donde ciertos grupos estn haciendo ciertos tumores. Estamos trabajando muy de cerca con Sean y la

idea es llegar lo ms cerca que podamos de los 500 tumores por completo secuenciado. [0:19:55] Diapositiva 39 Quiero hacer un comentario sobre el anlisis de datos. Es - la cantidad de datos siendo producido es enorme no slo en el volumen de ella, pero slo el anlisis. Y para cualquier persona en bioinformtica por ah, necesitamos ayuda. Hay claramente una falta de conexin ahora, creo, pero slo estamos completamente sobrepasar la capacidad de la bioinformtica. Se est haciendo mejor, pero Definitivamente se puede utilizar ms herramientas. Diapositiva 40 Y, por ltimo, al igual que la gente gracias. Este es mi grupo y el bioinformtica grupos en la OICR. Sitio web que en la parte inferior si desea ms informacin sobre el OICR. Y gracias por escuchar. Diapositiva 41 Sean Sanders: Muy bien. Muchas gracias, Dr. McPherson. Diapositiva 42 Por lo tanto, nuestro orador final hoy es el Dr. David Wheeler. El Dr. Wheeler completado su licenciatura en Ciencias de la Universidad de Maryland, College Park, de pasar a un Master of Science en bioqumica y un doctorado en molecular la gentica, tanto en la Universidad George Washington en Washington, DC llev a cabo su formacin postdoctoral en la Universidad Brandeis en Waltham, Massachusetts, antes de trasladarse a Baylor College of Medicine en Houston, Texas, para dedicarse a su creciente inters en la nueva rea de cmputo la biologa. Wheeler fue director de la Computacin Biologa Molecular Recursos en el Baylor durante 10 aos y en 2001 se uni a la del Genoma Humano Centro de Secuenciacin all. En la actualidad es director de la bioinformtica y la la genmica del cncer en el genoma humano Centro de Secuenciacin, donde desarrolla mtodos para el descubrimiento de la variacin del genoma humano y en el las poblaciones de animales que utilizan las tecnologas de secuenciacin de ADN con el objetivo de polimorfismos relacionados con las enfermedades humanas, especialmente el cncer. El Dr. Wheeler Tambin es miembro del consejo editorial de la Revista de Investigacin del Genoma. Muchas gracias. El Dr. David Wheeler: Muchas gracias, Juan. Diapositiva 43 11 Buenas tardes a todos. Creo que desde el principio, va a ser interesante dar un paso atrs por un segundo para ver de dnde venimos y hacia dnde vamos con todo esto la secuenciacin del ADN.

Era 2003, que el primer genoma humano se complet a un costo de $ 3 mil millones. Eso fue alrededor de $ 1 por la base del genoma humano. Tom cerca de 10 aos para hacer ese trabajo. En 2007, se haba secuenciado el ser humano individual primero genoma utilizando una tecnologa de prxima generacin a un costo de alrededor de 2 millones de dlares y sobre la pena de dos meses de trabajo. As, la velocidad a la que est siendo secuencia de ADN generado es rpidamente cada vez mayor y los costos van disminuyendo. Esperamos que por el momento el secuenciadores de tercera generacin estn disponibles, en algn momento alrededor del ao 2010, que vamos a secuenciar el genoma humano por alrededor de $ 10.000 a $ 1000. Y esto se logra en cuestin de una semana, quizs dos semanas por genoma. Diapositiva 44 Por lo tanto, esto demuestra las plataformas que estn en uso en el Genoma Humano Centro de Secuenciacin. Tenemos toda la actualidad disponible en el mercado tres plataformas. Y el aumento de la secuencia de ADN que es evidente en esta curva. Dentro de un ao, vamos a estar produciendo alrededor de ms de 1 mil millones de bases por meses. Y esto est siendo impulsado principalmente por la mejora de la plataformas de secuenciacin de uso corriente en lugar de la adicin de nuevos plataformas. Por lo tanto, estas curvas de proyectar el desarrollo tecnolgico que estas empresas estn poniendo en este empeo. Diapositiva 45 As que, por qu la secuencia del genoma del cncer y lo que est buscando? Estamos buscando las mutaciones somticas en el ADN. Estamos buscando los cambios epigenticos y estamos en busca de cambios en la expresin. Mi colegas han cubierto los dos ltimos de estos temas. Voy a pasar un tiempo en mutacin somtica en el ADN hoy. Uno de los aspectos ms desafiantes de esto es que la magnitud de la variacin es tan amplia. Estamos buscando a escalas que van desde una sola base de la totalidad del genoma cuando se est buscando en el genoma del cncer. El otro problemas es la gran variedad de instrumentos de ltima generacin que producen La secuenciacin del ADN lecturas de diversa duracin y caractersticas variables. Y combinando toda esa informacin se est convirtiendo en un desafo. Diapositiva 46 Debido a la gran cantidad de datos que est siendo producido ahora, hay

ha habido una pltora de nuevos instrumentos que se introducen para analizar los datos. Y el principal tipo de anlisis que estamos haciendo hoy es la comparacin de la lee que se generan de nuevo a una referencia del genoma. 12 Cuando se produce el primer genoma humano, el montaje real del genoma era lo importante. Ahora, la comparacin es el lo importante. Y por lo que hay herramientas especficas que est desarrollando ingenieros de software para manejar este problema especfico. [0:25:11] Diapositiva 47 De nuevo, esto muestra la variacin de la escala. Usted notar que la escala de longitud Aqu es logartmica, va desde una sola base hasta la longitud del cromosoma de la alrededor de 100 millones de bases. El SNP y las mutaciones individuales se encuentran en una final de este, donde buscamos mini o variacin en los microsatlites, la insercin, eliminacin, la variacin, y los desplazamientos, tambin copiar los cambios de nmeros, centros de coordinacin amplificacin y aneuploida cromosmica. En el lado derecho de esta diapositiva son la secuenciacin del ADN diferente metodologas que se aplican para detectar esta variacin. As, para la mayor escalas, podemos simplemente mirar cmo las lecturas de un genoma completoexperimento escopeta cubrir el genoma de referencia. Para desplazamientos, inserciones, supresiones, inversiones y otros reajustes estructurales como que, nos fijamos en la forma en que dos a dos final lee el mapa del genoma. Y buscamos anomalas en los extremos de dos a dos como John McPherson discutido. Luego, en el nivel ms bajo, buscamos dentro de la lee a s mismos para ver base de la variacin dentro de las lecturas. El reto aqu es que las lecturas tienen las tasas de error en ellas. Y el tasas de error son generalmente mucho mayor que la tasa de variacin, el verdadero la tasa de variacin en el genoma. Por lo tanto, necesitamos herramientas ms sofisticadas para errores distintivos de variacin real. Diapositiva 48 Por lo tanto, esta imagen muestra lo que un nmero de copias experimento de alteracin sera parecer. Lo que sucede aqu es que el nmero de lecturas a travs de cada cromosoma se cuenta, tanto para el tumor y el normal correspondiente secuencia para el mismo paciente. Y cuando el histograma se desva por encima de la lnea central, que es una indicacin de la amplificacin. Cuando el histograma se desva por debajo del lnea central, que es una indicacin de su eliminacin. Y se puede ver que, por

ejemplo, el cromosoma 7 es ampliamente amplificada en este paciente en particular. Se trata de un paciente con cncer de cerebro. Cromosomas 9 y 10 muestran deleciones a gran escala y el cromosoma 19 tambin muestra la amplificacin. Diapositiva 49 Si nos centramos en los cromosomas, en el cromosoma 7, se puede ver el amplificacin general de ese cromosoma. Y tambin se puede ver una amplificacin especfica en 7p11.2, que es donde el gen EGFR se encuentra. 13 As, este paciente tiene una amplificacin muy extensa del gen EGFR, que es un gen clave enviando seales mitognicas en la clula para acelerar su divisin de tasa. En el cromosoma 9p21, se puede ver una delecin homocigtica del CDKN2A gen, un gen crtico para regular el ciclo de divisin celular. Diapositiva 50 As que, ahora, vamos a hablar acerca de los SNP y las mutaciones que se remonta hasta el otro extremo de la escala. Y en el esfuerzo para detectar las mutaciones, ya he mencionado que hay puede ser y existe una tasa de error en la secuencia de ADN que es mucho ms grande que la tasa de variacin que se encuentra en condiciones normales y en los tejidos enfermos. Diapositiva 51 Por lo tanto, cuando descubrimos las diferencias, es importante para validar los diferencias, y por lo general hacen que el uso de una tecnologa de segunda, un segundo qumica. Por lo tanto, si tuviramos que generar la secuencia en el secuenciador SOLiD y recoger la variacin, en ese caso deberamos validar tal vez un 454 secuenciador o una secuencia de Sanger. Diapositiva 52 A medida que estas tecnologas se estn desarrollando, en la secuenciacin del genoma humano Centro, estamos a la cobertura de la secuenciacin profunda entre 20x y 30x utilizando la slida plataforma, y estamos al mismo tiempo la secuencia de 6x a 10x cobertura utilizando el secuenciador 454. Y esto proporciona una validacin global cuando vemos mutaciones en ambas - cuando vemos variacin en tanto plataformas. [0:30:12] Diapositiva 53 Esto demuestra nuestra cartera global para el procesamiento de estos datos. Cada vez que son la determinacin de la secuencia del genoma, tenemos que mirar tanto el tumor como la normal. Y as, en este caso concreto, se recogieron los datos de lectura el tumor en la normal a la cobertura de 15x. Tenemos un mapa de la lee de

nuevo a el genoma, de vuelta a la referencia mediante Corona Lite, que es un software de AB, y detectar todas las variantes. Con estas variantes, somos capaces de crear una lista electrnica de la sonda. Y hacer un experimento que es muy similar a un SNP matriz, salvo que lo haga por va electrnica y llamamos a este eGenotipado donde podemos mirar hacia atrs en las lecturas de la plataforma 454 y encontrar el variacin en las lecturas sin tener que volver a asignar todos los lee al genoma. Eso nos da una lista de la variacin vlida tanto en el tumor y el normales. Y a continuacin, restando la variacin normal del tumor variacin, se obtiene la lista de mutacin. Diapositiva 54 Los resultados de uno de nuestros primeros experimentos con el cncer de cerebro, hemos encontrado ms de 2,2 millones de variantes de alto rigor y precisin muy alta. Este llev a travs del e-genotipo en la validacin de una coleccin de casi 6000 mutaciones somticas de los cuales 5 de ellos podran causar un cambio de sentido errneo. 14 Diapositiva 55 Y la siguiente diapositiva muestra una lista de siete de esos cambios de sentido errneo que podra estar implicado en el cncer. Estos son en genes que tienen se conoce en otros tipos de cncer a participar en la enfermedad. Diapositiva 56 Por lo tanto, pensar de nuevo acerca de los costos actuales del genoma humano, estamos en un punto donde por aproximadamente $ 100,000 hoy en da, podemos hacer una completa genoma. Pero eso es todava bastante caro para el procesamiento de un gran nmero de muestras. Por lo tanto, para esta aplicacin, nos dirigimos a la captura tcnicas de secuenciacin dirigido que John McPherson mencionados. Diapositiva 57 En el Centro del Genoma, utilizamos la plataforma de NimbleGen. Y tenemos que genera fichas completas exn para la captura de todos los exones de la conocida los genes. Y en concreto, que el aislamiento y secuenciacin de los exones de profundidad cobertura. Diapositiva 58 Esto muestra el perfil de un experimento tpico normalizar todo el objetivos a una longitud de 100. Y usted puede ver que la cobertura es bastante uniforme sobre la zona de destino en azul. Y que hay algunas sangran ms en lo que llamamos la memoria intermedia. Debido a que los fragmentos de ADN que estn

de ser capturados son bastante grandes y para que los resultados - as, estn en el orden de aproximadamente 3 a 500 bases, y que lo que los resultados en alguna extensin a las secuencias flanqueantes. Diapositiva 59 Por lo tanto, con esta tecnologa, hemos sido la secuenciacin de pncreas adenocarcinoma. Y de nuevo, la comparacin de un tumor a la normalidad, por el momento tenemos en nuestros experimentos de 3000 sin sentido y mutaciones sin sentido. La cobertura sigue siendo baja en este punto. Pero a medida que aumentamos la cobertura, la exactitud de este experimento se mejoran. Sin embargo, actualmente, hemos encontrado tres mutaciones que tambin estn en el Base de datos de COSMIC. Y as, la bsqueda de mutaciones que se han visto antes es un fuerte indicio de que van a ser real. Y as vemos tres genes que se sabe que estn implicados en el cncer que tambin han sido mutado en este paciente. Diapositiva 60 As, en resumen, la cobertura de secuencia de profundidad por la prxima generacin de los mtodos es con precisin el descubrimiento de las mutaciones relacionadas con el cncer. Multi-plataforma planteamiento est dando la validacin rpida en nuestros resultados. Y el eGenotipificacin mtodo que hemos desarrollado con rapidez y eficacia evala los datos en bruto de secuenciacin de SNP y las mutaciones conocidas. Gracias. 15 Sean Sanders: Muy bien. Muchas gracias, doctor Wheeler. Diapositiva 61 Por lo tanto, vamos a entrar de lleno en la sesin de Q & A ahora. Gracias a todos por sus presentaciones. Hemos tenido una serie de preguntas que vienen, pero estoy va a empezar con uno que lleg a travs de correo electrnico, y lo voy a pasar a El Dr. Grimmond primero. El espectador se pregunta cunta profundidad de cobertura es necesario o adecuado para el cncer de anlisis de transcriptoma, por ejemplo la deteccin de SNPs de codificacin? [0:35:18] El Dr. Sean Grimmond: Muy bien. As, en el caso del anlisis transcriptoma, la profundidad depende realmente sobre la cuestin que desea hacer. Si slo ests buscando en el genoma o la actividad del gen similar a un experimento de microarrays, que slo puede estar tomando

aproximadamente 10 millones de lecturas se requieren. Pero si quieres obtener una informacin completa la cobertura de todos los exones que se expresan, es probable que tenga en el orden de 100 a 150 millones de lecturas de esa muestra. Ya sabes, a esa profundidad, los genes que se expresan a 100 copias por clula, usted tendr una excelente cobertura de los. Y, de hecho, que los que son altamente expresar, un millar de copias por clula, que tienen un enorme cobertura. Sin embargo, usted comenzar a bajar a la profundidad requerida que necesita en las transcripciones raras. Sean Sanders: Uh-hum. El Dr. McPherson? El Dr. John McPherson: Slo para convertirlo en una cuestin de ADN del genoma, as que la cobertura no David mencion acerca de la cobertura de 30x como un objetivo. Y eso es muy tpico estos das, de aproximadamente 30x cobertura de un genoma en promedio. Y a continuacin, a llamar a un SNP en una regin, que necesita de 8 a 10 veces ms en una regin. Usted necesita de 8 a 10 veces cobertura de slo una parte de un problema de toma de muestras para asegurarse de que usted ha visto tanto alelos. Para la aplicacin con el cncer, es posible que tenga que ir mucho ms profundo y hacer el heterogeneidad de la poblacin del tumor y / o la contaminacin con normales. Sean Sanders: Muy bien. El Dr. Wheeler? El Dr. David Wheeler: Si. Para eso, debo aadir, en el tecnologa de captura, de hecho vamos mucho ms profunda ahora. Estamos tratando de llegar hasta cerca de media 150x cobertura. Esto se debe a la cobertura mnima que se necesita llamar a un mutacin, como dijo Juan, es de aproximadamente 8 a 10 veces. Y este descubrimiento es impulsado por la cobertura mnima. Por lo tanto, se necesita un promedio de cobertura de alta para conseguir este 16 mnimo de cobertura en la mayor parte de los objetivos. Por lo tanto, es algo anloga a esta situacin con la ARN-ss. Sean Sanders: Uh-hum. Muy bien. Por lo tanto, haba una pregunta vienen en uno de nuestros televidentes sobre la reciente artculos en el New England Journal of Medicine. Y ha habido una par de preguntas sobre esto, acerca de una cierta controversia acerca de si especialmente en la secuencia del genoma entero, la totalidad de asociacin del genoma Los estudios son vlidos para - usted sabe, por lo que este espectador se pregunta, se han limitado valor. Y cul es su opinin. As, tal vez vamos a empezar con el Dr.

McPherson. El Dr. John McPherson: Es una buena pregunta. Por cierto, histricamente, ha habido una gran cantidad de Los estudios de asociacin que no se han analizado detalladamente. Y creo que se debi a pequeos nmeros: tamao pequeo de la muestra. Ahora, las personas se estn uniendo, poblaciones muy grandes que estn estudiando, la bsqueda de picos, que son conseguir de forma independiente validado en otras poblaciones. Y creo que que las regiones que estn siendo identificados son reales y va a ser un xito. Sean Sanders: Uh-hum. El Dr. John McPherson: La siguiente pregunta es, cul es el siguiente paso? Cmo se reduce a lo que es la mutacin causante real? Ests viendo un marcador que se encuentra cerca. Pero, cmo se encuentra la causal real. Sean Sanders: Uh-hum. Muy bien. El Dr. Wheeler, tal vez le gustara aadir algo. El Dr. David Wheeler: Si. Slo para establecer un contraste entre la asociacin del genoma completo y lo que hemos estado hablando aqu. As que con el G-ondas, ya que son sabe, estamos buscando la predisposicin gentica a una enfermedad. Y as, esa es una pregunta un poco diferente que las mutaciones somticas que hemos estado hablando acerca de donde se compara el tumor y el normal dentro de un determinado paciente en busca de cambios somticos. Sean Sanders: Muy bien. Excelente. Una pregunta acerca de la secuenciacin de prxima generacin. Dnde estn los cuellos de botella de la derecha ahora? Cules son los problemas? Veo el Dr. Grimmond sonriendo. Vamos a tirar ese en el que entonces. El Dr. Sean Grimmond: Yo podra empezar y voy a reclamar la tierra alta, que es la bioinformtica. La mayor reto en este momento en el tiempo es el requerido para la bioinformtica tener una cantidad tan grande de datos y convertir esos datos en conocimiento. As, 17 a partir de la asignacin a travs de la identificacin de variantes para hacer llamadas en aquellas variantes, y luego dando una cierta penetracin biolgica a que es un ejercicio enorme. Y, creo, lo que hemos visto aqu es con los gustos del ICGC, necesitamos para hacer esto a gran escala. Por lo tanto, tenemos un gran nmero de pacientes. Por lo tanto, podemos empezar a relacionar estos eventos con la enfermedad, lo que significa la toda iniciativa es enorme. Sean Sanders: Muy bien.

El Dr. John McPherson: Creo que otro cuello de botella est consiguiendo realmente buenas muestras de analizar. Si queremos hacer un gran nmero, necesitamos un gran nmero de buenas Las muestras de calidad y con el consentimiento informado para la adecuada a gran escala secuenciacin. Y as, muchos de los estudios que estamos librando ahora, no estamos usando algunas de las colecciones antiguas que han existido. Estamos partida para recoger de nuevo. Y algo as como el cncer de pncreas que Sean y yo estamos muy interesados en David, y as, es un poco comn cncer. Y as conseguir la coleccin como para buscar a 500 va a ser un reto en s mismo. [0:40:10] Sean Sanders: Muy bien. Grande. Por lo tanto, a continuacin de eso y algo que el Dr. Wheeler estaba hablando antes sobre la comparacin de tumor y normal muestras. Tenemos una pregunta sobre si se puede abordar la relacin impactos de la atencin escribiendo el tumor y una cuidadosa seleccin del paciente antecedentes genticos y el patrimonio, y mirando el medio ambiente. Entonces, cmo los tienen un impacto en su toma de muestras y su anlisis? El Dr. John McPherson: Supongo que, puedo empezar con eso. Comience con el medio ambiente. El medio ambiente es obviamente muy importante en hacer la investigacin del cncer. Cuando recoja el muestras, hay una gran cantidad de informacin adicional y datos clnicos que tambin viene con eso. Pero desde el punto de vista de lo que estamos buscando menos, es una especie de anlisis de aguas abajo. Y en la seleccin en este momento, estamos mirando ms de los cambios somticos, los cambios, las mutaciones que se han producido en el tumor. No s Sean si usted quiere recoger en eso? El Dr. Sean Grimmond: S, creo que el foco principal de algunos de estos genoma del cncer iniciativas en este momento es hacer que el Atlas de los acontecimientos somticos. Creo que, es muy importante reconocer que no van a ser el medio ambiente componentes y otros componentes de conduccin estas enfermedades. Tenemos que 18 capturar esa informacin. Una vez que el atlas se ha presentado con un gran nmero de muestras, entonces podemos empezar a hacer esas correlaciones. Sean Sanders: Uh-hum. El Dr. John McPherson: Si. Creo que a los que yo podra agregar que la mayora de los cnceres tienen una gran variedad de subtipos. Y una de las cosas que estamos tratando de hacer con estas

mutaciones atlas es ayudar a los ms sub-clasificacin de los tumores. Y as como los datos medida que ms datos se est generando y tomamos conciencia de ms subtipos, creo que ser capaz de hacer preguntas cada vez ms especficas con los datos de secuenciacin. Por lo tanto, slo estamos en los albores de este nuevo campo en estos momentos. As, el espectador plantea una cuestin muy importante que creo que a desarrollarse en los prximos aos. Sean Sanders: Muy bien. Excelente. Una pregunta ms especfica sobre la normalizacin de los datos de transcriptoma secuenciacin, cmo se hace esto? El Dr. Sean Grimmond: Por lo tanto, los datos de transcriptoma puede ser tratado como la matriz de datos normales siempre hay algunas normalizaciones, que normalmente no se ver. Para entrar en los detalles de cmo el transcriptoma es tpicamente secuenciado, tomamos todos los ARN y lo rompe en pedazos pequeos. Y que se hace por conveniencia, para que podamos entonces secuencia con el plataformas de nueva generacin. El reto no es que si una transcripcin es muy, muy largo, se puede obtener una gran nmero de etiquetas. Y si una transcripcin es muy, muy corto, es probable que tener menos fragmentos. Por lo tanto, hay una cierta normalizacin que usted puede hacer para tener en cuenta la longitud de transcripcin. Pero aparte de eso, una vez que los datos es recolectada, entonces, supongo, igualar los pasos de la secuencia. As, si nos tenemos dos muestras, una muestra normal y una muestra del tumor, lo haramos asegurarse de que cuando empezamos a hacer las comparaciones una vez que han sido longitudes normalizadas, que tenemos un nmero similar de etiquetas. Por lo tanto, nos mira en la abundancia relativa por 10 millones de lecturas o lo que sea. Y entonces slo puede ser tratado como una secuencia de datos estndar. Sean Sanders: Muy bien. Por lo tanto, aqu est uno para usted. Cree usted que la secuenciacin de prxima generacin reemplazar la tecnologa de microarrays? Por lo tanto, el Dr. McPherson, que desea iniciar con eso? El Dr. John McPherson: En muchas reas, creo que ya lo tiene. 19 Sean Sanders: Uh-hum. El Dr. John McPherson: Pero no por completo. Todava es - por ejemplo, el anlisis del nmero de copias, sigue siendo muy barato hacer un microarray en comparacin con la secuenciacin. Y estamos haciendo el anlisis de microarrays para el nmero de copias. Usted puede obtener el nmero de copias a cabo

de los datos de la secuencia, pero usted tiene que generar una gran cantidad de la secuencia de lo cubre. As que, creo, muchas aplicaciones han reemplazado a algo as como chip-ss de ejemplo o chip-chip ha sido sustituido por chip-ss. Las ventajas claro es que usted no tiene que decidir qu poner en el microarray. Por lo tanto, es verdadero descubrimiento en comparacin con un anlisis de lo que usted piensa que ya se saber. Sean Sanders: Muy bien. El Dr. Wheeler? El Dr. David Wheeler: Por lo tanto, la tecnologa de anlisis en fase slida de expresin y CGH array, esas tecnologas estn avanzando tambin y cada vez menos costoso. Por lo tanto, hay una especie de carrera de caballos pasando y es difcil predecir lo que ocurrir tambin en el futuro lejano. Hemos visto la secuencia hacer incursiones cada vez ms en lo que sola que sea claramente el dominio de estas metodologas en fase slida. Creo que, como Juan dijo, que esos avances se continuar por un tiempo. Es difcil saber si alguna vez va a sustituir completamente uno para el otro. [0:45:07] Sean Sanders: Muy bien. Dr. El Dr. Sean Grimmond: me gustara hacer un comentario rpido all que creo que las matrices son todava muy ms escalable que la secuenciacin. Puede analizar los datos en su computadora porttil y, en este momento, necesito un super ordenador para ver la secuencia de datos. Por lo tanto, hay algunas diferencias reales en la facilidad con que stas plataformas puede ser utilizado. Creo que desde un punto de vista de que la expresin matrices sin duda tienen unas piernas sin embargo, desde hace algunos aos. Sean Sanders: Uh-hum. El Dr. Sean Grimmond: Debido a que puede procesar un gran nmero de muestras y luego profundizar con el enfoque de secuencia. Si pones los dos juntos, entonces sabemos lo que estamos viendo en los arreglos, y en el uso de la herramienta en funcin de la tarea que va a asumir. Sean Sanders: Muy bien. 20 Parece que 5 'regiones no traducidas no son secuenciados tanto como 3' UTRs. Est de acuerdo con esto y usted tiene algn comentario sobre el problema? Wheeler, que desea iniciar? El Dr. David Wheeler: Por lo tanto, en el contexto de la secuenciacin del genoma completo, por supuesto, vemos todo. En el exn entera de que estaba hablando antes, en la actualidad slo estamos mirando el - o que estamos buscando principalmente en la codificacin de

secuencia. La secuencia de codificacin de hoy es lo que entendemos y puede el ms fcil de interpretar. Por lo tanto, el paso del tiempo y comprender mejor y mejor a las seales en efecto, tanto el extremo 3 'y 5', creo, la captura metodologas comenzar a incluir esas regiones. Sean Sanders: Dr. McPherson? El Dr. John McPherson: Creo que - casi me haba ordenar de acuerdo con esa afirmacin. Yo creo que - No de David, pero la pregunta y la forma en que fue formulada. Creo que extremos 5 'se muestrean con frecuencia ahora. No estaban en el pasado porque muchas de las tcnicas eran en realidad recoger las etiquetas 3 "para ejemplo. Sean Sanders: Uh-hum. El Dr. John McPherson: Pero, ciertamente, en las matrices de captura y otros mtodos de aislamiento cosas especficas, definitivamente estamos buscando en los extremos 5 'de genes. Y Ciertamente, como Sean, dijo con transcriptoma, nos fijamos en todo el transcriptomes, usted est consiguiendo todo. El Dr. Sean Grimmond: puede ser que haga un punto de ah que si usted echa un vistazo a algunos de los RNAseq trabajo que es por ah por el momento, muy a menudo, usted ve una falta de representacin de los extremos de los 5 '. Y hay una serie de razones metodolgicas para ello. Si tira el ARN del extremo 3 'y hay un poco de la degradacin, ver una representacin insuficiente de los 5 ' final. Sin embargo, todas las metodologas estn presionando para que iguale a cabo estas da. Sean Sanders: Uh-hum. Por lo tanto, voy a darle una pregunta ms prosaica de una escuela secundaria estudiante. Queran - claramente un amante de los animales. Ellos queran saber si usted puede hacer esto en los seres humanos, puede hacerlo en animales? El Dr. John McPherson: Es la secuencia? Sean Sanders: Los tipos de experimentos que estamos haciendo aqu. 21 El Dr. John McPherson: Por supuesto. Y, de hecho, el cncer de la secuencia que estamos haciendo, estamos en realidad - no son modelos de ratones que podran ser utilizados. Y estamos haciendo realmente secuenciacin de xenoinjertos, que son tumores que son implantados en ratones. Sin embargo, su ADN es el ADN, usted puede hacer esto para los animales, que puede hacer esto por bacteria, que puede hacer esto para nada. Sean Sanders: Y los resultados que estamos obteniendo con estos estudios son tiles en humanos? El Dr. John McPherson: Creemos que s. Sean Sanders: As es. [Risas] En realidad, lo que nos trae, supongo, para costar tan bien y tenamos una pregunta

que le pregunt sobre la - ya que el costo de la secuenciacin del genoma completo sigue bajando, se siguen enfoques especficos a emplear o hacer usted piensa que slo va a ser la secuenciacin de genomas completos? Y, yo adivinar, esto va a la cuestin de los datos tambin. Tal vez, el Dr. Wheeler, usted comenzar a nos disuadi. El Dr. David Wheeler: Si. Creo que para - el objetivo ser utilizar tumor de un paciente determinado ADN para ayudar a diagnosticar y ayudar a delinear un curso de tratamiento para la paciente. Y para hacer eso, lo ms probable es ir con todo el genoma secuenciacin. No puedo decir que los enfoques dirigidos no tendra investigacin de aplicacin o en algunos mbitos y, en algunos tipos de cncer. Pero a medida que el costo sea bajo lo suficiente para hacer toda la secuencia, creo yo, que es la direccin iremos. Sean Sanders: Uh-hum. El Dr. John McPherson: Y creo que los enfoques orientados no necesariamente va a desaparecer. La pregunta mucho es que la secuencia se vuelve ms barato y ms barato, usted sabes, por qu molestarse seleccin de las regiones. Pero sigo pensando que habr muchos, muchos casos en que si lo hace un enfoque especfico, puede una piscina cientos de muestras. Y por el precio de la secuenciacin de uno, usted puede secuenciar de un centenar. Y de nuevo, se remonta al diseo experimental. Creo que t tiene que decidir qu es lo que desea ver. Sean Sanders: As es. El Dr. Sean Grimmond: Tambin me gustara aadir que hablar de la G es as [0:49:52] [fontico] experimentos, antes de que podamos encontrar una regin que predispone a algunos individuos en una base de la poblacin, es posible que una regin del genoma 22 que desea buscar en un gran nmero de muestras. Y creo que este es un excelente manera de seguir adelante con eso. [0:50:04] Sean Sanders: Muy bien. La siguiente pregunta es de, creo, un colega del Dr. Wheeler en el Baylor. Cree usted que la heterogeneidad de las mutaciones del cncer es mayor que el esperado a partir de otras enfermedades genticas, por otra gentica enfermedades? El Dr. David Wheeler: Ciertamente, la heterogeneidad de los tumores es bastante extensa. Y eso es un la zona que vamos a ser capaces de adentrarse en profundidad con la prxima generacin y la especialmente en lo que vamos a la secuenciacin de verdad una sola molcula. As que s, el cncer es

ms heterognea. Y eso es toda un rea que queda por explorado ahora. El Dr. John McPherson: yo tambin creo que algunas de las enfermedades complejas son muy heterogneos, como as. Y que, usted sabe, estamos utilizando estudios de GUS o lo que sea, estamos identificando genes que son importantes para la enfermedad. Pero teniendo en cuenta para efectos muy pequeos en general. No vamos a encontrar - salvo en algunos casos, no vamos a encontrar el gen que causa esta enfermedad en un complejo enfermedad. Creo que por eso, no hay mucho espacio por recorrer. Si se agrega a todos ellos, seguimos siendo slo la comprensin, en muchas enfermedades slo el 10% o 15% de la la causa subyacente de la enfermedad. Por lo tanto, hay una gran cantidad de heterogeneidad an no se explorado en muchas otras enfermedades tambin. Sean Sanders: Muy bien. Nuestra siguiente pregunta es sobre la preparacin de muestras y hablamos he sobre el uso de mltiples plataformas diferentes de ver las muestras. Y el espectador le pregunt si el uso de estos mtodos de la plataforma de validacin de mltiples identificar sesgos de preparacin de la muestra, si esto es algo que he visto. El Dr. McPherson? El Dr. John McPherson: Hay prejuicios en todos los mtodos y creo que lo importante es que empezar a entender, y entender los sesgos en los datos. Y si son complementarios es lo que estamos explorando. Por lo tanto, tenemos dos diferentes plataformas. Hay una cierta sobrecarga de participar en el mantenimiento de dos plataformas diferentes y las prepas de la muestra son levemente diferente. Son muy similares en muchos pasos tambin. Y estamos tratando de combinan todos los pasos que nos lo podemos tener ms de una sola va que difiere en un par de puntos. Pero, en general, pienso que slo hay que 23 comprender los sesgos y esperan existen sesgos. Y qu es nuestra esperanza que van a ser algo complementario. Sean Sanders: Uh-hum. Muy bien. Una cuestin sobre la secuenciacin sola clula, es posible secuencia las clulas individuales? Y tambin ha habido algunas preguntas sobre la madre del cncer clulas. As que tal vez podemos hacer frente a eso tambin. El Dr. Grimmond? El Dr. Sean Grimmond: Ha habido un trabajo muy poco mirando a la secuenciacin del

transcriptoma de las clulas individuales, que ha sido recientemente publicados. Y eso sin duda se abre una gran cantidad de emocin para nosotros para poder tomar individuo las clulas cancerosas y empezar a abordar la heterogeneidad general que vemos en el transcriptoma. Todava creo que es muy difcil tambin. No ha habido algunos trabajos realizados en las bacterias, en las clulas individuales en el trabajo del genoma, pero una vez que vaya con el tamao de los genomas de mamferos, todava es muy difcil de trabajar en ese nivel. El Dr. John McPherson: S, estoy de acuerdo. Creo que es difcil de conseguir en un anlisis exhaustivo sola clula a este punto en el tiempo. Y yo a m mismo pensar que el Santo Grial iba a ser capaz de hacer todo este trabajo en una sola celda. Y cuanto ms pensar en ello, creo que, ya sabes, estoy muy contento con los pequeos poblacin de clulas que pueden analizar. Celda individual no hay repeticiones. Usted obtiene un punto de datos y vas a tener que media en varias celdas, creo, de todos modos. Por lo tanto, creo que, desde un punto de vista de investigacin de la comprensin de cmo una clula funciona, es una herramienta muy importante que se sigue desarrollando. De el punto de vista de lo que estoy tratando de hacer, voy a ser feliz si es capaz de bajar a cientos de clulas en lugar de una sola clula. Sean Sanders: Uh-hum. El Dr. David Wheeler: S, creo que esto se remonta a la cuestin de la heterogeneidad y son los tumores famosos por su gran heterogeneidad. Y hay preguntas especficas podemos preguntarnos si podemos conseguir en el nivel de clulas individuales. As que, creo, hay una fuerte motivacin para llegar al nivel de clulas individuales con el tiempo, y tal vez algunos de los secuenciadores de tercera generacin ser capaz de darnos esa tecnologa. Sean Sanders: Muy bien. Por lo tanto, no hemos hablado mucho sobre la epigentica o cambios epigenticos que Voy a tirar una pregunta sobre la secuenciacin de bisulfito. El espectador dice que cuando 24 que s la secuenciacin de bisulfito para controlar la metilacin del ADN lo que es el porcentaje del genoma que no se puede evaluar debido a reducirse complejidad? Entonces, quin le gustara tener uno en que? [Risas] El Dr. John McPherson: Voy a saltar en, supongo. No s la respuesta exacta a eso. Ciertamente,

cuando las longitudes de lectura eran bastante corto, que era un problema grave en el intento para asignar de nuevo con el genoma. Leer longitudes son cada vez ms largos. Hay trucos en las obras que le permiten trazar mejor las cosas. Por lo tanto, no estoy seguro de que en este punto, qu porcentaje va a ser no es accesible. Creo que en el final, no ser muy diferente de tratar de asignar a los inconversos vuelve a leer. [0:55:01] Sean Sanders: Uh-hum. El Dr. John McPherson: Pero en este momento, yo realmente no s lo que es el porcentaje. Es sin duda menor que mirar Lecturas regular, pero sigo pensando que en realidad es bastante alto. Sean Sanders: Muy bien. Tengo una pregunta sobre el uso de parafina las muestras tumorales. Alguno de ustedes con este tipo de muestras y qu tipo de xito has logrado? El Dr. David Wheeler: Por lo tanto, tenemos algunas colecciones muy grandes de las muestras de tejido que son embebidos en parafina y esta es un rea muy difcil en estos momentos. Hay motivacin muy fuerte para tratar de ser capaz de hacer la secuenciacin de ADN de este material porque las colecciones son tan extensas. Es difcil. La desafo proviene de la degradacin del ADN. Pero hay una gran cantidad de investigacin activa en marcha para tratar de reducir al mnimo el dao al ADN. En la actualidad, los rendimientos de recuperacin son bastante buenos. Y as, es convirtindose en la prctica de tomar este ADN y utilizarlo en el contexto del exn capturar, y los investigadores estn tambin con xito la obtencin de ARN. As que, creo,

25

que.

Y creo que

Creo que

tratamiento.

26 Qu

La

Y,

Muy bien.

27

Adis. Gracias.
Deshacer cambios Nuevo! Haz clic en las palabras anteriores para editar y ver traducciones alternativas. Descartar Traductor de Google para empresas:Google Translator ToolkitTraductor de sitios webGlobal Market Finder Desactivar traduccin instantneaAcerca del Traductor de GoogleMvilPrivacidadAyudaEnviar comentarios

S-ar putea să vă placă și