Documente Academic
Documente Profesional
Documente Cultură
Introduccin
La secuenciacin de DNA es un mtodo utilizado para conocer la secuencia de un fragmento,
para cualquier experiencia posterior. Por ejemplo, para hacer un mapa de restriccin, para
determinar si existe un marco de lectura abierto, para poder hacer mutagnesis dirigida, para
conocer la secuencia que codifica una protena y relacionarla con otras protenas (ver a que familia
pertenece, homologas, etc.), para determinar secuencias no codificadoras y reguladoras, entre
otras.
En general, los geles utilizados en la secuenciacin son geles de poliacrilamida desnaturalizante
(urea), de muy alta resolucin que permiten que el DNA corra como simple cadena. Se los usa al 6
8%, y permiten resolver secuencias muy grandes de DNA (hasta 800 1000 nucletidos) que se
diferencian en una sola base de longitud. Estos geles son conocidos como geles de secuencia.
En las reacciones de secuenciacin se realizan 4 reacciones de secuencia, una correspondiente
a cada una de las bases que se va a determinar. Se genera un set de oligonucletidos que tienen
un extremo 5 fijo, pero varan en la longitud del extremo 3. Este set tiene todas las longitudes
posibles que se diferencian en una base y que se resuelven en calles adyacentes en un gel de
secuencia.
Existen diversos mtodos de secuenciacin, que se diferencian en la forma de generacin de
estos fragmentos de DNA. Entre ellos se encuentran el mtodo enzimtico y el qumico, que
generan un conjunto de molculas de DNAss de distintas longitudes.
Mtodos de secuenciacin
Mtodo enzimtico:
Ideado por Sanger en 1977. Es el mtodo ms utilizado. En el mismo se utiliza una DNA
polimerasa para generar una copia marcada simple hebra complementaria al DNA molde que se
desea secuenciar. Se basa en que la polimerasa tiene la capacidad de incorporar
desoxinucletidos (dNTP) y didesoxinucletidos (ddNTP). El ddNTP (2, 3) no posee el OH 3, si no
que tiene un H, por lo que la polimerasa no puede agregar otro nucletido, y la polimerizacin se
detiene. Se utilizan oligos sintticos de 17 20 bases. Se deben realizar 4 reacciones para leer
cada uno de las 4 bases del DNA. Lo que se debe agregar en el tubo es el molde simple hebra, el
primer, la polimerasa, los dNTP (de los cuales uno debe estar marcado) y un ddNTP diferente en
cada tubo.
Mtodo original o de Sanger: Lo que se hace es colocar en 4 tubos distintos el molde simple
hebra, el primer, la Klenow (que no puede corregir errores), dNTPs (de los cuales uno debe
encontrarse marcado para poder marcar la hebra naciente) y un ddNTP, que debe ingresarse uno
de cada tipo en cada uno de los 4 tubos. El producto de estas reacciones se va a sembrar en 4
calles de un gel de poliacrilamida. Este gel va a ser luego expuesto a una placa radiogrfica y lo
que se va a leer es la hebra recin sintetizada, por lo que es complementaria a la cadena molde. El
gel se lee desde abajo porque all se encuentran los fragmentos ms pequeos, que pertenecen al
extremo 5. Todo se realiza en un solo paso.
Mtodo Sanger modificado, o de Tabor Richardson: Este mtodo usa la t7 DNA polimerasa
modificada (secuenasa). Esta enzima pierde la actividad 35 exonucleasa, es mucho ms
eficiente que la Klenow o Taq porque tiene una capacidad de discriminacin de anlogos 100
veces menor y es muy procesiva. Adems, la marcacin del DNA y la terminacin de la
polimerizacin se realizan en 2 pasos diferentes. Por un lado, uno puede asegurarse de que la
hebra de DNA se marque, y por otro lado, regulando la concentracin de los dNTPs se puede
correr la lectura. Los pasos son:
Anillado: DNA molde ms el primer.
Marcacin: Secuenasa ms una baja concentracin de dNTPs (de los cuales uno debe estar
marcado). En estas condiciones la enzima tiene baja procesividad.
Terminacin: Alta concentracin de dNTPs ms un ddNTP (uno distinto en cada tubo), lo que
provoca una terminacin de la polimerizacin del DNA.
Detencin de la reaccin: Concentracin elevada de los 4 dNTPs de manera que la enzima
termine de polimerizar todas las molculas generadas no por la incorporacin de un ddNTP sino
porque la polimerasa se desprendi aleatoriamente. Esta detencin tambin se realiza en el
mtodo original.
Cuando termina la reaccin, se agrega una solucin de stop que tiene formamida, la cual
desnaturaliza la enzima y el DNA. Por ltimo, se hierve a 94 C durante 2 minutos, de manera que
se deshibride completamente.
La secuencia se lee a partir de los 20 30 nucletidos, porque estos primeros no poseen
nucletidos terminadores (la cantidad de nucletidos a partir de los cuales se puede leer la
secuencia va a depender del tiempo de la etapa de marcacin). Hasta una polimerizacin de
aproximadamente 30 pb no se agregan los ddNTPs y ademas en las condiciones en las que se
corta la corrida, esas primeras molculas pasaron de largo.
Mtodo qumico:
Este mtodo fue diseado por Maxam Gilbert en 1977. En el mismo se usan reactivos qumicos
que modifican las bases de forma especfica. La ventaja que posee es que el DNA puede
encontrarse como doble o simple hebra, pero presenta la desventaja de que el DNA debe
encontrarse marcado si o si en un solo extremo. Despus del tratamiento con los agentes
qumicos, se agrega piperidina, que lo que hace es clivar el enlace fosfodiester entre una base
modificada y otra no modificada. Pasos:
Marcacin de un extremo del DNA (ya sea doble o simple hebra): se corta con una enzima de
restriccin que deje extremos 5 sobresalientes, y luego se agrega la Klenow ms un nucletido
marcado para poder rellenar. Despus se realiza un segundo corte con una sola enzima que
escinda un solo extremo y lo deje romo.
Modificacin especfica de las bases de DNA: el DMS (dimetil sulfoxido) metila N 7 de las
guaninas (G); el cido frmico protona los N de los anillos de purina (G + A); la hidrazina rompe los
anillos de pirimidinas (T + C); la hidrazina ms NaCl produce la reaccin slo con citosinas (C).
Agregado de piperidina: se clivan las bases modificadas.
Corrida en gel: se lee desde abajo (porque el marcado es el extremo 5; se ve slo lo marcado,
desde 5* hacia distintas longitudes, correspondiendo los tamaos con las bases que se cortaron).
La lectura es diferente. Por ejemplo, si existe una banda en G+A y tambin en G, la base es una G;
en cambio, si existe G + A pero no G, se trata de A.
Este mtodo es muy utilizado para la secuenciacin de oligonucletidos.
Gel de corrida:
Los geles de secuencia son muy delgados, del grosor aproximado de una placa radiogrfica. Las
corridas son verticales. Este gel se arma entre 2 vidrios separados por un espaciador del espesor
del gel, los cuales se colocan a ambos lados de los vidrios. Estos vidrios deben estar muy bien
pulidos, poruqe cualquier deformacion deforma mucho la corrida.
Cuando se coloca el gel no deben quedar burbujas, porque cualquier alteracin va a modificar el
gel, por lo que no se va a poder leer la corrida. Generalmente, la mezcla se carga por abajo con
una jeringa y luego se calza el peine.
Antes de la siembra, lo que se hace es precorrer el gel a una temperatura aproximada de 50 C
durante una hora, para homogeneizar la temperatura en todo el gel y eliminar los catalizadores
(ejemplo, APS). De esta forma se asegura que el ADN se mantenga desnaturalizado. Se debe
tener cuidado con la temperatura, la cual se va regulando con el voltaje, porque al ser el gel tan
delgado el efecto Joule es enorme. Los soportes empleados, por lo general, vienen con un
termmetro en el vidrio que va desde 40 a 60 C. Se utiliza un gel de arcilamida de 6 8%. Los
colorantes, que se le colocan a la muestra antes de sembrar, son el bromofenol blue (que corre
como si tuviera 10 nucletidos) y el xilencianol (que corre como si tuviera 106 nucletidos), siendo
este ltimo celeste.
La siembra se realiza con el peine puesto, colocando 3 L por pocillo. La corrida se realiza a
3000 V. Cada desplazamiento de 100 bases demora 3 horas. Se pueden hacer hasta 3 corridas (9
horas en total), lo que permite leer 300 nucletidos.
Se hace una primera reaccion, hasta que el celeste este por caer del buffer. En este momento,
se siembra una segunda reaccin en las calles de al lado, hasta que cae el azul.
Despus de la corrida, se transfiere a un papel matman y se revela en placa radiogrfica. Para
fragmentos mayores a 300 nucletidos, se realiza una secuenciacin con 2 primers distintos (1 de
cada lado), o se realiza un subclonado, para cortarlo y secuenciar los fragmentos (aunque posee la
desventaja de ser un proceso ms tedioso, que consume mayor cantidad de tiempo).
Polimerasas usadas:
Secuenasa: es una t7 DNA polimerasa modificada. No posee actividad endonucleasa. Posee
la ventaja de tener una procesividad y velocidad de elongacin elevada, no discriminan a los
anlogos de nucletidos (100 veces menor que Taq y Klenow) y poseen una temperatura optima
de 37 C < T < 55 C.
Klenow: es un fragmento de la DNA polimerasa I de E. coli. Tiene una actividad 35
exonucleasa dbil, por lo que discrimina a los anlogos (ddNTPs). Tiene la desventaja de una
disminuida procesividad (fragmentos de hasta 1 kbp) y una alta discriminacin de ddNTPs. Tiene la
ventaja de que se puede disminuir la discriminacin si se agrega Mn a la reaccin. Adems permite
el uso de dITP y 7-deaza-dGTP, usadas para modificar la estructura secundaria del DNA. Permite
la utilizacin de temperaturas de hasta 50 C.
Taq: no tiene actividad 35 exonucleasa, pero si 53. Sin embargo, la amplitaq y
termosecuenasa, no tienen esta actividad 53 exonucleasa. Tiene procesividad moderada.
Discrimina ddNTPs y dITP, pero puede usar 7-deaza-dGTP. Tiene la ventaja de permitir reacciones
de 55 70 C.
AMV-RT (transcriptasa reversa): para secuenciar RNA. No tiene actividad exonucleasa. Posee
procesividad intermedia. No discrimina anlogos de los dNTPs. Utiliza temperaturas entre 37 42
C.
Parmetros crticos:
Relacin primer / molde: a) para simple hebra, 1:1; b) para doble hebra, 2:1; c) para ciclacin
trmica, 15:1 (la cantidad de primers que se agrega debe ser equivalente a la cantidad de ADN al
final).
Temperatura de anillado: la mxima admisible segn el primer.
Longitud del DNA producido:
- Metodo de Sanger original: control sobre la relacin ddNTP / dNTP, que si es elevada, la
secuencia es ms corta.
- Metodo modificado:
Tiempo de reaccin de marcacin: cuanto mayor sea, mas larga la secuencia.
Concentracin de los dNTPs durante marcacin: si disminuye la concentracin
aumenta la procesividad.
Cantidad de molde: si es elevada, la extensin es ms corta, la marcacion es mas
corta.
Relacin ddNTP / dNTP, en reaccin de terminacin.
Problemas:
Calidad del DNA molde, debido a nicks o impurezas. Cuando se desnaturaliza, estos nicks
pueden ser usados por la polimerasa como cebadores, generando productos inespecificos.
Estos se soluciona utilizando cepas con las endonucleasas mutadas. Por otro lado, la presencia
de impurezas disminuye la eficiencia de la enzima, por lo que habra erminaciones prematuras
inespecificas.
Compresiones en el patrn de bandas del gel: se ven 2 o mas bandas a la misma altura en
varias calles y hacia arriba en el gel faltan bandas, hay un espaciamiento irregular. Se da por
estructuras secundarias que puede formar el DNA naciente (estables a la temperatura de
reaccin, urea y formamida de la solucion de stop). La solucin es aumentar las condiciones de
astringencia (como la temperatura o agregar formamida), o usar anlogos, 7-deaza-dGTP o dITP
(disminuyen la formacin de estructuras secundarias).
Terminacin prematura: se ve en todas las calles, aunsencia de bandas hacia arriba en el gel
(no hay secuencias largas). Se da porque la enzima se desprende inespecficamente, por la
estructura del DNA molde. Puede solucionarse aumentando la concentracin de la enzima,
usando condiciones termoestables (a 72 C el DNA no va a poder formar estructuras
secundarias), agregando protenas que desestabilizan las estructuras secundarias del DNA o
usando secuenciacin qumica.
Las terminaciones prematuras se distinguen de las compresiones muy fcilmente. En las
primeras se ve en todas las calles una mancha uniforme, y sobre esta no hay nada. Otra
posibilidad es que se vean algunas bandas muy tenues en la posicin donde deben estar, o sea
que el problema no es de la cadena naciente sino que estaba antes.
Ciclacin trmica: es un mtodo que posee la ventaja de necesitar poca cantidad de DNA molde
(en otras tcnicas se necesitan 2 g de DNA por reaccin) y el mismo puede estar como simple o
doble hebra. Se hacen 3 ciclos como en la PCR: desnaturalizacion, anillado y extension.
Adems, al trabajar a altas temperaturas se evitan los problemas de que la polimerasa se detenga
porque el DNA molde posee algn plegamiento (por lo que no hay terminaciones prematuras). Para
este mtodo se usa un solo primer, por lo que la amplificacin es lineal, no exponencial. Se usan
los ddNTPs, cada uno marcado con un fluorocromo distinto. La enzima utilizada es la Taq
polimerasa, aunque tambin la termosecuenasa (que comete menos errores).
Electroforesis capilar:
Las reacciones de secuenciacion se hacen en placas de 96 pocillos, de manera de hacer mayor
cantidad de reacciones por vez. El capilar se carga con un polmero, el cual puede ser de
poliacrilamida. Se siembra la muestra, y despus de la corrida se limpia el capilar, se vuelva a
cargar el polimero y asi sucesivamente. Permite hacer reacciones mucho mas largas (1200
pb/reaccion) y se pueden leer 96 reacciones en 3 horas.
El DNA marcado con fluorforos, se coloca en la placa. Un laser excita a los fluorforos, y la
computadora lee la emisin.
En los proyectos genoma los secuenciadores son totalmente automatizados, hasta las reacciones
de secuenciacin. Funcionan las 24 hs del da sin supervisin humana.
Los mtoidos de secuenciacin vistos hasta el momento permiten secuenciar fragmentos de
hasta 1000 pb. Sin embargo, esto sera muy complejo para secuenciar un genoma, y entonces se
debe idear una estrategia diferente.
En principio, se toma el genoma a secuenciar y se subclona en clones mas chicos. Es decir, se
arma una biblioteca genmica y se determina la secuencia d cada uno de los clones que la
conforman. Para estos clonados se pueden utilizar vectores plsmidos, fago , csmidos, BACs o
YACs (cromosomas artificiales de bacterias y levaduras).
Cuando se comenz a pensar en el Proyecto Genoma Humano (PGH), se desarrollaron mltiples
innovaciones tecnolgicas de secuenciacin. En 1990 surge el proyecto pblico de secuenciacin
del genoma humano, integrado por Watson y Collins. Por otro lado, Craig Venter larg un proyecto
privado. Ambos se diferenciaban por las tcnicas utilizadas para la secuenciacin, si bien el
proyecto privado comenz aos despus, llegaron a terminar juntos.
Secuenciacin jerrquica o clon-a-clon: fue el mtodo utilizado por el proyecto pblico. Se basaba
en tomar el ADN genmico, partirlo en fragmentos ms pequeos (entre 150-200 mil pb) y construir
una biblioteca BACs. A estos clones de la biblioteca genmica se les hace una agrupacin en
contigs. Un contig se define como el menor nmero de clones de la biblioteca que se solapan y
cubren una determinada regin del genoma. Como la seucenica no se conoce, por varias tcnicas
como pueden ser hibridizacin, PCR o fingerprinting, se determinan cuales clkones BAC de la
biblioteca pertenecen a una determinada parte del genoma.
A cada uno de estos insertos que forman el contig, se los subclona en fragmentos ms chicos y
secuencia. Todas las secuencias halladas deben ser filtradas: hay que corregir errores, rellenar
agujeros desconocidos que pueden quedar. Luego se ensamblan y se obtiene la secuencia de un
pedazo determinado. Por ultimo, se ensambla todo y se obtiene la secuencia genmica mediante
un programa informtico.
Cada BAC est inmovilizado en una determinada posicin en un filtro, esto se hibrida con sondas
y aquellos BACs que hibridan pertenecen a un clon. Otra forma de obtener el clon es por PCR
utilizando primers complementarios a determinadas regiones conservadas del genoma. Una vez
que se obtiene el grupo buscado, se fragmentan los clones que forman parte de este grupo,
subclona, secuencia y ensambla y se junta con los otros contigs para armar la secuencia del
genoma completo.
Shotgun cloning: fue la tcnica utilizada por el pryecto privado. En este caso el genoma es
digerido en fragmentos chicos (1000-5000 pb) por medios fsicos, endonucleasas o enzimas de
restriccin. Esto se clona en plsmidos, que admiten entre 1000 y 3000 pb, y se secuencian con
primers universales desde los 2 extremos. Al finalizar esto, todas las secuencias se deben
ensamblar. Los programas que se utilizan son mucho ms complejos y caros que los usados por el
proyecto pblico. Esta tcnica es mucho ms rpida, porque se evita un paso, pero se necesitan
muchas tecnologas.
Primer walking Mtodo didesoxi: al igual que el anterior, consume mucho tiempo. Lo que se
hace es utilizar un primer cebador (universal) para secuenciar 300 500 nucletidos de un inserto
grande. Una vez secuenciados, se arma un nuevo primer haciendo uso del extremo 3 de la
secuencia obtenida, y se secuencian otros 300 500 nucletidos. Y as se repite el ciclo hasta
secuenciar todo el inserto.
Microarrays
Solexa: es uno de los equipos ms nuevos que permiten secuenciar un billn de bases en 48
hs de corrida, sin supervisin humana. Se parte el genoma en fragmentos de 100 pb, y a cada
fragmento se le pegan colas de poliA y se marcan con un colorante fluorescente. Estos se hibridan
sobre una placa que tiene el primer especfico para esta colita, es decir, un poliT. Una vez que esto
se hibrida se hace incidir una luz que excita el colorante y permite determinar donde hay molculas
de ADN doble cadena. Despus de esto, las molculas de colorante se cortan, se lava y se
empieza a secuenicar. Para esto, se agregan los dNTPs con un colorante fluorescente pegado.
Entonces, se agrega el ATP (por ejemplo), la polimerasa lo incorpora (si debe hacerlo). Despus se
elimina la polimerasa y los dNTPs que no pegaron, se hace incidir luz sobre la placa para que el
colorante se excita y emita a una determinada longitud de onda. Y asi se determina en qu
posiciones dentro de la placa se produce la seal luminosa. La cmara lo registera, esto va a una
computadora, luego se remueve el colorante y se vuelven a agregar los otros dNTPs.