Documente Academic
Documente Profesional
Documente Cultură
El otro 75% del genoma humano es el que tiene menos tiempo de ser estudiado y ha sido mirado
de distintas formas a lo largo del tiempo. Cuando se dieron cuenta que había dna que no
codificaba lo declararon dna basura. Este dna se divide en dna único o en bajo número de copias
y el moderadamente o altamente repetitivo. Este conjunto de dna único es variable, uno puede
encontrar gene virales, genes de organismos bacterianos que han sido transferido de manera
horizontal y que se incorporan permanentemente al genoma. La transferencia horizontal es la
transferencia de genes entre organismos de distinta especie (no en forma heredada), puede ser
una infección por virus (herpes, hepatitis b, varicela).
Cuando uno mira dna en eucariontes, contienen varios números de estructuras repetidas:
satélites, microsatélites, retrotramposones, retrovirus, etc. Y cuando uno compara organismos
“cercanos”, por ejemplo homo sapiens en cuanto a heterocromatina (dna condensado y por lo
tanto no expresado), con un chimpancé, gorila... uno encuentra que hay una correlación lineal.
Entonces cuanto más de ese dna repetido hay más grande es el genoma, todos tienen la misma
cantidad de genes, entonces lo que determina el cambio en el tamaño del genoma no es el dna
codificante sino que el dna no codificante.
El otro gran grupo corresponde a secuencias de dna repetida que a su vez se divide en dna
repetido agrupado y dna repetido disperso. Dentro del dna repetido agrupado podemos
distinguir tres variedades: dos de ellas las más importante en términos estructurales para el
genoma. Una de ellas es el dna repetido centromérico. En la diapo vemos una tinsión dirigida
para la región centromérico. De este tipo de dna en la literatura se le llama dna satélite. Pero aquí
hay un detalle, porque en citogenética el dna satélite corresponde al dna ubicado en la
constricción secundaria en el telómero del cromosoma. En cambio genéticamente dna satélite es
el de la región centromérica, y se llama satélite porque se aisló por centrifugación diferencial en
un gradiente de densidad. Entonces el dna completo cuando se digiere corre como una gran
banda difusa cuando se centrífuga en un gradiente, y el dna de los centrómeros como tiene
tamaños relativamente cte corre como una banda más pequeña.
El tamaño de este dna centromérico es de 80-180pb pero los conglomerados que se forman
alineados unos tras otro pueden llegar a 5000Kpb (5 millones de pb). Esto es variable entre
individuos de la misma especie, es decir hay un polimorfismo en cuanto a variabilidad de tamaño
de este dna centromérico.
El otro tipo de dna repetido agrupado es el dna telomérico, ahí vemos cromosomas teñidos por
otro tipo de tensión en donde se ven marcados las regiones teloméricas. El tamaño relativo es de
6pb, el tamaño del conglomerado es de 100pb a 20Kpb (20 millones de pb). ¿para qué sirven los
telómeros? Una de las propuestas es que cuando uno tiene un dna fragmentado lineal (no
circular), tiene extremos romos que pueden ser objeto de exonucleasa, luego si uno tiene los
genes al borde de ahí puede ser que se vaya perdiendo información por acción de exonucleasa. Y
por lo tanto el organismo se muere, entonces la solución es que en esta región de los extremos
(telómeros), permite que no s pierda información que es necesaria. Además entre otras funciones
tienen relación con la individualidad de los cromosomas (marcadores de individualidad, que son
importantes para que los homólogos se identifiquen entre sí), localización en la mb, formación
del complejo sinaptonémico y no se replican en forma normal, con una hebra molde. Sino que
con una enzima específica “telomerasa” que es capaz de sintetizarlos de novo, y por lo tanto va
alargando los telómeros ctemente. Mucho tiempo se dijo que la vejez afecta en la acción de esta
telomerasa y por lo tanto se van perdiendo genes.
El tercer grupo de dna repetido agrupado, son una gran cantidad de dna que se agrupan
formando un conjunto que es de un trozo repetido 20 o 15 veces, pero que se encuentra en
distintas partes del genoma y no son todas iguales.
Los dna agrupado único se pueden encontrar como vntr o str, que tiene que ver con el tamaño
de la repetición. Los VNTR son repetidos de tamaños de número variable, y al STR se le mucho
por short, el repetido es de 2 a 4 nucleótidos. Estos STR se analizan en los exámenes de
paternidad. La probabilidad de cuando uno toma 16 loci y que dos personas coincidan en todos
los alelos, considerando que somos diploides, la probabilidad es muy baja. Son bastante propios
de cada individuo.
Los VNTR son tamaños “grandes” de repetidos (50 pb por ejm), los STR son más chico y
pueden tener (4 nucleótidos) repetidos en distintas combinaciones. Estos no son importantes en
términos de cantidad, pero sirvieron para mapear el genoma porque se pudo determinar donde
estaban y se pudo determinar posiciones en el genoma, y además sirve como análisis de
paternidad.
Los otros son los dna repetidos dispersos aquí están los más frecuentes. Primero están todos los
asociados a actividades retrovirales. Recordemos que un retrovirus es aquel que tiene como
material genético el rna y convertir ese material en cDNA y a partir de él generar múltiples
copias de rna codificante. En el periodo en que los retrovirus están como cDNA existe la
posibilidad de que se incorporen a un genoma, hay una buena cantidad de elementos similares a
retrovirus incorporados a nuestro genoma y que representan, junto a genes de tipo autónomo y no
autónomo, a un 8% del genoma.
Hay otro tipo de elementos móviles, tramposones de dna que corresponden a trozos de dna que
pueden moverse, porque tienen ciertas características en sus extremos que reconocen posiciones
determinadas en el genoma. Son un grupo de estructura de dna que pueden moverse como dna o
rna, que pueden moverse por retrotranscripción que son capaces de moverse. Es decir
físicamente, que se salen de un lugar y se mueven, o que la copia de ellos se mueve a otro lugar.
Tenemos dos grupos importantes de este tipo: los del tipo LINEs secuencias de inserción de
tamaño grande y los del tipo SINEs que son secuencias de inserción de retrotransposones de
tamaño pequeño. Los LINEs son básicamente autónomos, o sea portan en su interior (cuando
están íntegros) dos orf. ¿cómo saben que hay genes, como se sabe cuales son los genes? Lo que
deberíamos encontrar para saber si es un gen es encontrar una secuencia promotora, una rna
polimerasa transcribiendo, un triplete de inicio y una señal de término, señales de poliadenilación
(que sugieren donde se agregan los poli A, para ser procesado los RNAm con poli A). Ahora
entre ese camino están los intrones y nos complican, porque no codifican. Pero los bordes de los
exones son característicos, son los sitios dador y aceptor de splicing. Cuando se buscan genes se
buscan regiones con islas CPG el P de fosfato, están relacionado con la regulación de la
expresión génica asociado a los promotores, entonces busco islas CPG, identifico promotor y
encontramos el 1º exón, luego un sitio dador o aceptor de splicing y reconocemos un intrón.
Cada exón tiene una secuencia que puede ser leída, traducida completamente. Ese hecho de
secuencia legible con un codón Stop, es un marco de lectura abierto (poder leer el dna en
regiones que traducen, sin que se produzca una interrupción). Si el sistema funciona con triplete,
¿cuántos marcos de lectura abierto tenemos? si tenemos AGT... por ejemplo, puedo empezar a
leer del A, del G o del T y por lo tanto tengo 3 marcos de lectura. Pero también debo leerlo al
revés, yéndome por la otra hebra hasta encontrar un marco de lectura abierto. Esto es lo que
hacen los software, buscan elementos de estructura de los genes y leer marcos de lectura abierto
en las regiones que consideran, según los algoritmos que tienen, exones. Hasta que ese gen no se
descubre realmente done esta el mensajero y el mensajero se asocia a esta posición genómica, no
se sabe si el gen es verdadero o no verdadero.
Este gen LINEs tiene dos marcos de lectura abierto, que uno esta asociado a la transcriptasa
reversa y el segundo que está asociado con una actividad de que el transposón se inserte en una
región distinta. Entonces cuando un LINEs está completo es capaz de: la rna polimerasa del
huésped (considerando como parásito al extraño en nuestro genoma), produce el rna y este
codifica para proteínas y una de esas es una transcriptasa reversa que es capaz de tomar ese rna y
convertirlo en cDNA, y este se puede incorporar al genoma y se copia. La gracia de esto es que
los LINEs quedan donde estaban. En diapo vemos el LINE marcado en negrito su sitio de unión
para rna polimerasa, la polimerasa humana produce el trascrito, este mensajero contiene dos
genes codificados que se traducen dos proteínas y una de esas proteínas tiene la capacidad de
producir cDNA a partir de rna y la otra proteína puede reconocer la región y permitir que esta
hebra que se está formando se una acá, y la dna polimerasa completa la doble hebra. Y así se
mueve. Afortunadamente esas regiones de unión de rna polimerasa pueden ser reguladas
mediante metilación, acetilación y metilación de histonas. Estas zonas están bajo una condición
de represión de la transcripción, es decir estos LINE no se transcriben como locos porque si no
se moverían dentro del genoma ctemente.
Los SINEs son más chicos, 280 pb 600 pb, los más comunes son los Alu. Pero si nos fijamos
tiene un poliA y regiones para que se una la polimerasa, pueden transcribir. Pero ellos por sí
solos no se pueden mover, requieren que haya algunas actividad de transcriptaza reversa presente
en la célula para que pueda moverse. En total si se suman, representan el 34% o más del genoma.
Y ahí vemos un resumen de su distribución y características en forma general. Las familias más
representativas de los retrotramposones SINE y LINE: son los Alu y LINE1. longitud del
fragmento para el caso de Alu 280pb y para el caso de los LINE entre 6 a 8 Kpb, pero estos son
los tamaños de los LINE que están intactos e intactos tenemos unos cientos dentro del genoma,
el resto están fragmentados y han perdido trozos. La cantidad de copias en el genoma 1 millón y
medio de los SINE y 250 mil LINE que representan 560 millones de pb. Podemos concluir que la
mayoría de los SINE y LINE están fragmentados.
La localización cromosómica preferencias es en bandas G- hay más SINE y en bandas G+ hay
más LINE. Hablamos del rango entre el 40 y 60%.
Ahí vemos el efecto del movimiento de tramposones en vivo y directo. Ese gen que vemos ahí es
el gen para la Huntingtonina que tiene que ver con la enfermedad de Huntington (1º vez que se
ubicó el gen exacto de una enfermedad). Si uno incompara el gen de Fucus con el humano
podemos ver que hay bastante homología, pero el gen humano es más grande y esto es solo
explicado por inserción de tramposones dentro de los intrones del gen humano. A medida que los
genomas crecen se debe a duplicación génica y una de las maneras en que crecen en los
vertebrados y principalmente en los mamíferos es por retrotramposición. Esto es evidencia, otra
cosa es porqué ocurre. ¿cómo pasa esto y porqué pasa? Cuando uno ve la distribución de esos
elementos retrotramposones dispersos dentro del genoma. Los SINE cuando uno ve una gráfica
entre proporción que corresponden del genoma y del contenido GC, están en las regiones del
contenido GC más alta, las regiones de contenido GC más baja contiene a los LINE.
Si uno recapitula todo lo que hemos dicho tenemos un genoma que esta armado por un 25% de
genes y 75% de cosas que no tiene que ver con los genes. Ese 25% esta distribuida en forma
dispersa en el genoma y cada uno de esos genes contiene mayoritariamente intrones y los exones
son solo el 2% del genoma total. Entre esos genes uno puede encontrar distintos otros elementos
que representan juntos el 75% del genoma total y esos elementos pueden ser: genes ribosomales
(en el caso de los cromosomas con constricción secundaria), elementos retrotamposones como
los LINE (con mayor en unas regiones que en otra) y los SINE (como los Alu, encontrados entre
los genes pero también por su tamaño pequeño incluso entre los intrones), dna centromérico (dna
satélite) y dna microsatélite (STR y VNTR).
Ese 75% de dna que se creía basura, se sabe que tiene que ver con la estructuración del complejo
sinaptonémico, con el reconocimiento de los cromosomas, con el posicionamiento del dna dentro
del núcleo...
Se debe tener una idea de cuan distinto somos. Al secuenciar el genoma, no se uso solo un
individuo sino que 5 individuos, en donde se consideró hombres y mujeres, gente de origen
asiática, afroamericana, hispana y anglosajona. Y por consiguiente hoy se tiene secuencias
comparables entre al menos 4 grupos étnicos distintos. Otra aproximación es comparar 50 genes
y en base a las diferencias que se puedan comparar en base a ellos, extrapolar cuanta seria la
diferencia en número de nucleótidos entre individuos de distintos grupos étnicos. Y al hacer eso
uno se encuentra con cosas como: que somos entre un 99,92 y 99,98% idénticos, cosa que
cuando uno lo multiplica por los 3000 millones de pb, uno obtiene una cantidad no despreciable
de nucleótidos en los que podemos diferir. Ahora la gran mayoría de esos cambios están fuera de
los genes y si están en los genes se esperarían que están en los intrones y muy pocos en los
exones. Si hay variabilidad en los exones se esperaría que esto este en la 3º posición de los
exones de un codón. Incluso existe un fenómeno de la tautomerización de las bases, que permitía
que un tautómero se asociara con una que normalmente no aparea. Volviendo la lo de las
variabilidades entre individuos, podemos explicar estas variaciones por mutaciones silentes, que
la poca variabilidad que afecte a los exones se va a encontrar en la 3º posición del exón en un
codón, y por lo tanto no tendrá efecto. Y una pequeña cantidad se encontrará en 2º o 1º posición
y tendrá como consecuencia mucho o poco efecto, y ese es el que define la variabilidad
fenotípica y la susceptibilidad a enfermedades. Dentro de esa variabilidad de unos cuantos
millones pb esta el hecho de que algunos sean morenos, se enfermen por determinada bacteria o
que haga cáncer a determinada edad.
Los genomas tienen cantidad de polimorfismos que luego del PHG se les comenzó a llamar a
variaciones en solo un nucleótido como SNP, y estarían distribuidas en promedio 1 cada 1250 pb.
Ahora cuando uno construye un árbol filogenético, como este que es del tipo de berbold, uno
encuentra que si toma gente de origen asiático, africano y europeo. Primero uno puede tener
africanos que sean más distintos entre ellos que por ejemplo un africano, un europeo y un
asiático (a nivel genético). Y pueden tener también individuos que siendo de grupos muy
distintos compartan genomas parecidos. Lo que uno ve al analizar los genomas, es que hay
ciertas características que hacen distinguibles a individuos de distinto origen racial, cuando
miramos los genomas uno puede encontrar que dos individuos africanos son menos parecidos
entre ellos que lo que uno de ellos es en relación a un europeo o asiático.
Nos “parecemos” al chimpancé en un 98% con un 150 millones de pb de diferencia. El proyecto
genoma del chimpancé no ha terminado y probablemente estos datos estén obsoletos.