Documente Academic
Documente Profesional
Documente Cultură
Cada uno de los veinte aminoácidos del código genético constituye una familia
compuesta por los codones sinónimos del aminoácido.
Por ejemplo si se consideran los seis (6) codones (CGU, CGC, CGA, CGG, AGA,
AGG) que codifican para la Arginina (arg), los cuales son traducidos por tres (3)
tRNAs en la Escherichia coli [6], se ha establecido que un sólo tRNA decodifica los
codones (CGU, CGC, CGA) y es el más abundante (mayor número de copias) en
este organismo, los otros dos tRNAs decodifican los codones restantes y se
encuentran en menor concentración. Es de esperar que en los genes altamente
expresados se utilice muy frecuentemente uno o más de los codones traducidos
por el primer tRNA, y que en los genes con una expresión menor es posible que
se utilicen los dos tRNAs con frecuencias muy similares presentando un sesgo en
el uso de codones menos marcado. (Tabla 7).
E. COLI
ARGININA ALTAMENTE BAJA
EXPRESADO EXPRESION
AGA 0 2
AGG 0 1
CGA 0 9
CGG 0 6
CGC 6 36
CGU 34 17
Por ejemplo si se calcula el RSCU con las frecuencias de uso de codones para la
Arginina (para los genes de baja expresión) mostrados en la tabla 7, se obtienen
los siguientes resultados:
m
∑ Xi 2196 3617 71
i= 1
X= = =
m 6 6
2 12
RSCU AGA = = =0. 16090
71 71
6
1 6
RSCU AGG = = =0 . 0845
71 71
6
9 54
RSCU CGA = = =0 . 7606
71 71
6
36 216
RSCU CGC = = =3. 0423
71 71
6
6 36
RSCU CGG = = =0. 5070
71 71
6
17 102
RSCU CGU = = =1. 4366
71 71
6
Este cálculo se efectúa para todas las familias, (excepto para el Triptófano y la
Metionina por carecer de codones sinónimos). En la tabla 9 se observa el valor
del RSCU para los codones de la secuencia del gen DCRB mostrado a
continuación:
2.1.2 Codon adaptation index (CAI): El índice de adaptación del codón fue
propuesto por Paul M. Sharp y Wen-Hsiung Li [7].
El CAI es una medida muy efectiva para evaluar el prejuicio de uso de codones
sinónimos; es muy útil para predecir el nivel de expresión de un gen ya que el
valor del CAI es directamente proporcional a la expresión de un gen; es decir si un
gen es altamente expresado tendrá valores altos para el CAI [7].
CAI= ∏ W
L ni
i
Donde:
RSCUij Xij
Wij= =
RSCUi max Xi max
Es el valor RSCU del i-ésimo codón sinónimo
RSCUij
de la familia j.
Es el valor RSCU máximo entre los codones
RSCUimax
sinónimos de un aminoácido.
Es la frecuencia del i-ésimo codón sinónimo de
Xij
la familia j.
Es la frecuencia máxima entre los codones
Ximax
sinónimos de un aminoácido.
2 0. 1690
W 1,1 =W AGA= = =0. 0556
36 3. 0423
1 0. 0845
W 1,2 =W AGG = = =0 . 0277
36 3 . 0423
9 0. 7606
W 1,3 =W CGA= = =0. 2500
36 3. 0423
36 3 . 0423
W 1,4 =W CGC = = =1
36 3 . 0423
6 0. 5070
W 1,5 =W CGG = = =0 . 1667
36 3. 0423
17 1. 4366
W1, 6=W CGU = = =0. 4722
36 3. 0423
2 . 0223 x 10−20
0 . 52798
2.1.3 χ 2 escalado: Este método fue propuesto por Neil R. McEwan y Derek
Gatherer en el año de 1997 [8]. El valor que se obtiene es general para el gen y
ya que este se incrementa proporcionalmente con la longitud del gen ha sido
necesario ajustar los valores teniendo en cuenta este parámetro con el fin de
poder comparar genes de diversa longitud [9].
ei−0i j 2
18 fj
ei
χ 2=∑ ∑
i= 1 j= 1 2n
∑
fi
1
ei= Oij ∗
j= 1 fi
1 71
ei= 21936617 ∗ =
6 6
2
χ =
3481 4225 289 21025 1225 961
426
426
426 426
426
426
2 71
χ 2=
31206
426 =
31206
=0 . 5158698671
142 60492
Donde:
∑
j
sinónimo de tamaño j.
y
na ∑ p 2i −1 pi = Frecuencia relativa del codón i ( ni/ na)
j= 1
Figura 10. Frecuencia relativa de los dinucleótidos intercodones para el gen DCRB
Shepered [12], notó que los codones más frecuentes en los genes humanos son
de la forma RNY (R = A o G, Y = C o T, N = A, C, G o T), es decir la composición
más frecuente que se encontró en los genes del hombre, específicamente ha sido:
Purina – Pirimidina - Purina/Pirimidina., este resultado se ha usado para formular
métodos que prueban la existencia de una región codificante calculando el número
de diferencias entre la secuencia analizada y el patrón RNYRNYRNYRNY... RNY.
En la figura 11 se muestra el uso de nucleótidos por cada posición del codón para
el gen DCRB.
Figura 11. Frecuencia de nucleótidos por posición de codón para el gen DCRB.
Ui=−Log Pi
M
H=− ∑ PiLog Pi
i= 1
M
1
H=− ∑ PiLog
i= 1 Pi
Por ejemplo, en la Tabla 14 se muestra el Ui para una fuente que genera cuatro
símbolos A, C, T, y G, con probabilidades ½, ¼, 1/8 y 1/8 respectivamente.
Símbolo Pi Ui (bits)
A ½ 1
C ¼ 2
G 1/8 3
T 1/8 3
Los métodos que se han empleado para el estudio de este tipo de secuencias son: