Documente Academic
Documente Profesional
Documente Cultură
3 Annotation
3. A i des
d génomes
é
a) Localisation des éléments génétiques
éléments répétés
gènes des ARN stables (ARNr, ARNt)
gènes protéiques
Nb de gènes, taille du génome et complexité
pseudogènes
régions régulatrices
b) Annotation fonctionnelle
c) Intégration
1
Les éléments répétés
Télomères (plusieurs Kb) :
ADN minisatellite contenant le motif (TTAGGG)n
1) DNA transposons
Pas d’intermédiaire ARN
Transposase
Eucaryotes
Procaryotes (IS = Insertion sequence)
DNA transposons
Autonomous Short terminal
Transposase inverted repeats
Non autonomous
80 bp à 3 kb
2
Eléments transposables et leurs dérivés
2) Rétrotransposons (= rétroéléments = RNA transposons)
Un intermédiaire ARN
reverse transcriptase
Exemple L1 :
3
Exemple : SINE3
4
Homo sapiens, chr 18
78 Mb 115 378 repeats détectés
8 kb
en nb de copies
5
http://www.repeatmasker.org/
Plan
3 Annotation
3. A i des
d génomes
é
a) Annotation structurale : localisation des éléments génétiques
éléments répétés
gènes des ARN stables (ARNr, ARNt...)
gènes protéiques
Nb de gènes, taille du génome et complexité
pseudogènes
régions régulatrices
b) Annotation fonctionnelle
c) Intégration
6
Gènes des ARN non codant
Les ARN ribosomiques
ibosomiq es :
Très forte conservation =>Recherche par similarité
Beaucoup de séquences banques spécialisées
http://bioinformatics.psb.ugent.be/webtools/rRNA/index.html
http://www.arb-silva.de/
Structure
secondaire d’un 5’ 0 1 72 73 74 75 76 3’
ARNt 2
3
71
70
Bras accepteur
4 69
Bras T
5 68
6 67
Bras D
7 66 65 64 63 62 61 60 59 58
16 15 8 57
17 14 9
17A 13 12 11 10 49 50 51 52 53 56
54 55
18 48
19 22 23 24 25 47 46
20 21 26 44 e21 Boucle variable
20A 20B 27 43 45 e22
e11 e23
Nucléotides toujours présents 28 42 e12 e24
e13 e25
invariant ou semi-invariant 29 41 e14 e25
Bras anticocon 30 e15 e26
variable 40 e16 e27
31 39 e17 e5
38 e1 e4
Nucléotides parfois présents 32 e2 e3
intron
33 37
34 35 36
Promoteurs intragéniques anticodon
7
Algorithme de tRNAscan SG = 0
Signal caractéristique Non
(1)
du bras T
3 bases invariantes SG = S G +1 Oui
1) Parcours de la séquence génomique (5‘ en 3’) (2) Possibilité de former le b ras T Non
5 appariements SG = SG +1 Oui
5’ 3’
15 bases
Signal caractéristique Non
(3)
du bras D
+1 3 bases invariantes SG = S G +1 Oui
2) Idem pour la séquence complémentaire
(4) Possibilité de former le b ras D Non
3 appariements SG = SG +1 Oui
Le programme tRNAscan-SE
Combinaison de 3 méthodes :
- tRNAscan
Excellente sensibilité (> 99%)
- algorithme de Pavesi nombreux faux positifs
recherche de signaux de transcription
seuls les gènes détectés
- Covels (modèles de covariance) par les méthodes
excellente spécificité mais très lent précédentes sont testés
8
snoRNA (small nucleolar RNA)
maturation des ARNr, des snRNA (splicing) et des ARNt
longueur : 6o à 300 nt
gènes souvent localisés dans les introns
présence chez Archaea et Eucaryotes
20-24 nt
qq dizaines à plusieurs
centaines de bp
9
micro ARN (miRNA)
10