Documente Academic
Documente Profesional
Documente Cultură
"(...)La substance organique qui est présente dans toutes les parties du corps animal
et, comme nous allons le voir, du royaume végétal, pourrait être appelée protéine,
de πρωτειοσ (au premier rang) (...)"
Gerardus Johannes Mulder
Journal für praktische Chemie 16, 129 (1839)
Voilà, c'est ainsi que le mot protéine entra dans notre vocabulaire. À cause de leur
capacité d'adopter une infinité de formes et de leur synthèse à même les cellules, les
protéines sont l'outil à tout faire du monde vivant, le canif suisse de l'évolution, les
blocs Lego avec lesquels tout ce qui vit est bâti.
Le cours BCM-514, biochimie des protéines, présuppose que vous en savez déjà
beaucoup sur ces molécules. Vous y aurez l'occasion de revoir, d'approfondir et d'y
mettre en contexte des notions acquises au cours de vos études. Ne vous étonnez
pas de vous sentir parfois en terrain familier; nous commencerons en effet par une
révision des notions physico-chimiques qui nous permettent de comprendre la
structure et le fonctionnement des protéines, afin de bien saisir un peu plus tard
comment ces paramètres influencent notre stratégie de purification ou d'analyse...
car l'essentiel du cours se consacre à l'utilisation de ces connaissances
biochimiques, que ce soit pour mieux comprendre les mécanismes moléculaires de
la cellule ou pour produire et purifier les protéines à des fins analytiques ou
industrielles.
1
échelle et d'autre part dans le contexte de projets de plus grande envergure
auxquels on colle souvent l'étiquette de projets en protéomique.
Nous discuterons aussi des travaux de l'industrie privée sur différents aspects de la
biochimie des protéines, particulièrement dans le domaine pharmaceutique.
Mais tout d'abord, revenons-en aux sources et consacrons quelques pages aux
notions de base sur la biochimie protéique...
2
Les protéines sont de longues chaînes composées d'une succession de maillons et
repliées dans l'espace. Les maillons de ces chaînes sont de petites molécules
appelés acides aminés. Comme leur nom l'indique, les acides aminés portent un
groupe acide (-COOH) et un groupe aminé (-NH2). Ils sont au nombre de vingt dans
les protéines (nous verrons quelques exceptions à cette règle un peu plus loin). On
retrouve plusieurs autres acides aminés dans l'organisme (l'ornithine, par exemple)
mais ils n'entrent pas dans la composition des protéines.
Les acides aminés retrouvés dans les protéines ont tous la même structure de base:
ils sont orientés autour d'un atome de carbone central, le carbone α, sur lequel
s'articulent le groupe carboxyl (-COOH), le groupe aminé (-NH2), un atome
d'hydrogène (-H) et un groupement latéral (noté -R). C'est la nature de ce
groupement latéral (on dit aussi chaîne latérale) qui différencie les acides aminés
entre eux.
Le carbone α central est donc asymétrique dans tous les cas mis à part celui de la
glycine (parce que la glycine a un hydrogène à la place d'une chaîne latérale). Cela
signifie qu'il est possible d'avoir deux conformations différentes d'un même acide
aminé, conformations qu'il est impossible d'interconvertir sans briser et réassembler
de liens covalents. On désigne ces conformations L et D. Bien que les deux puissent
être synthétisées dans une même réaction chimique, seule la forme L est utilisée
dans les protéines.
3
Les chaînes latérales des acides aminés permettent de classer ces derniers en
différents groupes partageant certaines caractéristiques. Certains sont polaires, et
donc hydrophiles, d'autres non-polaires et donc hydrophobes. Certains sont chargés,
d'autres non. Certains contiennent un cycle aromatique. Certains contiennent du
soufre, etc.
Deux acides aminés tranchent un peu parmi les autres: la glycine (G, Gly), le plus
petit acide aminé, n'a en guise de
chaîne latérale qu'un atome d'hydrogène. La proline (P, Pro), elle, a une chaîne
latérale en forme de boucle
(un anneau pyrrolidone) qui va contacter l'azote de son groupement aminé; le résultat
en est que la proline est techniquement un acide iminé (-NH-) plutôt qu'aminé.
L'impact de cette structure sur celle des protéines sera vu
plus loin.
Quatre acides aminés ont une chaîne latérale fortement ionisée et donc chargée à
pH neutre: il s'agit de l'acide aspartique (D, Asp) et de l'acide glutamique (E, Glu),
dont la chaîne latérale porte un groupement acide supplémentaire (COOH); et de la
lysine (K, Lys) et de l'arginine (R, Arg) dont la chaîne latérale porte un groupement
aminé (-NH3+ pour la lysine, =NH2+ pour l'arginine). Un cinquième acide aminé,
l'histidine (H, His), porte une charge positive plus faible à pH neutre.
4
Les deux acides aminés acides ont des dérivés dont le groupement acide (-COOH) est
changé pour un groupement
amide (-CONH2). Il s'agit de l'asparagine (N, Asn) pour l'acide aspartique et de la
glutamine (Q, Gln) pour l'acide glutamique. Ces deux acides aminés sont non-chargés à
pH neutre mais restent polaires et hydrophiles.
5
La sérine (S, Ser) et la thréonine (T, Thr) ont un groupement hydroxyl (-OH) dans leur
chaîne latérale.
Cela leur permet d'interagir avec l'eau et d'autres molécules en formant des ponts
hydrogènes, ou d'être la cible de modifications utilisant ce site réactionnel.
Les acides
aminés
contenant des
cycles comme
la phénylalanine
(F, Phe), le
tryptophane (W,
Trp) ou la
tyrosine (Y, Tyr)
sont très
hydrophobiques
; c'est le cas
aussi de leurs
congénères
dont la chaîne
latérale consiste
en une
succession de
groupements
éthyl- et méthyl-
. On dit de ceux-
ci qu'ils sont
aliphatiques.
6
L'alanine (A,
Ala), la la valine
(V, Val), la
leucine (L, Leu),
L'isoleucine (I,
Ile) sont tous
des acides
aminés
aliphatiques.
On inclut généralement dans cette famille la méthionine (M, Met), dont la chaîne latérale
plutôt aliphatique contient un soufre non réactif. Notons que la tyrosine, malgré son
caractère hydrophobique dû au cycle benzénique, a tout de même un groupement -OH
qui, à l'instar de la sérine et de la thréonine, lui permet d'interagir avec l'eau ou d'être la
cible de réaction utilisant les groupements hydroxylés.
7
La cystéine (C, Cys) est un peu dans une classe à part, car elle a à l'extrémité de sa
chaîne latérale un groupement sulfhydryl réactif..
Dans des conditions oxydantes, une cystéine forme fréquemment un pont disulfure avec une autre
cystéine pour donner un dimère qu'on appelle cystine. Les cystéines contribuent à maintenir la structure
tridimensionnelle de très nombreuses protéines grâce à cette faculté.
Certains acides aminés sont synthétisés à même nos cellules; d'autres doivent faire
partie de notre alimentation (d'où notre besoin de manger des protéines). Ces
derniers acides aminés sont dits essentiels; ce sont la thréonine, la lysine, l'histidine,
l'isoleucine, la leucine, la méthionine, la phénylalanine, le tryptophane et la valine:
TKHILMFWV (qu'une ritournelle mnémonique peut changer en "HoT MILK For VW"
Il faut juste se souvenir de ne pas prendre le r en considération. Le O, lui, ne code
pas pour un acide aminé impliqué dans la synthèse des protéines.).
8
1.1.1 Les vingt acides aminés de base: quelques spécifications
9
valine Val V 117,1 74 46
(a) Probabilité qu'un résidu particulier soit muté ponctuellement pendant l'évolution.
La valeur de l'alanine a été arbitrairement fixée à 100.
(b) Probabilité que 5% ou plus d'un résidu particulier se trouve à la surface d'une
protéine.
Une règle informelle suggère d'utiliser un poids de 110 Daltons par résidu pour
calculer à vue de nez le poids d'une protéine (même si le poids moyen d'un acide
aminé est plutôt 136). Cette règle fonctionne étonnament bien dans la plupart des
cas. Ainsi, le poids réel de la protéine de BARD-1, qui compte 777 acides aminés est
de 86,6 kDa (poids calculé à l'aide du calculateur ScanSite du MIT, trouvé sur le site
d'ExPASy) alors que le poids estimé "au pif" est de 777 acides aminés X 110 = 85,4
kDa, ce qui est très proche de la valeur réelle.
En parcourant la littérature scientifique, on tombe parfois sur des acides aminés dont
le nom abrégé (Iva, Abu) n'est pas familier. Il s'agit souvent de résidus modifiés, ou
parfois de noms alternatifs pour les acides aminés de base. Le tableau qui suit en
désigne quelques-uns.
10
1.2 Charge des acides aminés
Les acides aminés individuels portent au moins deux groupes ionisables: le groupe -
NH2 et le groupe -COOH, ionisables en -NH3+ et -COO-. Ils ont donc un caractère
amphotère car ils peuvent être à la fois donneur ou accepteur d'électrons. Ils
peuvent par conséquent servir d'agent tampon. On appelle zwitterion une molécule
qui porte à la fois une charge positive et négative (c'est de l'allemand pour "ion
hybride"). La nature dipolaire des acides aminés a d'abord été remarquée parce que
leurs cristaux étaient beaucoup
plus stables à la chaleur que ceux de molécules organiques de taille similaire: c'est
que les interactions ioniques entre les charges différentes fortifient le réseau
cristallin.
Le pKa des acides aminés tourne autour de 2, ce qui est normal pour un acide; leur
pKb tourne autour de 9-10, ce qui est attendu pour une base. Les chaînes latérales
qui ont un pK ont des valeurs variables: le pKR de D et E tourne autour de 4 (ces
chaînes sont acides); le pKR de H, R et K est de 6, 12,5 et 10,5 respectivement (ce
sont des chaînes basiques). Ce qui compte en bout du compte n'est de toute façon
11
pas tant le pK de chaque acide aminé, mais celui, global, de la protéine qui les
contient!
L'effet tampon des acides aminés est maximal quand le pH ambiant est près du pKa
ou du pKb de la molécule, ainsi qu'on le devine en regardant la formule
Quand toutes les charges portées par une protéine s'équivalent, on dit qu'elle atteint
son point isoélectrique. C'est aussi le point où une protéine a le moins d'interactions
avec les molécules d'eau, et donc le point où elle est le moins soluble.
Pour vous rappeler l'ordre dans lequel les groupes s'ionisent en fonction du pH,
rappelez-vous seulement qu'à pH bas, vous ajoutez tous les hydrogènes possibles
et qu'à pH élevé vous enlevez tous ceux que vous pouvez. Ainsi, à pH 2 les groupes
hydroxyls seront sous forme COOH et les groupes aminés sous forme NH3+, alors
qu'à pH 11 les groupes hydroxyls seront sous forme -COO- et les groupes aminés
sous forme NH2.
12
Acide aminé pK1 pK2 pK3 pI
13
Acide aspartique (D, Asp) 2,19 9,6 3,65 2,77
1.3 Hydrophobicité
La chaîne latérale des acides aminés peut être plus ou moins hydrophobe. Les
cycles et les chaînes aliphatiques sont bien entendu plus hydrophobes que les
chaînes chargées ioniquement. Ces différences joueront un rôle dans les structures
supérieures des protéines. La phénylalanine est le plus hydrophobe; l'acide
aspartique le plus hydrophile.
Voici une liste du degré d'hydrophobicité des acides aminés. Comme il existe
plusieurs façons d'évaluer l'hydrophobicité, on n'en présentera qu'une ici. Cette
échelle se nomme OMH (optimized matching hydrophobicity), et son origine remonte
à l'article suivant :
Phenylalanine 1,92
Tyrosine 1,67
Isoleucine 1,25
Leucine 1,22
14
Methionine 1,02
Valine 0,91
Tryptophane 0,5
Cysteine 0,17
Threonine -0,28
Alanine -0,4
Proline -0,49
Serine -0,55
Arginine -0,59
Histidine -0,64
Glycine -0,67
Lysine -0,67
Glutamine -0,91
Asparagine -0,92
15
Acide aspartique -1,31
Certains acides aminés ne se retrouvent pas dans les protéines, et certains acides
aminés protéiques subissent des modifications post-traductionnelles.
(Veuillez vous référer au chapitre 3 pour une couverture plus large des modifications
post-traductionnelle des protéines).
En dégradant des protéines pour obtenir les acides aminés qui les composent, on en
retrouve souvent qui varient par rapport au modèle de base. Ces acides aminés
modifiés jouent différents rôles importants dans la structure et la fonction des
protéines. On ne les ajoute pas à la liste des vingt, cependant, parce qu'ils ne sont
que des modifications d'acides aminés standards: une hydroxyproline, par exemple,
est une proline à laquelle un enzyme a été greffer un groupement hydroxyl.
Certains de ces acides aminés modifiés peuvent avoir une allure complexe: ainsi,
suite à une succession de pontages covalents, quatre lysines peuvent être réunies
en une molécule de desmosine (on la retrouve dans une protéine appelée élastine,
qui se retrouve dans les ligaments et le tissu conjonctif des grandes artères). La
desmosine aide à conférer à cette protéine ses vertus élastiques.
16
Quelques acides aminés modifiés qu'on retrouve dans les protéines.
Le gamma-carboxyglutamate qu'on voit dans cette figure est produit par une
modification d'un résidu glutamate. Cette modification est catalysée par la vitamine
K, qui tient son nom du mot allemand Koagulation. En effet, le gamma-
carboxyglutamate se retrouve dans plusieurs protéines impliquées dans la
coagulation sanguine, comme la prothrombine. Il aide à fixer un ion Ca2+.
1.4.2 Quelques acides aminés qu'on ne retrouve pas dans les protéines.
Des acides aminés peuvent avoir des rôles cruciaux sans être impliqués dans la
synthèse protéique. En voici quelques examples.
17
Les hormones thyroïdiennes, qui sont
responsables du contrôle du métabolisme
de l'organisme, sont appelées T3 et T4
(thyroxine et triiodothyronine). Ce sont des
modifications de la tyrosine portant un
cycle supplémentaire et des atomes d'iode.
C'est pour synthétiser ces deux hormones
que la glande thyroïde a besoin d'iode.
Par ailleurs, un autre dérivé d'acide aminé joue un rôle de premier plan dans le
contrôle de la production d' oxyde nitrique NO. Il s'agit de la diméthylarginine
asymétrique ou ADMA. L'ADMA est un inhibiteur de la réaction par laquelle l'oxyde
nitrique est synthétisé à partir de l'arginine:
Un acide aminé du nom de coprine présente un intérêt particulier pour les gourmets
amateurs de champignons. On le retrouve dans le coprin noir d'encre, Coprinus
atramentarius. La coprine n'est pas toxique en elle-même, et c'est pourquoi ce
coprin est considéré comestible (encore que pas particulièrement savoureux). Le
problème avec la coprine, c'est que sa dégradation produit deux composés, le 1-
Aminocyclopropanol et l'hydrate de cyclopropanone, qui agissent comme inhibiteurs
18
de l'enzyme aldéhyde déhydrogénase. Cet enzyme, en convertissant l'acétaldéhyde
en acide acétique et en CO2 aide à détoxifier l'ethanol. Cette inhibition qui peut durer
trois jours cause donc notre intoxication, non pas par le champignon lui-même, mais
par l'acétaldéhyde venant du catabolisme de l'ethanol! Ainsi, si on mange des
coprins noir d'encre, on ne doit absolument pas boire d'alcool sous peine de soufrir
d'une intoxication à l'acétaldhyde. Bonjour la migraine, les rougeurs, les maux de
coeur et tout le tralala.
Les acides aminés sont assemblés en chaîne selon un ordre déterminé par une
séquence d'ADN. Chaque acide aminé est représenté sur l'ADN par un triplet de
bases appelé codon.
Puisqu'il existe quatre nucléotides dans l'ADN, il existe aussi une possibilité
maximale de 43 codons, ou 64. Il n'y a cependant que 20 acides aminés, qui se
partagent ces possibilités entre eux (et avec trois signaux d'arrêt de la traduction). La
distribution des codons n'est pas égale: il n'y a par exemple qu'un seul codon codant
pour le tryptophane mais six pour l'arginine.
19
Le code génétique. Chaque codon
(ou triplet de nucléotides) se lit du
centre vers l'extérieur. En plus des
codons désignant les 20 acides
aminés, il existe trois codons
STOP, qui marquent la fin de la
séquence d'une protéine: les
codons amber (TAG), ochre (TAA)
et opal (TGA)
Le code génétique est extrêmement conservé dans la nature. Des plus humbles
procaryotes aux plus massifs séquoias, les acides aminés et les codons stop sont
presque toujours les mêmes. Il existe cependant quelques mutations qui se sont
accumulées au cours de l'évolution, principalement chez certaines mitochondries qui
ont leur propre génome, et dont le code peut varier un peu face à celui utilisé par
l'ADN nucléaire.
20
Variations sur un thème: certains codons ont changé de signification dans certaines
organelles ou certains organismes au cours du temps. Les flèches indiquent des
mutations cumulatives qui peuvent refléter soit une conservation évolutive, soit une
évolution parallèle. Ainsi, les mitochondries des planaires cumulent les mutations
Stop(TGA)W, R(AGA)S, R(AGG)S, K(AAA)N et Stop (TAA)Y. Notez que chez les
plantes, noyaux et mitochondries utilisent le même code et peuvent donc s'échanger
des gènes. (Adapté des travaux de Weberndorfer, Hofacker et Stadler)
En exprimant une séquence d'ADN dans un système hétérologue (H. sapiens dans
E. coli, par exemple), mieux vaut donc être sûr d'utiliser une séquence qui sera
facilement traduite par les ARNt de l'hôte, quitte à changer par génie génétique des
codons défavorisés par des codons favorisés. Sinon, on risque de s'exposer à des
tracas du genre
21
Dans la liste ci-dessous, on compare trois organismes et leur préférence en fait de
codons codant pour l'arginine. Si tout était égal par ailleurs, on s'attendrait à ce que
chacun des six codons Arg soit représenté avec une fréquence d'environ 16,5% et
en effet, chez l'être humain, il n'existe qu'un léger biais qui défavorise le codon CGT.
Par contre, chez S.cerevisiae, les codons CGG, CGC et CGA ne représentent
respectivement que 2%, 4% et 5% des codons Arg du génome et la levure ne
fabrique que très peu des ARNt portant les anticodons appropriés. Une séquence
humaine exprimée dans la levure aurait intérêt à voir tous ses codons Arg changés
pour AGA, qui est fortement favorisé par cet organisme.
UUA L 0.07 UCA S 0.15 UAA stop 0.28 UGA stop 0.5
22
CUG L 0.40 CCG P 0.11 CAG Q 0.74 CGG R 0.21
UUA L 0.28 UCA S 0.21 UAA stop 0.47 UGA stop 0.3
23
AUA I 0.27 ACA T 0.30 AAA K 0.58 AGA R 0.48
UUA L 0.13 UCA S 0.12 UAA stop 0.63 UGA stop 0.29
24
GUG V 0.37 GCG A 0.36 GAG E 0.31 GGG G 0.15
Les six codons les moins utilisés chez E.coli, et leur fréquence chez d'autres
organismes (nombre par millier de codons):
R R R L I P
acide
E.coli Levure Drosophile Humain
aminé
AGG AGG R
AGA AGA R
AUA AUA I
CUA CUA L
25
CGG CGG CGG R
CCC CCG P
UCG S
CGC CGU R
CCG P
CUC CUU L
GCG GCG A
ACG ACG T
UUA UUA L
GGG G
AGU S
UGU C
GUA V
UUG L
26
1.5.3 Le 21e et le 22e acide aminé
Après des décennies de travail avec nos vingt acides aminés familiers, il fut
surprenant de découvrir qu'il en existait finalement d'autres qui ne relevaient pas
d'une modification post-traductionnelle des résidus classiques mais qui étaient
insérés dans les protéines en tant qu'acides aminés originaux à part entière, avec
leur propre ARN de transfert. Le 21e acide aminé découvert (en 1986) est la
selenocystéine (Sec), le 22e (en 2002) est la pyrrolysine. Ils ne sont quand même
pas très courants.
Ces deux acides aminés sont codés par des codons STOP qui sont "contournés" par
des systèmes spéciaux. L'ARNt de la selenocystéine reconnait le codon UGA; celui
de la pyrrolysine le codon UAG. L'ARNt de la selenocysteine ne peut être
synthétisés que si la cellule a accès à une source de selenium.
En outre, on sait que la séquence de l'ARN en aval de l'UGA (sur environ 40 bases)
joue en rôle dans l'identité du UGA en tant que codon Sec plutôt que codon stop. Ce
n'est donc pas n'importe quel codon UGA qui codera pour une selenocystéine.
La pyrrolysine est chargée directement sur son ARNt par une ARNt synthétase, mais
dans le cas de la sélénocystéine la situation est un peu plus complexe. Chez E. coli,
27
quatre gènes sont requis pour produire une selenoprotéine: SelA, SelB, SelC et
SelD.
SelA code pour une selenocysteine synthase qui catalyse la conversion de seryl-
tRNA en selenocysteyl-tRNA. SelB code pour un facteur d'élongation analogue à
EF-Tu mais avec une spécificité pour l'insertion de selenocysteine au codon UGA. Il
nuit à la terminaison de la traduction au codon UGA, permettant à la selenocystéine
de s'intégrer et à la traduction de se poursuivre le long de l'ORF étendu. SelD code
pour une selenophosphate synthetase qui catalyse la réduction du selenium en
selenium monophosphate. Ce phosphate est la source de métal pour la
selenocystéine. SelC code pour l'ARNt de la selenocystéine, avec un anticodon
UCA. Cet ARNt est d'abord chargé d'une sérine par la séryl-tRNA synthétase. C'est
le plus long des ARNt connus jusqu'ici chez E. coli. Cette exception à la règle des
vingt acides aminés souligne d'abord que rien n'est jamais coulé dans le béton en
biologie, et ensuite que la nature a toujours une surprise ou deux en réserve pour
nous quand nous croyons avoir tout compris.
Il est bien connu que des mutations s'accumulent dans le matériel génétique au
cours des éons, et ces mutations génétiques dirigent la synthèse de protéines
également mutées (et encore heureux, car sinon nous serions tous encore des
petites morves qui nagent et rien de plus).
28
La mutation d'un codon dans une protéine passe par deux filtres: celui de l'occasion
et celui de la sélection. Tout d'abord, plus une mutation est simple et plus elle a de
chance de se produire (AGG muté en AGC est plus fréquent que AGG muté en TTT,
parce qu'un seul nucléotide a été affecté). Ensuite, pour que la mutation soit
maintenue, il faut qu'elle confère un avantage quelconque à son hôte, ou au moins
qu'elle ne lui nuise pas.
La plupart de nos protéines sont là depuis très longtemps (le cytochrome C, par
exemple, est un modèle qui dure et dure et dure). Comme ces protéines ancestrales
remplissent très bien leur office, on n'y observe pas beaucoup de mutations d'une
espèce à l'autre; les mutations ont tendance à être conservatrices (celles n'ont pas
beaucoup d'impact). Si un résidu lysine joue un rôle important dans une protéine à
cause de sa charge positive, sa mutation en arginine (même charge) sera plus
facilement tolérée qu'une mutation en acide aspartique (charge inverse).
On peut utiliser le taux de mutations entre des protéines partagées par de nombreux
représentants du monde vivant pour aider à déterminer leur lien de parenté. Dans la
figure ci-dessous, on peut suivre les mutations les plus fréquemment observées
dans des protéines aparentées. La direction des flèches indique celle des mutations;
les flèches pointillées sont des mutations plus rares. Notez que pour ces mutations,
il est toujours possible de passer d'un codon codant pour un premier acide aminé à
un codon codant pour un deuxième en ne changeant qu'un seul nucléotide.
Parallèlement à cette relation qui explique que ces mutations soient plus fréquentes
parce que plus faciles à effectuer, on remarque que les chaînes latérales des
résidus mutés ont une certaine parenté avec celles des résidus originaux (petit
groupe pour petit groupe, comnme G vers A, ou encore charge négative pour charge
négative comme D vers E et vice-versa, ou encore aromatique pour aromatique
comme F vers Y et vice-versa); cela signifie probablement que la mutation n'a pas
introduit d'élément néfaste au bon fonctionnement de la protéine, et n'a donc pas
subi de pression évolutive tendant à la faire disparaître.
29
Les mutations les plus fréquemment observées.
Des polypeptides assemblés sans que les ribosomes ne soient solicités??? Et oui,
ça existe. Les peptides issus de la NRPS (non-ribosomal peptide synthesis) sont
30
généralement assez courts, de deux à environ 50 acides aminés. Ces peptides ne
sont pas codés par un gène, et ils ne sont pas limités aux vingt acides aminés de
base. On y retrouve parfois des acides aminés de forme D, des variantes méthylées
des acides habituels, des résidus hydroxylés ou glycosylés, des résidus jamais
retrouvés dans les protéines, etc. Il arrive que la chaîne peptidique y soit cyclique,
ou même branchée.
Ces peptides sont synthétisés par des synthétases massives organisées en chaînes
de montage; certaines sont des complexes multimériques, d'autres de grandes
protéines. Ces enzymes sont modulaires et contiennent une série d'unités
fonctionnelles qui peuvent lier un acide aminé libre, l'activer sous forme de thioester,
et le coupler au polypeptide grandissant. Chaque module a une taille de 1000-1200
acides aminés, rendant certains de ces enzymes vraiment énormes: une unique
protéine de 15 281 résidus (pour une masse de 1,7 MDal!!!) est responsable de la
synthèse de la cyclosporine, un immunorépresseur qui ne contient que... 11 résidus!
Structure de la cyclosporine A.
MeLeu: méthylleucine
MeVal: méthylvaline
MeBmt: (4R)-4-[(E)-2-butenyl]-4-méthyl-L-
thréonine
Sar: Sarcosine
31
2.0 Structure des protéines
n distingue quatre niveaux stades structuraux chez les protéines, de la structure
primaire à la structure quaternaire.
(1) Structure primaire: ordre des acides aminés le long de la chaîne polypeptidique.
(2) Structure secondaire: repliement local des acides aminés en hélices, en feuillets, ou en
d'autres formes similaires.
(3) Structure tertiaire: agencement stable dans l'espace de ces hélices et feuillets.
(4) Structure quaternaire: agencement des sous-unités entre elles, quand la protéine est
constituée de plusieurs sous-unités indépendantes (comme l'est par exemple
l'hémoglobine).
Chaque acide aminé est lié au suivant par un lien peptidique, qui se forme quand le
groupement carboxylique d'un premier acide aminé réagit avec le groupement aminé
d'un second, avec élimination d'eau. Quand les acides aminés sont incorporés dans
une chaîne (qu'on appelle chaîne polypeptidique), on les appelle des résidus. La
chaîne polypeptidique n'est pas branchée; elle forme un unique filament étiré. Par
convention, on désigne le premier acide aminé de la chaîne comme étant celui dont
le groupement aminé reste libre; on dit qu'il est en 5' ou encore qu'il constitue l'
extremité N-terminale ou le N-terminus. On désigne comme étant le dernier résidu
de la chaîne celui dont le groupement carboxylique reste libre; on le dit en 3', ou à
l'extrémité C-terminale.
32
La figure ci-haut présente la conformation préférée du lien entre les résidus, soit en
trans. Cette conformation est généralement plus stable car elle positionne les
chaînes latérales loin l'une de l'autre. Qui plus est, les ribosomes synthétisent tous
les liens peptidiques en trans.
Chaque lien peptidique est donc rigide, mais de part et d'autre les liens peuvent effectuer
une rotation. L'angle de rotation d'un plan amide par rapport au carbone alpha en 5' est
noté angle ψ; l'angle entre le plan amide précédent et ce même carbone alpha est noté
angle υ. (Voir ci-dessous).
33
C'est la succession de ce genre de structures régulières, hélices, feuillets ou tours
qu'on appelle la structure secondaire d'une protéine.
En s'intéressant à l'agent actif d'un thé médicinal congolais qui facilite les
contractions utérines, on découvrit dans les années 90 qu'il s'agissait d'une petite
protéine de structure circulaire, assez stable pour résister à l'ébullition et à
l'ingestion. Cette protéine, la kalata B1, n'était que la première d'une série de
protéines circulaires que nous devions découvrir, et qui comptent maintenant plus
d'une centaine de membres parmi leurs rangs (on pense qu'il pourrait même y en
avoir plusieurs milliers). Leur structure leur confère une grande stabilité et plusieurs
d'entre elles ont des activités insecticide ou antimicrobienne. (D'autres peptides non-
protéiques circulaires existent, comme la cyclosporine dont nous avons parlé au
point 1.6.2). Certaines ont en outre une structure topologique en noeud (c'est le cas
de la kalata B1); on les appelle des cyclotides.
L'avantage d'être circulaire, pour uine protéine, est entre autres de ne pas offrir
d'extrémité terminale aux exopeptidases. La stabilité en est donc accrue. Il est
également plus difficile de les dénaturer de façon permanente par la chaleur ou les
variations de pH.
34
2.2 Structure secondaire
35
2.2.1 L'hélice alpha
L'hélice alpha s'élève de 0,15 nm par résidu et de 0,54nm à chaque tour. Elle
compte 3,6 résidus par tour.
Elle est stabilisée dans sa forme hélicale par des ponts hydrogènes établis entre
l'hydrogène d'un groupement aminé -NH et l'oxygène d'un groupement carboxylique
-C=O et situé quatre résidus plus loin.
Comme ces ponts hydrogènes vont dans la même direction que l'hélice, celle-ci est
élastique: les ponts hydrogènes brisés lors de l'étirement de l'hélice se reformeront
facilement quand la tension sera relâchée.
Les chaînes latérales des résidus dans une hélice alpha pointent à l'extérieur de la
structure.
Une telle hélice peut facilement avoir une nature amphipathique si les chaînes
36
latérales se trouvant toutes du même côté ont une nature hydrophile et que celle se
trouvant de l'autre côté ont une nature hydrophobe. Le domaine d'interaction
protéine-protéine riche en leucine de la structure bZip (aussi appelée "leucine
zipper") de plusieurs facteurs de transcription de type AP-1 est une telle hélice
amphipathique.
La proline n'ayant pas d'hydrogène sur son goupe aminé, elle ne peut pas contribuer
au pontage hydrogène. La proline déstabilise donc l'hélice alpha, et il est rare qu'on
retrouve un résidu proline dans une telle hélice. (La proline se retrouve cependant
dans un autre type d'hélice, l'hélice de collagène, dont nous parlerons plus tard).
L'hélice 310 ressemble à une hélice alpha tricotée serré. Elle compte 3 résidus par
tour (au lieu de 3,6) et s'élève de 0,6nm pour faire un tour complet au lieu de
0,54nm. Chaque pont hydrogène ferme une boucle de dix atomes, d'où le nom de
310 (3 résidus par tour, 10 atomes dans la boucle).
37
Dans une hélice 310, les ponts hydrogènes se font entre le groupement -NH en
position x et le groupement -C=O en position x+3. (Des ponts hydrogènes entre -NH
en x et -C=O en x+5 sont parfois, bien que rarement, observés, dans une structure
appelée hélice p).
2.2.2 Le feuillet β
Les feuillets beta (β-sheet en anglais) se forment quand des parties de la longue
chaîne polypeptidique se replient et se longent l'une l'autre, côte à côte, en formant
des pont hydrogènes avec la voisine. On parle de feuillets beta parallèles quand les
chaînes vont dans le même sens et d'antiparallèles quand elles vont dans des
directions opposées. La direction des angles Φ et Ψ alterne dans un feuillet beta (un
positif, l'autre négatif), donnant à la chaîne une allure en zigzag.
On peut se représenter un feuillet beta comme une grosse croustille Ruffle, avec des
chaînes latérales pointant en alternance en haut et en bas. La distance entre deux
résidus est de 0,335nm; chaque chaîne est séparée de sa voisine de 0,465nm. Un
feuillet beta est représenté, dans les modèles structuraux, par une grosse flèche
plate qui indique sa direction.
Puisque les ponts hydrogènes des feuillets beta pointent perpendiculairement à l'axe
de la chaîne polypeptidique, ils ne donnent pas d'élasticité à la structure.
On retrouve beaucoup de feuillets beta dans la soie de ver (Bombyx mori) et la toile
d'araignée.
Les feuillets beta sont représentés par des flèches, l'hélice alpha est représentée par
une spirale.
38
2.2.3 Hélice vs feuillet
E 1,59 V 1,87
A 1,41 I 1,67
L 1,34 Y 1,45
M 1,3 C 1,40
Q 1,27 W 1,35
K 1,23 F 1,33
R 1,21 L 1,22
F 1,16 T 1,17
I 1,09 M 1,14
H 1,05 Q 0,98
W 1,02 S 0,96
D 0,99 R 0,84
V 0,90 H 0,80
T 0,76 A 0,72
N 0,76 K 0,69
Y 0,74 G 0,58
C 0,66 E 0,52
S 0,57 N 0,48
G 0,43 D 0,39
39
P 0,34 P 0,31
Certains acides aminés ont une préférence marquée pour certaines structures:
expérimentalement, on remarque qu'ils se retrouvent plus souvent dans une
structure que dans une autre. Mais même si les hélices alpha et les feuillets beta
sont les structures secondaires les plus courantes, il ne faut pas croire qu'un acide
aminé soit nécessairement plus porté vers une hélice quand il n'est pas fréquent
dans un feuillet, ou vice-versa (ce n'est pas comme si on parlait d'hydrophobicité).
En fait, si certains résidus comme l'acide glutamique préfèrent clairement les hélices
alpha aux feuillets beta, et que la cystéine préfère clairement les feuillets beta aux
hélices alpha, il y a des résidus comme la leucine qui se retrouve fréquemment dans
les deux structures. Il y en a également d'autres (la proline par exemple) qui se
retrouvent rarement et dans l'une et dans l'autre.
Le tableau ci-haut vous indique la fréquence des acides aminés dans différentes
structures. Une valeur de 1 indique une distribution aléatoire (ou ce à quoi on
s'attendrait si les acides aminés étaient distribués au hasard); une valeur supérieure
indique qu'on retrouve l'acide aminé plus souvent que ce que le hasard prédit; une
valeur inférieure à 1 indique le contraire.
Différentes sources ne s'entendent pas toujours à l'unité près sur certaines valeurs,
mais elles restent très similaires.
40
hélice α (à droite) -57 -47 3,6 1,5 5,5
hélice β (à droite ou à
-57 -70 4,4 1,1 5
gauche)
L'hélice β ressemble à un ressort qui aurait une section triangulaire plutôt que
circulaire. Elle est composée de feuillets beta qui, au lieu d'être plus ou moins
parallèles les uns par rapport aux autres, tournent en rond au lieu d'un axe.
C'est une structure retrouvée, par exemple, dans plusieurs protéines antigel. La
figure ci-contre, représentant une hélice β de la protéine antigel de Choristoneura
fumiferana, est tirée de GRAETHER SP, KUIPER MJ, GAGNÉ SM, WALKER VK, JIA ZC,
SYKES BD & DAVIES PL: b-Helix structure and ice-binding properties of a hyperactive antifreeze
protein from an insect Nature 406, 325 - 328 (2000) © Macmillan Publishers Ltd.
41
2.2.4.2 Bourrelet β, tour β, et épingle à cheveux β
Ces termes traduisent les noms plus usuels de β-bulge, β-turn et β-hairpin. Le
bourrelet β est une discontinuité locale dans la structure d'un feuillet β. Le tour β, lui,
est comme un U-turn subit de la chaîne principale de la protéine; on en retrouve
souvent à la jonction de deux segments de la chaîne formant un feuillet β
antiparallèle. L'épingle à cheveux consiste également en un repli sur elle-même de
la chaîne mais est plus étendue.
42
à un feuillet beta, chez qui elle peut
causer une distortion (un coude dans
une hélice alpha, par exemple), mais
permet par contre d'autres types de
structures: les hélices de proline.
On n'a pas encore rencontré d'hélice PPI dans les protéines. Par contre, les hélices
PPII ont une importance biologique indéniable: le domaine SH3 (src-homology 3) de
plusieurs récepteurs lie des ligands de conformation PPII.
Cette hélice qui tourne à gauche s'apparente à l'hélice PPII. Elle a une structure fort
particulière: chaque troisième résidu y est une glycine, et près de la moitié des
autres est une proline. Elle est aussi très riche en résidus modifiés comme
l'hydroxylysine et l'hydroxyproline.
43
L'hélice de collagène est vue plus en détails à la section 3.7, car elle contient aussi
plusieurs acides aminés modifiés et servira de modèle pour résumer les trois
premiers chapitres.
(a) interactions charge-charge entre résidus de charge inverse comme K et R d'une part et
-
D et E d'autre part ( -NH3+ vs COO ). Quand une telle interaction est enfouie dans une
protéine globulaire, à l'abri de l'eau, on dit qu'il s'agit d'un pont de sel (salt bridge).
(b) Interactions charge-dipôle quand une chaîne latérale ionisée interagit avec le dipôle
d'une molécule d'eau. Cette interaction aide aussi à l'hydratation et à la solubilisation de la
protéine.
(c) Pont hydrogène entre H d'une part et O ou N d'autre part (il n'y a pas de Fluor dans la
composition des acides aminés). Les protéines peuvent bien sûr former des ponts
hydrogènes avec des molécules de solvant comme l'eau, et de telles interactions peuvent
aussi contribuer à la stabilité de la structure globale.
Forces de Van der Waals : il s'agit de dipôle temporaires de faible force.. Ceux-ci
peuvent se former parce que les nuages électroniques des atomes individuels
peuvent fluctuer, donnant naissance à des dipôles temporaires.
Ponts disulfures : Nous l'avons vu dans le chapitre un: une cystéine oxydée peut
former un lien covalent avec une autre cystéine. Ces ponts ne peuvent se produire
spontanément que dans des conditions oxydantes (ce qui n'est pas le cas dans le
cytoplasme, qui est légèrement réducteur). Les ponts disulfures se forment donc
44
dans la lumière du réticulum endoplasmique chez les cellules eucaryotes, et dans
l'espace périplasmique chez les bactéries. Le réticulum endoplasmique est
également riche en une protéine facilitant la formation de ces ponts: il s'agit de la
PDI, ou protein disulfide isomerase. Celle-ci peut oxyder des cystéines réduites et
les forcer à former un pont disulfure. La PDI, sous sa forme réduite, peut également
briser un pont disulfure déjà établi en formant un pont temporaire avec une des deux
cystéines impliquées, ce qui permet à la deuxième cystéine d'établir un pont ailleurs.
Ce processus permet de briser les ponts disulfures établis par accident entre deux
cystéines qui n'auraient pas dû être pontées, et permet ainsi à la protéine de
retrouver une structure tertiaire plus stable.
Les protéines globulaires ont une forme compacte, où on peut distinguer une surface
en contact avec le solvant et un coeur qui en est isolé. Les résidus hydrophiles se
retrouvent souvent à la surface; les résidus hydrophobes le plus souvent à l'intérieur.
Les ponts disulfures peuvent se former plus facilement à l'intérieur des protéines
globulaires, parce qu'ils nécessitent des conditions oxydantes et que le cytoplasme
est généralement réducteur à cause de la présence de glutathione. À l'abri des
molécules d'eau qui les hydrateraient, les acides aminés chargés enfouis dans les
protéines globulaires peuvent former des ponts de sel entre eux. Les acides aminés
hydrophobes peuvent aussi plus facilement s'y empiler pour former des régions
dépourvues d'eau.
Puisque toutes les protéines sont à la base une longue chaîne polypeptidique, on
peut se les représenter comme des spaghettis. Alors qu'une protéine globulaire est
45
une boule de spaghettis refroidis et figée, une protéine fibreuse s'étire en longueur.
Une protofibrille de kératine est formée par l'enroulement de deux ou trois hélices
alpha les unes autour des autres, en tournant de façon gauchère. 11 protofibrilles
forment une microfibrille de kératine; un grand nombre de telles microfibrilles forment
une fibre de kératine.
(c) la fribroïne de la soie est composée de régions très rigides et riches en feuillets
antiparallèles. Ces régions sont séparées par des régions moins structurées
conférant une certaine élasticité à la soie.
Les régions rigides riches en feuillets de la fibroïne sont peu élastiques parce que
leurs nombreux ponts hydrogènes sont perpendiculaires à la direction de la chaîne
polypeptidique. L’élasticité de la soie est conférée par les domaines amorphes
séparant les feuillets beta.
46
2.3.3 Domaines
Il existe des structures tertiaires qui ont connu un tel succès que la nature les a
utilisés comme domaines modulaires. Ces domaines peuvent se retrouver sur des
protéines différentes pour y jouer le même rôle. Plusieurs types de domaines
d'attache à l'ADN sont communs à de grandes familles de facteurs de transcription
qui pourtant n'ont pas du tout les mêmes fonctions: les doigts de zinc, les domaines
bZIP, les homéodomaines, les hélice-boucle-hélice, etc).
La plupart des domaines ont une structure stable qu'on peut transférer dans un autre
contexte protéique. On peut ainsi fabriquer des protéines chimériques consistant de
domaines de différentes origines. Un facteur de transcription très utilisé en
laboratoire pour l'étude de l'activation de la transcription est une fusion du domaine
d'attache à l'ADN de la protéine de levure Gal4 et du domaine d'activation de la
transcription de la protéine virale VP-16.
47
Ce domaine d'attache à l'ADN présente deux hélices reliées par une boucle non
structurée. La structure permet la dimérisation de facteurs de transcription et
l'attachement à l'ADN sur une séquence de type E box, CANNTG.
Il s'agit de deux hélices alpha antiparallèles reliées entre elle par une simple boucle
non structurée. Plusieurs protéines (et même plusieurs domaines) contiennent une
telle structure. Le répresseur lac ou l'homéodomaine, par exemple, contiennent des
domaines hélice-tourne-hélice.
48
2.3.3.6 Homeobox
Ce domaine consiste en une séquence très conservée (chez les levures, les plantes
aussi bien que chez les animaux) de 60 acides aminés formant trois hélices (voyez
la partie homeobox du domaine POU, ci-dessous). Ce motif se retrouve dans un
grand nombre de facteurs de transcription impliqués dans le développement
embryonnaire. Il s'agit d'un domaine d'interaction avec l'ADN.
49
Contrairement à des domaines de petites taille comme le doigts de zinc, ces
domaines-ci requièrent un grand échafaudage protéique pour se maintenir.
On retrouve ce motif dans des facteurs de transcription tels p50, p65, rel, et NFAT.
La boîte MADS est un motif commun à certains facteurs de transcription. Son nom
vient des quatre premiers facteurs dans lesquels on l'a identifiée: MCM1, Agamous,
Deficiens et SRF. On compte au dessus de cent facteurs contenant des boîte
MADS, particulièrement parmi les facteurs de transcription qui dirigent la
morphogénèse des plantes.
Motif s'apparentant au doigt de zinc, le doigt PHD se retrouve dans des protéines
comme p300, CBP, TIF1, ash-1 (une protéine du groupe trithorax), l'histone
acétyltransférase Moz, etc.
50
Une variété de RING finger est le motif RBCC, qui contient un RING finger, deux
domaines supplémentaires de liaison de Zinc (les B-box), une hélice de leucine
(Coiled Coil) et une région C-terminale variable). Ce domaine permet lui aussi une
interaction protéine-protéine.
2.3.3.13 Bromodomaine
2.3.3.14 Chromodomaine
51
2.3.3.16 Répétitions WD40
2.3.3.17 T-box
52
Toutes les protéines ne sont pas dans ce cas, bien sûr: pour la plupart, un traitement
dénaturant aura résulté en leur précipitation pure et simple ou du moins en une
agrégation à cause d'interactions hydrophobiques entre résidus exposés par le
dépliement de la protéine.
Il existe cependant une classe de molécules qui aident les protéines à retrouver leur
structure tertiaire si elles viennent à la perdre. Ces molécules sont les chaperones,
qui protègent les protéines d'un repliement inadéquat ou de l'agrégation. Les
protéines HSP (heat shock proteins) par exemple, servent à protéger les protéines
des dégâts causés par un choc thermique. Elles peuvent aussi aider les protéines à
retrouver leur forme momentanément perdue: c'est par exemple le cas de Hsp60,
qui aide au transport de protéines dans la matrice mitochondriale. L'enzyme F1
ATPase est synthétisé sous forme d'un précurseur à partir d'un gène nucléaire. Ce
précurseur contient un peptide signal lui permettant d'être reconnu par un récepteur
membranaire des mitochondries afin de faciliter son importation. Cependant, la F1
ATPase sous sa forme repliée est trop grosse pour passer par le canal de transport
mitochondrial. Elle doit d'abord être dépliée par l'action d'enzymes idoines.
L'ATPase, maintenant dépliée, peut ensuite passer par le canal et se retrouver dans
la matrice mitochondriale. Là, une protéase coupe son peptide signal et la Hsp60
l'aide à retrouver sa forme initiale. Sans Hsp60, l'ATPase ne réussit pas à reprendre
sa structure tertiaire et à rejoindre le complexe où elle agit d'habitude.
GroES est un anneau de 10 KDa consistant en sept sous-unités; GroEL est aussi un
anneau de sept protéines mais pesant 58 KDa.
53
En l'absence de GroES, deux anneaux GroEL s'empilent l'un sur l'autre. Le substrat
mal plié entre dans la cavité centrale d'un des anneaux. GroES vient alors couvrir le
trou, et induit dans la cavité un profond changement de conformation: elle passe de
majoritairement hydrophobe à majoritairement hydrophile, ce qui facilite aussi un
changement de conformation dans le substrat. Ce changement donne la chance au
substrat de peut-être retrouver une conformation stable et appropriée. Après vingt
secondes, quoiqu'il advienne, le substrat est relâché -qu'il soit bien replié ou non; il
peut toujours, si ça n'a pas marché, recommencer le cycle.
Voici un fait intéressant ayant rapport aux chaperones: dans le cas de la fibrose
kystique, l'origine de la maladie est une (ou plusieurs) mutations dans le gène CFTR,
qui code pour une pompe à ions Cl-. En bousculant la circulation des ions de part et
d'autre de la membrane plasmique des cellules pulmonaires, la maladie entraîne un
problème d'hydratation dans les poumons et facilite l'accumulation de mucus dans
lequel poussent des bactéries opportunistes.
L'hypothèse du prion, qui valut le prix Nobel à son inventeur, le Dr Stanley Prusiner,
suggère que l'agent pathologique de cette maladie (comme celle d'autres
encéphalites spongiformes, dont le nom vient du fait qu'elles changent le cerveau
en véritable éponge pleine de trous, et qui incluent la maladie de Creutzfeld-Jakob,
le syndrome de Gerstmann-Strausler-Scheinker et l'insomnie familiale fatale) n'est
pas une bactérie, ni un virus, ni même quoique ce soit contenant un acide
nucléique. Ce serait une protéine à laquelle on a donné le nom de prion.
La structure primaire du prion est codée par le gène PRNP (pour "PRIon Protein").
Chez un individu sain, la protéine codée par ce gène n'a rien de dangereux et fait
partie de notre bagage habituel de protéines. On désigne cette protéine normale par
le nom de PrPC; il s'agit d'une protéine extra-cellulaire fixée à l'extérieur de la
membrane plasmique par une ancre de GLI (ou glycosyl-phosphatidylinositol.
54
principalement faites d'hélices alpha en une structure très riche en feuillets beta.
Cette nouvelle structure est extrêmement stable et résiste à presque toutes les
techniques de désinfection. La protéine ayant adoptée cette nouvelle structure est
appelée PrPSC, pour "scrapie", le nom anglais de la tremblante du mouton, le
pendant ovin de la maladie de la vache folle.
Ce phénomène n'est pas limité aux mammifères: chez la levure, le produit du gène
URE2 semble lui aussi avoir une forme PrPC comme une forme PrPSC. Les prions
semblent donc être une forme extrêmement avancée de parasites moléculaires: non
contents de puis er dans nos cellules le matériel requis à leur reproduction, comme
le font les virus, ils ne se donnent même pas la peine d'emporter leur matériel
génétique avec eux.
Il existe chez les protéines un phénomène analogue à celui de l'épissage chez les
ARN messagers: une partie de la chaîne polypeptidique peut être enlevée quelque
part entre ses deux extrémités, et les deux bouts restant être raccordées ensemble.
55
Les intéines et les extéines sont à ces protéines épissées ce que les introns et les
exons sont à l'ARNm. (Mais ne nous mêlons pas: les exons ne codent pas pour des
extéines, ni les introns pour des intéines! Il ne s'agit que d'un parallèle de principe).
Voici le mécanisme d'excision d'une intéine. On peut souligner une parenté avec le domaine
autocatalytique de la protéine de signalisation Hedgehog, qui se coupe en deux pour greffer
à sa partie N-terminale une molécule de cholestérol lui permettant de se fixer à la membrane
cellulaire.
56
Les Dr Chilkoti et Filipe (le dernier de l'université McMaster en Ontario) ont mis au
point une technique de purification des protéines utilisant une intéine. Dans leur
approche, la séquence d'une intéine est introduite entre celle de l'ELP (Elastin-like
polypeptide) et celle de la protéine d'intérêt. La protéine de fusion finale, à cause de
la présence de l'ELP, précipite en présence de sel ou à une température inférieure à
30-40°C, menant à un très grand enrichissement (puisque les autres protéines, elles,
restent solubles). La protéine de fusion récupérée et resuspendue est ensuite
incubée de façon à ce que l'intéine se coupe elle-même, libérant la protéine d'intérêt.
À c e sujet, voir les références suivantes: Banki et al. (2005) Nat Methods 2: 659-62
et Ge et al. (2005) J Am Che Soc 127: 11228-9.
Un aspect encore plus intéressant de ces endonucléases est qu'elles jouent un rôle
dans la propagation de leur propre séquence codante. Voici comment, en utilisant
comme exemple la méganucléase PI-SceI, qui est une intéine retrouvée au beau
milieu du polypeptide d'une ATPase de levure, Vma1.
Il existe deux types d'allèle pour VMA1. L'une d'entre elles contient la séquence
codante pour PI-SceI. L'autre allèle ne contient pas cette séquence codante, mais à
la place contient le site de restriction reconnu par la méganucléase PI-Sce I:
57
Quand la levure, dans sa forme diploïde, contient les deux allèles, l'une d'entre elles
conduit à la production de PI-Sce I. La nucléase une fois libérée de son précurseur,
Vma1, migre vers le noyau où elle va retrouver son site de restriction qui justement se
trouve dans l'allèle de VMA1 ne contenant pas l'insertion codant pour PI-Sce I. (Ce
voyage vers une cible précise explique le nom anglais de ce type de nucléases: homing
endonucleases).
58
Nous verrons dans le chapitre 3 que le protéasome consiste en une usine
moléculaire de dégradation des protéines. Cette usine est elle-même formée de
plusieurs sous-unités protéiques formant un tunnel par lequel passent les protéines
destinées à la dégradation.
59
Les lymphocytes T de type CD8+ reconnaissent des antigènes que génèrent les cellules
présentant l'antigène (APC). Ces antigènes consistent en peptides de 8 à 10 résidus, et
proviennent des produits de dégradation des protéines- cibles par le protéasome. Ces
résidus se retrouvemt donc normalement à la queue-leu-leu dans la protéine originale.
On a cependant découvert il y a peu que ces peptides peuvent consister en deux courtes
séquences de résidus normalement séparées par une séquence intercalaire, et
fusionnées par le protéasome. Le mécanisme de cette fusion est décrit ci-contre et
correspond bien à une forme d'épissage protéique.
2.4.1 Hémoglobine
L'hémoglobine est la molécule qui, présente dans les globules rouges, permet le
transport de l'oxygène vers les tissus. Elle contribue aussi, dans une moindre
mesure, à l'évacuation des ions H+ et du CO2.
Chez l'adulte, elle est constituée de deux sous-unités d' -globine et de deux sous-
unités de -globine. Ces sous-unités sont assemblées de telle façon qu'elles laissent
une cavité au centre du tétramère. (Cette cavité ne sert pas à lier l'oxygène, mais
elle a un rôle à jouer dans la régulation du rôle de l'hémoglobine, comme nous allons
le voir à l'instant).
Chaque unité globine est associée à un groupe hème, qui contient un atome de fer
capable, quand il est bien enligné avec ce groupe, de s'associer à l'oxygène.
60
Les structures tertiaire et quaternaire de l'hémoglobine jouent un rôle primordial dans
son rôle comme transporteur. La protéine existe sous deux formes, la forme T (pour
tendue) qui a une faible affinité pour l'oxygène et la forme R (pour relaxée) de haute
affinité. Ces deux formes existent en un équilibre rapide qui dépend du pH ambiant et
de la présence d'oxygène. À pH élevé et en présence d'oxygène, la forme R est
privilégiée (et l'hémoglobine cherche donc à capturer de l'oxygène); à pH bas et quand
l'oxygène est rare, la forme T est privilégiée et l'hémoglobine relâche l'oxygène.
Lors d'une transition de T vers R, les sous-unités α1-β1 se rapprochent des sous-
unités α2-β2, réduisant la taille de la cavité centrale entre les sous-unités. Ce changement de
structure quaternaire a d'abord été remarqué lors d'expériences de cristallisation de
déoxyhémoglobine: ces cristaux, mis en présence d'oxygène, se cassaient -indice que la
structure des composantes du cristal avaient changé et n'était plus compatible avec le réseau
cristallin initial.
61
La sensibilité de l'hémoglobine au
pH procède du fait que les
cellules contenant beaucoup de
CO2 ont un pH plus acide, parce
que CO2 + H2O -> H2CO3.
L'hémoglobine ayant déchargé sa
charge d'oxygène peut alors
contribuer à évacuer l'excédent
de CO2 et d'ions H+ des cellules.
Elle est responsable d'environ
20% de cette évacuation. Les
ions H+ ne se lient pas au groupe
hème: ils se lient à l'histidine 146
de la -globine et à deux autres
résidus dans l' -globine de la
forme T. Le CO2, lui, se lie à
l'extrémité N-terminale de
chacune des quatre chaînes de
globine pour former la
carbaminohémoglobine.
Contrairement au CO2, le
monoxyde de carbone CO
compétitionne directement
avec O2 pour le lien libre sur
l'atome de fer du groupe
hème. Il a en outre une affinité
240 fois plus élevée. C'est
pourquoi le CO est beaucoup
plus toxique que le CO2: alors
que le CO2 est libéré
facilement (par simple
compétition) quand le patient
intoxiqué est mis en présence
de O2, le CO, lui, reste fixé très
longtemps sur le groupe hème,
puisque l'équilibre entre le CO
et O2 sur le groupe hème
favorise grandement le
premier.
La globine est une structure fort utile pour la capture de l'oxygène et on en retrouve
une autre forme, la myoglobine, dans les cellules musculaires. La myoglobine n'est
cependant pas un tétramère mais un monomère. En outre, elle ferait un pauvre
transporteur d'oxygène parce que son affinité pour ce gaz est trop élevée (elle a
tendance à le garder. Imaginez un laitier qui ne laisserait aller son lait qu'avec
62
réticence: il ferait un bien mauvais distributeur). La myoglobine sert donc à stocker
l'oxygène dans les muscles.
Chez l'hémoglobine, la capture d'oxygène par une première sous-unité entraîne une
augmentation d'affinité pour les suivantes. Les sous-unités de l'hémoglobine
pratiquent donc des interactions coopératives quand il s'agit de lier l'oxygène. La
courbe de saturation en O2 en fonction de la pression partielle d'oxygène est
sigmoïde, reflétant cette coopération.
Un autre agent joue un rôle important dans la régulation de la capture d'oxygène par
l'hémoglobine: il s'agit du diphosphoglycérate.
63
2.4.2 Anémie falciforme
64
Les effets pléiotropiques d'une seule mutation dans la séquence de la
beta-globine (Glu6Val) qui mène à l'anémie falciforme. (D'après Strickberger, MW,
Genetics (3e éd.) Prentice-Hall, Upple Saddle River, 1985).
L'hemerythrine est une protéine qui sert à véhiculer l'oxygène chez les
brachiopodes, les sipunculides, les priapulides et un annélide (le
Magelona). Elle est incolore dans son état désoxygéné et adopte une
couleur rose en absorbant l'oxygène. Contrairement à l'hémoglobine, elle
ne souffre pas d'empoisonnement au monoxyde de carbone.
Elle aussi utilise le fer pour fixer l'oxygène, mais pas sous forme de
groupement hème comme le fait l'hémoglobine. Deux atomes de fer y sont
liés aux anneaux imidazole de cinq histidines et au groupes carboxyliques
d'un acide aspartique et d'un acide glutamique. Un atome d'oxygène est
également positionné entre les deux atomes de fer. L'hemerythrine est le
plus souvent trouvée sous forme d'un octamère de 108 000 Da, mais il
65
existe des formes dimériques, trimériques ou tétramériques chez certains
organismes. La topologie de cette protéine est presque entièrement
composée d'hélices.
2.4.3.2 Chlorocruorine
2.4.3.4 Hémocyanine
Il n'y a pas que le fer qui puisse servir au transport de l'oxygène, il y a aussi
le cuivre. Les hémocyanines sont des transporteurs d'oxygène utilisant ce
métal. Il en existe deux types, associés à certains arthropodes (crustacés
et arachnides, entre autres, et donc crabes, araignées, scorpions et
limules) ou à certains mollusques (pieuvre, ormeau). La circulation chez
ces organismes est très différente de ce qu'elle est chez les vertébrés:
plutôt que d'être pompé à haute pression par le coeur dans des artères, le
sang est distribué à basse pression dans des espaces et des sinus autour
des organes internes.
Vous savez maintenant qui sont les vrais sang bleu dans l’évolution!!!
66
3.0 Modifications post-traductionnelles
3.1 Généralités
Voici une liste partielle des modifications post-traductionnelles qu'on peut rencontrer
dans une protéine.
Ajout de polypeptides:
67
- ubiquitination (couplage à l'ubiquitine: histones, aussi toute protéine appelée à être
dégradée par le sentier métabolique du protéasome 26S; sur une lysine).
- sumoylation (couplage du small ubiquitin-like modifier, ou SUMO: se produit chez
p53, IκB, PML; sur une lysine).
3.2.1 acétylation
L'ajout d'un groupement acétyl- (CH3-CO- ) est une acétylation. Cette modification
post-traductionnelle des protéines est dirigée par des enzymes appelés
acétyltransférases. Cet ajout est réversible par un autre type d'enzyme: les
déacétylases. L'acétylation se produit sur un groupement aminé, qui peut se trouver
soit à l'extrémité N-terminale d'une protéine ou à l'extrémité de la chaîne latérale
d'une lysine.
68
L'acétylation de plusieurs lysines localisées dans la partie N-terminale des histones
H3 et H4 est impliquée dans la régulation de l'expression des gènes. Ces régions
sont à l'extérieur du domaine globulaire des histones, et comme leurs nombreuses
lysines chargées positivement (-NH3+ à pH neutre), elles peuvent se coller sur l'ADN
qui, lui, est chargé négativement. L'acétylation des lysines neutralise leur charge
positive, et les queues N-terminales n'interagissent plus avec l'ADN qui, par
conséquent, est empaqueté de façon moins serrée par les histones.
Les acétyltransférases chargés d'acétyler les lysines N-terminales des histones sont
recrutées par des facteurs de transcription au promoteur d'un gène -cible. Les
histone déacétylases, elles, sont recrutés au promoteur d'un gène-cible par des
répresseurs de la transcription. On retrouve des acétyltransférases dans le
cytoplasme (comme Hat1) ainsi que dans le noyau (comme Gcn5). L'acétylation des
histones dans le cytoplasme aide à l'assemblage de la chromatine (une fois qu'elles
ont rejoint le noyau) et l'acétylation qui fait suite à cet assemblage a un rôle de
régulation de l'expression des gènes.
69
que ces modifications reflétaient un nouveau système de signalisation, qu'il a appelé
le "code des histones". Ce code est bien entendu encore bien mystérieux, si tant est
qu'il existe réellement.
Histone H3
Pas de modification répression
K14 acétylée transcription
S10 acétylée + S28 phosphorylée mitose
S10 phosphorylée + K14 acétylée transcription
K4 méthylée transcription
K9 méthylée répression de la transcription
Histone H4
K8 acétylée + K16 acétylée transcription
K5 acétylée + K12 acétylée dépôt des histones
K20 méthylée répression
3.2.2 amidation
Plus de la moitié des neuropeptides actifs sont amidés en C-terminal (chez les
insectes, ce chiffre atteindrait 90%). C'est le cas par exemple de l'hypocretin-1 et -
2, de la galanine, ou de la calcitonine de saumon; la gastrine et la cholŽcystokinine
sont Žgalement amidŽes. L'amidation est une réaction enzymatique qui a besoin de
vitamine C comme cofacteur. La source du groupement amide est une glycine
placée à l'extrémité C-terminale, et chez les vertébrés cette réaction est catalysée
par un enzyme bifonctionnel appelé PAM (peptidylglycine alpha-amidating
monooxygenase).
70
3.2.3 biotinylation
La biotine est une molécule qui peut être ajoutée à la chaîne latérale de certaines
lysines pour former la biocytine, le groupement actif d'enzymes telle la pyruvate
carboxylase, qui carboxyle le pyruvate pour donner de l'oxaloacétate. Dans ces
réactions, la biotine agit comme transporteur temporaire de groupements -COO-.
3.2.4 carboxylation
71
produit dans de nombreuses protéines impliquées dans la coagulation sanguine
(Facteur II ou prothrombine, facteur VII, facteur IX, facteur X), de même que dans
d'autres protéines (protéines anticoagulantes C, S et Z; ostéocalcine; certaines
protéines ribosomiques).
3.2.5 déimination
72
3.2.6 hydroxylation
73
3.2.7 méthylation
3.2.8 phosphorylation
74
Les kinases ne doivent évidemment pas phosphoryler toutes les protéines
contenant au moins un tyrosine, une sérine ou une thréonine, car alors
aucune transmission de signal spécifique ne serait possible. Voici quelques
sites-cibles de protéines-kinases:
CK II X- S/T -X-X-D/E 1
75
PKC X- S/T -X-R/K 1
References:
1- PROSITE pattern.
2- Pinna, L.A. and Ruzzene M. (1996) Biochim. Biophys. Acta 1314 :191-225.
3- Kennelly, P.J. and Krebs, E.G. (1991) J. Biol. Chem. 266 :15555-15558.
4- Kemp, B.E., and Pearson, R.B. (1990) Trends Biochem. Sci. 15 :342-346.
76
La phosphorylation du facteur NFAT le garde inactif dans le cytoplasme.
Un message membranaire permet l'influx de calcium dans la cellule, ce qui
stimule la phosphatase calcium-dépendante calcineurine. Celle-ci
déphosphoryle NFAT qui peut migrer dans le noyau et activer la
transcription de gènes cibles.
Ce système est intéressant au point de vue médical, car NFAT est impliqué
dans la différentiation de cellules du système immunitaire (les lymphocytes
T). Les drogues cyclosporine et FK506 sont des inhibiteurs de l'activité de
77
la calcineurine, et par effet indirect empêchent NFAT d'aller activer les
gènes requis par la réponse immune. C'est pourquoi la cyclosporine et
FK506 sont utilisés comme immunosuppresseurs chez les patients
porteurs d'une greffe hétérologue.
Qu'il s'agisse d'une chaîne organique hydrophobique, d'un acide gras simple ou d'un
complexe glycophosphatidylinositol, on retrouve de nombreuses "ancres" qui
permettent à des protéines de rester attachées aux membranes biologiques. Cette
section décrit les principales:
78
Nous parlerons aussi du cholestérol, même s'il ne s'agit pas d'un ajout fréquent.
mais la nature de la
chaîne liant le PI à la
protéine peut varier et
compter de nombreux
sucres. De telles protéines
n'ont pas de domaine
transmembranaire et sont
exclusivement trouvées à
la surface des cellules.
L'ancre de GPI est préformée et est ancrée dans la membrane. Elle est ajoutée à
une protéine en remplaçant une des extrémités de la chaîne; c'est à dire qu'une
partie de la protéine est perdue quand l'ancre est ajoutée. La cible du GPI sur la
protéine est une séquence de 3-5 petits acides aminés suivis de 8-12 acides aminés
hydrophiles, puis de 8-20 acides aminés hydrophobes; l'ancre de GPI s'intercale
entre les petits acides aminés et les aa hydrophiles.
79
3.3.2 Isoprénylation ou prénylation
le farnésyl-diphosphate ou le géranylgéranyldiphosphate
L'isoprénylation permet à des protéines de se fixer dans une membrane. C'est le cas
des protéines G impliquées dans la transduction du signal. Les membres de la
famille Ras s'accrochent aussi à la membrane plasmique par une ancre farnésylée.
En plus, N-Ras, K-RASA sont palmitoylés une fois et H-Ras l'est deux fois.
80
membrane et de véhiculer les signaux
extracellulaires pro-mitotiques.
Les deux acides gras les plus souvents ajoutés aux protéines sont l'acide palmitique
et l'acide myristique.
Ils servent eux aussi à ancrer les protéines dans une membrane, et parfois à les
diriger vers le bon compartiment cellulaire.
81
une interaction hydrophobes. Cependant, même si les deux morceaux restent collés,
l'extrémité N-terminale fraîchement coupée de p15 est maintenant GSQSAR, et
cette glycine N-terminale est une cible pour les enzymes qui transfèrent l'acide
myristique. p15 se fait myristoyler, et cette nouvelle ancre d'acide myristique permet
de diriger le BID activé vers la membrane de la mitochondrie.
82
3.4.4 Glycosylation en N et en O
Le sucre situé le plus à l'extérieur d'une chaîne glucidique liée à une protéine est
souvent l'acide N-acétylneuraminique, chargé négativement, qui aide à tenir les
protéines éloignées les unes des autres (par répulsion de charges).
La glycosylation des protéines est présente dans toutes les cellules eucaryotes. Elle
se retrouve aussi chez les bactéries, une découverte assez récente d'ailleurs. La
majeure partie des glycoprotéines se trouve sur la face externe de la membrane
plasmique, avec la partie glycosylée pendouillant dans le milieu extracellulaire; il
existe cependant aussi des glycoprotéines intracellulaires, comme les facteurs de
trannscription SP1ou YY1 qui sont O-glycosylés par le N-acétylglucosamine.
Les chaînes glucidiques des glycoprotéines sont dites liées en N ou en O selon leur
site d'ancrage.
83
Liées en O: sucres ancrés sur l'oxygène du groupement hydroxyl de
la sérine,
la thréonine,
l'hydroxylysine (dans le collagène).
Les structures liées en N ou en O sont très différentes. Les chaînes liées en O sont
plus courtes et plus variables que celles en N, et ne contiennent la plupart du temps
84
qu'un, deux ou trois résidus glucidiques. Les chaînes en N peuvent former de
véritables arborisations.
Selon la nature de ces autres glucides, on divise les arborisations glucidiques liées
en N en trois familles:
- Type riche en mannose, qui ne contient que des résidus mannose en plus de la
structure de base;
- Type hybride, qui contient différents sucres et sucres aminés;
- Type complexe, qui ressemble au type hybride mais contient aussi du NANA.
85
La chaîne glucidique n'est pas au bout de ses peines, cependant: elle continue
d'être modifiée dans le réticulum et dans le Golgi.
Liaison en O: Ici, les résidus sont ajoutés un par un (s'il y en a plus d'un). Les
sucres ajoutés sont sous forme "activée", c'est à dire liés à un nucléotide, et les
glycoprotéines transférases les ajoutent directement sur les acides aminés cibles.
Les groupes sanguins ABO résultent d'une glycosylation effectuée avec les mêmes
enzymes que pour la O-glycosylation, même s'ils ne sont pas toujours associés à
des protéines. Ils viennent de ce que trois conformations possibles d'un
oligosaccharide greffé sur une protéine membranaire des globules rouges donnent
naissance à trois antigènes: l'antigène H (ou O), l'antigène A et l'antigène B.
Ces épitopes, A, B et O, sont entièrement glycosidiques: ils peuvent être portés par
une glycoprotéine (comme la bande 3, la bande 4.5 ou d'autres) ou même par un
lipide. La bande 3 contient aussi une unique chaîne glycosylée liée en N, pointant
vers l'extérieur de la cellule, et qui porte elle-même plus de la moitié des épitopes
antigéniques du système ABO.
86
Ces épitopes, A, B et O, sont entièrement glycosidiques: ils peuvent être portés par
une glycoprotéine (comme la bande 3, la bande 4.5 ou d'autres) ou même par un
lipide. La bande 3 contient aussi une unique chaîne glycosylée liée en N, pointant
vers l'extérieur de la cellule, et qui porte plus de la moitié des épitopes antigéniques
du système ABO.
L'épitope "de base" du système ABO consiste à la base d'un groupe de cinq sucres:
le glucose, le galactose, le N-acétylglucosamine, le galactose et le fucose. Ces
sucres constituent l'antigène O (ou H) qui est -théoriquement- partagé par tout le
monde.
87
pour du sang O (puisqu'il ne réagit ni avec A ni avec B). Ces individus sont donc
passibles de recevoir une transfusion qui peut leur être fatale.
Pour échapper à une réponse immunitaire trop sévère de son hôte (l'être humain,
par exemple), la bactérie entérique Shigella flexneri est équipée d'une structure
lipopolysaccharidique qui contient plusieurs répétitions de l'antigène O. Ce polymère
d'antigène O s'étend bien au-delà de la surface de la bactérie.
Les enzymes qui doivent se rendre dans les lysosomes y sont dirigés par une glycosylation spécifiq
portent un mannose-6-phosphate. Le phosphate est ajouté à la protéine (qui est déjà une glycoprot
bien entendu) selon le processus décrit dans la figure qui suit. Cette réaction se produit dans le Go
88
3.4.7 Glycosylation et infection
- Le virus VIH entrent dans les cellules du système immunitaire en s'attachant à des
récepteurs tels CXCR4 et CXCR5, qui sont des glycoprotéines.
3.5.1 ubiquitination
Voir les revues suivantes sur l'ubiquitination: Pickart CM. Mechanisms underlying
ubiquitination. Annu Rev Biochem. 2001;70:503-33 ainsi que Voges D, Zwickl P,
Baumeister W. The 26S proteasome: a molecular machine designed for controlled
proteolysis. Annu Rev Biochem. 1999;68:1015-68 et Hershko A, Ciechanover A. The
ubiquitin system. Annu Rev Biochem. 1998;67:425-79.
89
L'ubiquitine est ajoutée par
sa propre extrémité C-
terminale à des résidus
lysine des protéines-cibles
ou, parfois, à l'extrémité N-
terminale de certains
facteurs (MyoD ou LMP-1 de
EBV, p.e.). D'autres
molécules d'ubiquitine
peuvent ensuite être
ajoutées par leur C-terminal
à la lysine K48 de la
précédente pour former une
longue chaîne qui permet
l'accostage de la protéine sur
des sites de reconnaissance
localisés sur la particule
régulatrice du protéasome
26S.
Au protéasome 26S, la
protéine est déroulée par des
ATPases et est dégradée en
peptides de 8 acides aminés
environ.
Trois familles d'enzymes sont requises pour ubiquitiner les protéines (E1 à E3); un
nouvel enzyme, E4, semble faciliter l'allongement de la chaîne poly-ubiquitine. Au
moins quatre ubiquitines sont nécessaires pour signaliser la destruction de la
protéine. Les membres des familles E2 et E3 forment des complexes qui s'associent
avec la protéine-cible; E3 fournit l'association à la cible et E2 fournit l'ubiquitine.
90
Il existe un enzyme E1, une vingtaine d'enzymes E2, et encore plus d'enzymes E3.
Cette variété permet une multiplicité de spécificités. L'enzyme E1 est d'abord
conjugué à l'ubiquitine (sur un résidu cystéine), qu'il transfère à l'enzyme E2,
également sur un résidu cystéine. E3, le partenaire de E2, permet de recruter la
protéine-cible et permet le transfert de l'ubiquitine sur cette dernière. Beaucoup de
membres de la famille E3 contiennent un RING finger, une forme de doigt de zinc de
séquence CXXCX(n) CX(1-3) HX(2-3) C/HXXCX (n)CXXC.
Un "ring finger".
Le signal d'ubiquitination des protéines cibles n'est pas très bien défini, quoiqu'on ait
décrit une "destruction box" qui en fait office chez les cyclines. Sa séquence est très
dégénérée et ressemble à ceci: R (A/T) (A) L (G) X (I/V) (G/T) (N), où les résidus
entre parenthèses sont présents 50% du temps ou plus. En outre, certaines
modifications post-traductionnelles (comme la phosphorylation) peuvent changer
une séquence peptidique inactive en signal de reconnaissance pour le système de
dégradation; c'est ce qui se passe dans le système IkB-NFkB illustré plus bas.
La "règle du N-terminus" (ou "N-end rule"), spécifie que certains résidus, quand ils
occupent la place N-terminale d'un peptide, peuvent donner un signal de destruction.
Les acides aminés concernés, qu'on peut identifier dans la table ci-dessous, se
combinent avec une lysine située légèrement en aval pour former une cassette
appelée N-degron. Le N-degron est reconnu par un complexe protéique E2-E3 qui
ajoute des ubiquitines à la lysine. La protéine est ensuite détruite par le protéasome
comme nous venons de le voir.
S.
Résidu E.coli
cerevisiae
Arginine, Arg, R 2 2
Lysine, Lys, K 2 3
Phenylalanine, Phe, F 2 2
91
Leucine, Leu, L 2 2
Tryptophane, Trp, W 2 2
Tyrosine, Tyr, Y 2 10
Plus de
Cysteine, Cys, C Plus de 600
1200
Plus de
Alanine, Ala, A Plus de 600
1200
Plus de
Serine, Ser, S Plus de 600
1200
Plus de
Threonine, Thr, T Plus de 600
1200
Plus de
Glycine, Gly, G Plus de 600
1200
Plus de
Valine, Val, V Plus de 600
1200
Plus de
Methionine, Met, M Plus de 600
1200
92
Le dégron de levure représenté ci-bas contient
(a) la séquence de l'ubiquitine,
(b) une arginine, et
(c) la séquence d'une dihydrofolate réductase (DHFR) thermosensible.
L'ubiquitine ne sert pas qu'à marquer les protéines pour la dégradation. De courtes
chaînes d'ubiquitine jouent probablement un rôle différent (Les histones H2A, H2B et
H1 peuvent être ubiquitinées dans leur partie C-terminale sans être condamnées à
la destruction). Par exemple, on sait que la protéine de réparation de l'ADN Rad26
aide à ubiquitiner la lysine 123 de l'histone H2B. Cette ubiquitination semble être un
pré-requis à la méthylation de la lysine 4 de l'histone H3, et on soupçonne que cela
est dû au recrutement de la sous-unité 19S du protéasome (la sous-unité
régulatrice) par H2B-K123-Ubi. La méthylation de H3K4 permet le recrutement de
SAGA via sa sous-unité Chd1, et SAGA peut ensuite procéder à l'acétylation de
93
l'histone H3 via sa sous-unité Gcn5.
3.5.2 Sumoylation
Il existe des protéines apparentées à l'ubiquitine, soit par leur séquence, soit par leur
capacité d'être greffée à des protéines déjà existentes. C'est le cas des protéines
SUMO ( small ubiquitin-like modifier).La sumoylation est une variante de
l'ubiquitination. Elle implique l'attachement de SUMO à une lysine présente dans
divereses cibles comme p53, IκBα, ou PML. Elle ne mène pas à l'assemblage de
94
longues chaînes de SUMO et ne mène pas non plus à la dégradation. La
sumoylation est réversible.
La dégradation des protéines est une des étapes majeures de la régulation de leur
activité. La dégradation peut être partielle, comme quand un zymogène est
partiellement dégradé pour libérer un enzyme actif, ou totale pour complètement
éliminer la molécule.
L'unité régulatrice qui coiffe l'empilement reconnaît les chaînes d'ubiquitine (et donc
les protéines marquées pour la destruction par ce système) et déroule la chaîne
polypeptidique qu'elle fait passer dans le canal des unités catalytiques, où la chaîne
est découpée en fragments d'environ huit résidus.
95
Les lysosomes, eux, sont des vésicules d'origine golgienne. Les enzymes
lysosomiques sont glycolsylés et portent un mannose-6-phosphate, qui est reconnu
à la surface interne du réticulum trans golgien par un récepteur qui dirige ces
enzymes vers les lysosomes en maturation.
Les chaînes A et B sont reliées par des ponts disulfures dans l'insuline mature.
Le rôle métabolique du peptide C n'est pas encore clair, mais il est sécrété en
quantité équimolaire à l'insuline.(Il peut être utilisé pour quantifier la production
d'insuline).
96
3.7 Le collagène, protéine très modifiée
Consultation suggérée: Darnell, Lodish & Baltimore: Molecular Cell Biology (2nd ed).
Scientific American Books, New York, 1990, pp. 906-915.
97
La glycine est un petit acide aminé. Sa chaîne latérale ne consiste en effet que d'un atome d'hydrogène. La
proline est un cas spécial: sa chaîne latérale se replie et vient rejoindre son groupement aminé: la chaîne
latérale dépasse alors de l'axe principal de la chaîne polypeptidique comme une anse de tasse. Cette
conformation inhabituelle et rigide rend la proline incapable de participer à l'élaboration d'une hélice a.
L'hydroxyproline est produite après la traduction de l'ARNm du collagène en chaîne polypeptidique: elle résulte
d'une hydroxylation d'un résidu proline par l'enzyme prolyl hydroxylase, avec comme co-facteurs O2, Fe2+, l'α-
cétoglutarate et l'acide ascorbique.
98
3.7.3 Structure quaternaire du collagène
99
Une fois dans le réticulum
endoplasmique, le peptide signal est
coupé (étape 1 de la figure ci-dessous).
Ensuite, plusieurs prolines et lysines du
polypeptide sont hydroxylés. Le
propeptide C-terminal est modifié par N-
glycosylation. Certaines hydroxylysines
sont O-glycosylées (étape 2). Les
différentes modifications et la formation
de ponts disulfure entre les propeptides
C-terminaux de trois chaînes permettent
ensuite leur alignement (étape 3). Une
fois sa base bien alignée, la triple hélice
s'enroule alors comme une fermeture
éclair, en direction du N-terminus. (étape
4). Dans l'appareil de Golgi, étape qui suit
le voyage dans le réticulum
endoplasmique, la triple hélice est
flanquée de part et d'autre de régions
non-hélicales qui ont aidé à sa maturation
(étape 5). Le propeptide est alors éjecté
par exocytose dans l'espace
extracellulaire, où des procollagène
peptidases coupent les propeptides N- et
C-terminaux et libèrent une triple hélice
mature de tropocollagène de 1050 a.a. ou
300 nm de longueur (étape 6).
100
Les molécules de tropocollagène s'assemblent côte à côte
mais avec un décallage de 67 nm. Des lysines de la partie N-
terminale d'une molécule sont pontées de façon covalente à
d'autres lysines de la partrie C-terminale d'une voisine par
l'action de la Lysyl oxydase.
101
Tannage:
102
4.0 Les enzymes
Les enzymes sont des catalystes biologiques qui permettent d'augmenter la vitesse d'une
réaction chimique jusqu'à plusieurs milliards de fois. Ce sont principalement des protéines,
quoique les travaux des Drs Thomas Cech et Sydney Altman, justement récompensés par le
prix Nobel de chimie en 1989, nous ait permis de découvrir que certains ARNs ont aussi une
activité catalytique.
Les enzymes sont généralement beaucoup plus grosses que les molécules sur lesquelles elles
agissent et qu'on appelle "substrat". Leur activité peut être modulée, et c'est principalement
sur la compréhension de la façon dont l'activité enzymatique est régulée dans la cellule que
repose l'essentiel de la recherche en biologie cellulaire et moléculaire.
Il existe plusieurs ressources sur les enzymes. Voici quelques lectures recommandées sur le
sujet:
(1) Lehninger, A.L. Principles of Biochemistry, Worth Publishers Inc., New York, 1982
(chapitre 9).
(2) Le site du Dr Michael King, très bien fait, très recherché, et surtout assez concis
pour être informatif sans nous perdre en cours de route.
(3) Deux pages du site du Dr John Kimball, sur les enzymes en général et sur la
cinétique en particulier. Le Dr Kimball a la réputation d'être l'un des professeurs de
biologie les plus appréciés de ses étudiants aux États-unis. Son site est très
informatif.
Quand à nous, nous pouvons parcourir les pages suivantes (elles s'ouvriront
chacune dans une nouvelle fenêtre):
4.2 Nomenclature
Étant déjà familiers avec plusieurs enzymes, vous aurez remarqué que le nom de la
plupart d'entre eux se termine par le suffixe "-ase" et que le reste du nom nous
donne une idée générale de ce que fait cete enzyme -et c'est très bien ainsi. De
cette manière, nous avons une assez bonne idée de ce que va faire une DNA
polymérase même si nous n'avons jamais travaillé avec ou même lu quoi que ce soit
à son sujet.
Des noms comme polymérase, phosphatase, kinase etc. sont cependant des noms
familiers, ou usuels, et non des noms systématiques. La nomenclature officielle des
enzymes, elle, a été établie par la Commission des Enzymes (EC), un organisme
tributaire de l'union Internationale de Biochimie et de Biochimie Moléculaire
(IUBMB). Cette nomenclature officielle nous permet d'avoir une référence unique à
l'échelle mondiale pour la désignation des enzymes. L'histoire du développement de
cette nomenclature est en elle-même une épopée que vous pouvez lire sur le site de
l'IUBMB.
103
Là où la nomenclature officielle diffère sensiblement de la nomenclature usuelle,
c'est qu'elle désigne les enzymes en fonction des réactions qu'ils catalysent et non
en fonction de la molécule qui possède l'activité enzymatique. Ainsi, les ARN
polymérases I, II et III, que nous distinguons en biologie parce que ce sont trois
complexes moléculaires différents qui sont responsables, respectivement, de la
transcription de l'ADN en ARN ribosomique (I), en ARN messager (II) ou en ARN de
transfert, ARN ribosomique 5S et autres petits ARNs (III). Pour la Commission des
Enzymes, ces trois entités ne sont qu'une seule et même activité enzymatique,
responsable du transfert de nucléotides triphosphates sur une chaîne de
nucléotides:
EC 2.7.7.6
"EC" désigne la commission des enzymes. Le premier chiffre classe l'enzyme dans
l'une des six classes d'enzymes:
104
4: Les lyases, qui catalysent l'addition de groupes à des liens doubles ou l'inverse;
5: Les isomérases, qui catalysent le transfert de groupes dans une même molécule
pour produire des formes isomères (la conversion d'un acide aminé L en acide
aminé D' par exemple);
6: Les ligases, qui forment des liens C-C, C-S, C-O et C-N lors de réactions de
condensation couplées à l'utilisation d'ATP.
Les autres chiffres désignent des sous-classes pour chaque enzyme; ils permettent
de savoir que telle transférase ajoute un groupement hydroxyl à une molécule de
glucose, par exemple.
En toute honnëteté, on n'utilise pas très souvent le noms systématique d'un enzyme
en biologie. Il est quand même bon de savoir que cette référence existe.
Nous avons utilisé le pouvoir de catalyse des enzymes pour favoriser notre mieux-
être depuis les temps les plus reculés, même si c'était parfois à notre insu. Dans
l'industrie alimentaire, par exemple, il n'est probablement pas possible de savoir
quand exactement nous avons commencé à utiliser les enzymes glycolytiques des
levures de type Saccharomyces pour faire fermenter la bière et faire lever le pain.
Les Sumériens brassaient déjà de la bière et comme ils ont inventé l'écriture, il est
difficile de chercher plus avant.
Quelques organismes parmi les très nombreux dont les enzymes nous facilitent la
vie:
enzymes glycolytiques
Penicillium roqueforti
105
Même si les enzymes étaient utilisés depuis l'âge de bronze au moins, leur étude n'a
commencé à se faire qu'assez récemment.
Une réjouissante description des querelles sévissant au XIXe siècle au sujet des
enzymes se trouve sur ce site: http://bip.cnrs-mrs.fr/bip10/buchner4.htm ; nous nous
limiterons ici à quelques considérations historiques.
Le mot "enzyme" a été inventé n 1876 par le professeur Willy Kühne de l'université
de Heidelberg (à qui nous devons aussi les noms de la myosine et de la trypsine).
Le mot vient vient du grec "en zume", et signifie, de façon assez appropriée, "dans la
levure". Et si vous avez la chance de goûter à la bière de Heidelberg, vous trouverez
pertinent l'intérêt de ce chercheur pour la fermentation alcoolique!
Le mot enzyme cherchait à donner à ces mystérieux catalystes biologiques qu'on savait se
trouver dans les microorganismes une connotation chimique. En effet, suite aux travaux de
Louis Pasteur sur la fermentation alcoolique, l'opinion généralement partagée était que cette
fermentation est un processus inséparable des organismes vivants. Des chercheurs comme
Berthelot et Kühne suspectaient bien que ce que Pasteur appelait "ferments" devaient être un
genre de composé qu'on pouvait extraire des microorganismes -seulement, à cette époque, les
techniques d'extraction cellulaire étaient encore à découvrir et les tentatives faites jusque là
n'avaient livré aucun ferment actif.
C'est finalement le scientifique allemand Eduard Buchner qui put produire un extrait
cellulaire aux propriétés enzymatiques indéniables. Sa zymase, un enzyme qui permettait
la fermentation du sucre en alcool en l'absence de levures vivantes, lui valut le prix Nobel
de chimie en 1907.
Un cofacteur peut être inorganique, tels que le sont les ions Fe 2+, Mn2+, Zn2+ ou
Mg2+, des cofacteurs fréquents. Il peut aussi être de nature organique, comme la
biotine ou le coenzyme A. La plupart des vitamines sont des cofacteurs
enzymatiques. Quand un cofacteur est une molécule organique complexe, il porte le
nom de coenzyme. La partie protéique de l'enzyme, elle, s'appelle apoenzyme et
l'union de l'apoenzyme et de son coenzyme (ou de son cofacteur) est un
holoenzyme.
106
Le cofacteur, qu'il soit petit comme un ion ou complexe comme un coenzyme, peut
être attaché de façon transitoire à l'apoenzyme ou encore y être fixé de façon
covalente; c'est alors un groupement prosthétique.
Finalement, un enzyme qui est synthétisé sous une forme inactive qui demande à
être activée par protéolyse partielle est un zymogène.
L'énergie individuelle des molécules dans une population varie beaucoup de part et
d'autre d'une valeur moyenne. L'énergie d'une molécule particulière pourrait être
suffisamment élevée pour lui faire passer le niveau d'une barrière d'énergie
d'activation qui sépare cette molécule d'un autre état plus stable:
L'état dans lequel une molécule se trouve quand elle est au sommet de la colline
(c'est à dire avec assez d'énergie pour changer d'état) et dit "état de transition",
parce que la molécule pourrait soit franchir la barrière, soit revenir à son état
antérieur. une fois la barrière franchie, le retour est extrêmement défavorisé.
Voici un exemple: un ballon au sommet d'une pente va rouler vers le bas sans
nécéssiter d'aide, parce que son niveau d'énergie potentielle en haut de la pente est
plus élevée qu'en bas. À moins qu'on lui fournisse activement de l'énergie, une
réaction va toujours du niveau d'énergie le plus élevé au niveau le plus bas.
L'énergie d'activation dans cet exemple pourrait être représentée par un caillou qui
tiendrait le ballon en place: ce dernier a besoin d'un léger coup de pied pour franchir
cette barrière. Après la réaction se déroule spontanément.
107
Il existe deux façons
de permettre une
réaction qui fait face à
une barrière
énergétique
d'activation: fournir de
l'énergie (en
chauffant, par
exemple) ou en
utilisant un facilitateur
chimique, un
catalyseur. Avec un
catalyseur, le niveau
d'énergie d'activation
d'une réaction est
abaissé: celle-ci a
donc moins besoin
d'un apport externe
d'énergie pour se
dérouler.
Un catalyseur peut ainsi accélérer une réaction d'un facteur de plusieurs millions de
fois.
Les enzymes sont des catalystes biologiques. Ils augmentent la vitesse de réactions
chimiques en en abaissant le niveau d'énergie d'activation; eux-mêmes ne sont pas
affectés par la réaction proprement dite.
Un enzyme est beaucoup plus volumineux que son substrat. Il semble qu'on ait
besoin d'une architecture fort complexe pour permettre à quelques acides aminés de
se trouver juste dans la position qu'il faut pour servir de catalyseur à une réaction. La
structure de l'enzyme sera donc déterminante pour sa fonction.
Le pH aura le même effet. L'état d'ionisation des différents acides aminés d'une
protéine aura une grande influence sur sa structure, et indépendamment de la
structure on doit aussi considérer l'état d'ionisation des acides aminés du site actif.
108
Les enzymes auront par conséquent des pH optimaux différents, selon leur structure
et la nature de leur site actif. La pepsine a un pH optimal de 1,5, approprié pour un
enzyme gastrique; la trypsine intestinale a plutôt un pH optimal de 7,7).
De même, il n'est pas rare qu'une même protéine ait plusieurs activités enzymatique.
Le facteur de transcription basal TFIID contient une polypeptide, TAFII250, qui
combine des activités kinase, acétylase et ubiquitinyl-transférase.
109
Le mécanisme réactionnel de la chymotrypsine a été partiellement déduit à partir de
sa structure. L'enzyme compte trois chaînes polypeptidiques (A, B et, sans surprise,
C) reliées entre elles par des ponts disulfures ainsi que vu dans la figure ci-haut. Le
site d'attache du substrat dans la chymotrypsine consiste en une région ressemblant
à une crevasse bordée d'acides aminés hydrophobiques. La conformation de cette
crevasse permet à ces acides aminés hydrophobes d'interagir avec les chaînes
latérales hydrophobiques de W, F et Y présentes dans les substrats. Les petites
chaînes latérales hydrophobiques (comme celle de la valine ou de l'alanine), de
même que les chaînes latérales hydrophiles (toutes celles qui sont polaires) ne
permettent pas les liaisons non-covalentes nécessaires à la liaison au site actif de
l'enzyme.
110
Mécanisme du site actif de la chymotrypsine. Le substrat, une chaîne polypeptidique
avec une chaîne latérale hydrophobique comme W, F ou Y, est logé dans le site de
reconnaissance de telle façon que le lien à être hydrolysé se retrouve près de la
sérine 195. La chymotrypsine est une sérine protéase en raison du rôle que joue cet
acide aminé dans son activité; le terme sérine protéase ne désigne pas une
protéase coupant les sérines! Un transfert d'électrons initié sur l'aspartate 102,
induisant l'histidine 57 à voler un hydrogène à la sérine active.
Cet azote vole à son tour l'hydrogène (en italique), ce qui brise le lien C-N du
substrat et libère une moitié de la chaîne en train d'être digérée. Une molécule d'eau
entre alors en jeu; un pont hydrogène avec l'histidine la met en présence du reste du
substrat (troisième figure). La molécule d'eau réagit avec le substrat après que
l'histidine lui eut elle aussi volé un hydrogène (figure quatre); le lien entre la sérine et
le substrat est conséquemment hydrolysé et l'enzyme retrouve sa forme initiale. Le
reste du substrat est libéré (figure cinq).
111
4.7 Cinétique enzymatique
et qui se simplifie en
112
1 / Vo = Km / (VMax[S]) + (1 / VMax)
L'avantage de cette
transformation
mathématique est qu'elle
permet de tracer un
graphique 1/Vo vs 1/[S]
dont la courbe est en fait
une droite pour les
enzymes obéissant à la
relation michaélienne
entre vitesse de réaction et
concentration du substrat.
À une concentration de
substrat infinie, à laquelle
la vitesse de notre enzyme
serait vraiment maximale,
la valeur de 1 / [S] sera de
0. Ce graphique nous
permet donc de trouver
facilement la valeur de 1 /
Vmax, qui correspond à 1
/ Vo quand l'axe des x est
à zéro.
Plusieurs enzymes catalysent des réactions à plus d'un substrat. L'hexokinase, par
exemple, a l'ATP et le glucose comme substrats et l'ADP et le glucose-6-phosphate
comme produits. Pour un tel enzyme à deux substrats, on observera un
comportement dit de déplacement simple ou de déplacement double.
113
Le cas de l'hexokinase serait un déplacement double, car seul un groupement
phosphate a changé de place.
Le modèle clef et serrure du substrat et de l'enzyme doit être pris avec un peu de
souplesse: en effet, certaines de ces clefs ont la capacité de changer la forme de la
serrure. L'hexokinas est un tel cas. Une fois que son site de reconnaissance a
permis au glucose de se fixer au site actif, l'enzyme subit une profonde modification
de conformation qui permet aux différentes composantes du site actif de trouver leur
position appropriée dans l'espace pour catalyser le transfert d'un groupement
phosphate sur le glucose. D'autre molécules peuvent entrer dans le site de
reconnaissance (le ribose, le glycérol, par exemple) mais comme ils n'induisent pas
un tel changement de conformation, ils ne sont pas de vrai substrats pour
l'hexokinase.
Nous verrons plus loin comment les enzymes allostériques sont régulés par un
changement de conformation.
Pratiquement toutes les réactions chimiques dignes de mention dans la cellule sont
catalysées par des enzymes. La cellule a donc besoin d'un système fiable de
régulation pour gérer toute cette activité bourdonnante. Imaginez seulement une
cellule dont tous les enzymes seraient en action en même temps. Ce serait comme
une grande ville dont tous les feux de circulation seraient au vert.
La présence d' ions métalliques comme le Zn2+, le Fe2+, le Mn2+, le Mg2+ est aussi
très souvent primordiale pour la fonction enzymatique. C'est pourquoi les cellules ont
des sytèmes permettant à ces métaux de pénétrer le cytoplasme, malgré le risque
qu'il peuvent aussi lui faire courir (la plupart des métaux lourds sont rapidement
mortels pour une cellule),
La rétroaction est l'action qu'a le produit d'une réaction sur cette dernière.
S'il s'agit d'une inhibition, nous parlons d'une rétroaction négative. Par exemple, la
conversion de la thréonine en isoleucine est le fruit de l'activité de cinq enzymes en
séquence, le premier étant la thréonine déhydratase. Le produit de cette conversion,
l'isoleucine, est un inhibiteur de cet enzyme; ainsi, quand la réaction a donné le
résultat attendu, la production d'isoleucine est arrêtée (n'utilisant pas plus de
thréonine que nécessaire).
115
Un enzyme allostérique qui est modulé par son propre substrat est dit
homotrophique; s'il est modulé par une autre substance il est dit hétérotrophique.
Cela s'explique par le fait qu'une très faible augmentation du substrat, dans la partie
à pic de la courbe, résulte en une grande stimulation de l'enzyme.
116
Parce que cette courbe n'obéit pas à la cinétique michaélienne, on ne peut pas
définir de KM en fonction de 1/2 Vmax. On note quand même une concentration de
substrat équivalent à 1/2Vmax, valeur qu'on désigne par K0,5.
Une telle courbe est aussi typique de la dynamique de capture de l'oxygène par
l'hémoglobine: le premier oxygène est le plus difficile à attraper, parce que sa liaison
induit un changement conformationnel qui facilite la capture des trois suivants. Ainsi
qu'on pourrait s'y attendre, la myoglobine (qui comme l'hémoglobine capture de
l'oxygène, mais n'a qu'une seule sous-unité globine au lieu de quatre) donne, elle,
une courbe hyperbolique plutôt que sigmoïde.
La forme la plus extrême de l'inhibition de l'activité d'un enzyme par une autre
substance (à part, peut-être, la destruction de l'enzyme!) est l'inhibition irréversible.
Cette inhibition, le plus souvent causée par la formation d'un lien covalent entre
l'enzyme et l'inhibiteur, cause la perte définitive de l'activité enzymatique de
l'enzyme.
117
Dans le cas d'une inhibition compétitive, le problème est que le site de l'enzyme est
souvent occupé par un obstacle. La vitesse maximale de l'enzyme n'est cependant
pas affectée, puisque l'enzyme, lui, fonctionne très bien: c'est l'accessibilité du
substrat qui est mise en cause. À une concentration suffisemment élevée de
substrat, la concentration de compétiteur deviendrait négligeable et la vitesse
maximale serait atteinte. Cependant, plus il y a d'inhibiteur, plus il faut de substrat
pour compenser; par conséquent, la concentration de substrat pour atteindre la
moitié de la vitesse maximale est aussi plus élevée et le KM augmente avec la
concentration d'inhibiteur.
L'inhibition par le substrat se présente quand il existe deux sites dans un enzyme
pour le même substrat, mais quand l'un des deux sites a une faible activité
catalytique et une faible affinité. La vitesse de l'enzyme devrait croître quand on
augmente la quantité de substrat. Dans le cas qui nous occupe, cependant, il arrive
un moment où la concentration de substrat est telle que même le site de faible
affinité finit par avoir accès au substrat. Comme ce second site n'est pas très
efficace, cependant, il peut nuire à l'action du premier sans lui-même compenser par
sa propre activité. Quoiqu'un modèle intéressant, ce n'est pas un cas très courant.
Nous avons vu comment un précurseur inactif peut être activé quand on lui fait subir
une protéolyse limitée (exemple de la chymotrypsine).
118
5.0 La purification des protéines
Peu importe le type de projet biochimique que nous poursuivons, il est fort probable
qu’à un moment ou à un autre nous aurons besoin d’une protéine sous une forme
raisonnablement pure. (Je dis "raisonnablement", parce qu’une protéine absolument
et totalement pure est probablement une vue de l’esprit. On peut s’estimer déjà très
heureux d’obtenir une protéine assez enrichie pour que tout contaminant puisse y
être tenu comme valeur négligeable).
En bout de course, cependant, vous aurez entre vos mains une protéine
extrêmement enrichie (allez, ne soyons pas modestes et disons-la purifiée) qui vous
permettra de vous livrer à vos expériences, qu’il s’agisse de cinétiques
enzymatiques si c’est l’activité de la protéine qui vous intéresse, ou qu’il s’agisse
d’études structurales si l’architecture moléculaire est votre passion.
Pour être d'une quelconque utilité, notre protéine purifiée devra avoir conservé une
certaine intégrité; il faut donc lui éviter autant que possible les différents
traumatismes qui pourraient l’endommager pendant la purification. Pour une activité
enzymatique, nous voulons surtout préserver la fonction de la protéine, même si sa
structure a un peu pâti; à l’inverse, pour des études structurelles, nous voulons une
structure intacte même si l’activité n’y est plus. L’idéal reste évidemment de tout
préserver! Heureusement, plusieurs précautions peuvent nous aider à atteindre ce
but. Les sections suivantes vous permettrons d'en savoir un peu plus sur les
méthodes utilisées pour purifier les protéines.
Ce sont ses caractéristiques intrinsèques, celles qui rendent une protéine unique, qui vous
permettront de la séparer de ses congénères cellulaires. Une protéine a une masse, une forme,
des structures primaire, secondaire, tertiaire et peut-être quaternaire; elle a une certaine
charge à un pH donné, elle présente une certaine densité; elle possède un certain degré
d’hydrophilicité ou d'hydrophobicité. Elle a peut-être des isoformes suite à un épissage
alternatif. Elle se retrouve peut-être dans une certaine région de la cellule ou dans une
organelle donnée. Elle a peut-être été nantie, par génie génétique, d’un quelconque marqueur
facilitant son identification. Tous ces critères peuvent être utilisés dans votre démarche: votre
stratégie de purification n’est réellement régie que par l’augmentation de vos chances de
succès.
119
L’équipement disponible dans votre laboratoire sera un des facteurs les plus importants dans
le choix de cette stratégie. Supposez que vous ayez à retrouver Carlos Sanchez dans une
foule. Carlos est un Paraguayen de petite taille, avec une moustache et des cheveux noirs; il
porte une cicatrice au genou gauche, il boit son café noir et fume des Gitanes. Votre
instrument de travail est un téléphone et vous devez travailler dans l'obscurité. Il y a gros à
parier que votre stratégie d’identification reposera davantage sur l’accent paraguayen de
Carlos que sur son goût en fait de café. C’est la même chose avec les protéines : si vous
disposez des appareils vous permettant d’utiliser la charge comme moyen de séparation,
allez-y; c’est la même chose avec la taille ou la densité. Ne vous croyez pas obligé d'utiliser
tous les paramètres en même temps.
Paramètre Technique
Taille Filtration sur gel
Solubilité Précipitation séquentielle au
sulfate d'ammonium
Charge Chromatographie d'échange
d'ions
Densité Centrifugation sur gradient;
ultracentrifugation
Hydrophobicité Chromatographie en phase
inverse
Marqueur ajouté Chromatographie d'affinité
Le tableau ci-haut simule une purification protéique. Dans le matériel brut (un extrait
cellulaire, par exemple) disons que nous avons 4000 unités arbitraires de notre protéine. Pour
chaque unité de cette protéine, on compte 2 millions d’unités d’autres protéines (en plus de
120
beaucoup de matériel non-protéique). Comme vous le voyez, nous avons affaire à une
aiguille dans une botte de foin (ou dans une très grande boîte d’aiguilles). Une première étape
de purification, qui d’habitude vise à éliminer le matériel non-protéique présent dans l’extrait,
nous fait perdre les trois quarts de notre matériel (oups!) tout en en augmentant la pureté par
un facteur de 4, puisque maintenant pour chaque unité de notre protéine on ne retrouve plus
que 500 000 unités d’autre chose.
La deuxième étape décrite ci-haut nous coûte moins cher en matériel, puisque nous ne
perdons que la moitié du matériel qui nous reste. En plus, elle permet d’augmenter le facteur
de pureté de cinq fois.
Pourquoi ne pas avoir adopté cette seconde étape en premier lieu, demanderez-vous,
puisqu’elle a clairement un meilleur rendement? Les réponses peuvent être multiples. Il se
peut que l’étape 2 ne puisse pas être réalisée avant l’étape 1 à cause de la sensibilité de
l’étape 2 aux contaminants éliminés par l’étape 1; il se peut que l’étape 1 livre l’ échantillon à
une concentration de sels qui permet de pratiquer l’étape 2 tout de suite, alors que
l’échantillon livré par l’étape 2 a besoin d’être dialysé avant d’être propre à passer par l’étape
1... L’expérimentateur doit considérer toutes ces options et faire un choix en conséquence. Un
des critères à respecter pendant une purification est que plus on fait vite, meilleures sont nos
chances d’avoir du bon matériel à la fin. Mieux vaut donc autant que possible limiter les
étapes en nombre et en durée.
L’étape 3 qui suit l’étape 2 a un très bon rendement : pour une perte d’un peu plus de la
moitié du matériel, notre pureté augmente d’un facteur 100!!! À l’inverse, l’étape 4 présente
un rendement pitoyable puisque nous perdons 95% de notre matériel pour un gain de pureté
de 10 fois seulement. Une telle étape serait certainement à reconsidérer dans un exercice réel!
Finalement, l’étape 5, qui nous coûte encore la moitié de notre matériel, nous donne une
protéine presque pure puisqu’elle constitue la moitié du matériel qui nous reste.
5.2 Planification
Chaque heure de planification vous sauvera dix heures d’effort. Avant d’entreprendre quoi
que ce soit, assurez-vous d’abord que tous les appareils soient disponibles, en état de marche,
et pas réservés par quelqu’un d’autre (réservez-les vous-même tout de suite). Soyez sûr que
toutes vos solutions soient préparées et refroidies à 4°C; que votre matériel soit prêt et que
vous ayez mis assez de temps de côté pour vous concentrer à la tâche. Ce sont là des
considérations terre-à-terre à l'extrême, mais vous seriez surpris de constater à quel point
elles peuvent être négligées même par des scientifiques chevronnés. (Un bon truc en passant:
gardez toujours une grande quantité d'eau stérile à 4°C. On ne sait jamais quand on aura à
préparer une solution en catastrophe... et si dissoudre une poudre se fait en un tournemain,
refroidir un litre de solution peut prendre des heures)!
Votre planification doit inclure les étapes suivantes , que nous allons explorer une à une.
121
2- Choix de la source de matériel. Source native vs source recombinante; source dispendieuse
mais idéale vs source moins idéale mais peu chère; impératifs scientifiques vs impératifs
pratiques... vous aurez parfois à faire des choix déchirants.
3- Choix d’une technique d’extraction. Elles sont nombreuses, et présentent toutes des
avantages et des inconvénients.
5.3 Essai
Vous aurez compris à la lecture de ce qui précède que la purification est un processus
étapiste. Une purification peut prendre plusieurs jours et nous voulons savoir à chaque étape
où en est notre protéine.
Il est possible de vérifier la présence aussi bien que l'activité d'une protéine, le choix se
faisant selon la nature de la protéine recherchée, la faisabilité du test et l'étape à laquelle nous
en sommes dans la purification. Les premières étapes se contentent généralement de vérifier
la présence de protéines (n'importe lesquelles) par spectroscopie; c'est plus tard pendant la
manoeuvre qu'on commencera à se soucier de vérifier la présence d'une protéine particulière
ou de son activité.
Quoiqu'il en soit, il est impératif de toujours, toujours garder des aliquots de matériel à
chaque étape! De cette manière, on peut retracer après coup le déroulement de la purification,
comprendre quelles en sont les étapes les plus utiles ou les plus dommageables, et améliorer
notre protocole pour l'avenir.
5.3.1 Critères
122
devrait donc vous permettre d'obtenir rapidement une idée de
ce qui se passe avec votre purification; si vous pouvez
l'effectuer à chaque étape PENDANT la purification, encore
mieux.
Ce type d'analyse est très pratique pour suivre la course de protéines sur une série de
colonnes de chromatographie. Tous les systèmes de chromatographie sont équipés d'une
cellule spectrophotométrique pour mesurer l'absorption des rayons UV par le matériel qui
sort des colonnes. C'est cependant une méthode simple dont le type de réponse est "oui, il y a
des protéines" ou "non, il y a eu un os quelque part". On ne peut pas sérieusement s'attendre à
pouvoir faire une relation exacte entre la densité optique d'un mélange protéique en cours de
purification et sa concentration réelle. (On utilise parfois un coefficient d'extinction très
approximatif pour dire qu'une densité optique à 280nm, dans une cuvette de 1 cm, correspond
à 1 mg/mL de protéines...Mais c'est comme de dire que la population de la Terre s'élève à
quelques milliards. C'est une idée générale, rien de plus).
En outre, n'oublions pas que l'ADN et l'ARN absorbent dans le coin de 250-260nm, ce qui
risque de nous causer des soucis de précision! (D'habitude, on a plutôt le problème inverse,
celui des protéines qui contaminent notre ADN. Mais tout finit par nous arriver si on vit assez
longtemps).
On peut utiliser le spectro pour détecter la présence de protéines parce que le tryptophane
(Trp, W) absorbe la lumière UV avec un pic à 280 nm. La tyrosine (Tyr, Y) le peut aussi,
quoiqu'à un degré moindre, et un troisième acide aminé cyclique, la phénylalanine, le peut
aussi très faiblement. Tous les peptides pourraient absorber l'UV aux environs de 190-200nm,
mais la plupart des tampons absorbent aussi massivement dans cette région qui n'est donc pas
très commode pour nous.
123
vaut mieux s'assurer de disposer d'une courbe standard dont le comportement représente bien
celui de notre protéine.
Toujours avoir plusieurs points sur notre courbe standard: on limite ainsi l'effet de ceux qui
auraient eu une mauvaise réaction. C'est comme avec des fonds mutuels, vraiment.
Il résiste assez bien aux différents composés présents dans les tampons
mais est sensible aux sels d'ammonium, ce qui en fait un mauvais choix
pour doser les protéines venant d'être précipitées par ce sel.
Méthode de Basée sur la réaction du biuret, elle utilise aussi la réduction du Cu2+ en
Lowry Cu+. Depuis 1951, la méthode de Lowry est la plus citée de toutes dans la
littérature scientifique.
124
pour des quantités de 2 — 100 ug.
En solution, il a une
forme cationique rouge
qui absorbe à 470nm. Lié
aux protéines, il a une
forme anionique bleue
qui absorbe à 595nm.
La méthode de Bradford
est encore plus sensible
que celle de Lowry (0,2
— 20 ug de protéines).
125
L'absorption aux UV et les méthodes colorimétriques c'est bien, surtout si on veut juste savoir
par où passent les protéines durant la purification. Il vient cependant un temps où, confiants
de ne pas avoir flushé nos protéines aux égoûts, on veut savoir si parmi elles se trouvent la
protéine qui nous intéresse.
Un critère utile de notre protéine pour la reconnaître parmi les autres est sa taille; un autre tel
critère est sa charge.
Le système le plus utilisé pour l'analyse de la taille des protéines d'un mélange est le gel de
SDS (ou SDS-PAGE, pour sodium docecyl sulfate -polyacrylamide gel electrophoresis).
Il serait avantageux, comme ce l'est pour l'ADN, de pouvoir séparer les protéines les unes des
autres par une simple séparation électrophorétique ne dépendant que de la taille des
molécules. Mais alors que l'ADN est uniformément chargé et que sa structure est
essentiellement la même quand il est sous forme linéaire, les protéines, elles, varient
énormément non seulement en poids mais aussi en charge et en forme. Pour les séparer selon
leur masse uniquement, il faut contrecarrer l'effet de leur charge et de leur forme.
Le sodium dodecyl sulfate (SDS) est un détergent anionique qui dénature les protéines en
enveloppant la chaîne polypeptidique selon un ratio de masse de 1,4 pour 1. Le SDS confère
aux protéines une charge négative proportionnelle à leur longueur; plus elles sont longues,
plus il y a de SDS. Les polypeptides deviennent donc des chapelets de charges négatives
partageant une même densité de charge par unité de longueur.
Le β-mercaptoethanol, lui, (un agent réducteur qui ne sent pas bon), en combinaison avec la
chaleur, brise les ponts disulfures internes des protéines que la chaleur ont dénaturées. Il brise
aussi les éventuels ponts disulfures inter-protéiques.
Les protéines ainsi dépliées et uniformément chargées en fonction de leur masse peuvent dès
lors être séparées par électrophorèse, de la cathode (-) à l'anode (+). Puisqu'elles sont
uniformément chargées par le SDS, leur vitesse de migration sur gel sera proportionnelle à
leur seule masse, les petites protéines étant les plus rapides.
On utilise d'ordinaire un gel discontinu: c'est à dire qu'en haut du gel de séparation
proprement dit, (le "running gel;" en bon franglais) se trouve une bande plus petite
d'acrylamide de composition différente, le gel de concentration ou stacking gel.
126
Alors que le gel de séparation a des pores petits et un pH de
9, le stacking gel a des pores plus grands et un pH de 6,8. La
taille des pores dans un gel de polyacrylamide est fonction
du degré de pontage entre les chaînes d'acrylamide, pontage
qui est proportionnel à la quantité de N,N,N',N',-méthylène
bisacrylamide dans le gel; plus il y en a, plus les chaînes sont
pontées et plus petits sont les pores.
De plus, les ions des deux gels au moment du dépôt des protéines sont des ions chlorure alors
que ceux du tampon sont des ions glycine. Les ions glycine qui entrent dans le gel de
concentration à pH 6,8 sont près de leur point isolélectrique et ont une très faible mobilité.
Les ions chlorure, eux, conservent une grande mobilité. Les protéines chargées par le SDS
sont plus lentes que le chlorure mais plus rapides que la glycine.
127
Quand le courant est
appliqué, les ions chlorures
filent vers l'anode, laissant
derrière elles un vide ionique
temporaire qui n'a qu'une
faible conductivité.
128
le front jusqu'au bout du gel
de concentration.
Maintenant qu'il y a assez d'électrolytes en avant d'elles, les protéines peuvent migrer
librement en fonction de leur masse. (La porosité du gel, qui est plus faible dans le gel de
séparation que dans le gel de concentration, assure que les ions glycine seront plus rapides
que les protéines).
Soyons honnêtes avant de continuer: il nous faut avouer que la mobilité des protéines dans un
gel de SDS n'est pas absolument proportionnelle à leur masse. En effet, on peut observe une
variation de vitesse de migration par rapport à la masse dans une majorité de protéines, allant
de très petites variations jusqu'à des résultats franchement désarçonnants. La cause peut en
être variable: par exemple, certaines protéines ont naturellement une faible affinité pour le
SDS et le ratio masse/charge s'y trouve modifié. Certaines modifications post-
traductionnelles peuvent aussi jouer un rôle: la glycosylation interfère avec la liaison au SDS.
Il convient donc de ne pas se désespérer si nos protéines purifiées ont sur gel de SDS une
taille apparente différente de ce à quoi on s'attendait!
Les très petites protéines (moins de 15 kDa), en outre, courent de façon très aléatoires dans
les gels de glycine. C'est qu'elles peuvent être capturées dans des micelles de SDS qui se
tiennent près du front de migration. On peut les en libérer en utilisant la tricine à la place de
la glycine dans le tampon de migration. La tricine aide à la libération de ces petites protéines.
On offre commercialement des gels de SDS Tris-tricine pour l'étude des protéines de plus
petit poids moléculaire.
Une fois les protéines dûment séparées selon leur taille, il reste à révéler leur présence. Les
deux approches les plus courantes sont de les colorer, ou d'utiliser un anticorps spécifique qui
permette de localiser une réaction chimique quelconque (mais donnant un résultat visible) là
où se trouve une protéine particulière (voir à ce sujet la technique de l'immunobuvardage de
type western, un peu plus loin).
On peut colorer les protéines directement sur le gel, ou les colorer après les avoir transféré
sur une membrane (quoique dans ce dernier cas, il ne s'agisse d'ordinaire que d'un rapide
contrôle pour vérifier la qualité du transfert; on colore presque toujours les protéines
directement dans le gel).
Les techniques les plus courantes sont la coloration au bleu de Coomassie et au nitrate
d'argent. Le bleu de Coomassie servait jadis à colorer les chandails de laine en bleu; son nom
129
commémore la prise de la ville Ashantie de Kumasie, au Ghana, pendant l'époque coloniale.
Le bleu de Coomassie colore les protéines de façon à peu près égale mais est de dix à cent
fois moins sensible que la technique de coloration au nitrate d'argent.
Cette dernière repose sur la réduction, facilitée par la présence des protéines, de sels d'argent
en argent métallique (qui précipite). Il existe plusieurs protocoles de coloration au nitrate
d'argent (choisissez la vôtre en fonction de sa facilité d'exécution et du temps qu'elle
requiert)! Cette technique est cependant sensible à plusieurs facteurs et ne colore pas toutes
les protéines de façon égale.
Une variante du gel SDS permet de greffer une charge aux protéines ou aux complexes
protéiques sans les dénaturer. À la place du SDS, un détergent, on utilise le bleu de
Coomassie qui donnera une charge négative aux protéines en se collant (principalement) sur
ses résidus arginine. La distrubution des charges ne permet pas de définir un ratio
charge/masse aussi constant qu'avec le SDS, mais au moins les protéines natives migrent
dans le même sens. Cette technique est appelée "blue native electrophoresis". (Schagger H,
von Jagow G. Blue native electrophoresis for isolation of membrane protein complexes in
enzymatically active form. Anal Biochem. 1991 Dec;199(2):223-31).
Elle consiste en une migration, induite par un courant électrique, des protéines dans un
gradient de pH jusqu'à ce qu'elles atteignent un pH équivalent à leur pI -moment auquel elles
cessent de migrer, puisque leur charge nette est nulle.
Cette technique, qui sépare les polypeptides en fonction de leur charge plutôt que de leur
masse, est très sensible: elle peut distinguer des protéines dont la différence de pI est aussi
faible que 0,01 unité de pH.
130
Focalisation isoélectrique.
131
5.3.2.2.3 Western blot et Dot blot
Il existe un outil extrêmement précieux peut nous renseigner sur la présence ou l'absence de
notre protéine: un anticorps.
Les anticorps sont des protéines complexes fabriquées par les plasmocytes, des lymphocytes
B stimulés pendant une réponse immunitaire. Les anticorps circulent dans le sang comme des
missiles à tête chercheuse; ils sont sélectionnés pour reconnaître avec une grande spécificité
une structure chimique particulière qu'on appelle antigène, qui se retrouve sur les corps
étrangers. (Toute partie d'un corps étranger qui sert de base à la sélection d'un anticorps par le
système immunitaire est par définition un antigène).
On peut immuniser différents animaux pour les induire à fabriquer des anticorps contre les
protéines qui nous intéressent. Le sérum de ces animaux fournit alors le matériel dont nous
avons besoin pour identifier, au milieu d'une soupe de protéines, celle que nous voulons en
particulier.
Alternativement, si notre protéine est le fruit du génie génétique, nous lui aurons peut-être
greffé un petit bout de séquence antigénique qui sera reconnu par un anticorps commercial.
C'est ainsi que l'étiquette FLAG de Sigma (DYKDDDDK) ou la série d'histidines
(HHHHHH) parfois utilisée pour faciliter la purification par chromatographie d'affinité pour
un métal immobilisé (IMAC, pour immobilized metal affinity chromatography) sont
reconnues par des anticorps commerciaux; toute protéine qui les porte sera identifiée par les
anticorps respectifs.
Un anticorps spécifique à notre protéine, ou spécifique à une étiquette que nous lui avons
greffée, peut être utilisé pour révéler la présence de la protéine sur une membrane après un
transfert à partir d'un gel (SDS ou de focalisation isoélectrique) ou, plus rapidement, une
membrane sur laquelle on a directement déposé un certain volume de solution contenant la
protéine. Dans le premier cas on parle de western blot (un jeu de mots sur la technique du
Southern blot, développée par le Dr Southern, et qui est basée sur le transfert d'ADN sur une
membrane). Dans le second cas, on parle de dot blot ou de slot blot parce que le dépôt de la
protéine sur la membrane se fait souvent avec l'aide d'un masque n'exposant que de petites
parties de la membrane, avec des trous de forme ronde (dot blot) ou en forme de fentes (slot
blot).
Dans la figure ci-dessous, on représente le transfert des protéines d'un gel SDS à une
membrane pouvant être ensuite traitée avec un anticorps. L'anticorps va coller sur sa
protéine-cible. Un deuxième anticorps, qui reconnaît la partie Fc du premier, est alors
appliqué pour révéler la présence de ce dernier. Ce second anticorps est d'ordinaire couplé à
un enzyme quelconque dont l'activité est facilement décelable: il s'agit le plus souvent d'une
phosphatase alcaline dont l'action sur des substrats adéquats causera la production de photons
(lumière!) ou l'apparition locale d'une coloration foncée.
De tels anticorps secondaires de même que les systèmes pour révéler leur présence sont
disponibles chez de très nombreux fournisseurs de réactifs biologiques.
132
Il est très utile de faire un double
de notre gel de SDS, en faisant
courir les mêmes échantillons, dans
le même ordre, sur un autre gel
qu'on fait courir en parallèle. Alors
que le premier gel sert au western
blot, le deuxième est coloré au bleu
de Coomassie ou au nitrate
d'argent (beaucoup plus sensible)
afin de juger du degré
d'enrichissement de la protéine
révélée par l'anticorps.
Nous pouvons avoir plusieurs raisons de nous intéresser à l'activité de ce que nous purifions.
D'une part, il est possible que nous soyons sur la piste de quelque chose qui a une activité
particulière, et que nous supposons être une protéine, mais sans en être sûrs. D'autre part, il
est possible que ce soit l'activité de notre protéine qui nous intéresse et que nous n'ayons
absolument pas besoin d'elle si elle a perdu cette activité. Dans les deux cas, nous devrons
faire un test d'activité.
Le choix de notre essai repose une fois de plus sur la nature de notre protéine: si c'est une
kinase, nous testerons sa capacité à phosphoryler un substrat; si c'est une polymérase, à
synthétiser des polymères.
On distingue des méthodes dites continue, discontinue et couplée pour les essais
enzymatiques, selon que la détection de l'activité enzymatique nécessite ou non des
manipulations supplémentaires.
Dans la méthode continue, le produit de l'enzyme est différent du substrat. Il n'est donc pas
besoin de les séparer avant de quantifier l'activité de l'enzyme. La méthode continue peut
s'effectuer directement dans la solution où se retrouve l'enzyme purifié. Un exemple en est la
quantification de l'activité de la luciférase, un enzyme qui hydrolyse la luciférine (son
substrat) en provoquant la libération d'un photon. C'est le système enzymatique qui permet
133
aux lucioles de s'envoyer des messages lumineux. Ici, le substrat est la luciférine alors que le
produit à quantifier est un photon. Rien ne saurait être plus différent! On peut donc ajouter de
la luciférine directement à une solution contenant la luciférase purifiée et compter les
photons. Le substrat qui n'a pas été utilisé par l'enzyme n'interfère en rien avec la mesure.
C'est le cas aussi de différentes phosphomonoestérases. On les teste en les incubant avec le 4-
nitrophényl phosphate, un composé incolore. L'action de ces enzymes convertit ce substrat en
nitro phénol de couleur jaune. Comme la couleur finale est distincte de la couleur initiale, on
peut l'évaluer directement.
Il peut arriver que notre substrat ne puisse se distinguer du produit par la méthode de
quantification utilisée. Le cas le plus flagrant est celui des méthodes utilisant des isotopes
radioactifs.
Un test de kinase, par exemple, peut recquérir l'utilisation d'ATP radioactif; la kinase, en
utilisant cet ATP, transfère un groupement phosphate isotopique sur son substrat. Il est
cependant impossible de distinguer, dans le mélange réactionnel, le substrat nouvellement
phosphorylé de l'ATP se trouvant dans la solution, puisque tous les deux sont radioactifs. Il
faut donc d'abord les séparer.
On a recourt à une deuxième réaction qui utilise le produit de la première comme carburant!
La figure ci-dessous nous résume une telle méthode, telle qu'utilisée pour doser l'activité de
l'aspartate aminostransférase. Cet enzyme convertit le 2-oxoglutarate et l'aspartate en
glutamate et en oxaloacétate.
Le NADH absorbe la lumière de longueur d'onde 340nm, ce que ne fait pas le NAD+. On
utilise donc l'action de l'enzyme malate déhydrogénase, qui convertit l'oxaloacétate et le
NADH en malate et en NAD+. Cette réaction est accompagnée par une chute d'absorbance à
340nm, et n'aurait pas pu se produire si l'oxaloacétate n'avait pas été formé lors de la
première réaction.
134
Bien que la mesure que nous prenons ne soit pas reliée à l'activité directe de l'aspartate
aminotransférase, c'est tout de même cette dernière qui est responsable de la baisse
d'absorbance observée. Une telle méthode couplée nous permet donc de mesurer
indirectement l'activité d'un enzyme dont le produit immédiat ne se prêterait pas à une mesure
plus directe.
En assumant que ce soit l'activité d'un enzyme qui vous intéresse, il ne sera pas suffisant de le
quantifier uniquement en termes de masse. L'activité devra être définie en termes d'unités.
Par exemple, on pourra définir une unité de nucléase EcoR I comme étant la quantité
d'enzyme requise pour digérer complètement 1 ug d'ADN de phage lambda en une heure à
37°C dans un volume de 50 uL. La notion d'unité permet de comparer les activités de
différentes préparations d'enzymes (on peut comparer l'activité spécifique de plusieurs
préparations indépendantes).
Voici un exemple de calcul de l'activité d'une préparation d'ARN polymérase II. Cet enzyme
catalyse la polymérisation de ribonucléosides phosphates en utilisant un brin d'ADN comme
gabarit. Une unité utile serait définie par la quantité de ribonucléosides phosphates qui sont
incorporés dans un polymère par unité de temps.
135
(a) une quantité connue de polymérase II purifiée, et
(b) une concentration connue de nucléotides triphosphates radioactifs, avec une activité
spécifique déterminée.
Test d'incorporation de GTP radioactif dans l'ARN par la polymérase II: un exercice à
vous faire dresser les cheveux sur la tête!!!
6 mM MnCl2
80 mM (NH4)2SO4
10 mM DTT
1 mM GTP
32
6 uL de GTP- P 10 uCi/uL (3000 Ci/mmol)
Les sels divers sont là pour assurer des bonnes conditions de pH et de salinité à la polymérase
II. Le poly riboC est un polymère de cytosine phosphate; il servira de gabarit à la réaction (la
polymérase II est particulièrement efficace pour initier la transcription sur un simple brin de
C répétés).
Réaction:
- Faire la réaction dans 100 uL. Mélanger 50uL de mélange réactionnel 2X, 30 uL H 20, et 20 uL de polymérase
purifiée.
- (pour distinguer la réaction spécifique de la Polymérase II de celles des Polymérases I et III, on peut répéter
l'expérience en y ajoutant 10ug/mL d' -amanitine, qui inhibe l'activité de la pol II beaucoup plus rapidement
que celle des deux autres polymérases).
- Incuber 20 minutes à T/P, derrière un écran de plexiglas. Le 32P est un émetteur de particules beta, des
électrons de haute énergie, qui doivent être bloqués par une couche épaisse d'une matière molle plutôt que par
une masse solide comme du plomb. 1 cm de plexiglas fait très bien l'affaire.
- Prendre 45 uL de réaction et spotter sur un filtre rond de papier chargé DE81 (qui lie l'ARN et l'ADN). Faire
de même sur un deuxième filtre pour avoir un duplicat. (On utilise 45 uL plutôt que 50 uL pour compenser pour
les pertes inévitables pendant le pipettage).
- Laver les filtres 3 fois avec un tampon phosphate (250 mL de Na2HPO4 5% à chaque fois). Il est pratique de le
faire dans une unité de filtration Nalgene de 500mL; on peut ainsi aspirer le liquide chaque fois sans avoir à le
136
manipuler (contenant le GTP radioactif non-incorporé, il est lui aussi très radioactif)!
- Après trois lavages, les filtres devraient être débarassés du GTP non incorporé. Rincer à l'éthanol et laisser
sécher à l'air. Compter par scintillation.
Activité de l'isotope:
On vient d'obtenir des comptes en CPM. Mais attention! Pour pouvoir comparer ces comptes
avec ceux obtenus lors d'autres préparations, il faut s'assurer de comparer les pommes avec
les pommes!
Pour ce faire, il faut d'abord établir l'activité spécifique exacte de l'isotope utilisé dans la
réaction. Le tube nous dit GTP- 32P, 10uCi/uL, 3000 Ci/mmol avec une date de référence.
L'activité d'un isotope s'éteint avec le temps; il faut en tenir compte dans nos calculs. Pour le
32
P, qui a une demi-vie assez courte de 14 jours, la baisse d'activité est la suivante:
Jours
0 1 2 3 4
0 1.000 0.953 0.906 0.865 0.824
5 0.785 0.748 0.712 0.678 0.646
Jours
10 0.616 0.587 0.559 0.532 0.507
15 0.483 0.460 0.436 0.418 0.396
20 0.379 0.361 0.344 0.328 0.312
Il est préférable de ne pas utiliser un isotope trop vieux. En fait, la plupart des fournisseurs
nous les livrent avant la date de référence (qui correspond au jour 0 sur le tableau ci-haut). À
la date de référence, l'activité spécifique par volume est réellement de 10 uCi/uL.
Si on utilise l'isotope avant la date de référence, 3 jours plus tôt par exemple, on aura une
activité spécifique réelle supérieure à 10 uCi/uL. En fait, si on utilise le tableau ci-haut, on
établira que l'activité spécifique dans trois jours d'ici, à la date de référence, équivaudra à
0.865 de l'activité réelle d'aujourd'hui. Une simple règle de trois nous apprendra alors que
l'activité de notre isotope est aujourd'hui de
Nous avons mis 6 uL de ce pastis dans notre mélange réactionnel; cela correspond à 69,36
uCi.
137
Activité spécifique du GTP dans notre mélange réactionnel:
Nous venons d'établir de façon précise l'activité spécifique de notre isotope; cependant, il ne
faut pas oublier que la majeure partie du GTP dans notre réaction n'est pas radioactive
(regardez la liste des sels dans le mélange réactionnel: nous y avons mis 1 mM de GTP). Le
GTP radioactif sera donc dilué par le GTP froid, et l'activité spécifique du GTP total dans
notre réaction sera donc moindre que celle trouvée dans notre pot de GTP radioactif (et
heureusement, sinon nous brillerions dans le noir).
L'activité totale, nous l'avons calculée à l'étape précédente, est de 69,36 uCi. La concentration
de GTP dans notre tampon 2X (dont nous avons préparé 3 mL ci-haut) est de 1 mM; cela
signifie 3 micromoles dans 3 mililitres. Il y a donc 3 micromoles de GTP dans notre mélange
réactionnel 2X.
L'activité spécifique du GTP dans le mélange réactionnel est de 69,36 uCi divisé par 3
micromoles, ou 23,12 Ci/mol.
À ce point, il faut préciser deux choses. D'abord, nous parlons ici de l'activité spécifique du
GTP, pas de celle du mélange réactionnel. Il n'est donc pas important que le mélange soit un
stock 2X, puisque le GTP froid sera dilué en même temps que le chaud; il y aura donc
toujours autant de froid que de chaud, proportionnellement, et l'activité spécifique du GTP ne
changera pas.
Ensuite, vous noterez que je n'ai pas considéré l'apport de l'isotope radioactif à la quantité
totale de GTP: c'est que la quantité de GTP froid est si grande par rapport à celle du GTP
chaud que cette dernière devient négligeable. (Mais si vous tenez vraiment à le savoir, petits
curieux, en ajoutant la quantité de GTP chaud à celle du froid on obtient 3,00000002
micromoles au lieu de 3 micromoles).
Mais nous ne sommes pas encore sortis de l'auberge! Les comptes que nous ont donnés le
compteur à scintillation sont des cpm, ou comptes par minute. Chaque compte est
l'enregistrement, par le compteur, d'un évènement de désintégration d'une particule
radioactive. Cependant, un compteur ne peut pas enregistrer toutes les désintégrations. En
plus, il peut arriver que son efficacité baisse avec le temps. Et puis tous les compteurs ne sont
pas aussi bons les uns que les autres. À cause de tout cela, le cpm n'est pas une valeur très
utile pour définir l'unité, car cette dernière ne serait alors utilisable qu'en utilisant toujours le
même compteur. On cherchera plutôt à établir à combien de désintégrations par minute
(dpm) nos cpm correspondent. Et c'est justement pour cela qu'un compteur est d'ordinaire
accompagné de ses fioles à calibration.
Ces fioles ont été remplies à une date précise (marquée sur la fiole) d'une quantité donnée
d'un isotope radioactif de longue demi-vie. L'étiquette de la fiole vous indique exactement le
138
nombre de dpm qu'on pouvait y enregistrer à la date de référence.
En utilisant un tableau comme celui du 32P ci-haut et la date de référence, on mettre la fiole
dans notre compteur et déterminer quelle est son efficacité aujourd'hui. De façon générale, un
bon compteur enregistre environ 1 cpm par 2 dpm.
Supposons que ce soit le cas chez nous. Mettons que notre expérience ait donné 10 000 cpm.
10 000 cpm équivaudra à 20 000 dpm. On transforme ensuite les dpm en Ci selon le rapport
Comme notre activité spécifique pour le GTP est de 23,12 Ci/mol, notre polymérase a donc
incorporé
Définition de l'unité:
Nous savons combien de polymérase purifiée nous avons mis dans chaque réaction, et grâce à
notre gymnastique arithmétique nous savons aussi quelle est l'activité spécifique du GTP
présent dans la réaction. Nous pouvons maintenant définir avec précision notre unité
d'enzyme comme étant "la quantité de polymérase requise pour incorporer 1 nanomole de
GTP en ARN pendant une réaction de 20 minutes à T/P".
Nous avions 20 uL de polymérase dans notre mélange réactionnel. Nous n'avons compté que
45 uL sur 100, ce qui correspond à 9 uL d'enzyme. Ces 9uL d'enzyme ont incorporé 0,39
nmol de GTP dans les conditions décrites. Pour incorporer 1 nmol de GTP, on aurait eu
besoin de 23 uL d'enzyme. Notre enzyme a donc une concentration de 1 unité / 23 uL, ou de
0,043u/uL. (Comme ce chiffre est bas, on peut aussi l'écrire 43 unités/mL, ça paraît mieux)!
Cette unité a l'avantage de permettre de comparer une préparation de polymérase à une autre,
peu importe où et quand celle-ci a été préparée, ni sur quel compteur à scintillation on l'a
évaluée.
Il peut arriver (et même il arrive fréquemment) que l'activité que nous cherchions ne soit pas
enzymatique. C'est le cas, par exemple, de la recherche de protéines se liant à l'ADN. De
telles protéines peuvent être des enzymes, mais ce n'est pas un pré-requis; de plus, leur liaison
à l'ADN n'est pas un processus enzymatique.
139
Les essais les plus simples pour une protéine liant l'ADN sont la migration retardée EMSA,
pour electromobility shift assay) et l'empreinte à la DNAse (ou footprinting).
5.4.1 Généralités
La source de notre matériel peut ne pas être sujette à discussion. Si nous étudions des
protéines dans leur contexte naturel, nous n'avons d'autre choix que d'aller les y chercher.
Cependant, si nous pouvons sans conséquences fâcheuses utiliser une source alternative, nous
devrions sérieusement le considérer si cette alternative se révèle plus disponible, moins
onéreuse ou plus commode à utiliser.
Autant que faire se peut, pour obtenir de grandes quantités de protéines, nous devrions opter
pour une méthode quelconque de surexpression. Alors qu'une protéine dans son contexte
naturel ne représente qu'une fraction infime du pourcentage de la masse totale des protéines,
une protéine surexprimée peut en représenter une fraction impressionante.
La surexpression passe souvent par la construction d'un vecteur d'expression qui contiendra la
séquence codant pour notre protéine: la construction d'un tel vecteur est une occasion en or
pour introduire dans la séquence une étiquette favorisant la purification ou l'identification de
la protéine.
Le tableau qui suit présente les caractéristiques de différentes sources de protéines exprimées
à partir d'un vecteur d'expression.
140
Interférence avec
rarement rarement rarement rarement non
l'hôte
Repliement correct pas toujours pas toujours oui oui pas toujours
acylation du N-
non oui oui oui non
terminus
gamma-
non non non oui non
carboxylation
5.4.2 Tissu
Travailler avec du tissu comme source de matériel peut être indispensable, mais ce n'est
certes pas commode. Le tissu devra souvent être brisé (à la moulinette ou au blender!) et/ou
traité à la collagénase pour en briser les fibres insolubles et très solides. Un avantage est que
la protéine vient de son milieu naturel; un autre est que le tissu en question est peut être
vendu à prix très avantageux (un boucher vous vendra du thymus, sous le nom de ris de veau,
à coups de kilogrammes).
Si nous étudions une protéine qui se retrouve aussi bien chez ces eucaryotes plus primitifs
que dans notre modèle habituel, alors les levures constituent une excellente source de
matériel. Les conditions de culture pour les levures sont élémentaires, elles peuvent donner
énormément de matériel, et elles ont l'avantage (par rapport aux procaryotes) d'être plus près,
141
évolutivement parlant, des eucaryotes supérieurs. On y retrouvera donc des enzymes, comme
les sérine-thréonine kinases, que ne possèdent pas les vecteurs d'expression procaryotes.
Elles restent ce qui se fait de moins cher et de plus puissant en fait de manufactures
moléculaires. Les bactéries peuvent être utilisées pour exprimer des quantités astronomiques
de matériel. Elles ont aussi été le sujet de plusieurs manipulations visant à en faire des
vecteurs d'expression de plus en plus performants (consultez un catalogue Stratagene, par
exemple, pour vous familiariser avec de nombreuses souches bactériennes qu'on a rendues
déficientes en protéases, ou permettant l'expression de protéines toxiques, ou que sais-je
encore).
L'utilisation d'un plasmide bactérien à partir duquel exprimer une protéine a de nombreux
avantages, dont le principal est certes la facilité. Il suffit de cloner la séquence codant pour
notre protéine dans un tel plasmide, en aval d'un promoteur qui fonctionnera dans la bactérie-
hôte choisie, et de transformer la bactérie avec le plasmide ainsi fabriqué. Si le plasmide
porte un gène de sélection (un gène de résistance à un antibiotique, par exemple) en plus
d'une origine de réplication, on n'a pas à se soucier d'intégration ou de quoi que ce soit de ce
genre.
De très nombreux vecteurs de clonage, prévu pour l'expression dans Escherishia coli, sont
disponibles commercialement. Nombre d'entre eux contiennent des sites de clonage sous le
contrôle de polymérases virales et non bactérienne (comme la T7 RNA polymerase), et sont
destinés à être utilisés en conjonction avec des souches modifiées pour exprimer une telle
polymérase -souvent sous le contrôle d'un système activable, comme celui de l'opéron gal.
L'avantage d'une telle approche est que, par exemple, tant que le répresseur gal n'est pas
inactivé par du galactose ou de l'IPTG, la polymérase T7 n'est pas synthétisée... et la protéine
recombinante que nous voulons faire exprimée ne l'est pas non plus. En outre, on peut traiter
nos cultures avec un inhibiteur d'ARN polymérase qui n'agit pas sur la polymérase virale:
ainsi, on sait que suite à l'activation, seule notre protéine est exprimée. Cela réduit le bruit de
fond causé par la présence des protéines endogènes de la bactérie.
142
Voici deux inhibiteurs d'ARN polymérase:
Une approche intéressante pour la production de protéines par des cellules eucaryotes est d'en
introduire la séquence codante dans le génome d'un virus, puis d'utiliser celui-ci pour infecter
des cellules.
On utilise beaucoup le baculovirus pour infecter des cellules d'insectes. Ce système est très
efficace. On doit cependant se souvenir de ce que la glycosylation protéique chez les insectes
n'est pas exactement la même que chez les mammifères. Si cet aspect est important pour
nous, il convient de ne pas l'oublier.
Le virus de la vaccine offre un autre système d'expression. Il peut fonctionner dans des
cellules humaines. En plus, l'infection par la vaccine cause l'arrêt de la transcription et de la
traduction des protéines de l'hôte (seules les protéines venant du virus sont exprimées), ce qui
enrichit notre protéine recombinante par rapport au bruit de fond. Le problème ici est que la
vaccine est un virus vivant qui peut se transmettre à l'utilisateur (et la vaccination contre la
petite vérole a été interrompue il y a déjà quelques lustres).
5.4.7 Le homard
À ce que je sache, personne n'utilise encore le homard de façon régulière pour l'expression
des protéines.
5.5.1 Généralités
Quelque soit le type de cellule que nous ayons choisi pour produire la protéine qui
nous intéresse, nous devrons persuader cette dernière d’en sortir. À moins que notre
candidate ne soit une protéine sécrétée et donc disponible dans le milieu, nous
devrons sélectionner une méthode pour briser les cellules et en extraire le contenu.
Plusieurs choix s’offrent à nous, choix qui seront faits en fonction du type de cellule
utilisé, des conditions de purification de notre protéine, de l’équipement disponible,
et même de nos goûts personnels. Soyons conscients de ce que certaines
143
méthodes d’extraction seront clairement préférables à d’autres même si elles sont
plus compliquées; il nous faut donc être souples quant à notre décision finale.
Les principales approches de lyse des cellules sont les suivantes. Un choc
osmotique peut suffire à briser la membrane cellulaire de cellules fragiles. Ce choc
peut être assisté par un léger traitement avec un détergent (ce qui permet aussi
d’aider à maintenir les protéines en solution). Une certaine action mécanique peut
aussi être ajoutée au processus: un homogénéisateur à piston permet de briser la
plupart des cellules de mammifères.
Pour les cellules de plantes, de levures ou les bactéries, toute approche "douce"
devra tenir compte de la présence d’une paroi cellulaire très résistante; les
protoplastes de telles cellules seront préparés en traitant ces dernières avec des
enzymes (telle la lyticase) qui détruiront la paroi sans briser la membrane plasmique.
Finalement, dans tous les cas, une méthode brutale peut aussi être utilisée. Le
traitement aux ultrasons, une lyse mécanique utilisant des billes de verre ou une
presse Aminco-French, comme les cycles de congélation/décongélation, sont tous
des moyens envisageables.
5.5.2 Tampon
L’extraction s’effectuera dans une solution tampon, dans laquelle les cellules seront
resuspendues après une centrifugation visant à les concentrer. À cette étape, notre
protéine est fort probablement en concentration infime par rapport à toutes les autres
protéines cellulaires; nous mettrons les chances de notre côté en limitant toute
dilution supplémentaire. On cherchera autant que possible à maintenir une
concentration élevée dès les premières étapes.
Rappelons-nous que le pouvoir tampon d’une substance est plus élevée dans une
région de pH proche de son pKa; voici les pKa de certains tampons populaires.
Bis-TRIS 6,46
PIPES 6,76
MOPS 7,20
TES 7,40
HEPES 7,48
Tris 8,06
Glycine 9,78
144
Le HEPES (pour la chromatographie d’échange de cations) et le Tris (pour l’échange
d’anions) sont ceux que vous rencontrerez le plus souvent en purification de
protéines. Méfiez-vous des solutions "tampon" qui ont un pH très éloigné du pKa; à
plus de deux ordres de grandeur en plus ou en moins que le pKa, ce ne sont
sûrement pas de très bons tampons.
Alors que l’intérieur des cellules est un environnement réducteur (à cause entre
autres de toute cette glutathione), l’atmosphère dans laquelle nous vivons est au
contraire oxydante (elle est riche en oxygène). Il y a gros à parier que notre protéine
devra être protégée d’une oxydation excessive : c’est pourquoi un agent réducteur
comme la glutathione, l’acide ascorbique, le beta-mercaptoethanol ou le dithiothreitol
(DTT) pourra être ajouté au tampon. Ne vous en faites pas trop pour les ponts
disulfures retrouvés à l'intérieur des protéines globulaires: ils devraient être bien à
l'abri des conditions externes.
Faisons face à cette dure réalité : notre protéine a beaucoup d’ennemis. La cellule
même d’où elle provient est remplie de protéases qui ne demandent pas mieux que
d’en faire une bouchée. En brisant les lysosomes (particulèrement si nos cellules de
départ ont une forte activité catabolique, comme les cellules du foie; ou si ce sont
des cellules de plantes avec des vacuoles riches en protéases) nous avons libéré
une horde de protéases féroces dans le même tampon de lyse que notre protéine.
La solution? Tenir le pH élevé (entre 7 et 8), garder la soupe au frais (4°C) et ajouter
des inhibiteurs de protéases à la solution.
Inhibiteurs Cible
PMSF Toutes les sérine protéases (trypsine, thrombine,
chymotrypsine, papaine, etc).
AEBSF Toutes les sérine protéases (trypsine, thrombine,
chymotrypsine, papaine, etc). Plus soluble et moins
toxique que son prédécesseur, le PMSF.
EDTA et EGTA métalloprotéases (métal comme cofacteur)
Benzamidine sérine protéases
Pepstatin A protéases aspartiques comme la cathepsine D, la
rénine, la pepsine et les protéases d'HIV.
Leupeptin sérine- (trypsine, plasmine, kallikréine porcine) et
cystéine- protéases (papaine, cathepsine B). N'inhibe
pas la thrombine ni la chymotrypsine.
Aprotinin sérine protéases, mais pas la thrombine ou le facteur
X.
145
Chymostatin sérine protéases avec une spécificité de type
chymotrypsine (chymotrypsine, chymases, cathepsine
G et des cystéine protéases comme les cathepsines B,
H et L.
Antipain Inhibe la papaine, la trypsine et la plasmine jusqu'à un
certain point. Plus spécifique pour la trypsine et la
papaine que ne l'est la leupeptine.
Si du tissu entier est choisi comme matériel, surtout s’il est riche en tissu conjonctif, il
faudra d’abord libérer un maximum de cellules. Un blender de cuisine sera un outil
fort utile pour ce faire, malgré son origine infâme pour les compagnies d’outillage de
laboratoire. On utilisera aussi un enzyme comme la collagénase pour briser les
fibres de collagène empêtrant les cellules.
Il est possible de lyser les membranes plasmiques sans briser les noyaux. La lyse
cellulaire doit être suivie par de fréquentes visites aux microscope. La lyse des
noyaux, si elle arrive accidentellement, se traduira par une soudaine augmentation
de la viscosité de la solution: c'est la chromatine qui est libérée qui en la
responsable.
146
5.5.4.2 Homogénéisateur de type Dounce
Cet appareil ressemble à une éprouvette (aux parois épaisses) dans laquelle s’enfonce un piston
serré. Le passage des cellules dans l’espace extrêmement exigu entre le piston et la paroi interne du
tube cause leur bris, un peu comme ce qui nous arriverait si nous étions accroché à une porte de
métro quand il s’engouffre dans un tunnel. Sproutch.
Le "potter" ressemble à un Dounce motorisé; son piston a souvent une tête de teflon et
tourne dans le cylindre contenant les cellules resuspendues.
La suspension de cellules est versée dans le cyclindre. Le piston est installé, obstruant le trou,
et une puissante vis sans fin commence à l’enfoncer dans le cylindre (avec un bruit assez
inquiétant il faut bien l’admettre). Comme il n’y a que peu d’air dans le cyclindre et qu’un
liquide est à toute fin pratique incompressible, l’enfoncement du piston fait très rapidement
grimper la pression sur les parois du cylindre. Quand on ouvre légèrement la valve, la
147
suspension de cellules est éjectée comme de l’eau qu’on fait passer entre ses dents et les
cellules sont déchiquetées. Plus la pression est haute dans le cylindre, plus totale est la lyse.
Elle consiste en une chambre pressurisée dans laquelle les cellules sont traitées
avec de l'azote à haute pression. La pression force l'azote à se solubiliser dans les
liquides. On libère alors la pression tout d'un coup; l'azote en solution reprend son
état gazeux, forme des bulles à l'intérieur des cellules et les fait éclater.
C'est un problème similaire qui attend les plongeurs sous-marins qui remontent sans
avoir respecté leurs paliers de décompression.
L’appareil utilisé pour cette technique ressemble à un blender (et un coup parti dans
les anglicismes, pourquoi ne pas aller jusqu'au bout... on appelle ça un bead beater),
à ceci près qu’il est beaucoup plus petit et ne contient pas de lames. Son contenant
amovible est rempli de petites billes de verre sur lesquelles on verse la suspension
de cellules. La suspension se répartit entre les billes. Il est important de remplir
complètement le contenant et de ne pas y laisser d’air pour éviter de faire de la
mousse et d’oxyder les protéines. Le tout est alors scellé et on lance la machine, qui
fait furieusement tourbilloner les billes de verre dont l’action abrasive a tôt fait de
réduire les cellules en charpie.
Séparer les billes du lysat est très facile parce que les billes coulent au fond dès que
l'agitation cesse.
On doit prendre soin de garder le tout au frais; en fait le contenant est souvent nanti
d’une chambre où on installe de la glace. Le mouvement des billes génère en effet
beaucoup de chaleur.
148
5.5.4.7 La sonication
Elle consiste en la destruction des cellules par les ultrasons, exactement comme le
faisait l’invention du professeur dans "L’affaire Tournesol" de Hergé. Ici, une tige de
métal (le "sonicateur") à l’extrémité très fine est introduite dans la suspension de
cellules et induite à vibrer violemment, émettant un bruit fort déplaisant même pour
l’utilisateur portant ses cache-oreilles obligatoires.
Les vibrations sont des ondes de pression ultrasoniques qui causent la croissance
de bulles par un phénomène appelé "cavitation". Ces bulles sont soumises à un
grand stress par les ondes ultrasoniques et peuvent subitement grandir, se
contracter ou même imploser. Une telle implosion est accompagnée d'une très haute
augmentation locale de la pression et de la température. Quel genre
d'augmentation? Et bien une microbulle qui implose ainsi peut voir sa température
grimper à 5000°C et sa pression atteindre plusieurs centaines d'atmosphère.
Comment les microbulles se forment-elles? Une analogie possible est celle d'un
attache-trombone qu'on tortille. Il est fait de métal, mais en le pliant et le dépliant
rapidement vous pouvez faire augmenter sa chaleur, "fatiguer" les liens moléculaires
qui assurent sa cohésion locale et le briser. C'est la même chose qui arrive aux
molécules d'eau quand un sonicateur les fait vibrer. Les vibrations ultrasoniques
réussissent à briser les ponts hydrogènes qui assurent l'état liquide de l'eau, ce qui
les convertit en gaz. Il s'agit en quelques sorte d'une ébullition à froid, effectuée en
agitant les molécules d'eau. Mais comment maintenir de l'eau à l'état gazeux dans
un liquide froid? Assurément cela ne peut pas durer bien longtemps et le gaz se
condense. Or voilà: le gas qui se condense perd du volume et laisse derrière lui un
espace vide (une cavité, d'où le nom de "cavitation"). L'eau liquide se précipite dans
l'espace vide pour le remplir, et les molécules d'eau liquides entrent en collision au
coeur de la cavité. L'onde de choc de cette collision s'étend alors dans le voisinage
comme les cercles concentriques générés par un caillou lancé dans une mare. Et
l'addition de toutes ces ondes de choc peut pulvériser les cellules, comme le ferait
un très puissant ouragan qui tomberait sur notre maison à l'improviste.
Le hic avec le sonicateur est qu'il génère beaucoup de chaleur dans le matériel
biologique. L'utilisateur a tout intérêt à garder le tube dans lequel a lieu la sonication
dans un bac à glace.
149
5.5.4.8 Enzymes lytiques
Avec les levures, les plantes, les bactéries, il faut tenir compte de la paroi cellulaire
qui protège la membrane plasmique. Si on n’opte pas pour une méthode mécanique
et violente d’extraction, il faudra d’abord détruire cette paroi avant de s’en prendre
au reste de la cellule.
Différents enzymes comme le lysozyme (du blanc d'oeuf de poule, par exemple) ou
la lyticase de S.aureus sont disponibles pour s’occuper de cette tâche; il suffit de
choisir le plus approprié.
La cellule contient une très grande quantité de protéines, parmi lesquelles celle qui
nous intéresse est fort probablement très minoritaire. Si possible, il sera donc tout à
notre avantage de nous débarasser le plus vite possible de la majorité des protéines
qui ne nous intéressent pas.
Les protéines nucléaires sont presque toujours préparées à partir de noyaux et pas
de cellules entières. Une bonne façon de séparer les noyaux du reste est de
150
déposer le lysat cellulaire (avec les noyaux intacts) sur un coussin de sucrose. La
densité du sucrose ne laisse passer que les particules denses comme les noyaux,
les débarassant de la majeure partie du reste du matériel cellulaire.
5.5.4.10 La chromatine
Selon la technique utilisée, nous nous retrouverons avec un extrait protéique brut
contenant de l’ADN plus ou moins intact et associé à un grand nombre d’histones.
Plus cette chromatine est intacte, et plus notre soupe est visqueuse. Une extraction
à la presse Aminco-French ou au sonicateur va pulvériser la chromatine et n'en
laisser que des débris; une extraction de protéines ne lysant pas les noyaux laissera
la majeure partie de la chromatine derrière nous.
On peut opter pour un traitement aux nucléases (si on ne craint pas de traîner des
nucléases derrière nous) ou encore choisir comme première étape de purification
chromatographique un passage sur une résine de DEAE, chargée positivement, qui
retiendra fortement l’ADN chargé négativement. Ce serait en tout cas mon choix.
La même chose est vraie de protéines exprimés chez E.coli, surexprimées ou non,
et qui se retrouvent dans des agrégats insolubles appelés corps d’inclusion. Notons
au passage que la solubilité d’une protéine surexprimée chez E. coli peut varier
selon les étiquettes qu’on y ajoute par ingénierie génétique; ainsi, il est possible
qu’une même protéine soit insoluble avec une étiquette 6-histidines et soluble avec
une étiquette GST.
151
nous pouvons alors entreprendre de resolubiliser les protéines qu’ils contiennent.
Des agents vigoureux comme la guanidine-HCl, le SDS ou l’urée 8M sont utilisés
pour resuspendre les agrégats; ils doivent ensuite être éliminés pour permettre la
renaturation.
Le problème au point de vue expérimental est de jongler entre des conditions assez
dénaturantes pour prévenir l'aggrégation et la précipitation, mais aussi assez douces
pour ne pas systématiquement dénaturer toutes nos protéines. Chaque protéine
demandera un protocole optimisé.
Tampon de lavage
50 mM Tris-HCl pH 7.5
50 à 200 mM NaCl
Tampon d'extraction
50 mM Tris-HCl pH 7.5
8 M urea
1 mM DTT
1 mM PMSF* * Le PMSF est instable en solution aqueuse et est ajouté au
tampon au moment décrit dans le protocole.
Procédure
1. Centrifuger le lysat cellulaire à 4°C pour 20 min. à 30 000 g (16 000 rpm dans un rotor SS34 de
Sorvall ou JA-20 de Beckman).
2. Resuspendre le culot dans 10 mL de tampon de lavage contenant 1% triton X-100 et 1M urée par
gramme de culot de cellules. Incuber à T/P pour 5 minutes.
3. Centrifuger le lysat cellulaire comme à l'étape (1).
4. Répéter 3 fois.
5. Resuspendre le culot dans 10 mL de tampon de lavage et centrifuger la suspension à 4°C pour 30
min. à 45 000 rpm dans un rotor 45Ti de Beckman.
6. Resuspendre les corps d'inclusion dans le tampon d'extraction. Utiliser assez de tampon pour
obtenir une concentration finale en protéine de 1 mg/mL. Ajouter 10 uL PMSF (100 mM) par mL de
solution. Incuber une heure à T/P.
7. Diluer la solution dix fois avec le tampon d'extraction et dialyser toute la nuit contre 100
volumess de solution de lavage.
8. Centrifuger le dialysat à 4°C pour 30 min. à 45 000 rpm dans un 45Ti.
152
En voici un autre, de Laurent Vuillard et Alasdair Freeman de l'université de St
Andrews (Royaume Uni).
et laisser 1h at 4C.
- Le matériel insoluble est retiré par centrifugation à 100 000g pour 10 minutes. Cette étape est
particulièrement importante pour enlever les aggrégats qui pourraient servir de noyaux de précipitation
pendant le relpiement des protéines resolubilisées.
Repliement
Les protéines resolubilisées sont diluées aussi vite que possible 1 : 10 dans le tampon de repliement à 4°C:
La concentration finale en protéines ne devrait pas excéder 0,05 à 0,1 mg/ml. Le mélange doit être fait
rapidement. Pour de très petits volumes, on peut directement déposer la suspension protéique dans la
solution de repliement en vortexant. Pour des volumes plus grands, plutôt qu'un vortex, utiliser un
agitateur magnétique vigoureux. Agiter 2 minutes après l'addition. Incuber 1 heure à 4°C. Le reste du
NDSB et de la guanidine peuvent être retirés par dialyse.
Notes
153
- Les paramètres-clés de ce protocole sont la concentration protéique, celle du guanidium résiduel et la
température. Optimiser au besoin.
- Les NDSB (Non-detergent sulfobetaines) sont des agents aidant le repliement des protéines. Ce sont des
zwitterions qui contiennent un groupement sulfobetaine hydrophilique et une courte chaîne
hydrophobique; ils ne peuvent cependant pas former de micelles. Ils aident à réduire l'aggrégation et
facilitent le repliement des protéines dénaturées (on présume que c'est en interagissant avec les
groupements hydrophobes des protéines et en masquant ceux-ci à des groupes similaires sur d'autres
protéines).
Le NDSB 256 est d'habitude un peu plus efficace que le NDSB 201 mais ce dernier est beaucoup moins
cher.
Après avoir choisi une source de matériel et sélectionné une technique d'extraction, vous
voici arrivé à l'étape de la séparation des protéines et de l'enrichissement de celle que vous
voulez purifier.
De façon générale, les premières étapes d'une séparation protéique sont des techniques peu
coûteuses et à capacité élevée. Les techniques demandant des réactifs plus onéreux (des
anticorps, par exemple) sont d'habitude gardées pour plus tard, quand il y a moins de matériel
total et une plus grande proportion relative du matériel qui nous intéresse.
Cette technique utilise la solubilité différentielle des protéines. Comme chaque protéine est
plus ou moins soluble en solution selon sa composition, on peut en séparer plusieurs en
fonction de leur tendance à précipiter plus ou moins vite quand on change la force ionique de
la solution qui les contient.
Une force ionique élevée peut avoir deux effets sur la solubilité: neutraliser certaines charges
ioniques requises en surface pour le maintien de la solubilité, et compétitionner avec les
protéines pour les molécules d'eau disponibles en solution. Quand la concentration en sel est
assez élevée pour priver une protéine des molécules d'eau qui l'hydratent, celle-ci sort de
solution et précipite. C'est ce qu'on appelle le phénomène de salting-out.
Les protéines seront éventuellement toutes précipitées par une teneur en sel assez élevée,
mais certaines d'entre elles seront remarquablement résistantes alors que d'autres
précipiteront très facilement. C'est cette différence de solubilité qui permet de les séparer.
La série de Hofmeister ci-dessous décrit les effets relatifs de différents ions sur la
précipitation des protéines ou la promotion de leurs interactions hydrophobiques. (L'anion
phosphate et le cation ammonium sont est les plus efficaces pour précipiter les protéines;
l'anion chlorate et le cation Ca2+ sont au contraire les plus efficaces pour les remettre en
solution. Notez que ce ne sont pas toutes les combinaisons de ces ions qui donnent un sel
soluble).
154
précipitation PO43- > SO42- > COO- > Cl- > Br- > NO3- > ClO4- chaotropique
(salting out) NH4+ > Rb+ > K+ > Na+ > Cs+ > Li+ > Mg2+ > Ca2+ (salting in)
Le sel le plus utilisé en laboratoire pour précipiter les protéines est le sulfate d'ammonium
(NH4)2SO4. Sa solubilisation n'affecte pas la température de la solution (au contraire du NaCl,
dont la solubilisation exothermique aide à faire fondre la glace dans les rues l'hiver), il ne
dénature pas les protéines et ne coûte pas cher.
Le tableau ci-dessous donne les quantités de (NH4)2SO4 requises pour atteindre le niveau de
saturation à 0°C. (Le tableau indique aussi combien de sel ajouter à une solution qui en
contient déjà).
(fraction C20)
155
(2) Ajustement du surnageant Centrifugation et récupération du culot
Notre protéine se trouvera dans une des fractions C20, C40, C60, C80 ou C100.
Bien sûr, si on sait à l'avance comment notre protéine réagit au salting-out, on peut viser avec
plus de précision. Si elle précipite à environ 35% sulfate, on fera une première coupure avec
30% sulfate, une deuxième à 40% sulfate, et une dernière (juste au cas) à une teneur en sel
plus élevée. Mais nous saurons déjà que notre protéine se trouve dans la fraction C40, et
qu'elle est débarassée de tout ce qui précipite en-deçà de 30% sulfate et au-delà de 40%.
Les culots de protéines peuvent alors être resuspendus. Ils contiendront cependant encore une
grande quantité de sulfate dont il faut se débarasser.
5.6.2 Dialyse
La méthode la plus utilisée pour changer la concentration en sels d'une solution protéique est
la dialyse. Dans une dialyse, les protéines dans une concentration de sels donnée sont
séparées d'une solution à la concentration en sels différente par une membrane poreuse. Les
pores de cette membrane peuvent avoir différentes tailles; certaines membranes ne laisseront
passer que des ions alors que d'autres laisseront même passer de petites protéines (jusqu'à des
poids moléculaires de 50 000 Da).
Les sels auront tendance à équilibrer leur concentration de part et d'autre de la membrane. En
utilisant un volume de tampon de dialyse beaucoup plus grand que celui de la solution
protéique, on changera rapidement la teneur en sels de celle-ci en la même que celle du
tampon de dialyse.
Afin d'accélérer le processus, il vaut mieux changer souvent le tampon de dialyse pour du
tampon neuf plutôt que d'utiliser une seule quantité (même grande) de tampon. Voyez plutôt:
puisque C1V1=C2V2, la dialyse de 10mL de solution protéique à 500mM dans 1000mL de
tampon de dialyse à 100mM donnera une concentration de 104 mM à l'équilibre.
156
On aurait pu atteindre la même concentration en dialysant dans un plus petit volume et en
changeant le tampon une fois:
Notez que l'eau sera la première à diffuser: il n'est pas rare de voir un tube de dialyse gonfler
progressivement alors que l'eau y pénètre pour en réduire la concentration en solutés.
Attention aux éclatements.
À l'inverse, on peut utiliser des agents hygroscopiques pour concentrer les protéines dans un
sac à dialyse sans en changer la concentration en sels: il faut alors utiliser un tampon de
dialyse de même composition que le tampon se trouvant dans le tube, mais contenant un
agent comme le polyethylèneglycol (ou PEG, un gros polymère hygroscopique) de taille
supérieure à la porosité de la membrane. Le PEG ne pourra pas entrer dans le tube mais il
attirera l'eau qui s'y trouve hors du tube, concentrant du même coup les protéines.
Je la mentionne ici parce qu'elle peut être utilisée pour changer la salinité d'une solution de
protéines, mais en fait la filtration sur membrane se prête beaucoup mieux à une étape tardive
de la purification qu'au début des opérations.
On y utilise des membranes avec une porosité permettant à certaines substances de passer
(sels, petites molécules, petites protéines). Ces membranes sont le plus souvent vendues sous
forme d'unités de filtration (vous en avez peut-être déjà rencontrées sous le nom de colonne
Centricon),
qui consistent en un tube dont la partie inférieure est séparée de la partie supérieure par la
membrane. Les protéines sont déposées dans la partie supérieure du tube, et reposent sur la
membrane; le tube est alors centrifugé à basse vitesse pour forcer le liquide et les petites
molécules à traverser cette dernière sous le coup de la gravité. Les protéines, trop grosses, ne
peuvent pas passer et restent dans la partie supérieure; on peut ensuite soit les diluer avec un
nouveau tampon et recentrifuger (c'est une bonne technique de lavage) ou récupérer les
protéines concentrées.
Il faut bien sûr ne pas centrifuger si longtemps que tout le liquide ait traversé la membrane.
157
5.6.4 Sédimentation
Vous trouverez beaucoup d'informations sur les principes de la sédimentation à cette adresse:
http://ntri.tamuk.edu/centrifuge/centrifugation.html
Les protéines ont un coefficient de sédimentation défini par leur taille, leur forme et leur
densité. On peut donc les séparer par ultracentrifugation sur des coussins ou des gradients de
sucrose ou d'autres substances.
Dans une centrifugation zonale, l'échantillon est déposé en une mince bande au sommet d'un
tube contenant un tampon présentant un gradient de densité. Les protéines s'enfonceront et se
sépareront dans le gradient en fonction de leur coefficient de sédimentation (les plus lourdes
et denses coulent plus vite). Comme toutes les protéines finiront par arriver au fond du tube,
il faut arrêter la centrifugation avant, puis séparer chaque "étage" du tube (en fait, on
fractionne le contenu du tube en en retirant des volumes égaux à partir du sommet).
Dans une centrifugation isopycnique, maintenant, le gradient de densité couvre un spectre qui
inclue la densité de toutes les particules à séparer. Le matériel "flottera" alors dans le gradient
à un niveau où sa densité est égale à celle du milieu ambiant.
L'ADN a longtemps été préparé sur des gradients isopycniques de chlorure de césium. On
peut aussi séparer les protéines sur CsCl. (Le CsCl forme spontanément un gradient dans un
tube quand il est centrifugé à haute vitesse pendant 24-48hrs parce que les atomes lourds Cs+
ont tendance à decendre au fond). Comme ce gradient se forme spontanément, les particules à
158
séparer peuvent être mélangées directment au CsCl avant la mise en tube: l'établissement du
gradient de CsCl et la séparation isopycnique des particules se feront en même temps pendant
la centrifugation.
Le Percoll, une substance développée par Amersham Biocsciences, est une suspension de
billes de silice couvertes de polyvynipyrrolidone. Comme les billes ont une taille hétérogène,
le Percoll peut lui aussi spontanément former un gradient quand il est centrifugé assez
longtemps, On s'en sert pour la séparation isopycnique d'organelles cellulaires ou de virus.
Il est possible de préparer une centrifugation isopycnique avec un gradient préparé à l'avance:
il faut alors s'assurer de ce que la partie la plus dense du gradient excède la densité du
matériel que l'on veut voir se stabiliser dans sa migration en fonction de sa densité propre.
159
Comme la densité maximale du gradient ne dépasse pas celles des particules, celles-ci
s,enfonceraient toutes jusqu'au fond si on ne les arrêtait pas avant.
Il s'agit ici d'une séparation des protéines selon leur taille utilisant un tamis moléculaire. Une
colonne de chromatographie pour filtration sur gel est remplie d'une résine consistant en
billes creuses et poreuses. La taille des pores de ces billes est telle que certaines protéines
(petites) peuvent entrer et sortir à leur guise; que certaines (plus ou moins grosses) peuvent
essayer d'entrer mais avec plus ou moins de succès, alors que d'autres (trop grosses) ne
peuvent pas entrer du tout et passent tout droit.
Les plus grosses protéines, celles qui passent carrément entre les billes, sortent en premier de
la colonne. Les autres sont retardées par leurs interactions avec les billes; les plus petites
protéines, qui peuvent entrer et sortir à leur guise, sont les dernières à quitter la colonne.
160
type polyacrylamide
Cette technique est très efficace mais nécessite une haute concentration et un faible volume
de matériel de départ parce que les protéines ont tendance à s'étaler le long de la colonne, ce
qui réduit la qualité de leur séparation si elle n'y entrent pas relativement toutes en même
temps.
La forme d'une colonne de filtration devrait être étroite et longue pour une meilleure
séparation.
La filtration sur gel se fait avec un tampon dont la nature ne change pas pendant la séparation,
à l'inverse de ce qui se passe dans une chromatographie d'échange d'ions. Les protéines
assemblées en complexes macromoléculaires (comme par exemple les ARN polymérases, qui
comptent un grand nombre de sous-unités) ont donc plus de chances de rester assemblées,
puisqu'on n'interfère pas avec les interactions entre les différentes sous-unités.
161
5.6.6 Échange d'ions
Dans une colonne à échange d'ions, les protéines collent par affinité électrostatique à des
groupements chargés de la résine. Une résine portant des groupements positifs est dite
"échangeuse d'anions", parce que des ions négatifs ou les groupements acides d'une protéine
peuvent interagir avec. Une résine portant des groupements négatifs est dite "échangeuse de
cations" parce que ce sont des cations ou les groupements basiques d'une protéine qui
interagissent avec elle.
On fera décoller les protéines d'une telle résine en augmentant progressivement la force
ionique du tampon d'élution, ou en changeant le pH de telle façon que la protéine soit moins
chargée. Un gradient salin permet de séparer les protéines selon leur degré de charge positive
ou négative à un certain pH et est une étape de choix dans une purification.
On peut même effectuer les deux types de chromatographie d'échange d'ions, car une même
protéine aura souvent des charges positives et des charges négatives distribuées de façon
inégale. À l'inverse de ce qui se passe en électrophorèse, ici, ce n'est pas la charge nette de la
protéine qui compte mais la capacité de ses résidus chargés d'interagir avec la résine.
Comme on veut favoriser l'interaction de la protéine avec la résine choisie, on aura avantage
à jouer avec le pH de la solution tampon qui circule dans la colonne. Pour une résine
échangeuse de cations (monoS ou phosphocellulose, par exemple), on voudra optimiser la
charge positive de la protéine et donc travailler à un pH plus bas, histoire de bien former des
groupements -NH3+ et -COOH plutôt que -NH2 et -COO-. Un tampon HEPES à pH 7,5 serait
approprié. À l'inverse, pour une résine échangeuse d'anions (monoQ ou DEAE), on utilisera
plutôt un tampon basique comme le Tris à pH 8,2, histoire de favoriser la formation de
groupements -COO- et de réduire la présence de groupements NH3+.
La résine n'a pas à être utilisée en colonne. On peut la mettre au fond d'un bécher et y ajouter
la solution de protéine (ce qui est pratique dans les premières étapes d'une purification si on a
de très grands volumes de matériel). On peut aussi ménager la chèvre et le chou et mettre les
protéines en contact avec la résine dans un bécher ou un tube, effectuer des lavages à faible
force ionique dans le même récipient, puis déposer la résine dans une colonne vide pour
procéder à une élution plus contôlée.
162
Il existe une très grande variété de résines échangeuses d'ions, variant les groupes chargés
comme la nature des supports solides. Des colonnes pré-empaquetées sont aussi disponibles
et sauvent un temps précieux. Le catalogue Amersham Biosciences www.amersham.com
présente un grand inventaire de telles résines et colonnes.
En solution, les protéines à caractère hydrophobe cherchent davantage à s'associer entre elles
qu'à s'hydrater avec les molécules d'eau.
163
frais élué (avec une haute concentration en sel) d'une colonne d'échange d'ions directement
sur une colonne d'interaction hydrophobe, sans avoir à dialyser ou diluer.
Les résines les plus utilisées pour ce type de chromatographie sont l'octyl- et le phényl-
sépharose.
5.6.8 Hydroxyapatite
Dans une telle technique, on a recours à l'affinité de certaines molécules pour d'autres. On
pourra ainsi fixer des anticorps sur une matrice solide dans une colonne (Protéine A-
sépharose, par exemple) et faire passer notre échantillon sur la colonne pour y attraper les
protéines reconnues par l'anticorps.
On a souvent recours à des colonnes dont la matrice porte des fragments spécifiques d'ADN
pour aller pêcher les protéines liant l'ADN. Le bromure de cyanogène (CNBr) est l'un des
réactifs utilisés pour coupler ainsi une cible à la matrice d'une colonne.
Plusieurs protéines de fusion ont des étiquettes permettant de reconnaître et de fixer des
résines spécialement adaptées. Une telle étiquette est la glutathione-S-transférase, qui permet
164
à la protéine à laquelle elle est fusionnée de se fixer sur une résine de glutathione-sépharose.
La chitin-binding-protein (CBP) fait la même chose pour une résine couplée à de la chitine,
un polymère de N-acétylglucosamine.
Les lectines comme l'agglutinine de germe de blé (WGA, pour wheat germ agglutinin) ont la
très utile capacité de permettre l'adsorption de protéines glycosylées. Le WGA lie le N-
acétylglucosamine; la concanavalin A (Con A) lie le mannose et le glucose
165
Cibacron blue F3G-A enzymes nécéssitant des nucléotides
ConA Sepharose 4B glycoprotéines contenant du -D-mannose, du -
D-glucose et des sucres similaires
Wheat germ Lectin Sepharose glycoprotéines contenant du N-acetyl- -D-
glucosmine
On retrouve dans le commerce des résines d'affinité déjà faites. En voici quelques unes
vendues par la compagnie Amersham.
Des résines "pré-activées" et prêtes à recevoir un ligand pour former une nouvelle résine
d'affinité existent aussi.
166
Ce type de chromatographie d'affinité fait appel à l'immobilisation, sur une résine, d'un atome
métallique comme le nickel ou le cobalt. Cet atome immobilisé peut établir des liens de
coordination avec certains polypeptides, comme par exemple une chaîne d'histidines.
L'étiquette 6-His est justement ajoutée aux protéines pour que ces dernières soient plus
aisément purifiées par chromatographie d'affinité pour le métal.
Dans la figure ci-dessous, une résine IMAC populaire (nickel- nitriloacetic acid ou nickel-
NTA) utilise un ion de nickel comme site actif. L'ion Ni2+ possède six liens de coordination.
Quatre sont sollicités par le NTA pour l'immobiliser sur la résine; il en reste donc deux pour
interagir avec les atomes d'azote du cycle de la chaîne latérale de deux résidus histidines.
À pH <6, les résidus histidines commenceront à être réduits et ne pourront plus lier le nickel.
On peut donc utiliser une variation de pH pour faire décoller les protéines. Cependant, la
technique d'élution la plus usuelle (plus douce) se fera à l'aide d'un composé qui
compétitionnera avec l'histidine pour le nickel: l'imidazole.
Le nickel peut être chélaté par l'EDTA et l'EGTA, aussi ces composés doivent être utilisés
avec parcimonie (et selon les instructions du fournisseur en résine). Les agents réducteurs
peuvent aussi avoir un effet néfaste et doivent aussi être utilisées selon les instructions du
manufacturier (qui a généralement amplement testé sa résine)!
Comme une étiquette multi-histidines est très petite, facilement clonable à l'extrémité N' ou
C' d'une protéine, qu'elle permet la purification par affinité et peut être reconnue par des
anticorps spécifiques disponibles commercialement, elle est un excellent choix de
modification mineure facilitant la purification d'une protéine recombinante. Son aléa majeur
167
est qu'il existe des protéines contenant naturellement des séquences répétées d'histidines; il
faut donc se débarasser de celles-ci par une autre étape. (une recherche BLAST sur le
protéome de S. cereviasiae révèle 15 protéines avec au moins six histidines d'affilée). Pour de
telles protéines, une colonne IMAC peut servir de colonne d'affinité même sans l'ajout d'une
étiquette.
La figure ci-dessous décrit un système de base de chromatographie (il est inspiré du système
FPLC d'Amersham Biosciences).
Le coeur de ce système est évidemment la colonne. Elle est reliée au reste du système de
façon à ce que le tampon la traverse de haut en bas. Ce tampon provient de réservoirs situés
tout au bout en amont du système. On a ici représenté deux tampons différents (A et B) reliés
chacun à une pompe (A et B), même si bien entendu il est possible de faire fonctionner ce
système avec un seul tampon et une seule pompe. L'avantage d'en avoir deux est qu'on peut
programmer le système pour pomper progressivement plus d'un tampon que de l'autre,
générant ainsi un gradient. (D'ordinaire, les deux tampons ont la même composition sauf pour
la concentration en sel; faire varier la proportion de l'un par rapport à l'autre pendant la
chromatographie génère un gradient de force ionique dans la colonne).
Chaque pompe est reliée au mélangeur, une chambre où s'effectue le mélange des deux
tampons. Le tampon de chromatographie passe ensuite dans le distributeur, qui l'enverra soit
vers la colonne, soit vers une autre destination. C'est aussi dans le distributeur qu'on déposera
l'échantillon à chromatographier; le distributeur le dirige vers la colonne.
168
La figure ci-dessous nous montre ce à quoi ressemble l'enregistrement de la densité optique
de l'éluat en fonction du temps pendant une chromatographie d'échange d'ions avec un
gradient de sel.
Remarquez que les pics ont des formes différentes. La plupart d'entre eux reflètent sûrement
la présence de plusieurs protéines différentes, surtout si cette chromatographie a été pratiquée
en début de purification. On remarquera aussi que certains pics sont fusionnés: ainsi, le pic 2
court presque à la même place que le pic 3 et lui donne une épaule. On trouve une autre
épaule, beaucoup plus importante, dans le pic 8; cependant, dans ce cas, l'épaule peut
simplement être due à la très grande taille du pic.
5.6.12 HPLC
High performance liquid chromatography: il s'agit d'une technique permettant de séparer les
protéines (entre autres) avec une très grande résolution.
En gros, un système HPLC ressemble au système vu ci-haut: les différences majeures seront
que la colonne est généralement en acier et que le tampon de chromatographie (le solvant) est
sous haute pression pendant la séparation.
169
ou hydrophobique et le solvant est polaire (eau, méthanol, acétonitrile). C'est le pendant à
haute pression de la chromatographie à interaction hydrophobe.
Le HPLC se distingue par le très petit diamètre de ses colonnes (moins de 5 mm); un flot à
haute pression de solvant; la capacité de séparer et détecter de très petites quantités; et
finalement une très haute résolution.
Sur le sujet du HPLC, je vous recommande le livre en ligne des Drs Yuri Kazakevich et
Harold McNair.
On a souvent recours à une précipitation d'un aliquot de notre préparation pour des fins
analytiques (pour mettre les protéines sur gel, par exemple). Il existe plusieurs techniques
rapides et fiables pour précipiter les protéines. Je recommanderais de se tenir loin de toutes
celles qui utilisent le triethanolamine, cependant, à cause de son odeur de latrines de métro.
Voici deux protocoles rapides et efficaces ne demandant que très peu de manipulations.
Attention à vos doigts: ils sont couverts de kératine qui va promptement contaminer vos
échantillons si vous n'y prenez garde! Le port de gants de laboratoire est de rigueur.
5- Centrifuger 5 minutes
7- Centrifuger 5 minutes
170
5- Les protéines sont à l'interface. Retirer la phase supérieure et jeter.
5.6.14 Pontage
Les protéines s'associent souvent à d'autres molécules. Il est indispensable parfois de pouvoir
préserver ces associations pendant une purification. Bien qu'il soit parfois possible d'utiliser
certaines méthodes douces préservant les associations en questions, très souvent on doit
s'assurer qu'elles tiennent bon en les aidant un peu à l'aide d'un traitement chimique.
Un exemple de pontage entre les sous-unités d'une protéine est donné ci-dessous. Dans ce cas
on a eu recours au DMS, ou diméthylsuberimidate. (Ne pas confondre avec un autre DMS, le
diméthylsulfate ou encore avec le DMSO, le diméthylsulfoxide). Il est possible que toutes les
sous-unités ne soient pas pontées en même temps, mais à l'analyse on peut déduire la nature
de leurs interactions.
Ici, comme on découvre sur gel SDS des bandes correspondant à des complexes des sous-
unités 1-2-3, des sous-unités 1-2 et 1-3 mais pas des sous-unités 2-3, on pourrait conclure que
la sous-unité 1 contacte les deux autres dans l'holoenzyme, mais que les sous-unités 2 et 3
n'ont pas de contact direct.
171
6.0 Étude des protéines modifiées
6.1 Généralités
Que faire de nos protéines maintenant qu'elles sont purifiées? Ce que nous voulons! Mais
certaines méthodes d'analyse se retrouvant plus souvent que d'autres dans la littérature
scientifque, c'est à elles que nous prêterons maintenant attention.
Vous noterez que nous ne nous attardons pas trop aux principes physiques sur lesquels
reposent les techniques de spectrométrie. Ces sujets dépasseraient le propos de ce cours, aussi
nous nous limiterons à expliquer la base de chaque méthode et à comprendre comment les
utiliser dans le cadre d'un projet de biologie moléculaire.
Vous ne pouvez pas vous tromper non plus en visitant le site de l'université de
l'Arizona.
Mieux encore, si vous avez accès à une information génomique complète (comme
c'est le cas pour de plus en plus d'organismes dont les génomes ont été séquencés)
vous pouvez utiliser le spectromètre de masse pour identifier des protéines. Ainsi, si
vous digérez la protéine XYZ (encore inconnue) à la trypsine et que vous en
analysez les fragments par spectrométrie de masse, vous recevrez une liste de
poids moléculaires. Un ordinateur peut facilement comparer les poids de cette liste
avec les poids de toutes les séquences polypeptidiques codées par les cadres de
lecture du génome qui nous intéresse, et identifier celles qui coïncident. Quand vous
entendez un biochimiste dire qu'il a découpé une bande d'un gel SDS et l'a envoyé
en mass spec, c'est tout juste ce qu'il a fait.
172
Le principe général de la spectrométrie de masse repose sur une ionisation du
matériel et au voyage du matériel chargé vers un détecteur. On distingue plusieurs
systèmes de spectrométrie de masse selon la technique d'ionisation et la technique
de détection.
6.2.1 Ionisation
Ici, on utilise la chaleur pour faire perdre des électrons à un filament de tungstène ou
de rhénium dans lequel passe un courant électrique. Ces électrons sont emportés
par un champ magnétique induit par un aimant, ce qui cause la formation d'un
faisceau d'électrons avec lequel les particules gazéifiées de notre échantillon vont
entrer en contact. L'impact va briser les protéines en plus petits peptides et les
ioniser.
À basse énergie (environ 20 eV), les électrons ne résussissent pas à provoquer une
ionisation. À environ 70 eV, le transfert d'énergie entre les électrons et les molécules
organiques analysées est maximisé, ce qui favorise l'ionisation des peptides.
Ici, c'est un faisceau d'atomes de gaz (argon ou xénon) de haute énergie (4-10 KeV)
qui bombarde la substance à analyser. Cette énergie est transmise à nos peptides
qui sont ejectés sous forme ionique (positive et négative). Si la source d'accélération
(les deux éclairs dans la figure ci-haut) induit un courant positif, ce sont les ions
négatifs qui seront accélérés vers le détecteur; si le courant induit est négatif, ce
seront les ions positifs.
Ici, l'échantillon est d'abord soumis à un fort champ magnétique pour en ioniser les
molécules. Celles-ci sont pulvérisées dans la chambre d'ionisation sous la forme de
microgouttes pleines d'ions (comme si elles sortaient d'un pouiche-pouiche pour
arroser les plantes), gouttes qui sont rapidement déshydratées par un courant de
gaz chauffé (il s'agit le plus souvent d'azote). Le solvant disparaissant, les ions de
173
même charge dans les gouttes finissent par ne plus pouvoir se supporter, la faisant
exploser en plusieurs gouttelettes plus petites. Le processus se répète jusqu'à ce
qu'il n'y ait plus de solvant du tout, laissant des ions "nus" dans les airs.
Les charges sont distribuées sur les peptides de façon statistique; un même peptide
peut en porter plusieurs. Un séchage plus rapide des gouttelettes favorise la multi-
ionisation.
Une sectrométrie de masse utilisant l'ESI présente souvent ses résultats sous forme
de m/z (ou masse / charge) pour présenter la proportion des différentes formes
chargées d'un même peptide.
174
particulièrement efficace et qu'on n'avait pas eu d'ions monovalents, le pic m/z de
1200 n'aurait pas été là. Malgré cela, on aurait quand même pu déterminer que le
peptide initial avait une masse de 1200 en identifiant le ppcm (le plus petit commun
multiple, comme on disait à la petite école!) de 171, 200, 240, 300, 400 et 600.
Ici, l'échantillon est d'abord associé à une matrice de telle façon que chaque molécule de
peptide soit séparée de ses voisines. Les peptides et la matrice doivent former une "solution
solide" (un mélange qu'on a laissé sécher jusqu'à ce qu'il forme un biscuit, en quelque
sorte!) dont tout le liquide a été retiré. L e s composés les plus populaires pour la
composition de la matrice sont l'acide sinapinique, l'acide alpha-cyano-4-hydroxycinnamique
et l'acide 2,5-dihydroxybenzoïque. Ces molécules ont un poids moléculaire assez faible pour
permettre leur vaporisation quand on les excite avec assez d'énergie, mais aussi assez
élevé pour prévenir leur évaporation spontanée pendant ou après la préparation de
l'échantillon. Elles sont en outre acides, ce qui facilite la protonation des peptides, et
absorbent la lumière UV (ce qui joue un rôle crucial dans l'étape suivante).
L'échantillon est ensuite zappé avec un laser UV. L'énergie du laser est absorbée en
quelques nanosecondes par la matrice qui chauffe très rapidement. Comme les
peptides de l'échantillon sont associés à un nombre bien plus grand de molécules de
la matrice, ce sont ces dernières qui absorbent le gros de l'énergie; les molécules
peptidiques ne sont donc pas endommagés par le laser. Cette excitation énergétique
a plusieurs effets. Elle cause d'abord la désoprtion de certains peptides qui sont
expulsés. De plus, le transfert subit d'énergie de la matrice aux peptides peut les
ioniser. (On peut observer des transferts de protons de la matrice vers les peptides;
on peut aussi voir les peptides perdre des électrons ou en gagner. Le choix de la
matrice joue un rôle important sur l'état ionique final de l'échantillon).
Comme toute cette opération se déroule entre une anode et une cathode, les ions
sont ensuite propulsés en direction de l'électrode portant une charge inverse à la
leur -et vers un détecteur. (Les peptides peuvent, mentionnons-le, porter de
multiples charges; quoique dans le cas du MALDI, les peptides n'en portent
d'habitude qu'une seule).
175
6.2.2 Détection
Cette technique prend en considération le temps que met un ion pour parcourir le
chemin de la chambre d'ionisation au détecteur. Les ions plus gros mettent plus de
temps que les plus petits.
Elle ne semble pas limitée par la taille des ions et est extrêmement précise. Elle est
souvent combinée avec une méthode d'ionisation rapide comme le MALDI, qui
permet de savoir exactement quand les particules ont pris leur envol à cause de la
vitesse du processus MALDI (un rayon laser voyage en effet à la vitesse de...ah,
vous le saviez déjà).
Cette technique (aussi appelée sector analysis) permet de focuser les ions de même
charge et de même masse mais ayant un niveau d'énergie différent, ce qui
augmente la résolution de la détection des ions de même nature.
6.2.2.3 Q (quadrupole)
Dépendant des champs électriques produits avec le courant passant dans les fils,
seuls les ions avec un ratio m/z particulier se rendront jusqu'au détecteur au bout du
quadripole. Les autres seront déviés sur les fils. En variant la force et la fréquence
des champs, différents ions seront détectés, nous donnant ainsi leur spectre de
masse. Ne vous fiez pas à la grosse flèche droite de la figure, qui ne vous indique
que la direction générale. La course d'un ion dans un quadripole ressemble plus à
celle d'une abeille saoûle.
176
6.2.2.4 FT-ICR (Fourier transfrom ion cyclotron resonance).
Ici, un piège à ions dans un champ magnétique statique et uniforme dans l'espace
force les ions à adopter une orbite circulaire dans ledit champ; la fréquence de cette
orbite dépend de la masse, de la vitesse et de la charge de l'ion. Des détecteurs
suivent la course des ions et permettent d'en déterminer ces paramètres.
Dans ce piège à ions, un autre type de quadrupole est capable de capturer les
particules ionisées selon leur masse et leur charge, ainsi que selon le courant qu'on
fait passer dans le quadrupole. C'est la trajectoire des ions capturés dans des
conditions données de potentiel au niveau du quadrupole qui donne les informations
sur m et z.
Cette technique commence par séparer les ions en les faisant passer à travers une
série de trois quadrupoles qui sont réglés pour ne laisser passer que certains ions
vers le détecteur (par exemple, un certain peptide tryptique). Un MS laisserait
normalement passer tous les peptides issus d'une digestion protéique, et nous
donnerait le poids de chacun. Dans le MS/MS, on commence par n'en laisser passer
qu'un.
Le peptide qui réussit à passer entre dans une chambre où il est frappé par des
molécules de gaz chargées qui brisent sa chaîne peptidique en un ou plusieurs
endroits. Ces bris font en sorte que ce sont des morceaux du peptide tryptique qui
finissent par arriver au détecteur. En sachant le poids théorique du peptide tryptique
au départ et en comparant les poids des différents petits peptides qui en sont issus,
on peut établir l'ordre des résidus contenu dans le fragment initial. Cette technique
de MS/MS permet donc de séquencer un petit peptide.
177
6.3 Dichroïsme circulaire
Maintenant, si nous combinons deux rayons lumineux polarisés à 90° l'un de l'autre
mais se propageant dans la même direction. On obtiendra les ondes suivantes:
178
La résultante des deux ondes est une autre onde sinusoïdale située entre les deux
premières. Chaque pic de l'une correspond au pic de l'autre, et chaque noeud de
l'une arrive au même point que pour l'autre. Mais si notre filtre (un modulateur
photoélastique), en plus de laisser passer ces deux ondes, les déphase en plus
d'une valeur de π/ 2, le résultat sera tout autre. La résultante sera une spirale.
Dans L'exemple ci-dessus, on a retardé l'onde verticale bleue d'un quart de longueur
d'onde (λ / 4, ou encore π / 2 radiants) pour une résultante en hélice de pas droit. Si
on avait plutôt avancé l'onde bleue de π / 2 par rapport à la rouge, on aurait obtenu
une hélice de pas gauche. Pour une démonstration animée, veuillez vous référer à
l'excellent site suivant.
179
Cette déviation est appelée dichroïsme circulaire. Elle permet d'établir un spectre
(appelé CD spectra en anglais) de forme caractéristique pour trois structures
secondaires retrouvées dans les protéines: l'hélice, le feuillet et la forme aléatoire
(ou random coil), qui chacune présentent des asymétries structurales.
(a) hélicale,
(b) en feuillet,
(c) aléatoire.
180
La stabilité thermique d'une protéine peut être évaluée en suvant le comportement
de sa structure à différentes températures; cette opération peut aussi se faire de
façon continue avec un spectre de températures à une longueur d'onde fixe.
Les électrons, les protons et les neutrons peuvent être imaginés comme des
sphères tournant sur leur axe. Dans plusieurs atomes comme le carbone 12, de
telles révolutions (le spin) sont appariées de telle façon que le spin global du noyau
est égal à zéro. Dans d'autres atomes, cependant, comme le 1H ou le 13C, le noyau
possède un spin.
(a) Si le nombre de protons et le nombre de neutrons sont tous les deux pairs, le
noyau n'a pas de spin.
(b) Si le nombre de protons plus le nombre de neutrons est impair, le spin a une
valeur qui finit en 1/2 (comme 1/2, 3/2, 5/2...)
(c) Si le nombre de protons et de neutrons sont tous les deux impairs, le spin a une
valeur entière (1,2,3...)
On peut faire transiter un noyau de l'état d'énergie faible à l'état d'énergie élevé en
l'irradiant avec une fréquence donnée (dont la valeur exacte a à voir avec la
précession du spin, mais là nous entrons dans des considérations de physique
quantique qui, pour toutes intéressantes qu'elles puissent être, nous éloignent un
peu de notre propos). Le retour subséquent du noyau à son état d'énergie antérieur
est enregistrée par un détecteur. Ce phénomène de transition d'un niveau d'énergie
à un autre est la résonance qui donne le R de RMN.
181
Pour en savoir plus long, n'hésitez pas à vous référer à ce site.
6.5.1 Principe
Dans un cristal parfait, toutes les sous-unités ont la même conformation et la même
orientation. Quand des rayons X sont focusés à travers un cristal de protéines
purifiées, ils sont déviés selon un patron particulier qu'on appelle le patron de
diffraction.
182
6.5.2 Cristallisation
Un cristal de protéines, qui contient environ 50% de solvant réparti dans les
interstices entre les molécules, tient ensemble par le biais de forces hydrophobes,
de ponts hydrogènes et de ponts de sel (contrairement à un cristal minéral qui utilise
surtout les liens ioniques). En fait de solidité, un cristal de protéine est donc plus
proche d'un cube de jello sec que d'un diamant.
En mode Sans Contact, la sonde ne touche pas l'échantillon mais est maintenu au-
dessus de celui-ci, à 50-150 Angstroms. Les forces de Van der Waals entre la sonde
et l'échantillon créent une tension entre les deux, et la mesure de cette tension
permet d'établir la forme de l'échantillon. Le mode sans contact est utile pour les
échantillons fragiles que la sonde pourrait endommager en les touchant.
En mode "poule qui picore" (tapping mode), la sonde monte et descend très
rapidement (50 000 - 500 000 Hz). Quand la sonde est au dessus d'une bosse, elle
a moins d'espace pour osciller; quand elle est au dessus d'un creux, elle en a
davantage. Ces variations permettent d'établir le profil de l'échantillon. Ce mode a
l'avantage de ne pas "traîner" le long de l'échantillon, ce qui évite les problèmes
causés par les interactions électrostatiques, par l'adhésion, par la friction, et la
plupart des problèmes rencontrés d'habitude par les deux autres modes.
184
Ce lien mène à de très belles images obtenues par AFM. On peut y suivre la
condensation croissante d'un fragment de chromatine en fonction de la
concentration en sel dans le milieu ambiant.
1953 fut l'année où les travaux de Crick, Watson et Rosalind Franklin nous permirent
de visualiser la molécule d'ADN sous la forme hélicale qui nous est maintentant
familière. Cette date devrait aussi être remémorée comme celle où où Frederick
Sanger décrivit la séquence des résidus dans une molécule d'insuline.
185
Pour l'extrémité C-terminale, on a recours à une protéolyse contrôlée avec la
carboxypeptidase Y, C ou P (elles coupent le résidu situé le plus en 3 prime). Il fait
alors faire attention à ne pas digérer plus d'un acide aminé à l'extrémité C-terminale.
186
5- Seconde coupure de la chaîne polypeptidique avec un nouvel agent. Nous avons,
en (3), coupé la chaîne avec un réactif ou un enzyme afin de pouvoir séquencer les
fragments obtenus. Pour pouvoir enligner ces fragments, il nous faut maintenant
recommencer (3) et (4) avec un nouvel échantillon de la protéine intacte et un agent
différent. (Par exemple, si on a utilisé la trypsine en (3), on pourra maintenant utiliser
la chymotrypsine).
Pour découvrir où se situent les ponts disulfures, on peut faire comme Sanger sur
l'insuline: il a utilisé de l'acide prformique, qui non seulement coupait les ponts
disulfures mais en plus convertissait les chaînes latérales résultantes en
187
6.8 Synthèse de peptides
Ce n'est pas vraiment une technique d'analyse, mais puisqu'elle est pratiquement le
contraire conceptuel de la dégradation d'Edman nous allons rappeler ici les bases de
la synthèse chimique de peptides.
On y utilise une phase solide sur laquelle la chaîne est alongée, un résidu à la fois,
par l'addition en séquence des réactifs appropriés.
La synthèse se fait à l'envers de ce qui se passe dans la nature: c'est à dire que le
premier acide aminé de la chaîne est le plus C-terminal (c'est lui qui est attaché au
support solide). Le groupe N-terminal de ce résidu est protégé par un groupement
Fmoc (9-fluorenylmethoxycarbonyl-), qui est stable dans les acides mais pas les
bases.
Ce cycle est répété autant de fois que nécessaire et la chaîne s'allonge d'un résidu à
chaque fois.
Quand le polypeptide est complété, il est libéré du support solide par traitement à
l'acide trifluoroacétique, en présence de scavengers qui servent à neutraliser les
cations formés pendant le retrait des groupes protecteurs des chaînes latérales.
188
7.0 Interactions protéiques
Les protéines interagissent avec leur environnement, et ce sont les règles qui
régissent leur incessante partie de chassé-croisé qui nous permettent de mieux
comprendre comment elles contrôlent notre métabolisme.
Notre tentative de dresser une carte de toutes les interactions protéiques d'un
organisme a donné naissance à un nouveau terme, la protéomique. (En fait, le
suffixe "-omique" est de nos jours appliqué à toutes les sauces pour désigner l'étude
de systèmes à grande échelle. Ainsi, l'étude du génome entier est connu depuis un
certain temps sous le nom de génomique, celles d'un grand nombre de protéines est
de venu la protéomique, et on trouve déjà des références à l'interactomique (étude
des interactions), ou à la transcriptomique (étude de l'ARNm). L'étude du sens de
l'humour à grande échelle s'appellera peut-être un jour la comicomique.
.1 Interactions protéines-protéines
7.1.2 FRET (fluorescence resonance energy transfer)
Les deux molécules doivent être séparées par 10-100 Angstroms; le spectre
d'absorption de l'accepteur doit chevaucher le spectre d'émission du donneur; et les
orientations des dipôles du donneur et de l'accepteur doivent être à peu près
parallèles.
189
La distance à laquelle le transfert est efficace à 50% est appelé distance de Förster
et varie selon les agents fluorescents utilisés.
7.1.3 Co-précipitation
190
en mnême temps sédimenter un complexe dont elle ferait partie.
On peut aussi s’y prendre à l’envers, et transférer d’abord l’ADN sur une membrane
de nylon; on l’incube ensuite avec un extrait protéique. Si une protéine se lie à
l’ADN, on pourra la révéler grâce à un anticorps spécifique. Bien entendu, pour que
le système fonctionne, l’interaction ADN-protéine doit être assez stable pour se
maintenir tout au long du traitement par les anticorps primaire et secondaire.
Cette technique est très simple, mais aussi très élégante et a permis de démontrer
que la protéine GCN5 avait une activité histone acétyltransférase. On prépare
d'abord un gel SDS normal, à ceci près que sa matrice contient aussi une cible
quelconque (dans le cas de l'expérience mentionnée, cette cible consistait
191
d’histones). La cible est aussi retrouvée dans le tampon. Bref, tout le système est
saturé en cible.
On dépose un extrait protéique dans les puits et on fait migrer le gel pour bien en
séparer les protéines. Aprèes la migration, on lave le gel pour le débarasser du SDS
pour permettre aux protéines de se renaturer, dans un tampon au pH et à la salinité
appropriée.
On fournit ensuite le substrat qui permet de suivre la réaction qui nous intéresse.
Dans le cas des histones acétyltransférases, il s'agissait d'acétyl-CoA radioactif. Une
histone acétyltransférase devrait transférer le groupe acétyl radioactif de l’acétyl-
CoA sur les histones qui sont à sa portée.
Pour évaluer l’interaction entre une protéine 1 et une protéine 2, on commence par
en faire des hybrides par génie génétique: un premier hybride entre la protéine 1 et
un domaine d’attache à l’ADN, et un second entre la protéine 2 et un domaine
d’activation de la transcription.
On transfère ensuite les vecteurs d’expression de ces hybrides dans une levure
contenant un gène rapporteur (comme la beta-galactosidase) sous le contrôle d’un
promoteur reconnu par le domaine d’attache à l’ADN de l’hybride 1.
192
Expérience de double hybride
L'ADN d'une cellule coupé à la nucléase micrococcale et séparé sur gel d'agarose
ressemble à une échelle de fragments dont la taille est un multiple d'environ 147pb.
Ils correspondent à des monomères, dimères, trimères, etc. de nucléosomes. Quand
on tranfère cette échelle sur une membrane et qu’on l’hybride avec une sonde
d’ADN, on observera une échelle si la région où s’hybride la sonde a des
nucléosomes en phase (régulièrement déposés) ou encore une traînée si les
nucléosomes sont déphasés (déposés irrégulièrement).
193
Pour juger d'un site spécifique de coupure par la nucléase micrococcale, on peut
effectuer un marquage indirect ("indirect end-labelling"). Pour ce faire, après
traitement à la nucléase micrococcale, l'ADN est coupé avec une endonucléase qui
a un site près de la région qui nous intéresse. On effectue ensuite un transfert de
Southern, et comme sonde on en choisit une, pas trop longue, qui hybride juste à
l'extrémité du fragment laissé par la digestion à l'endonucléase. Cette hybridation
revient au même que d'avoir effectué un marquage au site de restriction, et permet
de juger des distances entre ce bout et toute coupure causée par la nucléase
micrococcale. (Cette technique fonctionne aussi bien sûr avec toutes les nucléases).
Cette technique un peu plus compliquée donne des résultats plus difficiles à
analyser mais fournit énormément d'information sur la position des nucléosomes.
194
On commence par digérer de la chromatine par la nucléase micrococcale jusqu'à
l'obtention de nucléosomes monomériques (les conditions de digestion sont à
déterminer empiriquement et préalablement).
L'ADN récupéré des monomères de nucléosome est dénaturé et hybridé sur l'ADN
simple brin du phagemide; il est ensuite allongé par la polymérase de Klenow.
Chaque monomère donnera naissance à un fragment d'ADN dont la synthèse
commence à une position qui lui est propre.
L'ADN obtenu après l'extension par la Klenow est ensuite coupé avec une
endonucléase coupant une fois dans le plasmide, ce qui génère une échelle de
bandes: chaque bande de cette échelle a une taille correspondant à la distance
entre l'extrémité distale du monomère et le site de restriction. Cela nous donne la
positon d'une des extrémités de chaque nucléosome.
On répète l'opération avec l'autre brin pour obtenir la position de l'autre extrémité.
7.2.3 EMSA (ou electromobility shift assay) et REMSA (RNA electromobility shift
assay)
Cette technique, la plus simple qui soit pour étudier une interaction entre un acide
nucléique et des protéines, repose sur le fait qu’un complexe ADN- protéine ou
ARN-protéine migrera moins vite dans un gel non-dénaturant qu’un ADN ou un ARN
nu. Ce retard de migration permet de juger au premier coup d’oeil si une séquence
particulière d’ADN ou d’ARN a été reconnue et liée par une protéine. On l’appelle
aussi gel-shift ou gel à retardement, ce qui le fait sonner comme une bombe.
Certaines protéines font se courber l’ADN. Dépendant de l’endroit où elle se lie sur
une sonde d’ADN, une protéine qui fait courber l’ADN affectera de façon différente la
migration sur le gel d’EMSA. Plus la courbure est au centre de la sonde et plus la
migration est retardée. On peut utiliser une même sonde en y déplaçant le site de
reconnaissance de la protéine pour juger de l’habileté d’une protéine à courber
l’ADN.
196
On part d'un ensemble d'oligonucléotides dont la séquence est aléatoire; cela veut
dire qu'on y trouve toutes les séquences possibles -incluant les séquences
reconnues par notre protéine, ainsi qu'une énorme majorité de séquences qu'elle ne
reconnaît pas. Ces oligonucléotides contiennent des séquences permettant leur
amplification par PCR: par exemple, ils pourraient avoir une séquence comme
ACGTCCGTGCNNNNNNNNNNNNNNNNNNCCGTCGTGCA. Une ronde
d'amplification par PCR avec des amorces ACGTCCGTGC et TGCACGACGG les
amplifierait tous, quelque soit la séquences de la région
NNNNNNNNNNNNNNNNNN.
Ce "pool" de séquence est ensuite soumis à une sélection. In vitro, le plus simple est
de faire un EMSA avec le pool en entier; les rares séquences qui sont reconnues par
la protéine sont retardée lors d'une migration sur gel et le reste est éliminé. Les
bandes retardées sont récupérées, et comme elles ne contiennent que peu de
matériel, elles sont à nouveau amplifiées par PCR. Comme il est possible que des
contaminants se soient glissées à travers les mailles du filet, un nouvel EMSA est
pratiqué sur ces séquences réamplifiées; les bandes retardées sont une fois de plus
purifiées. On peut exécuter ce cycle plusieurs fois. Les séquences sont à la fin
séquencées et on peut alors déterminer celles pour lesquelles la protéine a le plus
d'affinité.
Cette technique peut aussi se faire à partir de matériel cellulaire. On commence par
ponter les protéines et l'ADN avec du formaldéhyde à même la cellule. Ensuite, on
morcelle la chromatine (par sonication, par exemple). Les fragments récupérés sont
immunoprécipités avec un anticorps contre la protéine; le pontage est renversé par
traitement à la chaleur et l'ADN récupéré. Les fragments d'ADN sont alors rendus
francs par traitement à la Klenow et on leur ajoute des adapteurs par ligation pour
permettre une amplification par PCR. Aprèes amplification, on peut soit utiliser un
EMSA comme ci-haut ou recommencer une ronde d'immunoprécipitation, au choix
de l'expérimentateur.
197
L’exonucléase III a une activité 3’-5’ exonucléase, mais ne s’attaque qu’aux
extrémités 5’ proéminentes ou franches. Elle ne coupe pas l’ADN simple-brin, ni à
partir d’extrémités 3’ proéminentes.
Cette activité de l’exo III est utile pour déterminer les limites d’une interaction entre
une protéine et un fragment d’ADN. Si on marque l’extrémité 5’ du fragment au 32P,
et que l’on traite celui-ci à l’exonucléase III pendant qu’une protéine en protège une
partie, l’exonucléase III ne pourra digérer l’ADN que jusqu’à ce qu’elle entre en
contact avec cette protéine, qui lui barre le chemin ni plus ni moins. La taille de
l’ADN protégé, qu’on détermine sur gel dénaturant, permet alors de déterminer
jusqu’où s’étendait l’interaction ADN-protéine.
Un des avantages de l’empreinte à l’exonucléase III est que l’ADN non-protégé par
une protéine est entièrement dégradé; une interaction partielle ne génère pas de
bruit de fond.
Cette technique, une fois de plus, utilise le fait qu’une protéine déposée sur l’ADN
peut le protéger de l’activité de dégradation d’une nucléase. Dans ce cas précis, il
s’agit de la DNAse I, une nucléase qui sans couper absolument partout a quand
même une affinité générale pour l’ADN et coupe très fréquemment. La DNAse I ne
coupe qu’un seul brin à la fois, aussi on marque un seul des brins au 32P pour suivre
son comportement sur gel de séquence.
La DNAse I favorise les sites du sillon mineur de l’ADN. Quand l’ADN est en contact
avec une surface continue (comme une plaque de verre ou la surface d’un
nucléosome, par exemple), elle génère des coupures à toutes les 10 paires de
bases, reflétant la fréquence d’hélicité de la spirale d’ADN.
C’est le radical HO· qui attaque l’ADN. Il n’a pas de préférence quant à la séquence
et tend à couper partout. Une telle empreinte peut donner plus de bruit de fond
qu’une empreinte à la DNAse parce que cette dernière, beaucoup plus massive,
peut difficilement atteindre des sites situés sous la protéine qui protège l’ADN, alors
qu’une petite molécule comme HO· y arrive plus facilement. Pour cette raison, une
empreinte générée par les radicaux libres est moins claire qu'une empreinte à la
DNAse I.
D’autres radicaux existent pour ce type de réaction, comme par exemple le cuivre-
phénanthroline. La décision quant à la technique adoptée revient au chercheur.
Votre kilométrage peut varier.
Un avantage du DMS est qu'il peut pénétrer les cellules sans qu'on ait à solubiliser
199
celles-ci au préalable; il se prête donc facilement aux études in vivo. Il est
particulièrement actif sur les G se trouvant dans le sillon majeur de l'ADN.
Les UVB (280-320 nm) et les UVC (200-230 nm) peuvent induire la formation de
dimères de pyrimidines quand deux pyrimidines se voisinent: on obtient alors des
CPD, pour cyclobtuane pyrimidine dimers, ou des photoproduits pyrimidine-
pyrimidone (6-4PP) . Les 6-4PP se forment à un taux d'environ 15-30% des CPDs.
Les 6-4PP peuvent être coupés par la piperidine chaude; les CPD doivent être
traités à la T4 endonuclease V et re-traités aux UVA (320-400nm) et à la photolyase.
Cette technique vise plus particulièrement les régions riches en pyrimidines. Elle se
prête bien aux techniques in vivo, car aucune perméabilisation membranaire n'y est
requise; de plus, l'irradiation peut être très brève si l'intensité de l'irradiation est
élevée, permettant de prendre une "photo" de ce qui se passe dans la cellule à un
moment précis, avec un minimum de perturbations.
Presque toutes les techniques utilisées pour étudier les interactions ADN-protéines
in vitro peuvent être utilisées in vivo aussi. Il est juste un peu plus difficile de faire
pénétrer les réactifs dans la cellule et d’en récupérer l’ADN par la suite. La technique
la plus populaire depuis une dizaine d’années pour récupérer des fragments d’ADN
aprèes une réaction d’empreinte in vivo est celle du LMPCR, ou ligation-mediated
Polymerase chain reaction. Elle est décrite ci-dessous.
(1) Récupération de l'ADN génomique. Cet ADN contient des coupures simple-
brin, là où la DNAse I ou un autre agent comme le DMS a endommagé la chaîne
de groupements phosphates.
(2) Séparation des brins et annélisation de l'un d'eux avec une amorce 1 spécifique
à une région qui nous intéresse. L'autre brin pourra être étudié plus tard lors d'une
autre expérience. Notez que les fragments d'ADN dont nous disposons à cette
étape sont de tailles différentes, parce que la coupure à la DNAse I n'est que
partielle.
200
(3) Extension de l'amorce 1. Cette élongation se fait jusqu'au bout de l'ADN qui
sert de gabarit, rendant cette extrémité franche ("blunt", comme dirait Coleridge s'il
avait fait de la biologie au lieu de la poésie).
(4) Ligation d'un adapteur double-brin dont une des extrémités est franche et
l'autre cohésive. Ces extrémités différentes empêchent l'adapteur de se liguer
plusieurs fois.
201
cellules a été coupé par la DNAse I et nous voulons maintenant voir si des sites ont
été protégés au niveau de ce promoteur.
Dans la case 1, l’ADN génomique en entier est récupéré. L’ADN qui correspond à
notre promoteur est en si petite quantité comparé à tout le reste de l’ADN de la
cellule qu’il doit être amplifié par PCR pour pouvoir être visualisé de façon utile.
Dans un premier temps, une amorce spécifique au promoteur qui nous intéresse est
utilisée. L’ADN génomique est dénaturé, et l’amorce 1 (ci-dessus) est utilisée pour
s’allonger sur tous les fragments correspondant au voisinage du gène d’intérêt.
Cette élongation s’arrête quand la polymérase manque d’ADN-gabarit, c’est à dire là
où la DNAse I a fait une brèche dans le brin du bas. L’ADN de promoteur ainsi
allongé est donc rendu franc à une de ses extrémités.
Cet adapteur est franc à un bout et 5’ proéminent à l’autre; cela évite entre autres
d’avoir un concatémère d’adapteurs au bout de notre fragment: un seul réussit à s’y
liguer. Notez que l’extrémité du fragment d’ADN se trouvant en amont de l’amorce 1
n’a pas pu être allongée et a donc une extrémité proéminente; l’adapteur ne peut
pas s’y liguer non plus.
Comme elle se rend jusqu’au bout du fragment, cette première élongation complète
la séquence manquante de l’adapteur; lors du deuxième tour de PCR, l’amorce 3
sera capable de s’hybrider et la réaction sera vraiment exponentielle.
(a) la DNAse I (il faut alors perméabiliser les cellules pour permettre l’entrée de
l’enzyme, et s’assurer de ce qu’il y ait assez de Mg2+ présent dans le milieu);
202
empreinte aux UV a l’avantage de ne pas toucher aux cellules du tout, et permet
donc d’étudier une cellule très près de son état naturel.
Le gros avantage de ce pontage covalent est qu’il est réversible par la chaleur.
On peut également ponter les protéines à l’ADN par d’autres techniques. Les rayons
UV pourront y parvenir, de même qu’un rayon laser. Dans de tels cas, l’énergie
transmise au système permet d’avoir une réaction plus ou moins rapide; un laser
assez puissant donnera une image presque instantanée de ce qui colle à l’ADN
alors qu’une lampe UV de basse énergie demandera plusieurs minutes, ne révélant
que les complexes très stables. (Un problème avec les sources UV de faible énergie
est que les rayons UV sont facilement absorbés par le milieu de culture).
7.2.10 SPR (ou surface plasmon resonance), plus communément appelée Biacore
On mesure ici l’interaction entre deux partenaires moléculaires grâce à une machine
mesurant l’intensité d’un rayon de lumière. Cette machine est fabriquée par la
compagnie Biacore, qui a donnée son nom à l,appareil comme frigidaire l’a fait au
réfrigérateur.
Dans le système Biacore (tm) ces milieux sont (1) la solution dans laquelle se trouvent
les molécules à analyser et (2) le verre d’une lame qui sert de senseur. Le film
conducteur à l’interface des deux est un très fin film d’or à la surface de la lame de
verre.
203
Le changement d’indice de réfraction aura pour effet de changer l’angle pour lequel
la lumière réfléchie perd un maximum d’énergie par résonance.
Dans sa forme la plus simple, le ChIP permet de vérifier la présence d'une protéine
donnée à un endroit donné dans le génome. Dans un tel cas, on commence par
traiter les cellules avec du formaldéhyde, qui provoque des pontages covalents entre
les protéines et l'ADN. Comme nous le verrons un peu plus loin, ces pontages sont
solides mais peuvent être renversés par la chaleur (67°C).
L'ADN génomique, maintenant ponté avec une grande quantité de protéines, est
ensuite brisé pour donner des fragments de petite taille (environ 500 paires de
bases). La technique la plus utilisée pour cette fragmentation est la sonication.
204
Pour récupérer les fragments d'ADN sur lesquels se trouve pontée la protéine qui
nous intéresse, on utilise un anticorps spécifique contre cette dernière. L'anticorps
sera idéalement biotinylé, ce qui permettra de le retenir contre une bille magnétique
couplée à la streptavidine. Le complexe bille magnétique- streptavidine- anticorps-
protéine pontée- ADN est retenu au fond d'un tube par un aimant pendant que tous
les autres complexes ADN-protéines sont éliminés par lavage.
Dans la figure qui suit, on utilise un anticorps qui reconnait une protéine représentée
en vert.
Après les lavages, la bille magnétique a permis de retenir tous les fragments d'ADN
avec lesquels la protéine d'intérêt a une interaction assez importante pour permettre
le pontage au formaldéhyde. Reste maintenant à identifier ces fragments..
205
La façon la plus simple de procéder est d'utiliser une paire d'amorces spécifiques à
une région particulière (la région promotrice d'un gène qui nous intéresse, par
exemple) et de procéder soit à un PCR normal, soit à un Q-PCR (aussi appelé "real-
time PCR", qui permet d'effectuer des analyses plus quantitatives). Si la protéine
étudiée était associée à la région qui nous intéresse, des fragments d'ADN
contenant cette séquence auront été retenus lors des lavages et le PCR pourra en
amplifier la séquence.
Plutôt que de se limiter à une seule région lors de la réaction de PCR, on a aussi
l'option (plus coûteuse!) d'analyser la présence de notre protéine partout dans le
génome.
Pour ce faire, on commence par une ligation d'adapteurs aux extrémités des
fragments d'ADN purifiés lors du ChIP. On utilise ces adapteurs pour pratiquer une
réaction de PCR amplifiant tous les fragments présents. Cette amplification se fait en
présence d'un nucléotide associé à une substance fluorescente, du genre Cy3 ou
Cy5.
Pour identifier et démêler tous les fragments obtenus, on les hybride ensuite sur une
micropuce d'ADN (aussi appelée "DNA chip", d'où le nom de "ChIP on chip"). Plus la
micropuce contient de séquences, et plus celles-ci sont courtes, plus la résolution
obtenue est élevée en termes de localisation des protéines dans le génome. (Bien
entendu, le résultat sera plus intéressant si la micropuce contient non seulement des
séquences codantes, comme c'est le cas pour les puces de cDNA, mais aussi des
séquences intergéniques qui contiennent des régions de contrôle. L'idéal serait une
puce portant des séquences couvrant le génome entier).
206
En utilisant une telle technique, si on dispose d'une micropuce adéquate, on peut
(par exemple) suivre l'association globale d'un facteur de transcription à l'ADN
pendant le cycle cellulaire, ou suite à un traitement quelconque, ou encore
déterminer d'un seul coup d'oeil la position de plusieurs composantes de la
chromatine dans différentes situations.
7.3.3 ChIPPET
Technique d'abord publiée dans Wei et al. (2006) Cell 124, 207-219.
Des données, des données, trop de données!!! C'est le drame des biologistes
moléculaires modernes. Toute technique capable de réduire la quantité de bruit par
rapport aux informations cherchées ne peut être que la bienvenue.
On va ensuite couper notre librairie de ChIP avec l'enzyme Mme I avant de refermer
les plasmides avec de la ligase. Cette étape enlève la majeure partie des fragments
immunoprécipités et n'en laisse que deux bouts par plasmide, soit les 18 pb en 5' de
l'insert et les 18 pb en 3' de l'insert. Ces deux fragments de 18 pb recollés
ensembles forment une étiquette (le diTag) qui est caractéristique d'une position
dans le génome. La librairie de vecteurs ainsi coupés et religués est maintenant
affublée du très flatulent nom de librairie de PETs.
La librairie de PETs est ensuite coupée avec un autre enzyme présent dans le site
de clonage multiple, l'enzyme BseR I, qui lui aussi coupe en dehors de son site de
207
reconnaissance (GAGGAG, 10,8). En raison de sa position par rapport au site Mme I
du vecteur original, BseR I causera la formation de fragment d'environ 40 pb ayant
cette allure générale :
Tous ces inserts sont ligués ensemble dans des vecteurs, formant une troisième
librairie, la librairie de ChIPPET dont chaque composante sera séquencée
séparément. Chaque réaction de séquence identifiera un grand nombre de fragment
grâce à ses diTAGs.
208
7.3.4 ChIPSeq
3- Les longs fragments se replient et leur extrémité libre (qui porte un des brins de
l'un des adapteurs) s'apparie aux courtes amorces complémentaires collées aur le
support solide.
209
5- Dénaturation de ces fragments double-brin; chaque brin reste attaché par son
amorce fixée au support solide.
210
8- Les réactifs sont lavés, le groupement qui bloque le bout 3' du premier nucléotide
est coupé chimiquement, le fluorophore du premier nucléotide est coupé
chimiquement, et un deuxième nucléotide est rajouté. Comme ci-dessus, l'appareil
enregistre quel nucléotide s'est ajouté à quel point. On répète ainsi les cycles base
par base, en enregistrant la séquence de chacun des points.
Ces deux techniques ont été publiées par le laboratoire du Dr Laemmli (le même
que celui du tampon éponyme!) dans Schmid et al. (2004) Cell 16, 147-157.
211
8.0 Protéomique et découverte de drogues
La protéomique, ou étude à grande échelle des protéines, n'est pas strictement limitée au
domaine commercial. De nombreux laboratoires utilisent depuis longtemps des techniques de
gels 2D ou de spectrométrie de masse pour étudier en même temps de très nombreuses
protéines.
La grande force de notre système moderne de mise en marché des médicaments, c'est que ces
derniers sont supposés fonctionner. Ne riez pas! Pendant longtemps, les décisions médicales
ou pharmacologiques n'ont rien eu à voir avec l'observation ou avec ce duo étonnant que sont
Essai et Erreur.
À la place, nos ancêtres pleins de bonnes intentions essayaient de corriger les états de santé
défaillants en appliquant leurs connaissances limitées du monde qui les entourait. Vous avez
sûrement entendu parler de nombreuses théories qui nous paraissent fort étranges aujourd'hui,
théories souvent basées sur d'antiques systèmes philosophiques plutôt que sur l'observation
des malades.
Ainsi, au moyen-âge, le plus docte des médecins aurait pu vous expliquer sans rire que votre
état de santé dépendait de l'équilibre des quatres humeurs que vous contenez: le phlegme, la
bile jaune, la bile noire et le sang. (Son collègue le chimiste vous aurait expliqué que la
matière, elle, était composée de quatre éléments: le feu, l'air, la terre et l'eau). Sur quoi se
basait cette croyance? Pas sur l'étude des malades, en tout cas!!! Il y a gros à parier que si
vous attrapiez une phlébite, un chirurgien-barbier vous diagnostique en moins de deux un
excès de sang par rapport aux trois autres humeurs, et vous étiez bon pour un petit traitement
aux sangsues. (George Washington, le premier président des États-Unis, trouva la mort après
avoir pris froid un bel hiver... et avoir été abondamment SAIGNÉ par son médecin).
Cet état de choses plutôt dangereux pour les patients provenait en partie d'une croyance
(encore maintenue aujourd'hui par de nombreux vendeurs d'huile de castor) selon laquelle les
Sages de l'antiquité étaient vachement forts en tout, et que toute sagesse ne pouvait provenir
que de l'émulation de ces très grands esprits. Alors si Aristote déclarait que les abeilles ou les
écrevisses sont des animaux dépourvus de sang, il était inutile d'aller vérifier. Aristote l'a dit
212
il y a 2 000 ans, donc ça doit être vrai.
Dans le premier cas, on étudiera des pathologies particulières, et on cherchera à les contrôler
en jouant sur différents paramètres qui lui sont propres. Par exemple, puisqu'on sait que de
nombreux cancers dépendent de la protéine de signalisation Ras qui est positionnée à la
membrane plasmique par une ancre de farnesol, on peut développer un inhibiteur de
farnesoylation et ainsi contrecarrer l'action de Ras.
Dans le second cas, on peut ramasser n'importe quel microorganisme dans un champ ou une
forêt, le cultiver en laboratoire, et tester les substances qu'il produit dans différents contextes
pour voir si cette bibitte ne serait pas en train de synthétiser un quelconque médicament
miracle. C'est ainsi qu'on a découvert la pénicilline ou la cyclosporine, après tout.
La première chose à l'ordre du jour lors de cette étape est d'avoir une cible, qui sera
d'ordinaire fournie par des travaux de recherche fondamentale. Par exemple, des chercheurs
peuvent déterminer que certains cancers du sein sont stimulés par les estrogènes. La stratégie
serait donc de découvrir un médicament qui inhibe l'activité du récepteur des estrogènes (le
facteur de transcription ER) pour attaquer ces cancers. ER serait considéré la cible d'une telle
stratégie.
213
Bien sûr, certaines entreprises pharmaceutiques chercheront à découvrir elles-mêmes leurs
propres cibles. Pourquoi? Parce que dans l'industrie, il n'y a rien de tel pour assurer les profits
que l'exclusivité d'un concept, d'une idée, d'un protocole ou d'une substance. Cette exclusivité
est assurée par l'obtention d'un brevet. Et au bureau des brevets, c'est premier arrivé, premier
servi. Si l'idée d'utiliser ER comme cible dans le traitement du cancer du sein avait été
pondue dans une entreprise plutôt qu'un labo académique, cette entreprise aurait pu la
breveter... et être la seule à avoir le droit de s'en servir.
8.1.4 Phase I
Les phases cliniques sont celles ou on teste chez l'être humain. Elles sont au nombre de
quatre.
La phase I dure entre deux et six mois. Elle vise principalement à déterminer si la drogue
candidate est sécuritaire chez l'être humain. Quelques dizaines de sujets sont utilisés comme
cobayes pour cette phase; certains sont malades, d'autres bien portant. Bien sûr, on a déjà
testé la drogue sur des animaux à cette étape et on sait qu'elle sera probablement sans danger;
cependant, on veut s'en assurer parce qu'on ne sait jamais. Les deux tiers des drogues
candidates passent cette étape.
8.1.5 Phase II
La phase II vient ensuite. Personne n'ayant subi de dommages spectaculaires pendant la phase
I, on peut maintenant tester la drogue sur un plus grand nombre de personnes (jusqu'à
plusieurs centaines). On va aussi commencer à tester la drogue pour voir si elle a l'effet qu'on
veut sur les patients. Cette phase peut durer deux ans et à la fin on aura éliminé les deux tiers
des drogues candidates qu'on avait au début.
La phase III est encore plus poussée et onéreuse. Elle implique des milliers de patients et peut
durer quatre ou cinq ans. Il s'agit ici de tester différents aspects de la posologie et de
l'efficacité de la substance: effet placebo, dosage de la quantité optimale de drogue pour
qu'elle ait un effet supérieur à celui d'autres substances, assurance de l'absence de contre-
indication, etc. Seul le quart des candidats du début passeront cette étape et pourront recevoir
le satisfecit de la FDA (Food and Drugs Administration).
C'est cette approche en plusieurs étapes qui a permis au Dr Frances Kelsey, de la FDA,
d'empêcher que la thalidomide ne soit utilisée pour traiter la nausée du matin aux États-unis.
Nous n'avons pas eu cette chance ici...
8.1.7 Phase IV
La phase IV se déroule quand une drogue est sur le marché. Il peut arriver (malheureusement) que malgré tous les eff
pendant les trois premières phases, un médicament présente des effets dangereux imprévus à long terme.
La fenfluramine (Fen-Phen), par exemple, a été brièvement vendue comme drogue miracle
pour faire maigrir et vous imaginez quel succès elle a pu avoir chez les consommateurs.
214
Malheureusement, plusieurs utilisateurs devaient mourir de problèmes cardiaques peu après
le début de leur utilisation du produit, qui fut retiré du marché.
Le développement d'une
nouvelle drogue, depuis
les phases initiales
jusqu'aux quatre phases
cliniques.
215
C'est principalement au niveau de la recherche pré-clinique que la protéomique peut aider
l'industrie, et surtout au niveau de l'identification de nouvelles cibles. Par contre, ce n'est pas
là son unique application et on peut tester l'effet d'une drogue sur l'expression globale des
protéines, ou utiliser des techniques ingénieuses de synthèse pour mettre au point des
protéines artificielles qui auront un effet thérapeutique.
Le schéma ci-contre résume le processus qui conduit à la mise en marché d'une nouvelle
drogue. Qu'on parte avec une maladie à guérir ou un médicament à tester, on doit identifier
un cible qui puisse servir dans un test expérimental ET être utile dans le traitement d'une
maladie. Le test sert à vérifier si la substance candidate peut jouer un rôle; quand on découvre
qu'elle a du potentiel, on en modifie la structure chimique pour maximiser son efficacité.
Les compagnies suivantes (qui n’ont aucun lien avec ce site, je m’empresse de le préciser!!!)
utilisent des techniques de pointe pour étudier les interactions protéiques, découvrir de
nouvelles cibles thérapeutiques, ou encore développer de nouveaux médicaments. Une visite
sur leur propre site ne peut être qu’instructive.
La compagnie Cellzome a utilisé la technique du TAP-tag pour définir une très grande
majorité des interactions protéiques chez la levure. La compagnie offre même ses résultats à
la communauté scientifique.
La compagnie Sangamo, au lieu d’utiliser des facteurs de transcription naturels pour contrôler
l’expression des gènes, synthétise ses propres facteurs en modifiant la structure de doigts de
zinc. Cela permet de créer de nouveaux facteurs de transcription capables de reconnaître de
nouvelles cibles.
216