Documente Academic
Documente Profesional
Documente Cultură
Puces à ADN
par Pascal SOULARUE* et Xavier GIDROL**
Nouveaux outils d’étude des composants moléculaires de la cellule, les puces à ADN
ont permis la mesure massivement parallèle de la concentration à l’équilibre des ARNm.
Un grand nombre d’applications peuvent être envisagées comme l’étude des réseaux
génétiques au sein d’une cellule ou l’obtention de signatures moléculaires caractéristiques
d’un type de cellule, d’une pathologie ou d’un patient.
1. De la notion de cellule Ainsi l’ADN présent dans une cellule de levure est * Ingénieur
Responsable de la plate-
constitué d’un enchaînement de 14 millions de
à celle de transcriptome nucléotides, 170 millions de nucléotides dans une
forme Biopuces du SGF
C C C T
A T A G
G G G A
A C C A
T A T
C G C A
Nucléotides
G complémentaires
T T T
G C G
gine d’un dysfonctionnement grave de l’organisme taine de milliers chez la souris ou l’homme, constitue
(maladie génétique chez l’être humain). le génome des êtres vivants.
Si l’on reprend l’analogie entre la molécule La molécule d’ADN est en fait analogue à une
d’ADN et une encyclopédie, le polymorphisme encyclopédie dans laquelle on trouverait 95 % de
peut être assimilé à des « fautes de frappe ». ponctuation (séquences non codantes) et seule-
Certaines de ces fautes peuvent n’avoir aucune ment 5 % de texte. Ce texte serait une succes-
incidence sur la compréhension du texte (ex : sion d’informations (les gènes), composées
baktérie, bactèrie ou bactéri pour « bactérie »), exclusivement des 4 lettres A, C, G et T. Chaque
d’autres peuvent, au contraire, en modifier com- information comprend des paragraphes, les
plètement le sens et le rendre totalement incom- exons, interrompus par des messages publicitai-
préhensible (douche, souche moche, moiche, res, les introns : l’information TACTACTACTAC-
mouhe en lieu et place de « mouche »). TAC peut ainsi y être représentée par la
séquence suivante : ... ...
..gcagacggcatcgTACTAgttgacgtgaCTACTAtgtgc-
1.3 Notion de génome tacatgacataaatgggaatCTACccgaactg... ....
L’ADN est la forme de stockage de l’information
génétique de tout être vivant. L’unité de base de Les gènes sont disséminés le long du génome, il
cette information est le gène. Un gène est une petite est par conséquent très difficile d’en localiser sur la
séquence d’ADN particulière qui va être utilisée par la molécule d’ADN, et encore plus de l’identifier, de lui
cellule pour synthétiser les protéines, les enzymes attribuer sa fonction exacte dans la cellule. Caracté-
qui lui sont nécessaires pour assurer le bon fonction- riser l’ensemble des gènes d’un organisme supérieur
nement de la machinerie cellulaire : respiration, divi- est donc un projet titanesque. Pouvoir attribuer à
sion et croissance, échanges avec les autres cellules, chaque gène une fonction exacte dans la cellule,
lutte contre les agressions extérieures, dégradation pouvoir établir de manière fine comment ils inter-
ou transformation de différents métabolites... agissent entre eux est un enjeu considérable pour la
médecine de demain.
Ces gènes présentent différentes caractéristiques :
Même si les grands projets de cartographie des
— ils sont disséminés le long du double brin d’ADN génomes, réalisés dans les années 1990, et l’avance-
de chacune des cellules ; ment du séquençage total de génomes d’organismes
supérieurs (1998-2000) ont déjà permis de caracté-
— leur taille, et donc leur séquence, présente une riser un nombre important de gènes, ces outils ne
longueur variable (de quelques centaines de nucléo- donnent que peu d’informations sur la fonction
tides à quelques milliers) ; exacte de ces gènes ainsi que sur leurs interactions
— chez les organismes supérieurs, ils sont morce- fines. L’ère de l’après-gène, ou post-génomique,
lés en de nombreux fragments informationnels appe- commence seulement !
lés exons, séparés par des morceaux de séquences
dont le rôle est pour l’instant indéterminé nommés 1.4 Du génome au transcriptome
introns ;
En fonction de leurs différents besoins, les cellules
— leurs séquences mises bout à bout ne représen- vont utiliser tout ou partie de ces informations (les
tent qu’une infime partie de la totalité de la molécule gènes) pour réaliser la synthèse des protéines
d’ADN : de l’ordre de 5 % seulement chez l’homme, nécessaires aux grandes fonctions cellulaires.
voire moins.
Le passage du gène (unité informationnelle pré-
L’ensemble de ces gènes, dont le nombre varie de sente dans le noyau) à la protéine (unité fonction-
quelques milliers chez la levure (6 200) à une tren- nelle synthétisée dans le cytoplasme) se fait en deux
Chromosome
Gène A Gène B
Transcription
Exon 1 Exon 2 Exon 3
AAAAA
ARN messager
Cytoplasme
AAAAA
Traduction
Protéine
étapes dites de transcription puis de traduction, pas- Ce transcriptome est le reflet instantané de l’acti-
sant par la synthèse d’un intermédiaire important : vité cellulaire. Il peut donc varier :
l’ARN messager, selon le principe décrit sur la
figure 3. — d’un type cellulaire à l’autre (neurone, cellule
sanguine, cellule de la peau...) ;
À partir d’un même gène, plusieurs copies d’ARN
messagers peuvent être produites simultanément en — pour un type cellulaire donné, il varie au cours
fonction de l’activité de la cellule. des différentes phases de la vie de la cellule ;
— il varie également lorsque les cellules sont sou-
Le noyau de la cellule est comparable à une mises à des conditions particulières de stress (modi-
bibliothèque où serait stockées toutes les infor- fications environnementales : changement de milieu,
mations vitales pour la cellule. Comme dans tou- radiations, stress chimique ou provoqué par des
tes les bibliothèques, les originaux ne peuvent médicaments...) ;
sortir. Seules les photocopies y sont autorisées. — il diffère enfin entre un état sain de la cellule et
L’ADN est donc photocopié en un nombre d’exem- un état pathologique de celle-ci.
plaires variable à l’intérieur du noyau au cours de
l’étape dite de transcription. Les photocopies, Pouvoir comparer le transcriptome de différents
ici les ARNs messagers, sont ensuite distribuées types cellulaires, dans différentes conditions de
dans le cytoplasme aux unités de production pro- stress, pouvoir analyser l’ensemble du transcriptome
téique que sont les ribosomes : c’est l’étape de d’une cellule à différents stades de son cycle cellu-
traduction. laire ou dans des conditions « pathologiques » per-
mettrait de mieux comprendre le fonctionnement
On appelle transcriptome l’ensemble des ARN cellulaire sur le plan fondamental. Cette analyse du
messagers transcrits. Plusieurs milliers de transcrits transcriptome offre également beaucoup d’intérêt en
différents sont présents dans le cytoplasme de la cel- termes d’applications comme nous le verrons ci-
lule à un instant donné. après.
Addition de A
Cette analyse simultanée de milliers de trans- A
crits en parallèle n’était pas envisageable il y a
seulement une dizaine d’années. Le développe- A
ment, au début des années 1990, d’un nouvel A
outil d’analyses, les PUCES à ADN, l’a rendue
désormais possible.
A Masque
2. Les puces à ADN T A C A G
C G C C T A
2.1 Principe A G T G G G
Comme décrit précédemment, l’ADN est présent A T G T G A
dans la cellule sous forme d’un double brin, la
séquence de chaque brin (c’est-à-dire la succession
des nucléotides) étant parfaitement complémentaire a synthèse « in situ » base par base,
de la séquence du brin en vis-à-vis (cf. figure 2). utilisant des masques successifs
C’est ce principe qui sert de base au concept des
puces à ADN, comme à beaucoup d’autres techni-
C
ques utilisées en biologie moléculaire, d’ailleurs.
C
Les puces à ADN sont en fait des supports fonction-
nalisés en verre ou en silicium, de petite taille (la T
taille d’une lame de microscope : 25 mm × 75 mm) T G G
sur lesquels vont être synthétisées directement, ou A G
C
greffées après synthèse, des milliers de séquences
d’ADN nucléiques, appelées sondes, caractéristiques A C T
d’autant de gènes (entre 5 000 et 12 000) (figure 4). A C A
La synthèse directe sur la lame est très onéreuse C T C
et peu souple car elle nécessite la conception de T G C
masques différents pour chaque étape de couplage A T
G
entre deux nucléotides. Aussi la méthode de greffage
des sondes après synthèse se révèle être la plus cou-
ramment utilisée : moins coûteuse, elle permet de Puce
déposer n’importe quelle sonde déjà synthétisée. Ces
puces à ADN sont ensuite mises en contact avec b greffage des sondes après synthèse
l’ensemble des transcrits issus d’une cellule, les
cibles, marqués par un fluorochrome. C’est l’étape Figure 4 – Greffage des sondes sur la puce
d’hybridation. Pendant cette étape, les séquences
cibles marquées du fluorochrome reconnaissent,
parmi les séquences sondes greffées sur la puce, cel- met, pour chaque gène que l’on veut voir figurer sur
les qui leur sont complémentaires et s’y apparient. la puce, de déterminer de courtes séquences nucléo-
Après hybridation, les hybrides cibles/sondes, sont tidiques le caractérisant. Juste avant l’hybridation, on
repérés et quantifiés grâce à leur fluorescence. dénature l’ADN pour qu’il se trouve sous la forme
Outre le fait que l’on peut, grâce aux puces à ADN, simple brin sur la puce, ce qui lui permettra de
analyser en un même temps un nombre considérable s’accrocher au brin complémentaire contenu dans la
de séquences, l’utilisation de 2 fluorochromes diffé- cible. Ces séquences vont servir d’amorces à une
rents [un rouge (Cy5) et un vert (Cy3) par exem- enzyme, la polymérase, qui synthétise par des réac-
ple] permet de comparer les niveaux d’expression tions en chaîne des copies rigoureusement identi-
relatifs de 2 transcriptomes différents sur une même ques caractéristiques du gène en question afin
Dans les Techniques puce. On obtient alors, en une seule étape et donc d’obtenir une quantité suffisante de sonde : c’est la
de l’Ingénieur : dans des conditions rigoureusement identiques technique de PCR (polymerase chain reaction)
Analyse des acides d’hybridation, 2 images : une rouge et une verte (figure 6).
nucléiques [P 3 315],
par B. Parfait et représentatives chacune d’un transcriptome. Ces Après 35 ou 40 cycles, l’ADN ainsi synthétisé (ou
D. Vidaud (2002). 2 images sont ensuite superposées « in silico » pour sonde) est purifié et quantifié. Il est alors quantita-
analyser le différentiel d’expression (figure 5). tivement et qualitativement prêt à être déposé
mécaniquement sur le support : la puce.
2.2 Les différentes étapes
de la réalisation d’une puce à ADN ■ Dépôt des sondes sur le support
fonctionnalisé
sur lame de verre
Après la synthèse, la purification et le contrôle des
■ Production des sondes milliers de sondes, celles-ci sont déposées sur la
Les sondes sont des séquences d’ADN double brin puce : une lame de verre de 25 mm × 75 mm recou-
caractéristiques des gènes dont on cherche à déter- verte d’une fine couche de polymère (du silane ou de
miner la fonction ou l’implication dans un processus la l-polylysine), permettant de « fixer » les sondes
métabolique. L’accès à des bases de séquences per- génomiques par de simples liaisons électrostatiques.
Transcriptome modifié
marqué au Cy5 (rouge)
Puce ADN
Image Cy5
635 nm
Scanner Image
résultante
Hybridation
compétitive
Image Cy3
532 nm
Transcriptome témoin
marqué au Cy3 (vert)
96 °C Dénaturation
ADN dénaturé
55 à 60 °C Appariement
des amorces
Amorçage
72 °C Élongation
Le dépôt est effectué par des robots dont la précision ce cas, la sonde, prélevée par une buse, est projetée
est de l’ordre de la dizaine de micromètres. sur la lame, sans contact direct avec celle-ci. Le dia-
Le dépôt proprement dit peut être réalisé par con- mètre des dépôts peut varier de 80 à 300 µm. La dis-
tact grâce à des aiguilles qui prélèvent un infime tance entre 2 dépôts sur la lame est de l’ordre de
volume de sonde et qui viennent au contact de la 250 µm (centre à centre) dans les 2 directions. Le
lame, ou par une technique de « jet d’encre ». Dans volume de sonde déposé est lui de l’ordre de 2 nL.
180 µm
greffée
rents sont présents dans les cellules. Leur abondance T—A A A
relative est révélatrice de l’activité cellulaire du T—A A A
moment. Afin d’analyser l’ensemble de ces transcrits T—A A—T A—T
qui serviront de cibles pour l’étape d’hybridation, il A—T T—A T—A
faut les extraire, puis leur incorporer un marqueur T—A A—T T—A
fluorescent qui permettra d’évaluer et de quantifier A—T A—T A—T Sonde greffée
Schéma de dépôt T—A A—T G—C
des sondes l’appariement sonde/cible. L’extraction de ces trans-
A—T T—A T—A
crits se fait à partir de quelques millions de cellules
A—T T—A C—G
(provenant de cultures cellulaires ou de biopsies), T—A A—T A—T
par les techniques physico-chimiques classiques de
séparation (lyse de la cellule et séparation sélective
Si l’on réalise le mar- Puce
quage au jour J, l’hybri- des ARN messagers).
dation de la puce se fait
sur la nuit, l’acquisition Comme il n’existe aucune technique de marquage
de l’image survient le direct de ces ARN, le marquage de ces derniers à Figure 7 – Hybridation spécifique cibles marquées/
jour suivant (J+1). sondes
L’analyse de l’image l’aide de marqueurs fluorescents nécessite une étape
peut se faire dans la supplémentaire : pour réaliser le marquage, on
journée J+1 voire J+2
(selon le nombre de effectue une transcription inverse pour revenir de
spots à analyser). l’ARN messager à la séquence nucléotidique du gène obtenir des valeurs relatives ou ratio d’expression,
de départ. C’est durant cette réaction de synthèse pour chacun des gènes présents sur la puce.
inverse que sont incorporés les marqueurs fluores-
cents (rouge Cy5 ou vert Cy3). On obtient ainsi un
mélange de cibles marquées qui seront ensuite mises
3.1 Localisation des spots
en contact avec les sondes greffées sur la puce pour Pour localiser les spots, il faut utiliser un
l’étape d’hybridation. « masque », une grille théorique définie par des cri-
tères précis pour la disposition des lignes et colon-
■ Étape d’hybridation
nes, en fonction du plan de dépôt. Ce masque est
Elle consiste à mettre en présence les séquences placé sur l’image pour repérer chacun des spots. Ce
cibles marquées et les séquences sondes greffées sur repérage doit être simple, rapide, automatique et
la puce. Du fait de la complémentarité A-T et G-C, les précis.
séquences complémentaires s’apparient (figure 7).
En effet, si l’expérimentateur devait réajuster
La réaction d’hybridation dure quelques heures en manuellement 10 000 spots par puce, cela pourrait
milieu liquide favorisant les liaisons entre séquences prendre énormément de temps. Il faut donc trouver
complémentaires. Les lames, après hybridation, sont le juste équilibre entre la précision du repérage et le
rincées pour se débarrasser des cibles ne s’étant pas gain de temps, car une bonne localisation des spots
fixées ou s’étant fixées de manière non spécifique. est essentielle pour la suite de l’analyse.
Après séchage, les lames sont scannées afin d’établir
le profil d’hybridation.
3.2 Segmentation des spots
3. Acquisition de l’image La segmentation est un processus de classification
des pixels d’une image, en fonction de leurs proprié-
et analyse des données tés. Pour les puces à ADN, la segmentation permet
d’identifier chaque pixel « bruit de fond » ou
Après la lecture des lames par un scanner qui per-
« signal ». Le bruit de fond n’est jamais uniforme sur
met de mesurer la fluorescence de chaque spot sur la
une lame, il varie en fonction de la surface, de l’auto-
lame, il convient d’analyser les images obtenues pour
fluorescence du support ou de l’hybridation non spé-
pouvoir en extraire une indication sur le différentiel
cifique. Il est donc indispensable d’évaluer le bruit de
d’expression pour chacun des gènes présents sur la
fond pour chaque spot. Il existe plusieurs méthodes
puce.
de segmentation qui peuvent être classées en quatre
L’analyse d’image se fait en trois étapes : catégories en fonction de la définition du spot : cercle
— localisation des spots, c’est-à-dire déter- fixe, cercle adaptable, histogramme et forme adapta-
mination des coordonnées de chaque spot sur la ble [1] (figure 9).
puce ;
■ Segmentation en cercle fixe
— segmentation des spots qui permet de discri-
miner, pour chaque spot, les pixels « signal » des Le contour du spot est défini par un cercle de dia-
pixels « bruit de fond » ; mètre constant, identique pour tous les spots de
l’image. Les pixels à l’intérieur du cercle correspon-
— extraction des données : elle consiste à défi- dent au signal, ceux à l’extérieur au bruit de fond.
nir, pour chaque spot, des paires d’intensités du Cette méthode décrite pour la première fois par
signal Cy3 et Cy5. (figure 8) l’équipe d’Eisen de l’université de Stanford [2] est
Les valeurs brutes obtenues à l’issue de l’analyse particulièrement efficace lorsque les spots sont
d’image sont ensuite filtrées et normalisées pour homogènes et parfaitement localisés. En revanche,
SO–
3 SO–
3
–O S
3 SO–
3
N+ N
O O N
O
a formule chimique du fluorochrome Cy3TM
SO–
3 SO–
3
–O S
3 SO–
3
N+ N
Le spot est délimité par un cercle rouge
O
Figure 9 – Image illustrant les différentes méthodes
O N de calcul de bruit de fond
O
3.3 Extraction des données — si ce rapport est supérieur à 1, le gène est dit
surexprimé ou induit (on parle alors de ratio d’induc-
■ Sélection des gènes significatifs tion).
Marquage
des cibles
Hybridation
sondes/cibles
Lecture
(numérisation)
Analyse
d'image
des gènes in silico et déterminer la fonction d’un loppements similaires commencent à apparaître pour
gène inconnu. Ainsi, à partir d’un compendium de l’analyse massivement parallèle des protéines ou
profils d’expression chez C. elegans on a pu identifier d’autres composantes cellulaires.
quelques grandes fonctions de gènes [11]. Cette révolution technologique, ce changement
d’échelle de la recherche biologique, va de pair avec
4.5 Action des médicaments une utilisation croissante de la robotique et de l’infor-
C. elegans est un ver
Les puces à ADN peuvent aussi être utilisées pour matique. Les biologistes, traditionnellement confron-
nématode de 959 cellules
de son vrai nom Caenor- l’identification de nouvelles cibles pour les médica- tés à quelques dizaines de données expérimentales,
habditis elegans.
ments. La plupart des médicaments agissent en inhi- vont devoir désormais apprendre à gérer des centai-
bant leur molécule cible, enzyme ou récepteur. Par nes de milliers de données. Grâce à ces technologies,
conséquent, une mutation du gène correspondant il est vraisemblable que la biologie prendra une
devrait avoir un effet similaire sur le transcriptome dimension théorique plus marquée.
de la cellule. Marton et al. [12] ont utilisé une puce à
ADN contenant le génome de la levure pour montrer Mots clés : puces à ADN, génomique fonction-
l’existence d’une corrélation entre le profil obtenu nelle, bio-informatique, profils d’expression,
lors d’une simulation médicamenteuse antimicro- transcriptome.
bienne et le profil d’expression d’une levure portant Keywords : DNA chips, functional genomics,
un gène muté et impliqué dans le métabolisme bioinformatic, expression profiles, transcriptome.
d’action de ce médicament.
Bien entendu, cette approche pourrait être réalisée
en aveugle pour rechercher le mode d’action d’un Sites à consulter
médicament en comparant le profil obtenu avec ce National Human Genome Research Institute,
dernier à une base de données répertoriant les profils National Institute of Health http://nhgri.nih.gov
d’expression de centaines de mutants. Cette appro- Affymetrix http://www.affymetrix.com
che pourrait permettre de trouver les groupes de
gènes modulés par différentes classes de médica- National Institute of Environmental Health Scien-
ments. De même des banques de données ces Microarray Center
répertoriant les profils d’expression engendrés par http://dir.niehs.nih.gov/microarray/bioinfor.htm
les médicaments pourraient permettre d’évaluer et DNA Microarray (Genome chips)
prédire l’efficacité et la toxicité de ces médicaments http://www.gene-chips.com/
[13].
European Bioinformatics Institute
http://www.ebi.ac.uk/microarray/
Contact auteur
5. Conclusion De Risi Lab. Department of Biochemistry and Bio-
SOULARUE Pascal : Les puces à ADN ont permis de réaliser un saut physics
SOULARUE@dsvidf.cea.fr
quantique dans l’analyse biologique. Il est mainte- http://www.microarrays.org/protocols.html
nant possible d’analyser l’expression de milliers de The Institute for Genomic Research
gènes en parallèle et à haut débit. Des déve- http://www.tigr.org/tdb/microarray/
Références bibliographiques
[1] YANG (Y.H.), BUCKLEY (M.J.), DUTOIT (S.) et SPEED [8] GOLUB (T.R.), SLONIM (D.), TAMAYO (P.) et al. – Mole-
(T.P.). – Comparison of methods for image analysis on cular classification of cancer : class discovery and class
cDNA microarray data. Tech report 584 (2000). prediction by gene expression monitoring. Science
[2] EISEN (M.B.), SPELLMAN (P.T.), BROWN (P.O.) et (2000).
BOTSTEIN (D.). – Cluster analysis and display of [9] IDEKER (T.), THORSSON (V.), RANISH (J.) et al. – Inte-
genome-wide expression pattern. Proc Natl Acad Sci grated genomic and proteomic analyses of a systema-
USA 95 p. 14863-8 (1998). tically perturbed metabolic network. Science 292
[3] SPELLMAN (P.T.), SHERLOCK (G.), ZHANG (M.Q.) et al. p. 929-34 (2001).
– Comprehensive identification of cell-cycle-regulated
[10] FAMBROUGH (D.), McCLURE (K.), KAZLAUSKAS (A.) et
genes of the yeast Sacchaaromyces cerevisae by
LANDER (E.S.). – Diverse signaling pathways activated
microarray hybridization. Mo biol Cell 9 p. 3273-97
by growth factor receptors induce broadly overlapping
(1998).
rather than independent set of genes. Cell 97 p. 727-
[4] IYER (V.R.), EISEN (M.B.), ROSS (D.T.) et al. – The 41 (1999).
transcriptional program in the response of human
fibroblast to serum. Science 283 p. 83-7 (1999). [11] KIM (S.K.), LUND (J.), KIRALY (M.) et al. – A gene
expression map fo Caenorhabditis elegans. Science
[5] HUGUES (T.R.), MARTON (M.J.), JONES (A.R.) et al. –
293 p. 2087-92 (2001).
Functional discovery via a compendium of expression
profiles. Cell 102 p. 109-26 (2000). [12] MARTON (M.J.), de RISI (J.L.), BENNETT (H.A.) et al. –
[6] HSIAO (L.L.), DANGOND (F.), YOSHIDA (T.) et al. – A Drug traget validation and identification of secondary
compendium of gene expression in normal tissues. drug target effects using DNA microarray. Nat Med 4
Physiol Genomics 7 p. 97-104 (2001). p. 1293-301 (1998).
[7] SHAFFER (A.L.), ROSENWALD (A.), HURT (E.M.) et al. [13] SCHERF (U.), ROSS (D.T.), WALTHAM (M.) et al. – A
– Signature of the immune response. Immunity 15 gene expression database for the molecular pharmaco-
p. 375-85 (2001). logy of cancer. Nat Gen 24 p. 236-44 (2000).