Sunteți pe pagina 1din 31

Ghid de nomenclatur

genic
Guidelines for Human Gene Nomenclature
Hester M. Wain, Elspeth A. Bruford, et al

HUGO Gene Nomenclature Committee,

http://www.idealibrary.com

Intoducere
Gena segm. ADN ce contribuie la un anumit
fenotip/funcie
Funcie necunoscut gena se caracterizeaz prin
secven, transcriere sau omologie
Locus punct genomial, identificat cu ajutorul
unui marker, ce poate fi localizat
Nu corespunde neaprat unei gene
Regiune cromozomial regiune genomic
asociat cu un anumit fenotip/sindrom
Ex ANCR

HGNC, e.g., ANCR Angelman syndrome chromosome
region and CECR cat eye syndrome chromosome region.
Symbols may therefore be assigned to the following:
a) Clearly defined phenotypes shown to be inherited
predominantly as monogenic mendelian traits, e.g.,
BBS1 Bardet-Biedl syndrome 1.
b) Unidentified genes contributing to a complex trait
shown by linkage or association with a known
marker, e.g., IDDM6 insulin-dependent diabetes
mellitus 6.
Nomenclatura genic
1. Fiecare simbol genic trebuie s fie unic.
2. Simbolurile reprezint abrevieri sau prescurtri
ale genei.
3. Simbolurile vor conine numai litere latine i
cifre arabice
4. Nu se folosesc semne de punctuaie.
5. Nici un simbol nu se va termina cu litera G de
la gene.
6. Simbolurile nu vor conine referine la o anumit
specie, de exemplu- H/h ptr human.

Nomenclatura genic
Caracterul iniial va fi ntotdeauna o liter
Toate caracterele se scriu n aceiai linie
Se evit referirile la:
Specifictatea tisular
Greutatea molecular
Localizarea cromozomial
Exemple
Gene implicate n boli monogenice ex. BBS1
"Bardet-Biedl syndrome 1".
Gene neidentificate-asociate cu un marker-
implicate n BMF ex. IDDM6 "insulin-
dependent diabetes mellitus 6
Segm. ADN clonate cu funcie descris -
COX8 "cytochrome c oxidase subunit VIII".
Pseudogenes ex. IL9RP1 "interleukin 9
receptor pseudogene 1".

Exemple
Gene codificate pe catena opus antisens-
suprapus pe o gen cunoscut ex. IGF2AS
"insulin-like growth factor 2, antisense".
Segmente funcionale ADN transcrise dar
netranslatate ex. XIST "X (inactive)-specific
transcript".
Gene deduse din aspectul fenotipic celular ex.
LOH18CR1 "loss of heterozygosity, 18,
chromosomal region 1
Gene cu funcie necunoscut dar care prezint
secvene similare ex. FAM7A1 "family with
sequence similarity 7, member A1" etc.

Caracter /simbol Semnificaie
AS antisense
AP Protein asociat
BP Protein de legare
C catalitic
FAM Familie de gene cu secv similare
N sau IN inhibitor
L like
LOH Pierderea heterozigozitii
MT sau M mitocondrial
OS Catena opus
P pseudogen
Simboluri genice n publicaii
Se scriu cu majuscule i italice genele i
alelele
Se precizeaz:
(mRNA)RP1
(gDNA) RP1
(cDNA) RP1
Fonturi standard - simbolurile ptr proteine

Segmentele ADN
Simbolurile pot fi obinute din baze de date
(Genome Database)
Sunt alctuite din 5 pri ex DXS9877E
1. D ptr ADN
2. 0,1,2, ...X,Y, XY -ptr cromozomi
0 segm cr. necunoscut
XY reg pseudoautozomal
3. S -secv unice, Z secv repetitive pe acelai
cromozom sau F familii de gene
4. Numr unic
5. E- pentru secv exprimate

Notarea mutaiilor genice
Scurt istoric i surse bibliografice
Prima ncercare, primele articole publicate Beaudet AL i Tsui LC
respectiv Beutler E 1993

Consens actual - den Dunnen i Antonarakis: Mutation nomenclature
extensions and suggestions to describe complex mutations: a
discussion. Human Mutation 2000:15: 7-12
http://www.hgvs.org/mutnomen/

Discuii, mbuntiri continue a recomandrilor curente
Sugestiile sunt bine-venite la:
J.T.den_Dunnen @ LUMC.nl
Stylianos.Antonarakis @ medecine.unige.ch




Mutaie i polimorfism


Definiii inechivoce, noiuni diferit interpretate:
polimorfism
Modificare care nu cauzeaz boal sau
O modificare care se ntlnete cu o frecven de 1%
n populaie
mutaie
Modificare cauzatoare de boal sau
Orice modificare

Pentru a preveni confuzia, se recomand folosirea unor termeni
neutri:
"sequence variant variant de secven
"allelic variant variant alelic
Principii fundamentale
Se recomand descrirea variantelor la nivel bazal, deci la nivel de ADN

Descrierea trebuie s se bazeze pe o secven de referin de ADN
genomic sau codant (RefSeq database)

Se vor folosi numai simbolurile oficiale acceptate de HGCN

Detaliile modificrii trebuie precedate de simbolul nivelului descris:
"c." pentru secvena de ADN codant (de ex.: c.76A>T)
"g. pentru secvena genomic (de ex.: g.476A>T)
"m." pentru secvene mitocondriale (de ex.: m.8993T>C)
"r." pentru secvena de ARN (de ex.: r.76a>u)
"p." pentru secvene proteice (de ex.: p.Lys76Asn)


Pentru a evita confuziile, descrierile variantelor la nivel de ADN, ARN i
proteine sunt unice:

ADN: notarea nucleotidelor cu majuscule
Numrul primului nucleotid modificat
Simbolul mutaiei
De ex. c.76A>T or g.476A>T
RNA: notarea nucleotidelor cu litere mici
Numrul primului nucleotid modificat
Simbolul mutaiei
De ex. r.76a>u
Protein: notarea aminoacizilor cu simboluri de trei litere
ncepnd cu o majuscul
Numrul poziiei aminoacidului modificat
Simbolul mutaiei
Aminoacidul modificat
De ex. Pro12Ala

Numerotarea nucleotidelor
ADN codant:

Exoni:
Nu exist nucelotid 0
Nucleotidul 1 codific A din codonul START

Introni:
La nceputul intronului, jumtatea situat in amonte:
numrul ultimului nucleotid din exonul precedent urmat de semnul + i poziia n
introni al nucleotidului descris
De ex.: c.77+1G
La sfritul intronului, jumtatea situat n aval:
numrul primului nucleotid al exonului urmtor, urmat de un semn minus i poziia
n aval n intron al nucleotidului descris
De ex.: c.78-1G

Secvene genice netranscrise:
Nucleotidele situate nainte de codonul START, n amonte de secvena codant
captul 5
sunt numerotate ncepnd cu primul nucleotid situat cel mai aproape i folosind
semnul - (-1, -2, etc.)
Nucleotidele situate dup codonul STOP, n aval de secvena codant captul 3'
sunt numerotate ncepnd cu primul nucleotid situat cel mai aproape i semnul *
(* 1, * 2, etc.)


Numerotarea nucleotidelor
ADN genomic:

Numerotarea nucleotidelor este arbitrar
Se ncepe cu 1 la nivelul primului nucleotid
din secvena din baza de date de referin,
care trebuie s includ toate nucelotidele
din secvena genic inclusiv promotorul la
captul 5'
Nu se folosesc semnele + sau -


Intervalul de nucleotide afectate este separat de
semnul _ (ntre primul i ultimul nucleotid modificat)

De ex.: c.76_78delACT

Dac nu se cunoate poziia exact a modificrii,
intervalul presupus este citat n paranteze

De ex.: c.(67_70)insG



Substituii:
Se folosete semnul >

Ordinea descrierii modificrii:
1. c. sau g. pentru nivelul de ADN la care se refer descrierea
2. poziia nucleotidului susbtituit
3. simbolul nucelotidului substituit
4. semnul >
5. simbolul nucleotidului nou


Ex.
c.76A>C
c.-14G>C
c.88+1G>T
c.89-2A>C
c.*46T>A

Deleii
Se folosete prescurtarea "del"

Ordinea descrierii modificrii:
1. c. sau g. pentru nivelul de ADN la care se refer descrierea
2. Primul nucleotid pierdut
3. Semnul _ pentru notarea intervalului
4. Ultimul nucleotid pierdut
5. Prescurtarea del
6. Eventual se poate aduga secvena nucleotidic pierdut

Exemple:
c.76_78del (c.76_78delACT)
c.88-?_923+?
c.(?_-30)_(*220_?)del
Duplicaii
Se folosete prescurtarea "dup"

Ordinea descrierii modificrii:
1. c. sau g. pentru nivelul de ADN la care se refer descrierea
2. Primul nucleotid duplicat
3. Semnul _ pentru notarea intervalului
4. Ultimul nucleotid duplicat
5. Prescurtarea dup
6. Eventual se poate descrie secvena nucleotidic duplicat sau
numrul nucleotidelor duplicate

Exemple:
c.77_79dup (sau c.77_79dupCTG sau c.77_79dup3)
c.5dupT (sau c.5dup)
c.(?_-30)_(*220_?)dup
Inserii
Se folosete prescurtarea ins"

Ordinea descrierii modificrii:
1. c. sau g. pentru nivelul de ADN la care se refer descrierea
2. Primul nucleotid inserat
3. Semnul _ pentru notarea intervalului
4. Ultimul nucleotid inserat
5. Prescurtarea ins
6. Eventual se poate aduga i secvena nucleotidic inserat sau
numrul nucleotidelor inserate


Exemple:
c.76_77insT


Del + Ins
(indels)

Se folosete prescurtrile delins"

Ordinea descrierii modificrii:
1. c. sau g. pentru nivelul de ADN la care se refer descrierea
2. Poziia primului nucleotid nlocuit prin deleie respectiv inserie
3. Semnul _ pentru notarea intervalului deleiei
4. Poziia ultimului nucleotid nlocuit prin deleie respectiv inserie
5. Prescurtarea delins
6. Nucleotidele inserate

Exemple:
c.112_117delinsTG (c.112_117delAGGTCAinsTG)

Inversii
Se folosete prescurtarea inv"

Ordinea descrierii modificrii:
1. c. sau g. pentru nivelul de ADN la care se refer descrierea
2. Poziia primului nucleotid din secvena inversat
3. Semnul _ pentru notarea intervalului
4. Poziia ultimului nucleotid din secvena inversat
5. Prescurtarea inv
6. Eventual se poate aduga lungimea secvenei inversate


Exemplu:
c.203_506inv (sau 203_506inv304)
Variabilitatea secvenelor repetitive:

Ordinea descrierii modificrii:
1. c. sau g. pentru nivelul de ADN la care se refer
descrierea
2. Poziia primului nucleotid din secvena repetitiv
3. Unitatea secvenei nucleotidice repetate
4. n parantez rotund intervalul valorii repetiiilor cu cele
dou valori limit separate de semnul _

De exemplu:
c.123+74TG(3_6)
Alte variante:

Conversii: con


Descrierea translocaiilor la nivel molecular
descrierea citogenetic urmat de descrierea poziiei
punctelor de ruptur conform unei secvene de referin
(Genbank, EMBL, DDJB)
De exemplu:
t(X;4)(p21.2;q35)(c.857+101_857+102)
Mai multe variante la aceeai persoan:
Dou secvene modificate n alele diferite enumerare n
paranteze drepte diferite separate de semnul +
De ex.: c.[76A>C]+[87delG]

Dou secvene modificate n aceeai alel enumerare
ntr-o singur parantez i separare cu semnul ;
De ex: c.[76A>C; 83G>C]

Mozaicism enumerare ntr-o singur parantez i
separare cu semnul ,
c.[=, 83G>C]



Descrierea mutaiilor la nivel de protein
(secven de aminoacizi)
Se folosete prescurtarea "p." pentru indicarea nivelului descris (p- protein)

Se prefer utilizarea simbolurilor cu trei litere, prima liter fiind notat cu
majuscule

X se folosete pentru notarea codonilor STOP

Numerotarea aminoacizilor indicarea poziiei variaiei:
Primul aminoacid (Met) se numeroteaz cu +1
Secvena proteic se refer la produsul primar al translaiei
Aminoacizii aprui n urma unor modificri care determin traducerea unor
secvene suplimentare n amonte se indic cu semnul (de ex. Gln-2,
Thr-1)
Aminoacizii rezultai din traducerea unor secvene intronice se indic cu
semnul + sau - n funcie de poziia exonului apropiat (de ex. Val4+1,
Phe5-2)
Aminoacizii aprui n urma unor modificri care determin traducerea unor
secvene suplimentare n aval prin pierderea codonului STOP se indic cu
semnul * (de ex. Gln*1, Ser*2)


One letter
code
Three letter
code
Amino acid Possible codons
A Ala Alanine GCA, GCC, GCG, GCT
B Asx Asparagine or Aspartic acid AAC, AAT, GAC, GAT
C Cys Cysteine TGC, TGT
D Asp Aspartic acid GAC, GAT
E Glu Glutamic acid GAA, GAG
F Phe Phenylalanine TTC, TTT
G Gly Glycine GGA, GGC, GGG, GGT
H His Histidine CAC, CAT
I Ile Isoleucine ATA, ATC, ATT
K Lys Lysine AAA, AAG
L Leu Leucine CTA, CTC, CTG, CTT, TTA, TTG
M Met Methionine ATG
N Asn Asparagine AAC, AAT
P Pro Proline CCA, CCC, CCG, CCT
Q Gln Glutamine CAA, CAG
R Arg Arginine AGA, AGG, CGA, CGC, CGG, CGT
S Ser Serine AGC, AGT, TCA, TCC, TCG, TCT
T Thr Threonine ACA, ACC, ACG, ACT
V Val Valine GTA, GTC, GTG, GTT
W Trp Tryptophan TGG
X X stop codon TAA, TAG, TGA
Y Tyr Tyrosine TAC, TAT
Z Glx Glutamine or Glutamic acid CAA, CAG, GAA, GAG
Substituii:
Mutaii cu sens greit : de ex. p.Trp26Cys
Mutaii non-sens: p.Trp26X

Deleii:
p.Lys2del
p.Cys28_Met30del

Duplicaii:
p.GLy4_Gln6dup

Inserii
p.Lys2_Met3insGlnSerLys

Variabilitatea secvenelor repetitive scurte
p.Gln6(3_6)
Mutaii cu decalarea cadrului de citire
(frame-shift )

Se folosete prescurtarea fs
Ordinea descrierii modificrii:
1. p.
2. Simbolul primului aminoacid care s-a modificat
3. Poziia primului aminoacid modificat
4. Fs
De exemplu:
p.Arg97fs
Sau
se folosete versiunea "fsX (cu notarea poziiei noului codon STOP)
Ordinea descrierii modificrii:
1. p.
2. Simbolul primului aminoacid vechi modificat
3. Poziia primului aminoacid modificat
4. Simbolul primului aminoacid nou
5. fs
6. X (codon STOP)
7. Poziia codonului STOP
De exemplu:
p.Arg97GlyfsX16

Mai multe variante la aceeai persoan:
Dou variante diferite pentru acelai locus - descrierea celor dou
alele n dou paranteze separate: [...] + [...]
p.[Ala25Thr]+[=]
p.[Ala25Thr]+[Ala25Thr]
p.[Ala25Thr]+[?]

Dou variante n aceeai alel descrierea celor dou variante n
aceeai parantez: [... ; ...]
p.[Ala25Thr;Gly28Val]