Sunteți pe pagina 1din 31

Ghid de nomenclatur genic

Guidelines for Human Gene Nomenclature Hester M. Wain, Elspeth A. Bruford, et al HUGO Gene Nomenclature Committee, http://www.idealibrary.com

Intoducere
Gena segm. ADN ce contribuie la un anumit fenotip/funcie

Funcie necunoscut gena se caracterizeaz prin secven, transcriere sau omologie

Locus punct genomial, identificat cu ajutorul unui marker, ce poate fi localizat

Nu corespunde neaprat unei gene

Regiune cromozomial regiune genomic asociat cu un anumit fenotip/sindrom

Ex ANCR

Nomenclatura genic
1. Fiecare simbol genic trebuie s fie unic. 2. Simbolurile reprezint abrevieri sau prescurtri ale genei. 3. Simbolurile vor conine numai litere latine i cifre arabice 4. Nu se folosesc semne de punctuaie. 5. Nici un simbol nu se va termina cu litera G de la gene. 6. Simbolurile nu vor conine referine la o anumit specie, de exemplu- H/h ptr human.

Nomenclatura genic
Caracterul iniial va fi ntotdeauna o liter Toate caracterele se scriu n aceiai linie Se evit referirile la:

Specifictatea tisular Greutatea molecular Localizarea cromozomial

Exemple
Gene implicate n boli monogenice ex. BBS1 "Bardet-Biedl syndrome 1". Gene neidentificate-asociate cu un markerimplicate n BMF ex. IDDM6 "insulindependent diabetes mellitus 6 Segm. ADN clonate cu funcie descris COX8 "cytochrome c oxidase subunit VIII". Pseudogenes ex. IL9RP1 "interleukin 9 receptor pseudogene 1".

Exemple
Gene codificate pe catena opus antisenssuprapus pe o gen cunoscut ex. IGF2AS "insulin-like growth factor 2, antisense". Segmente funcionale ADN transcrise dar netranslatate ex. XIST "X (inactive)-specific transcript". Gene deduse din aspectul fenotipic celular ex. LOH18CR1 "loss of heterozygosity, 18, chromosomal region 1 Gene cu funcie necunoscut dar care prezint secvene similare ex. FAM7A1 "family with sequence similarity 7, member A1" etc.

Caracter /simbol AS AP BP C FAM N sau IN L LOH MT sau M OS P

Semnificaie antisense Protein asociat Protein de legare catalitic Familie de gene cu secv similare inhibitor like Pierderea heterozigozitii mitocondrial Catena opus pseudogen

Simboluri genice n publicaii


Se scriu cu majuscule i italice genele i alelele

Se precizeaz:
(mRNA)RP1 (gDNA) RP1 (cDNA) RP1

Fonturi standard - simbolurile ptr proteine

Segmentele ADN
Simbolurile pot fi obinute din baze de date (Genome Database) Sunt alctuite din 5 pri ex DXS9877E
1. 2.

D ptr ADN 0,1,2, ...X,Y, XY -ptr cromozomi


0 segm cr. necunoscut XY reg pseudoautozomal

3.

4.
5.

S -secv unice, Z secv repetitive pe acelai cromozom sau F familii de gene Numr unic E- pentru secv exprimate

Notarea mutaiilor genice

Scurt istoric i surse bibliografice


Prima ncercare, primele articole publicate Beaudet AL i Tsui LC respectiv Beutler E 1993 Consens actual - den Dunnen i Antonarakis: Mutation nomenclature extensions and suggestions to describe complex mutations: a discussion. Human Mutation 2000:15: 7-12 http://www.hgvs.org/mutnomen/ Discuii, mbuntiri continue a recomandrilor curente Sugestiile sunt bine-venite la: J.T.den_Dunnen @ LUMC.nl Stylianos.Antonarakis @ medecine.unige.ch

Mutaie i polimorfism
Definiii inechivoce, noiuni diferit interpretate: polimorfism Modificare care nu cauzeaz boal sau O modificare care se ntlnete cu o frecven de 1% n populaie mutaie Modificare cauzatoare de boal sau Orice modificare Pentru a preveni confuzia, se recomand folosirea unor termeni neutri: "sequence variant variant de secven "allelic variant variant alelic

Principii fundamentale
Se recomand descrirea variantelor la nivel bazal, deci la nivel de ADN

Descrierea trebuie s se bazeze pe o secven de referin de ADN genomic sau codant (RefSeq database)
Se vor folosi numai simbolurile oficiale acceptate de HGCN Detaliile modificrii trebuie precedate de simbolul nivelului descris: "c." pentru secvena de ADN codant (de ex.: c.76A>T) "g. pentru secvena genomic (de ex.: g.476A>T) "m." pentru secvene mitocondriale (de ex.: m.8993T>C) "r." pentru secvena de ARN (de ex.: r.76a>u) "p." pentru secvene proteice (de ex.: p.Lys76Asn)

Pentru a evita confuziile, descrierile variantelor la nivel de ADN, ARN i proteine sunt unice:

ADN: notarea nucleotidelor cu majuscule Numrul primului nucleotid modificat Simbolul mutaiei De ex. c.76A>T or g.476A>T RNA: notarea nucleotidelor cu litere mici Numrul primului nucleotid modificat Simbolul mutaiei De ex. r.76a>u Protein: notarea aminoacizilor cu simboluri de trei litere ncepnd cu o majuscul Numrul poziiei aminoacidului modificat Simbolul mutaiei Aminoacidul modificat De ex. Pro12Ala

Numerotarea nucleotidelor ADN codant:

Exoni: Nu exist nucelotid 0 Nucleotidul 1 codific A din codonul START


Introni: La nceputul intronului, jumtatea situat in amonte: numrul ultimului nucleotid din exonul precedent urmat de semnul + i poziia n introni al nucleotidului descris De ex.: c.77+1G La sfritul intronului, jumtatea situat n aval: numrul primului nucleotid al exonului urmtor, urmat de un semn minus i poziia n aval n intron al nucleotidului descris De ex.: c.78-1G Secvene genice netranscrise: Nucleotidele situate nainte de codonul START, n amonte de secvena codant captul 5 sunt numerotate ncepnd cu primul nucleotid situat cel mai aproape i folosind semnul - (-1, -2, etc.) Nucleotidele situate dup codonul STOP, n aval de secvena codant captul 3' sunt numerotate ncepnd cu primul nucleotid situat cel mai aproape i semnul * (* 1, * 2, etc.)

Numerotarea nucleotidelor ADN genomic:


Numerotarea nucleotidelor este arbitrar Se ncepe cu 1 la nivelul primului nucleotid din secvena din baza de date de referin, care trebuie s includ toate nucelotidele din secvena genic inclusiv promotorul la captul 5' Nu se folosesc semnele + sau -

Intervalul de nucleotide afectate este separat de semnul _ (ntre primul i ultimul nucleotid modificat)

De ex.: c.76_78delACT

Dac nu se cunoate poziia exact a modificrii, intervalul presupus este citat n paranteze

De ex.: c.(67_70)insG

Substituii:
Se folosete semnul >
Ordinea descrierii modificrii: 1. c. sau g. pentru nivelul de ADN la care se refer descrierea 2. poziia nucleotidului susbtituit 3. simbolul nucelotidului substituit 4. semnul > 5. simbolul nucleotidului nou

Ex.

c.76A>C c.-14G>C c.88+1G>T c.89-2A>C c.*46T>A

Deleii
Se folosete prescurtarea "del" Ordinea descrierii modificrii: 1. c. sau g. pentru nivelul de ADN la care se refer descrierea 2. Primul nucleotid pierdut 3. Semnul _ pentru notarea intervalului 4. Ultimul nucleotid pierdut 5. Prescurtarea del 6. Eventual se poate aduga secvena nucleotidic pierdut Exemple: c.76_78del (c.76_78delACT) c.88-?_923+? c.(?_-30)_(*220_?)del

Duplicaii
Se folosete prescurtarea "dup"
Ordinea descrierii modificrii: 1. c. sau g. pentru nivelul de ADN la care se refer descrierea 2. Primul nucleotid duplicat 3. Semnul _ pentru notarea intervalului 4. Ultimul nucleotid duplicat 5. Prescurtarea dup 6. Eventual se poate descrie secvena nucleotidic duplicat sau numrul nucleotidelor duplicate Exemple: c.77_79dup (sau c.77_79dupCTG sau c.77_79dup3) c.5dupT (sau c.5dup) c.(?_-30)_(*220_?)dup

Inserii
Se folosete prescurtarea ins" Ordinea descrierii modificrii: 1. c. sau g. pentru nivelul de ADN la care se refer descrierea 2. Primul nucleotid inserat 3. Semnul _ pentru notarea intervalului 4. Ultimul nucleotid inserat 5. Prescurtarea ins 6. Eventual se poate aduga i secvena nucleotidic inserat sau numrul nucleotidelor inserate

Exemple: c.76_77insT

Del + Ins (indels)


Se folosete prescurtrile delins" Ordinea descrierii modificrii: 1. c. sau g. pentru nivelul de ADN la care se refer descrierea 2. Poziia primului nucleotid nlocuit prin deleie respectiv inserie 3. Semnul _ pentru notarea intervalului deleiei 4. Poziia ultimului nucleotid nlocuit prin deleie respectiv inserie 5. Prescurtarea delins 6. Nucleotidele inserate Exemple: c.112_117delinsTG (c.112_117delAGGTCAinsTG)

Inversii
Se folosete prescurtarea inv" Ordinea descrierii modificrii: 1. c. sau g. pentru nivelul de ADN la care se refer descrierea 2. Poziia primului nucleotid din secvena inversat 3. Semnul _ pentru notarea intervalului 4. Poziia ultimului nucleotid din secvena inversat 5. Prescurtarea inv 6. Eventual se poate aduga lungimea secvenei inversate

Exemplu: c.203_506inv (sau 203_506inv304)

Variabilitatea secvenelor repetitive:


Ordinea descrierii modificrii: 1. c. sau g. pentru nivelul de ADN la care se refer descrierea 2. Poziia primului nucleotid din secvena repetitiv 3. Unitatea secvenei nucleotidice repetate 4. n parantez rotund intervalul valorii repetiiilor cu cele dou valori limit separate de semnul _

De exemplu: c.123+74TG(3_6)

Alte variante:
Conversii: con Descrierea translocaiilor la nivel molecular descrierea citogenetic urmat de descrierea poziiei punctelor de ruptur conform unei secvene de referin (Genbank, EMBL, DDJB) De exemplu: t(X;4)(p21.2;q35)(c.857+101_857+102)

Mai multe variante la aceeai persoan:


Dou secvene modificate n alele diferite enumerare n paranteze drepte diferite separate de semnul + De ex.: c.[76A>C]+[87delG] Dou secvene modificate n aceeai alel enumerare ntr-o singur parantez i separare cu semnul ; De ex: c.[76A>C; 83G>C] Mozaicism enumerare ntr-o singur parantez i separare cu semnul , c.[=, 83G>C]

Descrierea mutaiilor la nivel de protein (secven de aminoacizi)


Se folosete prescurtarea "p." pentru indicarea nivelului descris (p- protein) Se prefer utilizarea simbolurilor cu trei litere, prima liter fiind notat cu majuscule X se folosete pentru notarea codonilor STOP Numerotarea aminoacizilor indicarea poziiei variaiei: Primul aminoacid (Met) se numeroteaz cu +1 Secvena proteic se refer la produsul primar al translaiei Aminoacizii aprui n urma unor modificri care determin traducerea unor secvene suplimentare n amonte se indic cu semnul (de ex. Gln-2, Thr-1) Aminoacizii rezultai din traducerea unor secvene intronice se indic cu semnul + sau - n funcie de poziia exonului apropiat (de ex. Val4+1, Phe5-2) Aminoacizii aprui n urma unor modificri care determin traducerea unor secvene suplimentare n aval prin pierderea codonului STOP se indic cu semnul * (de ex. Gln*1, Ser*2)

One letter code


A B C D E F G H I K L M N P

Three letter code


Ala Asx Cys Asp Glu Phe Gly His Ile Lys Leu Met Asn Pro Alanine

Amino acid

Possible codons GCA, GCC, GCG, GCT AAC, AAT, GAC, GAT TGC, TGT GAC, GAT GAA, GAG TTC, TTT GGA, GGC, GGG, GGT CAC, CAT ATA, ATC, ATT AAA, AAG CTA, CTC, CTG, CTT, TTA, TTG ATG AAC, AAT CCA, CCC, CCG, CCT

Asparagine or Aspartic acid Cysteine Aspartic acid Glutamic acid Phenylalanine Glycine Histidine Isoleucine Lysine Leucine Methionine Asparagine Proline

Q
R S T V W X Y Z

Gln
Arg Ser Thr Val Trp X Tyr Glx

Glutamine
Arginine Serine Threonine Valine Tryptophan stop codon Tyrosine Glutamine or Glutamic acid

CAA, CAG
AGA, AGG, CGA, CGC, CGG, CGT AGC, AGT, TCA, TCC, TCG, TCT ACA, ACC, ACG, ACT GTA, GTC, GTG, GTT TGG TAA, TAG, TGA TAC, TAT CAA, CAG, GAA, GAG

Substituii: Mutaii cu sens greit : de ex. p.Trp26Cys Mutaii non-sens: p.Trp26X Deleii: p.Lys2del p.Cys28_Met30del Duplicaii: p.GLy4_Gln6dup

Inserii p.Lys2_Met3insGlnSerLys
Variabilitatea secvenelor repetitive scurte p.Gln6(3_6)

Mutaii cu decalarea cadrului de citire (frame-shift )


Se folosete prescurtarea fs Ordinea descrierii modificrii: 1. p. 2. Simbolul primului aminoacid care s-a modificat 3. Poziia primului aminoacid modificat 4. Fs De exemplu: p.Arg97fs Sau se folosete versiunea "fsX (cu notarea poziiei noului codon STOP) Ordinea descrierii modificrii: 1. p. 2. Simbolul primului aminoacid vechi modificat 3. Poziia primului aminoacid modificat 4. Simbolul primului aminoacid nou 5. fs 6. X (codon STOP) 7. Poziia codonului STOP De exemplu: p.Arg97GlyfsX16

Mai multe variante la aceeai persoan:


Dou variante diferite pentru acelai locus - descrierea celor dou alele n dou paranteze separate: [...] + [...] p.[Ala25Thr]+[=] p.[Ala25Thr]+[Ala25Thr] p.[Ala25Thr]+[?] Dou variante n aceeai alel descrierea celor dou variante n aceeai parantez: [... ; ...] p.[Ala25Thr;Gly28Val]

S-ar putea să vă placă și