Sunteți pe pagina 1din 160

E N G E N H A R I A G E N T I CA

Alfredo J. M. Cravador

E N G E N H A R I A G E N T I CA E TECNOLOGIA DE DNA RECOMBINANTE

Alfredo J. M. Cravador

FARO 2011

PREMBULO

O estudo da base molecular da vida s muito lentamente pde progredir comparativamente ao das outras cincias, devido, por um lado, ausncia ou imperfeio das tcnicas de anlise e de medida, mas fundamentalmente complexidade dos sistemas biolgicos. No ser todavia por isso que o progressivo desvendar dos mecanismos que regem a organizao mxima da matria deixa de ser um dos captulos mais apaixonantes da Histria da Cincia moderna. Foi h cerca de 50 anos que WATSON e CRICK dobraram um dos cabos mais decisivos da histria da cincia moderna, ao publicarem a estrutura do cido desoxirribonucleico (DNA). Desde ento, milhares de cientistas e investigadores tm-se interessado pelos diferentes aspectos da estrutura e da funo do DNA, com o fim de compreenderem como a informao gentica est contida na molcula de DNA, e como ela tratada de maneira to ordenada e precisa durante os processos biolgicos. A conjugao de todos estes trabalhos de pesquisa levou acumulao de um volume enorme de informaes e de conhecimentos em gentica molecular e ao desenvolvimento de uma metodologia nova, a engenharia gentica. A engenharia gentica ou seja, a pesquisa sobre o DNA recombinante baseia-se num conjunto de tcnicas que conferem a possibilidade, at h pouco apangio exclusivo da qumica relativamente a pequenas molculas, de romper e formar ligaes covalentes de maneira especfica e controlada em molculas de DNA. O material gentico pode hoje ser modificado, mutado, transferido, detectado ou sintetizado com as finalidades mais diversas tanto aplicadas como fundamentais. A possibilidade de criar combinaes novas, no naturais, a partir de material gentico de diferentes origens e de as introduzir em organismos hospedeiros que as perpetuam e multiplicam, deu uma dimenso nova biotecnologia, dotou-a do refinamento prprio engenharia gentica. explorao emprica dos fenmenos biolgicos contrape-se, hoje, a construo racional de sistemas biolgicos artificiais elaborados por manipulao gentica no laboratrio de investigao, antes de serem explorados industrialmente ou na produo agrcola. neste contexto que deve ser considerada a engenharia gentica, no como uma nova disciplina em si, mas antes como um instrumento de investigao poderoso que tem contribudo para um melhor conhecimento e aprofundamento do conceito de gene. Esta disciplina no s permite compreender melhor os mecanismos fundamentais da vida, mas tambm, pela manipulao dos organismos mais diversos, produzir substncias teis para a medicina, a agricultura e a indstria em geral. de salientar que os extraordinrios progressos realizados em engenharia gentica s foram possveis graas aos resultados da investigao fundamental obtidos nos campos da gentica, da biologia
i

celular, da enzimologia, da virologia, da imunologia, da qumica dos cidos nucleicos e das protenas, da cristalografia e que s a interaco das diferentes competncias no seio desta rea multidisciplinar permite abordar nas melhores condies a tecnologia da clonagem de genes. A racionalidade e os conhecimentos humanos tendo os seus limites, a nova era industrial e agrcola em que entrmos no destituda da ameaas e s poder beneficiar as populaes humanas a longo termo se a explorao dos recursos biolgicos respeitar os grandes equilbrios naturais, os ciclos biolgicos e preservar a riqueza do patrimnio biolgico terrestre j amplamente enfraquecidos. O mecanismo que o homem agora capaz de manipular o estado superior da complexidade da matria e tambm o mais frgil. Como corolrio, o impacto da aco do homem na natureza passou a ser directo e profundo. As consequncias podero ser catastrficas ou positivas e s dependem de ns. As cincias da vida ao desembocarem no domnio das aplicaes, a pequena ou a grande escala, tocaram a ecologia e a tica, dimenses que no podem deixar de estar intimamente associadas formao cientfica que tm por misso ministrar.

ii

NDICE
1.OS INSTRUMENTOS DE BASE 1.a.As enzimas, suas actividades e utilizaes Endonucleases de restrio e metilases Outras endonucleases Exonucleases e polimerases Fosfatases Ligao de fragmentos de DNA 1.b.A sequenciao de DNA 1. Mtodo qumico ou de Maxam & Gilbert 2. Mtodo de terminao de cadeia ou de Sanger 3. Utilizao da PCR em sequenciao 4. Sequenciao "automtica" 1.c.Sntese qumica de DNA I. Princpios da sntese qumica de DNA 1) Preparao dos blocos de base para a sntese 2) Desproteco selectiva 3) Reaces de condensao 4) Construo da cadeia oligodesoxinucleotdica 5) Desproteco Rendimentos 6) Isolamento, purificao e caracterizao 2.VECTORES DE CLONAGEM a. Os plasmdeos Concepo de um vector plasmdico b. Bacterifagos Empacotamento in vitro c. Cosmdeos d. O fago M13 Concluses 3. MUTAGNESE DIRIGIDA Eliminaes Inseres Substituies Mutagnese dirigida com oligonucleotdeos sintticos Seleco e identificao dos mutantes Aplicaes da mutagnese dirigida 4. A TRANSFORMAO BACTERIANA 5. BANCO DE CLONES DE cDNA Esquema de construo de um banco de clones de cDNA 6. BANCOS GENMICOS 7. MTODOS DE DETECO E DE ANLISE DE CLONES a) Hibridao in situ entre o DNA dos clones recombinantes e uma sonda de DNA radioactiva b) Carta de restrio c) Sequenciao dos nucleotdeos do inserto nos clones positivos por hibridao d) Seleco do mensageiro especfico por hibridao com o DNA recombinante e traduo in vitro e) Southern blotting f) Escolha das sondas de DNA sintticas Uso da tcnica de Real Time PCR para a quantificao rpida e precisa de RNA e DNA iii 2 2 2 8 9 12 13 15 15 17 22 24 27 28 28 34 36 37 40 42 43 44 44 45 48 50 51 51 53 54 54 55 56 57 60 61 63 63 64 68 67 67 67 68 68 68 68

8. A SNTESE QUMICA DE GENES Sntese de genes por sntese qumica conjugada com PCR 9. SISTEMAS DE EXPRESSO: ORGANISMOS HOSPEDEIROS - VECTORES a. Expresso em E. coli Vectores de expresso em E. coli 1) Construo de vectores de expresso 2) Vectores baseados no promotor PL de 3) gt11 - vector de expresso derivado do fago Identificao das placas produtoras Limitaes da produo na bactria Produo da hormona de crescimento humana (hGH) Hormonas de crescimento animais Produo de insulina humana b. Expresso na levedura Os vectores de expresso de S. cerevisiae Exemplos de vectores de expresso para produo de protenas exgenas em leveduras 1) A integrao dirigida 2) O isolamento de alelos mutantes 3) Regulao da expresso dos genes na levedura 4) Um intro codifica para uma protena reguladora 5) Estrutura do gene da ferromona de levedura (MF) c. Expresso em clulas de mamferos Transferncia de genes nas clulas de mamferos (transfeco) Co-transformao Micro-injeco Isolamento dos genes transferidos Clonagem de oncogenes humanos Vectores virais utilizados para transfectar as clulas de mamferos Vector SV40 a) Substituio da regio tardia de SV40 b) Substituio da regio precoce de SV40 Vector vaivm derivado de SV40 Vector BPV (Bovine Papilloma Virus) Vectores derivados de retrovrus d. Expresso em clulas de insectos Construo dum vector de transferncia do baculovrus Actividade biolgica das protenas recombinantes e. Introduo de genes estrangeiros em vulos fertilizados. Animais transgnicos Expresso do DNA estrangeiro nos animais transgnicos A utilizao dos retrovrus Concluses e resumo 10. ENGENHARIA GENTICA DE PLANTAS Agrobacterium tumefaciens O plasmdeo Ti como vector Expresso controlada pela luz e especfica de rgo, dum gene de trigo em plantas de tabaco Plantas transgnicas a) Resistncia a herbicidas b) Resistncia a insectos c) Resistncia a vrus d) Produtoras de pptidos As plantas monocotiledneas Outros mtodos de transformao Insero do transgene no genoma do cloroplasto DA SEQUENCIAO DO GENOMA FUNO DO GENE Preparao de microarrays de oligonucleotdeos e de cDNA iv

71 72 73 73 73 75 76 77 78 79 80 83 84 85 86 88 90 91 91 92 93 94 96 97 97 98 99 99 100 100 100 101 101 101 103 105 107 108 109 110 111 112 120 114 117 118 118 119 121 124 125 125 126

Utilizao de microarrays para estudar transcriptomas de diferentes origens e condies 11. O DNA RECOMBINANTE E O DIAGNSTICO EM MEDICINA a. Alteraes cromossmicas b. Cartografia dos cromossomas humanos c. Mapeamento do genoma humano por RFLP d. Anomalias monognicas e multifactoriais e. O diagnstico de defeitos genticos 1) RFLP (Restriction Fragment Length Polymorphism) 2) Diagnstico de mutaes identificadas -talassemias a) Mutaes sem sentido e frame shift b) Mutaes que afectam a transcrio c) Mutaes que afectam a maturao do RNA d) Utilizao dos oligonucleotdeos sintticos e) Anemia falciforme A deficincia hereditria de 1-antitripsina f. Deteco de mutaes somticas g. Amplificao enzimtica de DNA (PCR) 1) Deteco da anemia falciforme e da hemoglobina C por PCR 2) Deteco de doenas infecciosas por PCR Deteco de HPVs Deteco de HIV 127 136 137 139 141 142 143 144 144 145 145 146 146 148 148 150 152 154 155 156 158

METODOLOGIA DO DNA RECOMBINANTE A tecnologia do DNA recombinante representa na realidade, um ramo da engenharia gentica considerada no seu sentido lato. Ela diz respeito recombinao in vitro do material gentico por meio de enzimas. Estas manipulaes in vitro s adquirem realmente um sentido quando o DNA recombinante introduzido num hospedeiro biolgico, onde pode ser mantido e propagado indefinidamente. Uma experincia tpica de clonagem requer no mnimo a) b) c) d) e) um DNA objecto duma pesquisa; um vector de clonagem; enzimas de restrio; DNA ligase; clulas procariotas ou eucariotas que servem de hospedeiro biolgico

(Fig. 1.II.). Depois da introduo no hospedeiro, as molculas recombinantes tm que ser isoladas e caracterizadas. Foi atravs deste processo de caracterizao, que o conhecimento do gene foi progredindo. O processo de clonagem em si, s fornece um meio de isolar e de identificar rapidamente os genes de interesse. Neste captulo passaremos em revista os diversos mtodos utilizados para clonar um gene.

1.

OS INSTRUMENTOS DE BASE 1.a.As enzimas, suas actividades e utilizaes Endonucleases de restrio e metilases Sempre que um bacterifago se desenvolve numa estirpe de Escherichia coli C, os fagos resultantes da lise deste hospedeiro multiplicam-se muito mal noutra estirpe, de tipo K. Diz-se que o fago "restrito" pela segunda estirpe bacteriana. Por outro lado, os fagos que escaparam restrio so capazes de crescer normalmente se forem utilizados para reinfectarem a estirpe K. No entanto, se estes mesmos fagos passarem primeiro por E. coli C, ficam de novo restritos por E. coli K (Fig. 2.II). Portanto, a eficcia com a qual um fago se multiplica num hospedeiro depende da estirpe na qual ele se multiplicou anteriormente. Esta modificao no hereditria, conferida ao fago pela segunda estirpe (K) e que lhe permite voltar a multiplicar-se nesta estirpe sem ser de novo restrito, chama-se modificao. Os fagos restritos adsorvem-se sobre os hospedeiros restritores e injectam o seu DNA normalmente. No entanto, este DNA rapidamente degradado depois da injeco. A enzima responsvel por esta degradao uma endonuclease, tambm chamada endonuclease de restrio ou enzima de restrio. O hospedeiro restritor tem evidentemente que proteger o seu DNA dos efeitos das enzimas de restrio que ele prprio contm; esta proteco assegurada pela modificao do DNA. Mais precisamente, as modificaes resultam da metilao (por metilases) de certas bases num nmero reduzido de locais do DNA, que constituem as sequncias de reconhecimento para a enzima de restrio. , pois, compreensvel a razo pela qual um fago que escapa restrio num dado hospedeiro, pode em seguida re-infectar eficazmente o mesmo hospedeiro: o DNA do fago ter-se- replicado em presena da metilase de modificao e ser protegido, assim como o DNA do hospedeiro, contra os efeitos de restrio. Os processos de restrio e de modificao existem em todos os sistemas nos quais o DNA transferido duma bactria para outra. A conjugao, a transformao, a transduo e a transfeco esto todas submetidas ao sistema de restrio-modificao. Os genes que especificam os sistemas res-mod podem residir no cromossoma do hospedeiro, ou podem estar localizados num plasmdeo ou num profago.

As endonucleases de restrio classificam-se em 3 categorias. As pertencentes classe I so constitudas por 3 subunidades e requerem como cofactores ATP, Mg2+ e Sadenosilmetionina. Possuem simultaneamente actividades de endonuclease e de metilase situadas em subunidades diferentes. Os stios especficos de reconhecimento, longos de 15
2

pares de base, so complexos, situando-se a cerca de 1000 pares de bases de distncia do stio de clivagem ou de metilao. Esta categoria pouco interessante em tecnologia gentica porque o local de clivagem no especfico. As endonucleases de restrio de classe III, constitudas por 2 subunidades tm ATP e Mg2+ como cofactores obrigatrios, mas no necessariamente a S-adenosilometionina. A regio de clivagem situa-se de 5 a 10 ou de 25 a 27 pares de bases a jusante do stio de reconhecimento. As do primeiro tipo clivam em geral sequncias no palindrmicas, dando origem a populaes heterogneas com extremidades 5' protuberantes, enquanto que as do segundo tipo clivam o DNA em stios fixos. As endonucleases de restrio de classe II so constitudas por uma nica subunidade activa e requerem unicamente Mg2+ como cofactor. Os locais de clivagem situam-se em geral dentro das sequncias de reconhecimento compostas de 4 a 8 bases. A clivagem d origem a extremidades 5' ou 3' protuberantes ou a extremidades rombas ("blunt-end"). Estas enzimas foram isoladas a partir de mais de 200 estirpes bacterianas representando quase todos os grupos de procariotas. Esta diversidade de enzimas torna indispensvel a utilizao duma nomenclatura apropriada. Cada enzima representada por um cdigo de 3 letras derivado do nome do gnero e da espcie da bactria donde a enzima foi isolada. Hae por exemplo, significa que a enzima foi isolada de Haemophilus aegyptiens. A maioria das sequncias de reconhecimento conhecidas palindrmica, i.., possui um eixo de simetria de rotao. Por exemplo a sequncia de reconhecimento de EcoRI 5'-GAATTC-3' 3'-CTTAAG-5' l-se da mesma maneira nas duas direces sobre as cadeias opostas. O arranjo simtrico dos locais de clivagem tem duas consequncias importantes: 1) os cortes em posies desviadas em relao a cada uma das cadeias produzem extremidades monocatenrias que so complementares em orientao anti-paralela, mas idnticas em orientao paralela; 2) as extremidades de uma molcula de DNA criadas por uma enzima dada, com uma dada sequncia de reconhecimento, podem formar pares de bases complementares com qualquer outra molcula de DNA que possua extremidades idnticas:

5'...G pApApTpTp C...3 ' EcoRI 5'... GOH3' + 5'pApApTpTpC... 3' 3'...C pTpTpApAp G...5' 3'... CpTpTpApAp5' 3'HOG 5'

fragmento A (corte 1)

5'... GOH 3'... CpTpTpApAp B 5'... GOHpA p A p T p T p C... 3' 3'... C p T p T p A p Ap HOG....5' A pApApTpTpC... 3'
HOG...5'

fragmento B (corte 2) Esta associao entre bases complementares pode ser completamente estabilizada, pela formao das ligaes covalentes entre as extremidades 3'OH e 5'-fosfato de cada uma das cadeias de DNA. Esta reaco de ligao realizada com uma enzima especfica, uma ligase, que tem, como veremos mais adiante, uma utilizao importante em metodologia de DNA recombinante. Deve ser, no entanto, referido que nem todas as sequncias reconhecidas so simtricas. Devido existncia de ambiguidades nos seus locais de reconhecimento, vrias enzimas reconhecem at 4 sequncias alvo diferentes. A digesto duma molcula de DNA com este tipo de enzima, pode originar extremidades no idnticas que no podem ser recombinadas ao acaso. Por exemplo, EcoRII reconhece as sequncias seguintes:

CCAGG GGTCC

CCTGG GGACC

Vrias enzimas denominadas isoesquizmeras possuem stios de reconhecimento idnticos. HindIII e HsuI por exemplo, partilham as mesmas sequncias de reconhecimento e de clivagem AAGCTT. Outras isoesquizmeras tais como SmaI (CCCGGG) e Xma I (CCCGGG) possuem a mesma sequncia de reconhecimento mas clivam em stios diferentes indicados por .Outras enzimas, denominadas isocaudmeras, podem diferir pelo seu stio de reconhecimento, mas originar extremidades complementares. Por exemplo, as digestes por BamHI (GGATCC), BglII (AGATCT), Bc1I (TGATCA) e Sau3A ( GATC) conduzem s extremidades coesivas 5'-GATC-3'. Todos os fragmentos de DNA formados por clivagem com qualquer combinao destas enzimas, recombinam-se entre eles. Assim, os fragmentos formados por digesto BamHI e BglII podem recombinar-se entre eles, mas neste caso a sequncia recombinante 5'-GGATCT-3' resistente digesto por qualquer destas duas enzimas porque as bases externas da sequncia hexanucleotdica de reconhecimento de BamHI e de BglII diferem (G/C e T/A respectivamente). BamHI 5'... G 3'... CCTAG Bg II GATCT...3' A...5'

5'...GGATCT...3' 3'...CCTAGA...5' no reconhecida por BamHI nem por BglII mas sim por MboI/Sau3A/DpnI

No entanto, as molculas originais e as recombinantes podem ser clivadas por outras enzimas tais como DpnI, Sau3A e MboI e podem ser facilmente distinguidas. Estas enzimas reconhecem a sequncia tetranucleotdica 5'-GATC-3' central e no so influenciadas pelas bases que a ladeiam. As endonucleases de restrio tm certas propriedades particulares: 1) Actividade parasita conhecida por "star" que uma alterao na especificidade da sequncia reconhecida, em condies de pH ou inicas particulares. Por exemplo, um aumento do pH, um abaixamento da concentrao em NaCl, ou a substituio do Mg por Mn alteram a especificidade de EcoRI que passa a reconhecer a sequncia tetranucleotdica 5'AATT-3' que ocorre mais frequentemente. Esta nova especificidade denominada EcoRI* (Eco star).
5

2) Sequncias na vizinhana de sequncias de reconhecimento podem influenciar a actividade duma enzima, privilegiando a clivagem de certos stios em relao a outros de mesma especificidade. Por exemplo, a actividade de EcoRI pode variar no plasmdeo pBR322 ao ponto de atingir diferenas de velocidade de 56x, em funo da localizao do stio em relao a certas sequncias. 3) A temperatura outro factor que influencia o desenrolar da clivagem. Certos pequenos fragmentos oligonucleotdicos desnaturam-se quando a temperatura da reaco enzimtica superior sua temperatura de dissociao. Certas enzimas tm a sua actividade ptima de funcionamento a temperaturas elevadas (65-79C), tais como TaqI, Tth111I, Tth111II isoladas de organismos termfilos. 4) Quando o stio de reconhecimento de certas enzimas se situa perto de uma extremidade da molcula de DNA a actividade diminui. Quando dois stios idnticos ficam demasiados prximos s um deles clivado, porque aps a primeira clivagem o segundo stio fica perto duma extremidade da molcula. Esta propriedade est relacionada com o fenmeno de dissociao mencionado em 3). 5) A probabilidade de uma sequncia de restrio estar representada num local com n pares de bases, numa molcula de DNA, composta de 50 % de AT e de 50 % de CG
P = 1 n 4

em que n o nmero de bases que comporta o stio. Uma sequncia tetranucleotdica dada aparecer num DNA em mdia cada 44=256 pares de base e uma hexanucleotdica cada 46=4096 pares de base. Se for conhecida a composio em GC de um DNA e o seu comprimento, possvel prever o nmero de vezes que uma sequncia de restrio, de composio e comprimento dados, aparece representada. Os diferentes fragmentos formados por digesto com uma enzima de restrio podem ser separados por electroforese em gel de agarose ou de poliacrilamida (Fig. 3.II.). Os fragmentos correm no gel em funo do comprimento e podem ser visualizados por colorao com o brometo de etdio, que se intercala entre as duas cadeias do DNA. A utilizao de vrias enzimas isoladamente, ou em combinao, permite estabelecer a carta de restrio duma molcula de DNA (Fig.4.II. e 5.II.). A carta indica as posies em que uma enzima particular cliva o DNA. A distncia entre os locais de clivagem expressa-se em pares de bases (medida em relao a um padro de referncia).
6

As metilases, ou enzimas de modificao, protegem o DNA de um organismo da actividade endonuclesica ao nvel das sequncias reconhecidas pela(s) enzima(s) de restrio prpria(s) ao organismo. Estas enzimas, que possuem actividades de metilase e ausncia de actividade de restrio, so a dam metilase, e a dcm metilase que fixam o grupo CH3 (m de metilo) em posio N6 da adenina e em posio C5 da citosina respectivamente, no interior dos stios de restrio. Dam-DNA adenina metilase GAmTC Dcm-DNA citosina metilase CCm A/TGG

NHCH3 N N N N O N

NH2 CH3 N

N6-metiladenina

C5-metilcitosina

Enquanto que certas enzimas de restrio reconhecem unicamente sequncias alvo no metiladas, os seus isoesquizmeros clivam tanto os stios metilados como os no metilados. HpaII (C/CGG), por exemplo, cliva o tetranucleotdeo no metilado, enquanto que o isoesquizmero MspI cliva a mesma sequncia no metilada ou metilada (CCmGG). As clulas de eucariotas contm habitualmente citosinas metiladas em proporo que pode atingir 10 %. Se bem que de menor importncia que no DNA de eucariotas, a metilao da adenina altamente relevante no DNA dos procariotas. A metilao dos resduos adenina pode ser testada por enzimas, tais como Sau3A ( GATC), MboI ( GATC) e DpnI (GATC). Enquanto que Sau3A cliva tanto 5'-GATC-3' como 5'-GAmTC-3', MboI cliva unicamente a sequncia no metilada e DpnI cliva exclusivamente 5'-GAmTC-3'. Uma sequncia hemimetilada, i.. uma sequncia metilada s numa cadeia resistente DpnI. Sempre que for necessrio clivar DNA de procariotas em qualquer local possvel, este DNA tem que ser preparado a partir de estirpes de E.coli que so dam-. Se bem que a maior parte das estirpes de E.coli possua actividades de restrio e de metilao, certas estirpes utilizadas em engenharia gentica possuem uma, ou outra, ou nenhuma destas actividades. Ex.: EcoK12 possui actividades de metilase e de restrio
7

MM294 possui modificao mas no restrio RRI no possui nem uma nem outra

Outras endonucleases [para alm das que possuem outra(s) actividade(s)] ) Desoxi- (Fig. 6.II.) Desoxirribonuclease I (DNase I) (pncreas bovino). Actividade: endonuclease, cadeia dupla ou cadeia simples. Com Mg++ ataca cada cadeia independentemente e no gera obrigatoriamente extremidades rombas. Com Mn++ cliva as duas cadeias no mesmo stio e gera fragmentos com extremidades rombas ou s com um ou dois nucleotdeos protuberantes. Utilizao: - na introduo de nicks ao acaso em DNA bicatenrio a fim de o preparar para a marcao radioactiva por nick translation; - na introduo dum nick em DNA circular a fim de o preparar para a mutagnese mediada por bissulfito (seco 3); - na criao de clones ao acaso para sequenciao em vectores de bacterifago M13; - na anlise de complexos protena-DNA. ) Ribonucleases Ribonuclease A (pncreas bovino)(Fig. 7.II.). Actividade: endonuclease - ataca o RNA em 3' de bases pirimidnicas e cliva o fosfato em 5' do nucleotdeo adjacente. D origem formao de nucleotdeos pirimidnicos-3'P e de oligonucleotdeos com pirimidinas-3'P. Utilizao: - na remoo de regies no hibridadas de RNA nos hbridos DNA-RNA; - no mapeamento de mutaes singulares em DNA ou em RNA (desemparelhamentos de um par de bases entre RNA e DNA so reconhecidos e clivados pela RNase A). Ribonuclease T1 (Aspergillus oryzae)(Fig. 8.II.) Actividade: endonuclease - ataca o RNA em 3' da guanosina e cliva o 5'-fosfato do nucleotdeo adjacente. D origem a guanosinas ou a oligonucleotdeos com guanosina-3'P. Utilizao: - na remoo de regies no hibridadas de RNA em hbridos DNA-RNA.

Exonucleases e polimerases ) DNA polimerase I (E. coli) (Fig. 9.II.) Actividades: exonuclease 5' 3' e 3 ' 5' polimerase 5' 3' reaco de troca Utilizao: - marcao de DNA por nick-translation. - Na marcao de DNA com extremidades 3' protuberantes. ) Fragmento de Klenow da DNA polimerase de E.coli (Fig. 10.II. e Fig. 4.16) Actividades: exonuclease 3' 5' polimerase 5' 3' reaco de troca Utilizao: - preenchimento das extremidades 3' retradas formadas por digesto de DNA com enzimas de restrio; - marcao de DNA por preenchimento das extremidades 3' retradas, com nucleotdeos trifosfatos 32P; - marcao terminal de DNA com extremidades 3' protuberantes; - sntese da segunda cadeia de cDNA em clonagem de cDNA; - sntese da segunda cadeia de DNA a partir de matrizes monocatenrias em mutagnese in vitro; - sequenciao de DNA pelo mtodo dos didesoxinucleotdeos (terminao de cadeia). ) T4 DNA polimerase (Fig. 11.II.) Actividades: exonuclease 3' 5' polimerase 5' 3' Utilizao: - como o fragmento de Klenow, utilizada na marcao de DNA por preenchimento de extremidades 3' retradas; - na marcao das extremidades de fragmentos de DNA, rombas ou protuberantes em 3' (reaco de troca);

- na marcao de fragmentos de DNA para uso como sondas de hibridao por digesto parcial de DNA bicatenrio utilizando actividade exonuclease 3'5' seguida por reaco de preenchimento, utilizando a actividade polimersica e [32P]dNTP; - na converso de extremidades protuberantes (5' ou 3') de DNA bicatenrio, em extremidades rombas; - na extenso do iniciador (primer) oligonucletdico mutagnico hibridado matriz de DNA monocatenrio, em mutagnese in vitro. ) Taq polimerase (Thermus aquaticus)(Fig. 12.II) Actividade: polimerase 5' 3' Utilizao: - na amplificao in vitro de sequncias especficas de DNA por reaco em cadeia (Polymerase Chain Reaction-PCR); - na sequenciao de DNA ) RNA polimerases dependentes de DNA de bacterifagos SP6, T3 e T7 (Fig. 13.II) Actividade : RNA polimerase 5' 3' Utilizao: - na sntese de RNA monocatenrio para utilizao como sondas de hibridao, como mRNAs funcionais em sistemas de traduo in vitro, ou como substratos em reaces de splicing in vitro. Cada uma destas trs polimerases possui um grau elevado de especificidade para com o seu promotor. - No caso do sistema de transcrio do bacterifago T7, para expresso de genes clonados em bactrias. ) Poli(A) polimerase (Fig. 14.II) Actividade: polimerisa AMP (derivado de ATP) na extremidade 3'-OH livre do RNA. Utilizao: - preparao de poli (A)- RNA para clonagem; - marcao da extremidade 3' de RNA com [-32P]ATP para preparar sondas de hibridao. ) Reverse transcriptase (transcritase reversa) (Fig. 15.II.) (vrus aviano de mieloblastose) Actividades : polimerase 5' 3' DNA. A matriz tanto pode ser o DNA como o RNA. Exorribonuclease 5' 3' e 3' 5' (RNase H) Degrada especificamente o RNA em hbridos DNA-RNA.
10

Utilizao: - sntese de cDNA para clonagem (1a e 2a cadeia) ou para sondas de hibridao; - marcao de extremidades de fragmentos de DNA protuberantes em 5' (reaco de preenchimento). - Tambm pode ser utilizada em sequenciao de DNA pelo mtodo de terminao de cadeia com os didesoxirribonucleotdeos. ) Nuclease Bal 31 (Fig. 16.II.) Actividades: exo e endonuclease 5' 3' e 3' 5' Utilizao: - remoo de nucleotdeos das extremidades de DNA bicatenrio de maneira controlada. O DNA encurtado pode ser ligado a adaptadores (linkers) ou a vectores com T4 ligase; - construo de mapas de stios de restrio; - mapeamento de estruturas secundrias do DNA, por exemplo junes entre B-DNA e Z-DNA, ou stios de modificao em DNA bicatenrio; - remoo de nucleotdeos de RNA bicatenrio para preparao de RNAs recombinantes. ) Nuclease S1 (Fig. 17.II.) Actividade: nuclease especfica de DNA monocatenrio ou RNA; utilizao: - anlise de estrutura de hbridos DNA-RNA; - remoo de extremidades livres (tails) de fragmentos de DNA para produzir extremidades rombas; - abertura do gancho formado durante a sntese de cDNA bicatenrio; - na anlise da estrutura dos hbridos RNA-DNA. ) Mung-bean nuclease Actividade : nuclease especfica de cadeia simples semelhante nuclease S1 mas mais suave. Utilizao: - converter extremidades protuberantes de DNA em extremidades rombas. ) Exonuclease VII (Fig. 18.II.) Actividades: exonuclesica sobre cadeia simples de DNA, 3' 5' e 5' 3'; dispensa Mg++ e trabalha em presena de EDTA. Utilizao: - recuperao de cDNA inserido em vectores plasmdicos por "tailing" dAdT;
11

- construo de mapas dos intres e dos exes. ) Exonuclease III (Fig. 19.II.) Actividades: exonuclease 3' 5' de DNA bicatenrio com extremidades 3'OH retradas. -3' fosfatase. Utilizao: - Preparao de DNA linear como molde para a DNA polimerase (p.ex. na sequenciao pelo mtodo dos didesoxi; vd. seco sequenciao); -preparao de sondas especficas de uma cadeia; -remoo de sequncias das extremidades de fragmentos de DNA, criando eliminaes unidireccionais a partir da extremidade 3'OH retrada; -degradao preferencial da cadeia parental no tiofosfatada, no mtodo de mutagnese especfica pontual que recorre a derivados tiofosfato (vd. seco 3) ) Exonuclease (Fig. 20.II) Actividade: exonuclease 5' 3' em cadeia dupla de DNA com um fosfato em 5'. Utilizao: -na modificao da extremidade 5'-fosfato dos DNAs substratos ulteriores doutras enzimas (ex.: remoo da extremidade 5'-protuberante do DNA antes do "tailing" com a terminal transferase).

Fosfatases Fosfatase alcalina - CAP (intestino de vitela), BAP (bactria) (Fig. 21.II.) Actividades: catalisa a remoo dos fosfatos em 5' do DNA bicatenrio ou monocatenrio, do RNA e de trifosfatos dos desoxirribonucleotdeos e dos ribonucleotdeos. Utilizao: -eliminao dos grupos fosfato em 5' do DNA ou do RNA para permitir a marcao com 32P em 5' pela T4 polinucleotdeo kinase e [32P]ATP, numa reaco de troca; - remoo do fosfato em 5' do DNA a fim de impedir a auto ligao (Fig. 24 e Fig. 4.9). T4 polinucleotdeo Kinase (Fig. 22.II.) Actividades: catalisa a transferncia de fosfato de ATP para a extremidade 5'OH do DNA mono ou bicatenrio e do RNA por reaco de fosforilao de 5'OH ou de troca com 5'P. Utilizao: - marcao da extremidade 5' do DNA para a sequenciao pela tcnica de Maxam-Gilbert;
12

- fosforilao de oligonucleotdeos sintticos, ou de outro DNA, para ligao; - marcao de oligonucleotdeos para serem utilizados como sondas de hibridao;

Ligao de fragmentos de DNA Existem dois mtodos que permitem estabelecer ligaes covalentes de DNA in vitro. O primeiro utiliza uma enzima que intervm na replicao do DNA, a que j nos referimos anteriormente, a DNA ligase (extrada de E.coli ou de clulas infectadas pelo fago T4). A enzima derivada do fago T4 at capaz de realizar a ligao entre molculas de DNA com extremidades rombas, reaco que estimulada pela RNA ligase de T4. T4 DNA ligase (Fig. 23.II.) Actividade: ligao de extremidades coesivas e de extremidades rombas. Utilizao: -catalisa a ligao covalente de molculas de DNA com extremidades coesivas complementares; - ligao covalente de extremidades rombas em molculas de DNA bicatenrio, umas com as outras, ou com adaptadores ("linkers") sintticos (observao: a T4 ligase mais eficaz nas ligaes de extremidades rombas). T4 RNA ligase (Fig. 24.II) Actividade: catalisa a ligao covalente de extremidades 5' fosforiladas de DNA monocatenrio ou de RNA, a extremidades 3'OH de DNA monocatenrio ou de RNA. Utilizao: -marcao radioactiva das extremidades 3' de RNA (pequenas molculas tais como os pNps so substratos eficazes); - sntese de oligodesoxirribonucleotdeos.

O segundo mtodo utiliza uma enzima que capaz de adicionar extremidades coesivas aos fragmentos de DNA. Quando por vezes necessrio ligar fragmentos de DNA desprovidos de extremidades coesivas complementares, recorre-se a uma enzima que permite adicionar, in vitro, sequncias homopolimricas complementares, aos fragmentos de DNA. O mtodo baseia-se na utilizao duma enzima isolada de timo de vitelo, a terminal desoxirribonucleotidiltransferase (terminal transferase). Em presena de um nucleotdeo trifosfato, a enzima adiciona este nucleotdeo de maneira repetida s extremidades 3' do DNA.

13

Pode-se, por exemplo, adicionar extremidades poli (A) em 3' dum fragmento de DNA e extremidades poli (T) em 3' dum outro fragmento de DNA. Ao misturarem-se, estes dois fragmentos hibridar-se-o por emparelhamento entre bases complementares A/T e a juno covalente dos fragmentos emparelhados pode ser efectuada pela enzima DNA ligase. Terminal desoxirribonucleotidiltransferase (timo de vitelo) (Fig. 25.II. e Fig. 5-9) Actividade: catalisa a adio de desoxirribonucleotdeos s extremidades 3'-OH das molculas de DNA monocatenrias ou 3' protuberantes (Mg++), ou s extremidades rombas ou 3'OH recessivas (Co++). Utilizao: -adio de caudas (tailing) homopolimricas complementares a vectores e a cDNA; -marcao das extremidades 3'OH de DNA com [-32P]-3'-desoxirribonucleosdeo ou com 3'-ribonucleosdeo. A marcao com ribonucleosdeos realiza-se polimerizando com [32P]rNTP em presena de Co++ efectuando em seguida um tratamento alcalino (Fig. 2.4-4).

14

1.b.A sequenciao de DNA Dois grandes mtodos baseados em princpios inteiramente diferentes foram desenvolvidos para sequenciar longos fragmentos de DNA. Os pequenos fragmentos oligonucleotdicos so um caso particular que ser tratado separadamente. Um destes mtodos baseado num processo de clivagem qumica especfica e controlada e o outro na sntese enzimtica de fragmentos de DNA interrompidos pela adio controlada de anlogos dos desoxirribonucleotdeos trifosfatos (dNTP), as cordicepinas ou didesoxirribonucleotdeos. O primeiro mtodo conhecido pelo nome dos seus autores, Maxam & Gilbert, ou mtodo qumico, e o segundo por mtodo dos didesoxi, ou de terminao de cadeia, ou ainda de Sanger, nome do seu autor.

1. Mtodo qumico ou de Maxam & Gilbert O princpio do mtodo qumico, de Maxam & Gilbert, baseia-se na clivagem duma cadeia de DNA, induzida por uma reaco qumica de modificao, especfica de cada uma das 4 bases. Trs etapas sucessivas esto implicadas na clivagem especfica ao nvel de uma, ou duas das 4 bases (Fig. 26.II.): 1) Modificao da base 2) Remoo da base modificada do ciclo furansico 3) Clivagem da cadeia de DNA ao nvel deste acar. As etapas 2 e 3 tm a propriedade de serem dependentes da etapa precedente, i.., o DNA s ser clivado ao nvel dum acar desprovido da base e somente uma base modificada de maneira adequada poder ser removida do ciclo furansico que lhe corresponde. A especificidade reside na primeira reaco. As reaces seguintes tm que ser quantitativas. Por consequncia, os reagentes de modificao que reagem com as bases so absolutamente fundamentais, porque so eles que determinam o stio de clivagem do DNA. O sulfato de dimetilo e a hidrazina so dois reagentes que correspondem aos critrios exigidos e conhecidos desde h muito tempo pelas suas propriedades de modificao e de abertura dos ciclos das bases, tornando o DNA vulnervel clivagem. As Fig. 27.II. e Fig. 28.II. detalham estas reaces. A primeira exemplifica as reaces da guanina: metilao do azoto 7 com o sulfato de dimetilo, que introduz uma carga positiva na parte N7-C8-N9 imidazlica do ciclo prico. Quando C8 atacado por NaOH, a ligao C8-N9 rompe-se. Em seguida a piperidina remove o ciclo aberto da 7-metilguanina e catalisa a eliminao dos dois fosfatos do acar. Um mecanismo semelhante passa-se com a adenina.
15

A segunda figura exemplifica as reaces duma timina. A hidrazina ataca a timina nos C4 e C6 abrindo o ciclo pirimidnico e ciclisando com C4-C5-C6 para formar um ciclo de 5 membros. A continuao da reaco com a hidrazina remove este novo ciclo pirazolona e o fragmento ureico N1-C2-N3 da timina, enquanto que os acares do esqueleto do DNA ganham a forma de hidrazona. Em seguida, a piperidina reage com todos estes glicosdeos e como precedentemente catalisa a eliminao dos 2 fosfatos do acar. A citosina reage de maneira semelhante. Modulando estas reaces pela natureza e concentrao da base, o pH, a temperatura, possvel favorecer a clivagem no stio de uma ou outra base prica, ou de uma ou outra base pirimidnica. Consideremos por exemplo, um fragmento de DNA marcado em 5' com 32P e submetido s reaces que conduzem clivagem, parcial mas especfica, ao nvel das guaninas. As condies experimentais sero escolhidas de maneira a que cada molcula de DNA no sofra mais duma clivagem. Neste caso, os fragmentos indicados na Fig. 29.II., marcados em 5' com 32P sero formados em propores idnticas. Se o fragmento de DNA for submetido separadamente a 4 sries de reaces, cada uma especfica de uma base e as 4 sries de fragmentos forem analisadas em paralelo num gel de electroforese e este for em seguida submetido a uma autorradiografia, a sua sequncia pode ser lida seguindo o "padro" das bandas na pelcula (Fig. 30.II.). Uma caracterstica essencial deste mtodo a necessidade de se dispor de um fragmento de DNA especificamente marcado numa das suas extremidades, 5' ou 3'. Em geral estes fragmentos so formados por clivagem com endonucleases de restrio e preenchimento das extremidades protuberantes com uma polimerase e 32P-ATP. Antes de sequenciar o fragmento de DNA, necessrio separar as duas extremidades marcadas. Uma maneira de proceder consiste em digerir o fragmento com uma endonuclease de restrio, que d origem formao de dois fragmentos bicatenrios de comprimento diferente que possam ser separados num gel de electroforese (Fig. 31.II.). A quantidade de DNA que deve ser utilizada depende do comprimento do fragmento e do nmero de reaces que se pretende efectuar, assim que da habilidade do experimentador. necessrio pelo menos 1 picomole para a marcao. Por exemplo, no caso do pBR322 linearizado, de peso molecular de 2.6106 Da, 1 picomole corresponde a 2,6 g de DNA. Se a actividade especfica de 32P-dNTP utilizada na marcao for de 1000 Ci/mmol, 1 mci (+ 106 cpm) poder ser teoricamente incorporada por nucleotdeo adicionado. Depois das etapas de precipitao sobejaro 105 cpm para colocar no PAGE (PAGE-polyacrilamide gel eletrophoresis) de separao. A resoluo do gel, a sua capacidade para separar fragmentos de comprimento N dos de comprimento N + 1 depende da natureza do gel, do seu comprimento e composio. Um gel convencional composto de 8 % de acrilamida, 8M de
16

ureia, tem 0,2-0,3 mm de espessura e 40 cm de comprimento. Obtm-se uma resoluo satisfatria de 200 nucleotdeos (Fig. 30.II.) Se no se puderem separar 200 nucleotdeos numa corrida nica aplicam-se alquotas das 4 reaces de clivagem (ou mais) a tempos diferentes. Na figura, as mesmas amostras aplicadas nos corredores da esquerda (I) foram aplicadas no gel 2 horas mais tarde, direita. As molculas mais pequenas separam-se nos corredores contendo as ltimas alquotas a serem aplicadas e que correram durante menos tempo. Comea-se a leitura nos corredores de direita. Na figura, as setas indicam os pontos que delimitam a zona de sobreposio. Existe equipamento que permite realizar gis mais compridos e ler um maior nmero de bases duma vez. A utilizao de dNTP marcados com 35S melhora, por sua vez, notavelmente a resoluo. A Fig. 5.3 (Sequenciao de DNA, mtodo de Maxam and Gilbert) ilustra e resume o princpio do mtodo.

2. Mtodo de terminao de cadeia ou de Sanger Neste mtodo, comea-se por hibridar um iniciador (primer) oligonucleotdico, complementar do DNA numa regio prxima da que se pretende sequenciar. O iniciador , em seguida, prolongado (em presena de dNTPs, um dos quais est marcado em posio com 32P, ou com 35S) com uma polimerase que utiliza o DNA alvo da sequenciao como molde. A cada uma das quatro misturas de reaco realizadas em paralelo, adiciona-se um didesoxirribonucleotdeo trifosfato correspondente a cada uma das quatro bases, em concentraes e propores bem definidas em relao aos dNTP. Obtm-se assim 4 populaes de fragmentos, tendo todos a mesma extremidade 5' e terminando com um didesoxirribonucleotdeo idntico, no seio de cada populao: ddA, ddT, ddC ou ddG (Fig. 32.II.). Os didesoxirribonucleotdeos no possuem os grupos hidroxlicos em 3' e em 2'.

O O

O O O B

P O P O P O O O

17 Estrutura geral dum ddNTP

Como o grupo 3'OH necessrio para a formao de ligaes fosfodister, a presena de ddNTPs provoca a terminao da cadeia. As reaces de sntese so paradas adicionando formamida que impede as cadeias de DNA de se hibridarem. Antigamente recorria-se a uma digesto por uma endonuclease que cortasse num stio dando origem a fragmentos mais curtos, que serviam de iniciadores. De cerca de 250 em 250 nucleotdeos era necessrio recorrer a um novo iniciador. Esta condio obrigatria, e a necessidade de dispor de DNA monocatenrio, eram considerados nos tempos da infncia do mtodo, como inconvenientes srios. Hoje, se bem que o princpio na base do mtodo no tenha mudado, a estratgia de clonagem do DNA que se pretende sequenciar, no fago M13, de DNA circular monocatenrio ou em derivados e a possibilidade de recorrer facilmente, graas aos progressos realizados na sntese qumica de DNA, a iniciadores oligonucleotdicos sintticos, levou adopo generalizada deste mtodo. A Fig. 5.4 (Sequenciao de DNA, mtodo d Sanger) ilustra e resume o princpio do mtodo. Com a finalidade de o tornar de utilizao mais prtica, o M13 foi modificado em vrias etapas a partir da sua forma replicativa bicatenria (RF) (Fig. 33.II.). O primeiro derivado o mp1, que possui na regio intergnica no essencial, representada a preto, uma insero composta da regio do gene lacI que codifica a poro C-terminal do repressor, a regio reguladora completa promotor-operador e os codes correspondentes aos primeiros 146 aminocidos da regio N-terminal do gene da -galactosidase, lac Z. O derivado mp2 resulta duma simples substituio dum dG em dA, com o fim de criar um stio EcoRI (Fig. 34.II.). Esta substituio, que converte o 5o codo do cido asprtico em codo de asparagina no tem consequncias na actividade do pptido que assegurada pelos primeiros 146 aminocidos da -galactosidase. Para tornar o vector mais prtico, inseriu-se no stio EcoRI um poli adaptador comportando vrios stios de restrio, nas duas orientaes possveis. Estas construes correspondem aos vectores M13mp8 e M13mp9. A introduo de aminocidos suplementares, resultante desta insero, no interfere com a actividade complementar que o pptido assegura a uma -galactosidase enzimaticamente inactiva, produzida por um epissoma F do hospedeiro E. coli Lac- (o epissoma comporta o opero lac com uma eliminao M15 no gene de lac Z, correspondente aos aminocidos 11-41). Esta complementao pode ser detectada por um teste corado, que se baseia na hidrlise do 5bromo-4-cloro-3-indolil--D-galactosdeo (Xgal) pela -galactosidase, produzindo o 5bromo-4-cloro-indigo azul, visvel nas placas de agar contendo Xgal, em que forem cultivadas as bactrias infectadas pelo fago em presena de isopropiltiogalactosdeo (IPTG), indutor gratuito do opero lactose.
18

HO

CH 2OH OH O S H OH IPTG Cl

CH 3 CH CH 3 HO

CH 2OH OH O O H OH

Cl Br

N H Xgal

O O

Cl Br N

Br N H

5',5'-dibromo-4,4'-dicloroindigo

A perda da complementao , depois da clonagem do DNA estrangeiro no seio do polilinker, serve para identificar rapidamente as bactrias que produzem o vector recombinante. Isto no tem, no entanto, valor absoluto, porque podem existir situaes em que a clonagem no anula a produo de um pptido que complemente a -galactosidase inactiva. S as inseres do DNA estrangeiro, que destruam a fase de leitura aberta do pptido , ou que introduzam codes de fim de leitura, conduzem sempre formao de placas brancas. Tm sido bastante utilizados os vectores M13mp18 e M13mp19, que provm de construes realizadas para aumentar o nmero de stios de restrio utilizveis. O iniciador utilizado na sequenciao universal; a sua extremidade 3' est situada na vizinhana da insero CTGGCC..... As duas cadeias dum inserto, com extremidades coesivas diferentes, podem ser sequenciadas, uma no mp18 e outra no mp19, pois estas construes contm o polilinker em sentidos opostos. Se o fragmento inserido tem extremidades idnticas, obtm-se as duas orientaes no mesmo vector. Insertos maiores que 300 a 400 nucleotdeos dificilmente podem ser sequenciados com um s iniciador. No entanto, a informao obtida sobre a sequncia lida o mais longe
19

possvel no inserto, permitir deduzir a sequncia de um segundo iniciador, que servir para sequenciar uma nova srie de 300 nucleotdeos. Esta estratgia permite a sequenciao de insertos de mais de 2000 nucleotdeos, graas sntese qumica rpida dos iniciadores oligonucleotdicos. Insertos muito maiores conduzem a um crescimento muito reduzido das clulas infectadas. O DNA de grande comprimento, como por exemplo DNA de vrus de 8000 pares de bases pode ser sequenciado por este mtodo, utilizando a tcnica do shot-gun. Fragmentos de restrio do DNA so clonados ao acaso nos vectores M13, sem controlo da sua orientao no genoma. Os fragmentos clonados so sequenciados a partir do iniciador universal e a informao reunida em seguida processada num programa computorizado, a fim de identificar as sequncias que se sobrepem. Para preencher as lacunas preciso recorrer a estratgias de sub-clonagem no aleatrias (Fig. 35A.II.). O fragmento de DNA a sub-clonar para ser sequenciado subsequentemente, clonado num vector M13mp. O DNA com o inserto em ambas as orientaes tratado com DNAseI em condies que provocam linearizao em posies ao acaso. A fim de obter uma srie de fragmentos contendo o DNA de M13 intacto (necessrio para haver transformao e formar placas de lise), mas comportando insertos de comprimento varivel, estendendo-se do stio Z at ao stio Y do outro lado do inserto, a mistura de fragmentos linearizados digerida com a enzima X. Aps tratamento com polietilenoglicol (PGE), que precipita unicamente grandes fragmentos de DNA, estes fragmentos so de novo suspendidos e ligados, para formarem molculas circulares de DNA. Entre estas molculas encontram-se as que foram cortadas com DNAseI dentro do inserto e que perderam o stio Y (1, 2 e 3). As que no foram cortadas inicialmente com DNAseI (esquema de reaco esquerda na figura 35A.II.), ou que foram cortadas dentro do segmento de DNA de M13 (molcula 4 na via reaccional da direita), ainda contm o stio Y. Aps digesto da mistura de reaco total com a enzima Y, estas ltimas molculas sero linearizadas, enquanto que as primeiras, com a srie de insertos comeando no stio Z, permanecero circulares. A eficcia da transformao, ou transfeco, com o DNA linear baixa, comparada com a do DNA circular. Assim, unicamente as molculas de interesse formaro placas aps transformao. Como todos os insertos possuem uma terminao comum (Z), a sequenciao dos diferentes clones, a partir dum iniciador da sntese (polimerizao) no stio X, deve eventualmente cobrir todo o inserto. Outra abordagem para sequenciar um longo fragmento de DNA consiste em criar uma famlia de clones M13, contendo cada um, um sub-fragmento do gene. Isto pode ser realizado preparando eliminaes ordenadas, como ilustrado na Fig. 35B.II. A cadeia de DNA bicatenria, comportando o inserto completo aberta numa extremidade deste, com uma enzima de restrio. O inserto em seguida digerido com uma exonuclease. Pores da mistura de reaco de digesto so removidas a diferentes tempos, antes da ligao ser
20

completa, de maneira a parar a reaco. Formam-se populaes de molculas com comprimentos diminuindo progressivamente. As molculas com eliminaes so de novo circularizadas com DNA ligase, colocando o stio de ligao perto do iniciador universal (USP, Universal Sequencing Primer), que fica adjacente da nova extremidade criada pela digesto pela exonuclease. Otm-se uma coleco de clones, nos quais a regio de hibridao do iniciador universal est bem situada para sequenciar diferentes pores do inserto. Ao sequenciar esta coleco de clones com um nico iniciador pode-se obter um elevado nmero de sequncias que se sobrepem e assim determinar a sequncia total do gene. Existe uma variante em fase slida do mtodo de sequenciao de Sanger, que se baseia na imobilizao de um plasmdeo contendo o inserto que se quer sequenciar (Fig. 36.II.). Este linearizado com uma enzima de restrio A, e as extremidades protuberantes so preenchidas por uma polimerase com os 4 nucleotdeos trifosfatos, dos quais um um derivado contendo biotina, por exemplo a 11-bio-dUTP comercial. Depois de uma segunda digesto com uma outra enzima de restrio B, a mistura passada numa coluna de avidinaagarose. A avidina, ao complexar fortemente a biotina, assegura a imobilizao do DNA biotinilado. As cadeias no biotiniladas so em seguida eliminadas por desnaturao e lavagem. O DNA biotinilado monocatenrio imobilizado servir de molde para a hibridao com um iniciador de sequenciao e para as reaces de polimerizao. Os oligmeros so eliminados, depois de desnaturados, deixando as cadeias matrizes disponveis para a reaco de sequenciao seguinte. O mtodo de sequenciao de terminao de cadeia pode ser aplicado sequenciao de DNA bicatenrio, clonado por exemplo, no pBR322 ou em derivados da famlia pUC (vd. seco 9.). Na prtica, as molculas recombinantes na forma circular fechada so completamente desnaturadas a pH fortemente bsico (NaOH). A re-naturao em estrutura inicial difcil a este pH (>12); forma-se uma rede de molculas hbridas que expem uma proporo suficiente de DNA monocatenrio. A utilizao da sequenase (variante gentica da DNA polimerase do bacterifago T7), em vez do fragmento de Klenow da DNA polimerase I, foi, sem dvida, um factor de sucesso na sequenciao de DNA pelo mtodo dos didesoxi, incluindo o bicatenrio. A actividade exonuclesica 3'5' da forma nativa foi removida por manipulao gentica in vitro. A enzima possui elevada processividade e actividade especfica, e uma boa estabilidade. Certas sequncias de DNA, em particular as que contm pares de dG e dC simtricos, no so completamente desnaturadas durante a electroforese. Sempre que este fenmeno ocorre, o padro da separao dos fragmentos de DNA interrompido; as bandas apresentam-se menos espaadas que normalmente (fenmeno de compresso) e a informao sobre a sequncia , por consequncia, perdida. Uma maneira de eliminar este artefacto
21

recorre incorporao dos anlogos da dGTP, o trifosfato de 7-desaza-2'-desoxiguanosina (7desaza-dGTP), ou o trifosfato de desoxiinosina (dITP), que formam estruturas secundrias mais fceis de desnaturar. Ambos so reconhecidos pela sequenase.
O N P O O N N H N NH 2 P O O N N N

OH

OH

7-desaza-dGTP

dITP

3. Utilizao da PCR em sequenciao Um progresso importante foi realizado nesta rea com a introduo da tcnica da amplificao enzimtica pela reaco de polimerizao em cadeia (Polymerase Chain Reaction, PCR), para a sequenciao de DNA. Este mtodo permite amplificar in vitro, fragmentos especficos de DNA, facilitando a acumulao da informao para a sequenciao de DNA. baseado na utilizao de dois oligonucleotdeos iniciadores da polimerizao catalisada pela DNA polimerase, sobre as cadeias complementares de DNA, dentro da regio compreendida entre os dois oligonucleotdeos (vd. seco 11.g para mais detalhes). Efectuando ciclos repetidos de desnaturao das cadeias complementares de DNA, de annealing dos iniciadores oligonucleotdicos com as referidas cadeias e de sntese de DNA com a polimerase, obtm-se um incremento exponencial dum fragmento discreto de DNA (Fig. 37.II.A e precedente, Fig. 6-3). Um inconveniente do mtodo inicial da PCR era a limitao dos fragmentos amplificados regio confinada entre os dois iniciadores. Existe actualmente uma variante (PCR invertida), em que os oligonucleotdeos so iniciadores da sntese de DNA em direces que divergem da regio compreendida entre eles. Aps digesto por uma enzima de restrio, auto-recircularizao e ligao com uma ligase do fragmento de DNA alvo, a PCR com iniciadores invertidos dar origem a um fragmento linear contendo regies de sequncias desconhecidas divergindo dos iniciadores. A utilizao mais evidente da PCR em sequenciao, na preparao das matrizes de DNA; existe uma variedade grande de mtodos para diferentes aplicaes. No entanto, a Taq
22

polimerase utilizada na reaco de amplificao uma enzima ideal para sequenciao, que pode assim ser efectuada directamente subsequentemente amplificao, sem que sejam necessrias modificaes significativas em relao aos componentes reaccionais. Habitualmente, a quantidade de matriz de DNA necessria para sequenciao obtm-se inserindo o DNA alvo em vectores bacterianos ou virais e multiplicando os insertos em clulas hospedeiras. Todavia, as matrizes para sequenciao podem-se obter mais eficazmente que com os mtodos dependentes de clulas, a partir de alvos genmicos ou de insertos de DNA clonados em vectores bacterianos ou virais, recorrendo amplificao por PCR dos insertos clonados. Mesmo a partir de sequncias completamente desconhecidas possvel recorrer amplificao, utilizando oligonucleotdeos iniciadores, no interior, ou prximos, do poli-linker do vector de clonagem. Desta maneira no necessrio fazer culturas repetidas e purificaes das matrizes de sequenciao a partir de bactrias ou de vrus. Um problema inerente sequenciao directa pelo mtodo da PCR resulta da reassociao rpida das duas cadeias de DNA linear amplificadas, aps desnaturao, que bloqueia a extenso do complexo iniciador oligonucleotdeo-matriz de DNA, ou impede o annealing desta com o oligonucleotdeo. Vrios mtodos podem ser utilizados para contornar este inconveniente e obter preferencialmente uma mono cadeia matriz para sequenciao. 1) O DNA bicatenrio gerado por PCR utilizado como matriz de sequenciao directamente, ou aps separao por electroforese e purificao a partir do gel, a fim de remover o DNA no amplificado, os iniciadores e os dNTPs. Em seguida, um dos oligonucleotdeos iniciadores utilizado para iniciar a reaco de sequenciao. O DNA desnaturado pode ser arrefecido rapidamente em neve carbnica, a fim de retardar a reassociao das cadeias. 2) Quando os produtos da PCR so de comprimento superior a 500 pb, o DNA bicatenrio pode ser desnaturado e as cadeias monocatenrias separadas por electroforese. Este mtodo apropriado para DNA de grande comprimento, cujas cadeias monocatenrias so difceis de obter por outros mtodos. 3) O DNA monocatenrio pode ser produzido directamente por PCR utilizando uma proporo molar assimtrica dos dois iniciadores oligonucleotdicos, ou ainda recorrendo a uma segunda reaco de PCR utilizando um excesso dum dos iniciadores e um fragmento alvo, proveniente duma PCR simtrica, separado por electroforese e purificado a partir de gel electrofortico (Fig. 37.II.B). 4) Uma alternativa para produzir DNA monocatenrio por PCR sem diminuir a eficcia da amplificao, (como pode ser o caso do mtodo assimtrico), recorre ao bloqueamento dum dos iniciadores da PCR. Um excesso de um terceiro oligonucleotdeo complementar de
23

um dos iniciadores da PCR adicionado durante a reaco de amplificao. O terceiro oligonucleotdeo retira da competio as molculas duma das cadeias acabada de ser sintetizada, impedindo-as de se complexarem com o iniciador bloqueado. A PCR assim transformada a dada altura numa reaco de extenso de mono cadeia (Fig. 37.II.C). 5) Uma abordagem completamente diferente recorre combinao da PCR com a transcrio reversa, utilizando uma sequncia promotora de fago, especfica da enzima, ligada a um dos iniciadores da PCR. Inicialmente a PCR efectuada de maneira equilibrada, simtrica, a fim de produzir DNA bicatenrio. A reaco de transcrio efectuada num segundo tempo e dar origem a um incremento suplementar do nmero de cpias da cadeia monocatenria desejada (RNA), devido ao reconhecimento especfico da sequncia promotora pela transcritase do fago. Este transcrito em seguida sequenciado recorrendo transcritase reversa (Fig. 37.II.D). A Taq polimerase uma enzima adequada para a sequenciao de DNA porque possui uma elevada processividade e incorpora em proporo excelente; alm disso incorpora o anlogo 7-desazaguanosina, utilizado para resolver a compresso das sequncias de DNA ricas em C-G. Para alm destas propriedades, que compartilha com a T7 DNA polimerase, funciona a 55-75C, condio que pode ser til para resolver estruturas secundrias eventualmente presentes no DNA e que podem dificultar a aquisio da informao de sequenciao.

4. Sequenciao "automtica" O princpio utilizado nos sistemas ditos "automticos", actualmente disponveis no mercado o do mtodo de terminao de cadeia de Sanger. As suas caractersticas principais so o sistema de deteco no radioactivo e o processamento da informao, que automatizado. Foram desenvolvidos dois sistemas que se baseiam na derivatizao qumica de desoxirribonucleotdeos, modificados por grupos fluorescentes que so incorporados nos fragmentos de DNA sintetizados pela polimerase. Cada um deles recorre a uma srie particular de 4 grupos fluorescentes. Num dos sistemas, os grupos fluorescentes so a fluorescena, o nitrobenzoxadiazolo, a tetrametilrodamina e o Texas Red (Fig. 38.II.). Os espectros destes compostos apresentam mximos de absorvncia a comprimentos de onda diferentes. Cada um destes grupos fluorescentes est ligado quimicamente ao nucleotdeo modificado em 5' do iniciador universal. Obtm-se 4 iniciadores que diferem unicamente pela natureza da entidade qumica fluorescente fixa na sua extremidade 5'. Se se utilizar cada um destes iniciadores em cada
24

uma

das

reaces

de

polimerizao

em

que

intervm

um

dos

quatro

didesoxirribonucleotdeos, associa-se um grupo fluorescente a um terminador de cadeia. A mistura dos produtos das 4 reaces separada por electroforese, num corredor nico duma coluna de gel de poliacrilamida, ou num gel com vrios corredores. As bandas fluorescentes so excitadas por um laser e detectadas perto da base do gel durante a electroforese. A informao transferida directamente para um computador, que identifica cada uma das bandas coradas, em tempo real, medida que elas passam, em funo do comprimento de onda do mximo de absorvncia. A sequncia temporal dos diferentes grupos fluorescentes representa a sequncia do DNA (Fig. 39.II.). Os dados sobre os comprimentos de onda so continuamente recolhidos e armazenados num computador, durante a corrida electrofortica e, em seguida, analisados para fornecerem a sequncia final. No segundo sistema os grupos fluorescentes esto ligados parte bsica dos trifosfatos dos derivados didesoxirribonucleotdeos (Fig. 40.II.). Os grupos trifosfatos asseguram a incorporao, sem que o grupo fluorescente impea aparentemente o reconhecimento da base complementar e o reconhecimento pela polimerase; a ausncia de grupo hidroxlico em 3' termina a polimerizao. Cada um dos quatro didesoxirribonucleotdeos modificado com um grupo fluorescente absorvendo a um comprimento de onda diferente, permitindo, como no primeiro sistema, uma deteco diferencial. O laser necessrio como fonte de excitao, a fim de se obter uma sensibilidade mxima a partir de cada banda de DNA. A figura 41.II mostra a informao bruta, a informao processada e um detalhe ampliado, entre os nucleotdeos 89 e 110 de um grfico de anlise. Este processamento da informao, que torna a diagrama mais claro e de mais fcil interpretao, de momento indispensvel, por 3 razes fundamentais: 1) Os espectros de emisso dos diferentes corantes sobrepem-se parcialmente. Os picos correspondendo presena de um s corante so, por isso, detectados por mais de um canal. , portanto, necessrio determinar as diferentes propores dos 4 grupos fluorescentes presentes no gel a cada instante. 2) Uma segunda complicao provm do facto de os grupos fluorescentes influenciarem a mobilidade dos fragmentos de DNA. Por exemplo, a fluorescena e a rodamina diminuem a mobilidade dos fragmentos de DNA de uma base e o Texas Red de 1 base e 1/4. , portanto, necessrio fazer a correco.

25

3) Uma terceira complicao inerente ao mtodo enzimtico, que d por vezes origem a variaes de intensidade das bandas ou a regies de leitura difcil, devido existncia de estruturas secundrias no seio do DNA. Foram desenvolvidos trs outros sistemas que utilizam cada um, um s marcador fluorescente e quatro corredores electroforticos. Esta modificao evita os problemas associados mobilidade diferencial dos fragmentos, causada pelos 4 diferentes marcadores qumicos e a sobreposio dos espectros de emisso dos mltiplos grupos fluorescentes. Qualquer deles l a sequncia em bases de DNA de maneira contnua e em tempo real, e possui uma sensibilidade entre 1 e 50 10-18 moles por banda, prxima da obtida com a autorradiografia convencional. Os marcadores qumicos fluorescentes encontram-se no iniciador do M13, utilizado na sequenciao pelo mtodo dos didesoxirribonucleotdeos. Num dos sistemas o marcador introduzido na extremidade 5' dum derivado sulfdrico do iniciador, por reaco com a iodoacetamida fluorescena de estrutura representada na figura 42.A.II. O feixe de excitao laser atravessa o interior do gel em linha recta, no sentido da largura (lateralmente), controlando continuamente os quatro corredores (disposio que elimina a necessidade de movimentos de "scanner" e aumenta a sensibilidade). Um gel de 20 a 30 cm de comprimento suficiente para efectuar a leitura de 300-400 bases em 5 horas. Nos dois outros sistemas, os iniciadores so marcados com o isotiocianato de fluorescena (FITC), introduzido em 5'-OH, ou num fosfato internucleotdico (Fig. 42.B.II), ou em posio C5 da base desoxiuridina, segundo o caso, por reaco com derivados oligonucleotdicos alquilaminados nas posies referidas. Num dos sistemas, dois grupos fluorescentes foram introduzidos no mesmo iniciador utilizando os derivados aminados em C5 de duas desoxiuridinas diferentes, com a finalidade de aumentar a sensibilidade da deteco e sem que haja interferncias com a actividade biolgica (Fig. 42.C.II.). As Fig. 43.II. e 44.II. ilustram esquematicamente a disposio da aparelhagem de irradiao de excitao laser, de filtrao, de irradiao emitida e de anlise computorizada dos dados. A irradiao de excitao lateral num dos sistemas (Fig. 43.II.) e orientada num ngulo, que minimiza os reflexos do vidro do gel e optimiza a energia transmitida s bandas, no sistema que utiliza a bi-marcao fluorescente (Fig. 44.II.). Este ltimo processo introduz uma focalizao do feixe laser que aumenta a resoluo das bandas separadas por espaos muito curtos e um sistema de scanning horizontal do gel que permite a criao duma imagem bidimensional (Fig. 45.II.). Este sistema permite sequenciar com ptima resoluo 500-600 bases duma nica aplicao, em gel de 30 cm correndo 4 amostras (16 poos) simultaneamente, com uma percentagem mdia de erro de 0,83 %.
26

1.c.Sntese qumica de DNA H cerca de 25 anos, a sntese qumica de pequenos fragmentos de DNA (oligonucleotdeos) era um domnio esotrico, apangio de alguns qumicos especializados. Calculava-se, em 1975, que seriam necessrios 20 anos para sintetizar um gene de 100 nucleotdeos segundo um esquema optimizado por computador. Actualmente, possvel realizar este trabalho em algumas horas. Esta proeza tcnica, s possvel graas ao desenvolvimento acelerado das tcnicas de sntese qumica, catalisado pelo advento das tcnicas da Engenharia Gentica. O alargamento contnuo do campo de aplicao dos fragmentos sintticos de DNA, assim como o aspecto fundamental do estudo estrutural de certas sequncias particulares, constituram estmulos poderosos para os qumicos orgnicos, cujos esforos conduziram ao ajustamento e ao aperfeioamento das tcnicas de sntese. O domnio das aplicaes dos oligonucleotdeos sintticos, ou de anlogos, pode ser assim resumido:

Sntese total ou parcial de genes Construes (adaptadores, mutagnese...) Iniciadores para polimerases e transcritases DNA Sondas de hibridao para escrutinar RNA (ex., diagnstico..)

(ex., Northern...) bancos genmicos bancos de cDNA

Mutagnese dirigida localisada Determinao de estruturas de DNA e de RNA Mecanismos de interaco DNA-protena

Inibio de

traduo transcrio

Apresentamos neste sub captulo um resumo histrico geral da qumica que esteve, ou est na base da sntese de DNA.
27

I.

Princpios da sntese qumica de DNA A sntese qumica em soluo de um oligodesoxinucleotdeo comporta as seguintes

etapas: 1) Preparao dos quatro desoxinucleotdeos: timidina, desoxicitidina, desoxiadenosina e desoxiguanosina, completamente protegidos. Estes so os blocos fundamentais para a sntese. 2) Desproteco selectiva de dois desoxinucleotdeos a condensar, de maneira a libertar em cada um dos blocos, unicamente as funes implicadas na formao da ligao internucleotdica. 3) Condensao dos compostos assim gerados para formar um dmero inteiramente protegido. 4) Extenso da cadeia de DNA repetindo as reaces das etapas 2 e 3 at obteno de um oligodesoxirribonucleotdeo completamente protegido. 5) Desproteco sequencial e controlada do oligodesoxirribonucleotdeo. 6) Isolamento, purificao e caracterizao. Quando a extenso da cadeia desoxirribonucleotdica realizada em fase slida, so necessrias algumas etapas suplementares: i) funcionalizao de um polmero insolvel; do primeiro desoxirribonucleotdeo protegido da cadeia

ii) fixao

oligodesoxirribonucleotdica a sintetizar, sobre a funo do suporte slido; iii) clivagem da cadeia de DNA do suporte slido. 1) Preparao dos blocos de base para a sntese As substncias de base na sntese de DNA so os quatro desoxirribonucleosdeos: timidina, desoxicitidina, desoxiadenosina e desoxiguanosina; (obtidos por degradao de ADN de origem natural) (Fig. 56.II.). Na molcula desoxinucleosdica podem-se distinguir trs centros que vo ser objecto de trs transformaes distintas: as bases e as funes hidroxlicas, em posio 5' e em posio 3'. a) Proteco das funes aminas exocclicas As bases que possuem funes aminas primrias (a timidina no possui) tm que ser protegidas. Esta proteco permanente, visto que o centro aminado no est implicado nas reaces de extenso oligomrica. Portanto, os grupos protectores devem ser estveis ao longo de todas as etapas de sntese. No entanto, eles devem poder ser retirados no fim da
28

sntese em condies que preservem a integridade da molcula final. Os grupos que, nas estratgias de sntese mais utilizadas, melhor satisfizeram estas condies, so o grupo benzoilo para a desoxicitidina e a desoxiadenosina e o grupo isobutanoilo para a desoxiguanosina. A sua introduo tem de ser selectiva, a fim de no bloquear os grupos hidroxlicos do ciclo desoxirribofuranosilo. Estes grupos so objecto de uma proteco transitria, que pode ser especificamente removida aps acilao dos grupos aminados (ex., Fig. 57.II.). Uma proteco suplementar original foi introduzida por vrias equipas, destinada a proteger a funo lactmica da desoxiguanosina, fonte de reaces secundrias durante as reaces de condensao e de fosforilao.
O NH HO
5' 4' 1' ' 2' 3

NH2 N HO
5' 4'

3'

1' 2'

OH Timidina

OH Desoxicitidina

NH2 N HO
5' 4'

O N HO
5' 4'

NH N NH2

3'

1' 2'

3'

1' 2'

OH Desoxiadenosina

OH Desoxiguanosina

Fig. 56.II

29

NH2 N HO
5' 1' 4' 3' 2'

NH2 N O ClSi(CH3)3 Si O
5' 4'

3'

1' 2'

OH Desoxicitidina

O Si O Cl

O HN N HO
5' 4'

O HN N O NH4OH dil. Si O
5' 4' 1' ' 2' 3

3'

1' 2'

O H

O Si

Fig. 57.II

b) Transformao dos grupos hidroxlicos Das funes hidroxlicas em posio 5' e 3', uma tem de ser protegida por um grupo protector transitrio, a outra fosforilada. A escolha do centro a fosforilar depende da estratgia adoptada. A estratgia que consiste em fosforilar a posio 3' deu os melhores resultados e tem sido utilizada nos mtodos gerais de fosfatotrister e de fosfitotrister. ) A proteco do grupo hidroxlico em posio 5' tem de ser temporria. Ela tem de ser removida antes de cada etapa de condensao, durante a extenso da cadeia desoxirribonucleotdica. O grupo protector deve neste caso possuir as propriedades seguintes: i) ii) poder ser introduzido selectivamente em posio 5' deixando intacta a funo poder ser retirado em condies suaves que no dem lugar a nenhuma reaco hidroxlica em posio 3'; secundria;
30

iii) ser estvel em todas as etapas de sntese, de desproteco e de purificao que se seguem sua introduo; iv) eventualmente, facilitar, pela sua introduo, a purificao dos intermedirios de sntese. Entre outros grupos introduzidos com bons resultados o 4,4'-dimetoxitritilo um dos mais correntemente adoptados. introduzido atravs do seu cloreto, tirando-se beneficio da sua selectividade pela posio 5', devido a factores estricos. (ex., Fig. 58.II.).

O HN N HO
5'

O OCH3 OCH3 N + HN

1' 4' ' 2' 3

Cl

5' 4'

3'

1' 2'

OH Desoxiadenosina protegida na base

OCH3

OCH3

OH

Fig. 58.II

O grupo 4,4-dimetoxitritilo pode ser quantitativa e rapidamente retirado em condies de baixa acidez (ex., cido dicloroactico, brometo de zinco) sem ruptura, ou com ruptura insignificante da ligao glicosdica; esta reaco conduz formao do catio dimetoxitritilo de cor laranja, cuja absorvncia pode ser medida espectrofotometricamente. Esta medida particularmente til na sntese em fase slida, pois ela a nica indicao da eficcia das reaces de condensao durante a construo da cadeia oligonucleotdica. ) A fosforilao em posio 3' dos nucleosdeos protegidos na bases e no grupo hidroxlico em 5' pode conduzir, segundo a estratgia escolhida, a um bloco completamente protegido, ou a uma espcie fosforilada activa, capaz de reagir directamente com outro bloco desoxinucleotdico desprotegido em posio 5' para formar a ligao internucleotdica. Numerosos agentes de fosforilao tm sido utilizados em sntese de oligodesoxirribonucleotdeos, sobretudo na metodologia do fosfatotrister (Fig. 59.II.).

31

DMTO

5'

1' 4' 3' 2'

Bp + R1Y

X P O X

DMTO

5'

1' 4' 3' 2'

Bp

R2Z

DMTO

5' 4'

1' 2'

Bp

3'

OH

O R1Y P O
5' 4'

O X R1Y P O ZR 2

HO

3'

1' 2'

Bp

Bp = base protegida DMT = Dimetoxitritilo Z,Y = N, O, S R1 = arilo, 2-etiloarilo, 2-etilotoarilo, arilo substitudo R2 = alquilo, alquilo substitudo... X = triazolo, oxibenzotriazolo, cloro...

OR
5' 4'

DMTO

1' 2'

Bp

3'

O R1Y P O O
5' 4'

1' 2'

Bp

3'

OR

Fig. 59.II

Um dos substituintes do tomo de fsforo protege de maneira permanente o anio fosfato, responsvel pelos fracos rendimentos das reaces de condensao, assim como das dificuldades crescentes de purificao e de solubilidade com o comprimento dos oligmeros, surgidas na metodologia inicial dos fosfatodister. O outro substituinte tem um papel de proteco temporria destinada a ser substituda pela ligao fosfato internucleotdica. O grupo protector permanente deve possuir uma estabilidade total durante as reaces de remoo dos grupos protectores temporrios e durante as reaces de condensao. No deve interferir negativamente com o rendimento e a eficcia destas ltimas. Ele tem, no entanto, que ser retirado especificamente no fim da sntese sem provocar a ruptura concorrente das ligaes internucleotdicas. O grupo protector transitrio deve ser suficientemente estvel para permitir o isolamento, a purificao e o armazenamento dos blocos desoxinucleotdicos completamente protegidos. A sua remoo deve ser especfica e rpida em condies que preservem os grupos protectores permanentes e o grupo protector temporrio em posio 5'.
32

Os grupos ortoclorofenilo (R = o-ClC6H4 com Y = O) permanente e o cianoetilo (R = CH2CH2CN com Z = O) temporrio (Fig. 59.II.) so exemplos de grupos muito utilizados na metodologia do fosfatotrister (ex., Fig. 60.II.).

O NH DMTO
5' 4'

O N N + Cl O N P O O Et3N H 2O O NH Cl N N N DMTO
5' 4'

NH O
1' 2'

3'

1' 2'

3'

OH

O P O HOCH2CH2CN O NH DMTO
5' 4'

N N N

DMTO

5' 4'

1' ' 2' 3

3'

1' 2'

O O Cl P O O-H+ Et3N Cl O

O P O OCH2CH2CN

Fig. 60.II

O grupo protector permanente na metodologia do fosfitotrister , actualmente, o cianoetilo, que veio substituir o grupo metilo, inicialmente utilizado. O terceiro substituinte do tomo do fsforo um grupo azodialquilo, introduzido em substituio de um tomo de cloro, o qual confere uma reactividade particularmente forte ao intermedirio fosfocloridrito (utilizado durante o desenvolvimento inicial do mtodo), que o torna instvel e de emprego pouco cmodo. Os compostos clorodiisopropilaminofosforoamidito (ou morfolino, entre parnteses) possuem um bom compromisso de reactividade-estabilidade (Fig. 61.II.).
33

O N DMTO
5' 4'

O NH N O N H C Cl
+

NH N N H

1' 2'

DMTO N

5' 4'

O C

3'

P NCCH2CH2O

3'

1' 2'

OH

O NCCH2CH2O

O P N

Fig. 61.II

O mtodo do fostitotrister o correntemente utilizado em sntese em fase slida, em rotina, num processo inteiramente automatizado de elongao da cadeia oligonucleotdica. importante sublinhar que o sucesso da sntese qumica de DNA se baseia sobretudo na preparao destes blocos de base, isto , na escolha dos diferentes grupos protectores, no rendimento das diferentes reaces e na pureza dos desoxinucleotdeos completamente protegidos. 2) Desproteco selectiva Para poder condensar dois desoxinucleotdeos pelo mtodo do fosfatotrister, necessrio libertar separadamente, por um lado a funo fosfato e por outro o grupo hidroxlico 5', das suas proteces temporrias. Por exemplo, o grupo dimetoxitritilo retirado em condies cidas suaves e o grupo cianoetilo em condies bsicas suaves (Fig. 62.II.).

34

DMTO

5' 4'

1' 2'

Bp

3'

O O Cl P O OCH2CH2CN

Base (Et3N) DMTO


5' 4'

cido (TCA, ZnBr) O Bp HO


5' 4'

1' ' 2' 3

1' 2'

Bp

3'

O O Cl P O O HNEt3 Cl O

O P O OCH2CH2CN

O S O N N N NO2 (MSNT)

DMTO

5' 4'

3'

1' 2'

Bp

O O Cl P O O
5' 4'

3'

1' 2'

Bp

O O Fig 62.II Cl 35 P O OCH2CH2CN

3) Reaces de condensao A reaco de condensao necessita evidentemente da formao de espcies activas, capazes de reagir com bons rendimentos, sem formao de produtos secundrios. A activao do fosfatodister frequentemente realizada pela aco conjugada de um cloreto de arilosulfonilo e de uma amina heterocclica, ou de uma sulfonamida (p ex., o mesitilenonitrotriazolo-MSNT), preparada antecipadamente a partir deste tipo de compostos (Fig. 62.II.). A activao dos fosforoamiditos realizada por um agente de protonao, cido fraco (ex.: tetrazolo pKa = 4,9) que acelera a ruptura da ligao do grupo dialquilamina e favorece o ataque pela funo hidroxlica que vai estabelecer a ligao internucleotdica. No , por isso, possvel, dentro desta metodologia, eliminar o grupo dimetoxitritilo em presena do grupo fosforoamidito. A reaco de condensao tem que ser seguida, neste mtodo, pela oxidao do fosfito trister em fosfato, o que se realiza correntemente pelo iodo aquoso (Fig. 63.II.).
5' 4' 5'

DMTO

1' ' 2' 3

Bp +

HO

1' 4' 3' 2'

Bp

N N N H

DMTO

5'

4'

3'

1' 2'

Bp

O P NCCH2CH2O N

OR NCCH2CH2O

O P O
5' 4'

3'

1' 2'

Bp

I2 H2O DMTO
5' 4'

OR

1' 2'

Bp

3'

O NCCH2CH2O P O O
5' 4'

3'

1' 2'

Bp

OR

Fig. 63.II
36

4) Construo da cadeia oligodesoxinucleotdica a) Em soluo Na sntese em soluo e pela metodologia do fosfatotrister a extenso da cadeia polinucleotdica pode fazer-se de maneira alternada no sentido 3' 5' ou 5' 3', visto que se pode desproteger o grupo hidroxlico na extremidade 5', ou o triesterfosfato na posio 3' do oligmero em construo. Dois oligmeros podem igualmente ser condensados um com o outro. Devido sensibilidade dos fosforoamiditos s condies ligeiramente cidas, esta flexibilidade prpria aos triesterfosfatos, no se aplica ao mtodo do fosfitotrister, que no foi desenvolvido em soluo. A sntese em soluo permite a deteco de reaces secundrias de maneira mais directa que a sntese em fase slida. Ela permite a identificao e a compreenso da origem dos produtos parasitas e portanto possibilita a interveno sobre os parmetros correctores (Fig. 64.II.). b) Em fase slida A extenso da cadeia de DNA em fase slida realiza-se numa s direco (em geral 3' 5'), a partir de um desoxirribonucleosdeo fixo, por uma das funes hidroxlicas, a um suporte slido. A fixao efectua-se em geral atravs da formao de uma ligao amida entre um 2'-desoxi-3'-succinilorribonucleosdeo e um polmero insolvel aminado (P-NH2) (Fig. 65.II.).

37

Bp O DMTO P O ClPh NEt3

Bp O OPOCE OClPh DMTO

Bp O P O ClPh NEt3

Bp O OPOCE OClPh

1. TCA 2. cromatog Bp O HO P O ClPh Bp O OPOCE OClPh DMTO Bp O P O ClPh

1. TCA 2. cromatog Bp O HO P O ClPh Bp O OPOCE OClPh

Bp O DMTO P O ClPh

Bp O OPO OClPh

Bp O OPO OClPh

1. MSNT 2.cromatog

1. MSNT 2.cromatog

Bp O DMTO P O ClPh

Bp O OPO

Bp O P

Bp O OPOCE OClPh DMTO

Bp O P O ClPh

Bp O OPO

Bp O P

Bp O OPOCE OClPh

OClPh O ClPh NEt3

OClPh O ClPh

1. TCA 2. cromatog Bp HO O Bp Bp Bp O O O OPOCE P P P OClPh

Bp DMTO

Bp Bp Bp O O O OPO P P P OClPh

O O O ClPh ClPh ClPh

O O O ClPh ClPh ClPh

MSNT

Bp DMTO

Bp Bp Bp Bp Bp Bp Bp O O O O O O O OPOCE P P P P P P P OClPh

O O O O O O O ClPh ClPh ClPh ClPh ClPh ClPh ClPh

DMT = dimetoxitritilo Bp = citosina, adenina, guanina protegidas ou timina ClPh =2-clorofenil TCA = cido tricloroactico MSNT = mesitilenosulfonil-3-nitrotriazolo

Fig 64.II

38

DMTO

Bp +

O O O

DMTO

Bp

DMTO H2N P DCC O

Bp

OH

O C CH2 CH2 CO2H O

C CH2 CH2 O C

NH

Bp = citosina, adenina, guanina protegidas ou timina P = polmero insolvel Fig. 65.II

O poliestirenodivinilbenzeno, a resina composta polidimetilacrilamida-kieselguhr, a slica, as esferas de vidro de porosidade controlada, a celulose, o co-polmero teflonpoliestireno so exemplos de polmeros insolveis que podem ser utilizados. A extenso da cadeia polinucleotdica em fase slida consiste na repetio de um ciclo que compreende essencialmente: a) a reaco de desproteco do grupo hidroxlico em 5' do primeiro nucleosdeo (ou de cadeia em crescimento) fixo no polmero insolvel; b) a reaco de condensao entre a funo hidroxlica libertada e a espcie nucleotdica introduzida em soluo e activada in situ no tomo de fsforo em posio 3'. Com o mtodo do fosfitotrister, uma terceira reaco, que consiste na oxidao do fosfito em fosfato, , como j acima foi referido, necessria. Uma reaco suplementar por vezes efectuada (caping). Ela visa o bloqueamento da ligeira percentagem dos grupos hidroxlicos que no reagiram na reaco de condensao a fim de os desactivar para as reaces ulteriores. Os reagentes em excesso, os subprodutos e os solventes das reaces e de lavagem so eliminados por simples filtrao do suporte slido (Fig. 66.II.).
Bp O DMT P OR Bp O P OR Bp O P OR Bp O O
repetio n vezes 1) Desproteco 5'OH 2) Condensao Bp

Bp O DMT P OR

Bp O O

Bp O O

DMT

P OR

OC(CH 2)2CNH P

OC(CH 2)2CNH P

3) capping 4) oxidao

DMT

OC(CH 2)2CNH P

Fig. 66.II

DMT = dimetoxitritilo Bp = citosina, adenina, guanina protegidas ou timina R = grupo protector do fosfato P = polmero insolvel

39

O isolamento do produto ligado ao polmero insolvel , por consequncia, simples e rpido, em relao aos mtodos convencionais em soluo. O conjunto das operaes prestase bem automatizao. Uma desvantagem da fase slida a cintica desfavorvel. Para conseguir reaces completas dentro de tempos razoveis, indispensvel utilizar excessos importantes de reagentes, cuja pureza portanto crtica. Vestgios de impurezas reactivas podem inibir completamente a reaco de condensao. Em fase slida a acumulao de produtos indesejveis inevitvel, visto no haver purificao em nenhuma etapa da extenso do fragmento de DNA. Uma maneira de minimizar este inconveniente consiste em utilizar dmeros ou trmeros, preparados em soluo, estratgia que diminui de um factor 2 ou 3 o nmero de reaces efectuadas no polmero insolvel. O comprimento do fragmento de DNA que possvel obter por sntese qumica depende evidentemente do rendimento da etapa de condensao, que tem que ser mantido o mais alto possvel (> 99 %). Do ponto de vista das vantagens e inconvenientes, o mtodo do cianoetilofosforamidito, pela alta velocidade da reaco de condensao e sobretudo pela possibilidade de obter produtos de reaco praticamente isentos de produtos secundrios (altos rendimentos) foi universalmente adoptado nos sintetizadores automticos. O polmero insolvel que melhores resultados tem dado constitudo por esferas de vidro de porosidade controlada e alquiloaminadas. 5) Desproteco A desproteco do fragmento de DNA uma operao delicada que deve preservar a integridade do edifcio molecular. Reaces incompletas, ou uma degradao parcial, conduzem a uma mistura complexa de produtos. A desproteco compe-se de 3 etapas distintas: I) transformao dos grupos triesterfosfatos em diesterfosfatos; II) desproteco das bases; III) desproteco da funo OH terminal em 5'. I) A desproteco dos grupos fosfatos uma fonte possvel de ruptura internucleotdica. Se a extenso da cadeia de DNA for realizada pelo mtodo do fosfatotrister em fase slida, a clivagem do suporte insolvel efectua-se com o mesmo reagente de desproteco dos grupos fosfatos clorofenilados, por exemplo com o 2-nitrofenilcarbaldoximato de
40

Esta pode ser minimizada utilizando reagentes selectivos antes de desproteger as bases.

tetrametilguanidina. O grupo metilo utilizado no comeo do mtodo do fosfitotrister era deslocado por ataque nucleofilico pelo anio tiofenalato, antes da clivagem do suporte slido. Esta efectuada em condies suaves. O grupo cianoetilo, utilizado actualmente, removido em condies ainda mais suaves e sem necessidade de fazer intervir um reagente suplementar: por NH4OH temperatura ambiente. II) As aminas exocclicas das bases so desaciladas por amonlise a 50C. Este tratamento provoca uma ruptura, que no desprezvel, das ligaes fosfatos internucleotdicas quando o fosfato est na forma de trister; esta a razo pela qual se converte antecipadamente e selectivamente o fosfatotrister em fosfatodister. III) O grupo protector da funo hidroxlica em posio 5' o ltimo a ser retirado (pelo cido actico 80 % no caso do grupo dimetroxitritilo). conservado at ao fim para impedir a formao de tristeres fosfricos cclicos que conduzem a estruturas oligodesoxirribonucleotdicas com ligaes 5' 5, durante as primeiras etapas de desproteco. Devido ao seu carcter hidrfobo, o grupo dimetoxitritilo protector da funo 5'OH facilita o isolamento do produto por cromatografia de slica em fase inversa (Fig. 67.II.).
Bp O DMT P OR Bp O P OR n Bp O O
Desproteco dos fosfatos e Clivagem

Bp O P O

Bp O P O

Bp
Desproteco das bases

B O P O

B O P

OC(CH2)2CNH P

DMT

OH

DMT

OH

Desproteco do grupo 5'OH DMT = dimetoxitritilo Bp = citosina, adenina, guanina protegidas ou timina R = grupo protector do fosfato P = polmero insolvel

B O HO P O

B O P

OH

n Fig 67.II

41

RENDIMENTOS N de etapas n 10 10 10 20 20 20 30 30 30 50 50 50 100 100 100 Rendimento/etapa 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% Rendimento final n x 100 35% 60% 90% 12% 36% 82% 4,2% 21,4% 74% 0,5% 7,7% 60% 0,0026% 0,59% 36%

42

6) Isolamento, purificao e caracterizao Os mtodos de isolamento e de purificao correntemente utilizados so a cromatografia de DEAE-celulose, de Sefadex, de camada fina de slica, a cromatografia liquida a alta presso (HPLC), com coluna de slica de fase inversa, ou de troca catinica e a electroforese preparativa em gel de poliacrilamida, ou capilar. A caracterizao do produto isolado e marcado numa das extremidades com um radioistopo pode ser efectuada pelo mtodo de sequenciao de DNA de Maxam & Gilbert. , no entanto, necessrio um reajustamento das condies das reaces aos fragmentos de pequeno comprimento. Um outro mtodo, conhecido pelo nome de Wandering spot, baseiase na anlise a duas dimenses (electroforese em acetato de celulose, seguida de cromatografia em camada fina de DEAE-celulose) dos fragmentos de oligonucleotdeo sinttico marcado numa extremidade, obtidos por digesto parcial com uma exonuclease. Este mtodo restringe-se a fragmentos de comprimento inferior a 20 nucleotdeos (vd. seco "Sequenciao"). As aplicaes dos oligodesoxirribonucleotdeos de sequncia definida abrangem quase todos os aspectos da investigao que implicam a recombinao de DNA, tanto no que diz respeito construo, identificao e caracterizao de clones bacterianos particulares, como manipulao do DNA clonado com o fim de modificar a sua estrutura. Nos campos da amplificao de DNA, da determinao de sequncias de DNA, do estudo das interaces protena-DNA, ou da anlise estrutural do DNA, os oligodesoxirribonucleotdeos sintticos tm-se revelado um instrumento extremamente til e indispensvel.

43

2.

VECTORES DE CLONAGEM A utilizao de novas molculas de DNA formadas por engenharia gentica depende da sua separao e da sua propagao. Para isso necessrio introduzi-las em clulas (bacterianas, por exemplo) de tal maneira que elas possam ser replicadas, preservadas e recuperadas vontade. Para o realizar recorre-se utilizao de vectores particulares, cujo DNA pode ser unido por ligao ao DNA que se deseja introduzir no hospedeiro biolgico e que podem depois ser levados a infectar eficazmente esse hospedeiro. Assim que a molcula recombinante se encontra no hospedeiro, pode-se replicar e propagar de maneira permanente. Portanto, em princpio, segmentos de DNA de qualquer origem podem ser clonados e preparados em quantidade a partir de cultura de clulas, contendo aquele DNA. Vrios tipos de vectores podem ser utilizados para clonar um fragmento de DNA e propag-lo na bactria E. coli: a) b) c) d) e) plasmdeos bacterifago cosmdeos bacterifago M13 sistemas de vectores bacterianos de elevada capacidade

Se bem que diferentes em comprimento e em estrutura, estes 5 tipos de vectores compartilham um certo nmero de propriedades: 1) 2) 3) replicam-se de maneira autnoma na bactria; podem ser facilmente separados do DNA do hospedeiro e purificados; contm regies de DNA no essenciais sua propagao no hospedeiro, nos quais

um DNA estrangeiro pode ser inserido. a) Os plasmdeos Os plasmdeos so molculas de DNA circular bicatenrio capazes de se replicar na bactria de maneira independente do cromossoma do hospedeiro. Em geral so designados por um p mnusculo (de plamdeo) e uma abreviao que pode ser descritiva ou meramente circunstancial. Cada plasmdeo possui uma sequncia que funciona como origem da replicao do DNA; sem esta regio no pode replicar-se na clula hospedeira. Os plasmdeos esto distribudos nos procariotas de maneira muito ampla; variam de massa molecular de + 106 a mais de 200 106 daltons. Conferem um certo nmero de fentipos ao hospedeiro que os contm (Tabela 1.II).
44

Os plasmdeos podem-se agrupar segundo duas categorias principais, os plasmdeos conjugantes e os no conjugantes. Estes ltimos so destitudos de uma srie de genes (tra) que conduzem conjugao bacteriana. As funes de transferncia (tra) incluem um cluster de 12 genes, pelo menos, que so responsveis, entre outras coisas, pela sntese de pili e de outros componentes de superfcie celular. Estes pili permitem o contacto fsico -um prrequisito para a conjugao- entre as clulas doadoras e as receptoras. Independentemente destas funes, todos os plasmdeos possuem regies especficas, responsveis pela sua replicao autnoma (rep), que inclui uma origem de replicao (ori). Dado todos os genes e sequncias de DNA num plasmdeo, estarem habitualmente organizados em clusters funcionais, possvel desenhar uma estrutura geral dos plasmdeos (Fig. 68. II A). Os mecanismos que regulam o nmero de cpias dos plasmdeos so da maior importncia para a sua manuteno na bactria. O nmero de cpias , ou estritamente controlado por, e correlacionado com o nmero de molculas de DNA cromossmico (i. ., dificilmente superior a um) ou relaxado (i. ., uma clula bacteriana pode conter mltiplas cpias dum plasmdeo). Assim, uma categoria de plasmdeos mantm-se no hospedeiro em nmero elevado de cpias (plasmdeo relaxado) e outra em pequeno nmero de cpias (plasmdeo restritivo). Com algumas excepes, os plasmdeos restritivos possuem uma massa molecular relativamente elevada e so conjugativos, enquanto que os relaxados so normalmente no-conjugativos e tm uma massa molecular relativamente mais baixa. Os plasmdeos que se replicam sob controlo restrito requerem biossntese proteica activa, mas no DNA polimerase I para a sua replicao; os plasmdeos relaxados, contudo, necessitam duma DNA polimerase I funcional (produto do gene polA), mas replicam-se sem biossntese proteica de novo. Muitos dos plasmdeos multicpia apresentam um comportamento pouco usual: so capazes de continuar a replicao, mesmo na presena dum inibidor da biossntese de protenas. Praticamente, quando se interrompe a sntese proteica do hospedeiro com um antibitico (p. ex., cloranfenicol), bloqueia-se tambm a replicao do seu DNA. No entanto, a do plasmdeo relaxado continua e podem-se obter vrios milhares de cpias deste plasmdeo por clula (amplificao). Assim, os plasmdeos relaxados podem-se replicar mesmo se a replicao do DNA do hospedeiro estiver interrompida. Como a amplificao afecta simultaneamente os insertos de DNA recombinante na molcula de plasmdeo, os plasmdeos multicpia relaxados desempenham um papel central na tecnologia do gene. Inversamente, a replicao dos plasmdeos restritivos est ligada de maneira dependente do DNA do hospedeiro.

45

O nmero de cpias de plasmdeos controlado geneticamente e pode ser alterado por mutagnese, de maneira a tornar a replicao do plasmdeo sensvel temperatura e, ou cessa, aps uma elevao da temperatura, ou, pelo contrrio, torna o plasmdeo relaxado.

Concepo de um vector plasmdico 1. Um vector plasmdico deve ser o mais pequeno possvel em relao ao DNA cromossmico. Esta propriedade facilita a manipulao do vector e aumenta as possibilidades de transformao eficaz do hospedeiro bacteriano. 2. O vector deve estar bem caracterizado em relao aos genes que contm, no que respeita sua carta de restrio e sua sequncia em bases. 3. O vector deve poder replicar-se de maneira autnoma (relaxado) e propagar-se eficazmente no hospedeiro, de maneira a poder obter-se facilmente grandes quantidades de DNA do vector e do DNA que nele tiver sido inserido. 4. O vector deve comportar um marcador de seleco que permita distinguir as clulas transformadas pelo vector das que no o so. Habitualmente este marcador uma resistncia a um antibitico, mediada por um gene que codifica para uma enzima de modificao de antibitico (Tcr, Apr, Kanr, Cmr, Nm, HygB, Str..., respectivamente tetraciclina, ampicilina, canamicina, cloranfenicol, neomicina, higromicina B, estreptomicina). 5. O vector ideal deve conter um marcador gentico adicional, que pode ser inactivado por insero do DNA que se quer clonar. A inactivao insercional deste marcador gentico permite distinguir as clulas que contm um plasmdeo recombinante, das que contm o plasmdeo original (Fig. 68.II.B.). 6. O vector deve conter o maior nmero possvel de stios de restrio nicos, localizados num dos marcadores genticos. Esta propriedade confere um mximo de flexibilidade em termos de clonagem. Evidentemente que estes stios de restrio no podem existir nas zonas do plasmdeo essenciais para a sua replicao. O plasmdeo pBR322 desenvolvido por Bolivar et al. (1979) tem em conta estas exigncias (Fig. 69.II, 70.II e Fig. 4.8). Este plasmdeo contm 4.361 pb. Neste vector, a replicao do tipo relaxado e os genes de resistncia aos antibiticos tetraciclina (Tcr) e Ampicilina (Apr) podem servir, um e outro, de marcadores para a seleco ou para a inactivao insercional. Este plasmdeo tem, ainda, stios nicos de reconhecimento BamHI, HindIII e SalI dentro do gene Tcr; um local PstI nico no gene Apr; um local EcoRI nico fora de qualquer DNA codificante; uma origem de replicao que funciona s em E. coli,
46

mantm-se em elevado nmero de cpias em E.coli e no pode ser facilmente transferido para outra bactria. O plasmdeo pBR322 um vector de clonagem bem concebido. No entanto, tem um pequeno nmero de locais de clonagem nicos e o mtodo de seleco moroso. Assim, desenvolveram-se outros sistemas, um dos quais o plasmdeo pUC19, que contm 2.686 pb e um gene de resistncia ampicilina; um segmento que pode ser regulado do gene da galactosidase (lacZ) do opero lactose de E. coli; um gene lacI que produz a protena repressora que regula a expresso do gene lacZ; uma curta sequncia com muitos locais de clonagem nicos (ex. EcoRI, SacI, KpnI, XmaI, SmaI, BamHI, XbaI, SalI, HincII, AccI, BspMI, PstI, SphI, HindIII), designada stio de clonagem mltipla (sequncia de clonagem mltipla, ou polilinker); e uma origem de replicao de pBR322 (Fig. 4.10). O procedimento de seleco com o pUC19 baseia-se no seguinte princpio da regulao do opero da galactose (Fig. 32-5). Quando as clulas que comportam pUC19 no modificado so cultivadas em presena de isopropil--thiogalactopiranosdeo (IPTG), que um indutor do opero lac, a protena produto do gene lacI (repressor) deixa de se poder ligar regio promotor-operador do gene lacZ, de maneira que este gene no plasmdeo transcrito e traduzido. A protina LacZ combina-se com a protena LacZ codificada pelo DNA cromossmico para formar uma -galactosidase hbrida activa (LacZ e LacZ so fragmentos no activos da -galactosidase que quando associados reconstituem actividade galactosdica). No pUC19, o local mltiplo de clonagem est incorporado dentro de gene lacZ sem interferir com a produo da -galactosidase hbrida funcional. Finalmente, se o substrato 5-bromo-4-cloro-3-indolil--D-galactopiranosdeo (X-Gal) estiver presente no meio ser hibrolisado por esta -galactosidase hbrida num produto azul o 5-bromo-4-cloro-indigo azul (vide utilizao do bacteriofago m13 em sequenciao, p. 18 e seguintes). Nestas condies, as colnias que contm o pUC19 no modificado aparecem azuis. Numa experincia de clonagem em pUC19, o DNA dum dado organismo digerido com uma endonuclease de restrio que reconhece um local de restrio existente no local mltiplo de clonagem. Este DNA exognio misturado com o plamdeo pUC19 que foi previamente digerido com a mesma endonuclease de restrio e subsequentemente com fosfatase alcalina. Aps ligao com a DNA ligase de T4, a mistura de reaco introduzida por transformao na clula hospedeira que pode sintetizar a parte da -galactosidase (LacZ) que se combina com o produto do gene lacZ para formar uma enzima funcional. As clulas hospedeiras so plaqueadas num meio contendo ampicilina, IPTG e X-Gal. As clulas no transformadas no podem crescer na presena de ampicilina. As clulas com plasmdeos que voltaram a circularizar sem o inserto de DNA exognio podem crescer no meio com ampicilina e, visto que produzem -galactosidase activa originam colnias azuis. Em contraste, as clulas hospedeiras que comportam a construo plasmdeo-DNA clonado, produzem, no mesmo
47

meio, colnias brancas. A explicao est no facto de que o DNA inserido no local mltiplo de clonagem rompe, normalmente, os codes da sequncia correcta de DNA (fase de leitura) do gene lacZ impedindo a produo duma protena LacZ funcional, de maneira que no h produo de -galactosidase hbrida. Na ausncia de actividade -galactosdica, o X-Gal, no meio no convertido no composto azul e assim as colnias permanecem brancas. As colnias brancas (positivas) devem subsquentemente ser escrutinadas para indentificar as que contm a sequncia alvo especfica de DNA. Outros antibiticos podem ser utilizados, para alm da ampicilina, assim como um certo nmero de de sistemas de seleco inventivos que foram criados para identificar clulas com construes inserto-vector. Um exemplo um vector derivado do pUC19 que contm um gene que, quando expresso, codifica uma protena que mata a clula (protena suicida). Este gene assassino de clulas est em fuso na fase correcta de leitura com o gene lacZ. Uma clula com um plasmdeo intacto e sem ITPG no meio no sintetiza a protena suicida. Com um inserto e IPTG, produzida uma protena suicida no funcional porque o inserto, muito provavelmente rompeu a fase de leitura do gene suicida. Em contraste, clulas com um plasmdeo e sem inserto, na presena de IPTG, sintetizam a protena suicida e so mortas. As clulas no transformadas so sensveis a um antibitico, enquanto que as clulas recombinantes possuem integrado no vector um gene que confere resistncia a um antibitico. Por outras palavras, neste caso, as nicas clulas a sobreviver na presena de IPTG e de antibitico so as que contm o plamdeo com o inserto de DNA. b) Bacterifagos Em certos casos pode ser mais vantajoso utilizar vectores fgicos. A transformao de E. coli pelo DNA de um fago manifesta-se pela produo de partculas fgicas que resultam da replicao e da expresso do DNA absorvido. O genoma do fago pode ser utilizado de maneira similar aos plasmdeos como vector para os fragmentos de DNA. Uma das vantagens dos vectores fgicos sobre os plasmdeos resulta da grande experincia bioqumica e gentica existente sobre estes fagos. Com os fagos no lisantes pode-se, nomeadamente, tirar partido dos sistemas de regulao prprios, para optimizar a expresso dos genes clonados, assim como a acumulao dos seus produtos nas clulas infectadas. Outra vantagem resulta da possibilidade de escrutinar e caracterizar vrios milhares de placas fgicas de lise, plexo., por hibridao DNA-DNA, numa placa de Petri. Alm disso, existe disponvel um sistema de empacotamento in vitro, que permite empacotar o DNA em

48

cabeas fgicas vazias. A infectividade do DNA recombinante aumentada vrias ordens de grandeza, quando comparada com a de preparaes de DNA puro. Ao contrrio do que acontece com os vectores do tipo plasmdico, o comprimento da insero do DNA estrangeiro limitado no caso da utilizao dos vectores fgicos. Pode-se evidentemente suprimir regies no essenciais do DNA fgico, mas apesar disso, o comprimento do DNA tem que permanecer dentro dos limites impostos pelo seu empacotamento no invlucro do fago. O sistema de empacotamento in vitro permite tirar partido desta limitao, impondo uma seleco do tamanho do DNA empacotado, de tal maneira que, em condies apropriadas, s as molculas de DNA recombinante sero empacotadas. Finalmente, milhes de partculas virais clonadas independentemente, constitudas na forma de banco genmico, representando a informao gentica completa dum organismo complexo, podem ser armazenadas num nmero reduzido de mililitros de meio de cultura. O escrutnio dos fagos recombinantes numa populao mista, baseia-se essencialmente na morfologia das placas, ou na sua cor sobre um tapete de bactrias indicadoras e ainda na hibridao DNA-DNA com uma sonda marcada. Lembramos que o fago contm uma molcula de DNA linear com 45 kbases, comportando extremidades coesivas. Estas extremidades coesivas naturais associam-se para formar o stio cos. Na Fig. 72.II. os genes da esquerda codificam para as protenas da cabea e da cauda do fago; os genes centrais esto implicados na recombinao e na lisogenia e podem ser considerados como no essenciais ao desenvolvimento ltico do fago. Os genes da direita conduzem nomeadamente lise. Um esquema simplificado do desenvolvimento fgico est representado na Fig. 73.II. O DNA de possui numerosos stios de clivagem para quase todas as enzimas de restrio correntes e como tal no apropriado para vector de DNA. Foi, portanto, preciso construir derivados do DNA selvagem, nos quais existe um s stio de restrio permitindo a insero de um fragmento de DNA exogneo (vectores de insero), ou nos quais, um par de stios de restrio flanqueia um fragmento de DNA no essencial, que pode ser excisado e substitudo por um fragmento de DNA estrangeiro (vectores de substituio). O contedo em DNA das partculas fgicas est submetido a limites quantitativos. Por um lado, um contedo inferior a 75 % da capacidade normal dos invlucros proteicos (cerca de 45 kb) no ser empacotado correctamente e no conduzir formao de partculas fgicas viveis. Por outro lado, um excesso de DNA (>105 % do contedo normal) levar a um empacotamento defeituoso. Estes limites so impostos por um sistema de clivagem especfico dos stios cos, sistema composto de nucleases localizadas na base de cabea do
49

fago. Muitos derivados de do tipo substituio, contm tambm eliminaes de algumas kbases nas regies no essenciais. Deste modo, sempre que se substitui um fragmento de DNA do fago, pode-se inserir um fragmento maior de DNA estrangeiro (at 22 kbases em certos casos) (Fig. 74.II.). A clonagem que utiliza os bacterifagos requer vrias etapas: 1) O DNA do vector digerido com as enzimas de restrio apropriadas e as extremidades esquerda e direita do DNA de so separadas da regio no essencial. 2) As extremidades so ligadas em presena de fragmentos de DNA estrangeiro que possuam extremidades compatveis com as das extremidades. 3) O DNA recombinante empacotado in vitro no invlucro proteico. As partculas fgicas assim formadas so utilizadas para infectar o hospedeiro bacteriano apropriado. 4) Os fagos recombinantes contendo as sequncias de DNA clonadas so a seguir identificados por diferentes processos. Empacotamento in vitro O empacotamento de DNA recombinante nos invlucros de fago in vitro, permite que ele seja introduzido no hospedeiro bacteriano pelo processo normal da infeco fgica com um rendimento muito elevado ( 106 placas de lise por g de DNA recombinante). Uma srie de acontecimentos particulares que se desenrolam durante o empacotamento do DNA no hospedeiro podem ser reproduzidos in vitro (Fig. 75.II.). O DNA do fago, na forma de concatmero (forma produzida aps replicao), constitui o substrato da reaco de empacotamento. Na presena de precursores da cabea (essencialmente produto do gene E) e do produto do gene A, o DNA concatmero clivado em monmeros nos stios cos e empacotado. O produto do gene D em seguida incorporado para formar as cabeas fgicas completas. Finalmente, os produtos doutros genes, tais como W e FII e estruturas da cauda unidas independentemente, juntam-se s cabeas para formar partculas fgicas maduras. Para efectuar o empacotamento in vitro, coloca-se o DNA recombinante em presena de concentraes elevadas de precursores da cabea, da cauda e de protenas de empacotamento. Esta operao realizada na prtica num lisado misto, derivado de duas estirpes bacterianas lisognicas, que foram induzidas antecipadamente. Uma das estirpes contm uma mutao sem sentido no gene D de , que bloqueia a etapa de maturao das cabeas dos fagos. A estirpe acumula pois, os precursores das cabeas fgicas. A segunda estirpe tem uma mutao sem sentido no gene E de , que impede a formao das cabeas fgicas. No lisado misto, a complementao gentica permite a formao de cabeas normais e o empacotamento do DNA recombinante.
50

c) Cosmdeos O sistema de clonagem no DNA de possui limitaes respeitantes ao tamanho mximo do fragmento que se quer clonar (de 15 a 25 kbases). Para clonar fragmentos de DNA de tamanho superior (at 40 kbases), preciso recorrer aos vectores do tipo cosmdeo. So plasmdeos que contm um fragmento de DNA de , incluindo o stio cos. Estes vectores so utilizados em combinao com o sistema de empacotamento in vitro. Aps o empacotamento, a partcula levada a infectar um hospedeiro apropriado. O DNA injectado circulariza-se como o DNA fgico, mas replica-se como um plasmdeo, sem haver expresso das funes fgicas. As clulas que contm os cosmdeos so ento seleccionadas com base na resistncia a um antibitico (Fig. 76.II.). Os stios cos foram clonados no gene Amp do plasmdeo pBR322, tendo sido mantido o gene de resistncia tetraciclina. O DNA que se pretende clonar primeiro clivado em fragmentos de + 35 a 40 kbases e ligado aos stios cos presentes no plasmdeo (o plasmdeo foi previamente clivado com uma enzima similar que foi utilizada para cortar o DNA). Cada um dos fragmentos clonados comportar pois, um stio cos a cada extremidade, visto ser a ligao efectuada em condies que do origem a concatmeros, DNA-cosmdeo-DNAcosmdeo ... Quando o extracto do empacotamento in vitro adicionado, os stios cos so reconhecidos, o DNA clonado clivado em fragmentos de + 45 kbases flanqueados de stios cos (contedo ptimo das cabeas de ) e estes fragmentos so em seguida empacotados, originando partculas fgicas. Estas partculas no so evidentemente fagos viveis, mas podem ser utilizadas para infectar E. coli e so seleccionadas com base na resistncia tetraciclina. Assim que se encontra no interior da bactria, o hbrido DNA-Cos comporta-se como um plasmdeo. Os cosmdeos combinam as propriedades dos plasmdeos e dos fagos e tm diversas vantagens sobre estes dois tipos de vectores. A capacidade de um vector cosmdeo superior de um vector . A seleco do comprimento (complemento normal da cabea do fago) elimina o barulho de fundo prprio aos cosmdeos sem inserto ou aos que contm insertos demasiado pequenos (< 75 % do contedo normal da cabea ). A infecciosidade do DNA plasmdico empacotado nas cabeas fgicas pelo menos 3 vezes superior do DNA plasmdico puro. d) O fago M13 O fago M13 um fago filamentoso que contm uma molcula de DNA circular monocatenrio (cadeia +). O DNA de M13 injectado na bactria replica-se de maneira a
51

formar uma molcula bicatenria (+/-), que se amplifica at atingir 300 cpias por clula (forma replicativa, RF). Esta forma replicativa pode ser isolada e utilizada como vector de clonagem. Assim que a forma replicativa se acumula na bactria, a sntese de M13 torna-se assimtrica e conduz sntese em excesso de uma das duas cadeias de DNA (+), que ser finalmente incorporada nas partculas fgicas maduras. Os fagos so produzidos em contnuo pela clula infectada sem conduzir sua lise. A vantagem principal do fago M13, enquanto vector de clonagem, reside na propriedade que tem de largar no meio de cultura da bactria infectada, partculas fgicas contendo um DNA circular monocatenrio, homlogo de uma das duas cadeias da forma replicativa. Alm disso, esta molcula monocatenria pode ser utilizada como molde no sistema de sequenciao de Sanger (mtodo dos didesoxi) (Fig. 77.II.). A clonagem na forma replicativa de M13 efectua-se como no caso dos plasmdeos. O fragmento de DNA clonado ser inserido na forma replicativa em qualquer das duas orientaes possveis, visto que as extremidades do DNA so idnticas. Assim, em funo da orientao, quer uma quer outra cadeia do DNA estrangeiro corresponder cadeia (+) e ser empacotada no fago. Para tirar partido do fago M13 na sequenciao do DNA, sintetiza-se um iniciador de cerca de 17 bases, complementar de uma regio do DNA de M13 prxima do stio de insero. Este iniciador serve de substrato DNA polimerase para fabricar os fragmentos marcados que sero analisados em gel de poliacrilamida (Fig. 78.II. e 79.II.). Um certo nmero de derivados do fago M13 foram construdos para facilitar, por um lado a identificao dos fagos que contm o inserto apropriado e para aumentar, por outro lado, as possibilidades de clonagem em numerosos stios de restrio (Fig. 80.II.). Em primeiro lugar, um fragmento do DNA de E. coli, contendo as regies de regulao e a informao que codifica uma parte da -galactosidase (lacZ), foi introduzido numa regio no essencial do DNA de M13. Por outro lado, a estirpe receptora do fago M13 contm um gene -gal-deficiente. Assim, quando o fago M13 infecta a bactria hospedeira, h complementao e produo de -galactosidase, em presena de um indutor gratuito, o IPTG (isopropiltiogalactosdeo). As clulas portadoras do fago so detectadas por um indicador corado (XGal) que reage com a -galactosidase. As colnias produtoras de fago aparecem azuis sobre o meio slido. Alm disso, uma sequncia de DNA multi-adaptadora (polylinker), contendo diferentes stios de restrio nicos, foi inserida no DNA do fago, na parte do gene truncado da regio codificando a extremidade amino-terminal da -galactosidase. Esta insero no afecta a
52

capacidade de complementao com o gene -gal-deficiente do hospedeiro. Em compensao, qualquer insero adicional de DNA na regio do polylinker destri a complementao. Por conseguinte, os fagos contendo insertos do origem a placas brancas em presena de indutor IPTG e de XGal (vd. Seco 1.b.2, sequenciao pelo mtodo de Sanger).

Concluses Os quatro tipos de vectores, plasmdeos, bacterifago , cosmdeos e M13, possuem propriedades biolgicas e fsicas que os tornam apropriados para diferentes tipos de clonagem (Tabela 2.II.). Devido ao grande comprimento dos DNAs estrangeiros que se podem introduzir nos cosmdeos e nos fagos , estes vectores so apropriados para a construo e a propagao de bancos de DNA de eucariotas. Estes vectores so no entanto, relativamente difceis de manipular e so pouco adequados para a anlise de pequenos fragmentos de DNA. Os vectores do tipo M13 so adaptados essencialmente para a sequenciao de DNA segundo o mtodo de Sanger, ou como fonte de DNA monocatenrio utilizvel como sonda de hibridao. Em compensao, os plasmdeos so apropriados para os diferentes processos de clonagem. Podem aceitar fragmentos de DNA de comprimento reduzido e podem servir de veculo para a subclonagem de grandes fragmentos, previamente clonados em cosmdeos ou em fagos . So geralmente munidos de numerosos stios de restrio nicos, permitindo uma grande flexibilidade em clonagem. Por ltimo, os plasmdeos so particularmente apropriados para a clonagem de DNAs complementares (cDNA) e podem ser concebidos para dirigir a sntese abundante e controlada de protenas (vectores de expresso).

53

3.

MUTAGNESE DIRIGIDA

A criao de mutantes uma prtica bem conhecida j em gentica clssica, sendo correntemente utilizada no estudo de funes genticas. A abordagem de gentica clssica, recorre a agentes mutagnicos qumicos ou fsicos, que induzem mutaes ao acaso. Os mutantes so em seguida seleccionados, com base num fentipo desejado. As posies relativas das mutaes num cromossoma podem ser determinadas, utilizando tcnicas convencionais de complementao e de anlise de recombinantes. As tcnicas modernas de sequenciao permitem conhecer a natureza precisa da mutao. Alternativamente, pode-se actualmente adoptar um procedimento antittico, i. ., criar modificaes especficas e controladas no DNA e analisar os efeitos destas modificaes no organismo, in vivo, aps ter introduzido nele o DNA mutado (Fig. 81.II.). Os mtodos modernos de isolamento e clonagem de genes e, acima de tudo, a sntese qumica de DNA, possibilitam a introduo de alteraes especficas nos genes tais como eliminaes (deletions), inseres ou substituies. Nesta ltima classe de mutaes esto includas as trocas pontuais de bases. Eliminaes A maneira mais simples de criar uma eliminao num cromossoma circular, de cortar o DNA com uma enzima de restrio que reconhece dois stios e produz dois fragmentos. Aps separao e eliminao dum dos fragmentos (em geral o menor) o outro pode ser de novo circularizado, ligando as suas extremidades coesivas intramolecularmente (Fig. 82.II.). Tambm se podem obter eliminaes por digesto com uma exonuclease, das extremidades duma molcula de DNA linear, formada a partir dum DNA circular por uma endonuclease de restrio que reconhece um stio nico. No exemplo da Fig. 83.II., o fragmento linear, produzido por digesto com a endonuclease BamHI duma molcula de DNA circular, digerido de maneira limitada com a exonuclease Bal31, dando origem a fragmentos de comprimento decrescente, em funo do tempo de digesto e da concentrao da enzima. Estas cadeias de DNA de comprimento varivel so de novo circularizadas, adicionando fragmentos adaptadores sintticos (linkers) que, aps ligao com uma ligase, criam de novo um stio BamHI. Para alm de Bal31, que possui actividade nuclesica em 3' e em 5', podem ser utilizadas outras exonucleases, isoladamente ou em associao, tais como a exonuclease (do fago ), que remove especificamente os nucleotdeos da extremidade 5' do DNA linear, a exonuclease III (ExoIII de E. coli) que remove os mononucleotdeos em 5' de DNA bicatenrio, mas na
54

direco de 3' para 5', ou a nuclease S1 que cliva e digere o DNA monocatenrio (ganchos ou extremidades protuberantes). Inseres Oligonucleotdeos sintticos podem ser utilizados como adaptadores e introduzidos em stios particulares do DNA clonado. A sequncia original deste DNA assim interrompida e alterada, podendo-se, por exemplo criar novos stios de restrio utilizveis em mutagnese. A Fig. 84.II. ilustra esta abordagem. Plasmdeos recombinantes so cortados pela endonuclease DNaseI pancretica, uma vez em mdia, ao acaso. A adio de adaptadores sintticos Xho I, seguida de clivagem com a enzima Xho I e ligao com a T4 DNA ligase para recircularizar o DNA, cria uma famlia de plasmdeos portadores de insertos de 8 bases. Um outro mtodo importante de mutagnese por insero recorre propriedade que tm os transposes de saltar de um loco de DNA cromossmico para outro, por um mecanismo de recombinao homloga, que faz intervir sequncias nucleotdicas idnticas orientadas em direco oposta (vd. I.8., os genes mveis). O transposo Tn5 que contm 5.7 Kb e codifica para a resistncia kanamicina e/ou neomicina, um exemplo, de elemento mvel utilizado para inserir genes num cromossoma. Esta tcnica consiste em inserir o Tn5 numa molcula de DNA clonada num vector, que em seguida reintroduzida num DNA cromossmico a fim de obter mutantes cromossmicos. A Fig. 85.II. ilustra as diferentes etapas deste processo. O plasmdeo pRK290-nif::Tn5 de 30 Kb contm um gene clonado (nif de Rhizobium melioti), no qual foi inserido o transposo Tn5. Quando este vector introduzido por conjugao em clulas de R. melioti transfere a regio nif para o DNA cromossmico por um mecanismo de recombinao homloga. O gene nif cromossmico substitudo pelo gene nif portador da insero Tn5, que confere resistncia neomicina ao genoma de R. melioti. Substituies Antes de estudar em detalhe mutaes pontuais nicas, por vezes aconselhvel examinar as consequncias biolgicas de vrias mutaes numa regio dada dum cromossoma. O mtodo de desaminao qumica de citidina modificando-a em uridina permite realizar este objectivo.

Modificao de C em U por desaminao qumica Esta tcnica tira partido da propriedade que possui o bissulfito de sdio de desaminar resduos de citidina em fragmentos de DNA monocatenrio. Estes podem ser criados por corte com enzimas de restrio, seguido de digesto com uma polimerase possuindo
55

actividade exonuclesica. No exemplo da Fig. 86.II. um plasmdeo recombinante cortado por SmaI (CCCGGG) e as cadeias do DNA so digeridas de 3' em 5' pelo fragmento de Klenow da DNA polimerase, em presena de ATP, unicamente. A enzima deter-se- na primeira adenosina que encontra. As citosinas desemparelhadas, situadas nas extremidades protuberantes, so convertidas em uridinas, por desaminao com o bissulfito de sdio. O preenchimento das extremidades protuberantes, utilizando agora a actividade polimersica da DNA polimerase de Klenow, em presena dos 4 nucleotdeos trifosfato, seguido de ligao das extremidades rombas para recircularizar o plasmdeo, gera uma molcula contendo, neste exemplo, duas mutaes G-C em A-U. Existe um outro mtodo para gerar DNA monocatenrio, que recorre a fagos monocatenrios, tais como o M13. Qualquer DNA clonado neste vector pode ser obtido na forma de molcula monocatenria e mutagenisado com bissulfito. A cadeia complementar (-) em seguida sintetizada, a partir da cadeia mutagenisada utilizando iniciadores especficos. A regio mutada de interesse, excisada da forma replicativa bicatenria, poder ser reclonada num vector no mutagenisado (Fig. 87.II). Substituio por incorporao incorrecta Em presena de brometo de etdeo, certas endonucleases de restrio (por exemplo, ClaI, EcoRI) clivam a ligao fosfodister do DNA no stio de reconhecimento, unicamente numa das cadeias. Este corte pode ser alargado, sem ruptura da cadeia intacta, por uma polimerase com actividade exonuclesica. O preenchimento da regio monocatenria pela polimerase, em presena de s 3 dos 4 nucleotdeos trifosfatos, resultar ocasionalmente, na introduo incorrecta de um nucleotdeo em face da base cujo par complementar foi omitido. No exemplo da Fig. 88.II. foi omitido o dCTP. Se o mecanismo corrector natural de exciso, prprio DNA polimerase no funcionar, o resultado final ser uma molcula de DNA contendo uma substituio de base. O desemparelhamento criado in vitro ser reparado na bactria, durante a replicao, aps transformao pelo plasmdeo. Os plasmdeos no mutados podem ser identificados pela presena do stio de restrio alvo do corte inicial (ClaI, neste exemplo). Os mutados no sero reconhecidos pela endonuclease. Uma alternativa para superar o mecanismo corrector da DNA polimerase, recorre a anlogos dos nucleotdeos, os nucleotdeos -tiofosfatos, (Fig. 94.II.) que so substratos da DNA polimerase mas no da sua actividade exonuclesica 3' 5'. Uma vez incorporado, o anlogo no pode ser excisado pela enzima, mas a sua extremidade 3' reconhecida como iniciador para prolongar a sntese do DNA.

56

Os mtodos descritos at agora dependem da presena dum stio de restrio apropriado, mais ou menos perto do stio da mutao. Esta limitao pode ser superada, recorrendo a um mtodo universal e extremamente especfico, que faz intervir oligonucleotdeos sintticos como agentes mutagnicos. Mutagnese dirigida com oligonucleotdeos sintticos Este mtodo oferece a possibilidade de mutar uma ou vrias bases perfeitamente definidas e localizadas, substituindo cada uma delas por qualquer outra antecipadamente escolhida. O oligonucleotdeo sinttico de sequncia definida complementar de uma das cadeias do DNA que se pretende mutar, excepto numa ou vrias posies alvo das substituies mutagnicas. Em condies escolhidas judiciosamente, visando nomeadamente, estabilizar a hibridao, o hbrido formado entre o oligonucleotdeo e o DNA circular monocatenrio, clonado num vector M13, se bem que imperfeitamente emparelhado, ser suficientemente estvel para servir de iniciador numa reaco de polimerizao que levar sntese da cadeia complementar do fago. A molcula bicatenria resultante ser portadora de um ou vrios desemparelhamentos. Uma vez introduzida em clulas E. coli competentes, os "erros" sero reparados e dois tipos de molculas descendentes sero obtidas: umas possuem a sequncia do tipo selvagem, outras contm as modificaes desejadas. Os fagos cuja cadeia (-) foi s parcialmente sintetizada daro origem, aps transfeco ao tipo selvagem (Fig. 89.II.). Para distinguir as molculas modificadas das do tipo selvagem, pode-se recorrer clivagem dos stios de restrio, eventualmente criados, ou suprimidos pelas mutaes, ou se esse no for o caso, hibridao do oligonucleotdeo sinttico marcado radioactivamente (com 32P por exemplo) com os dois tipos de fagos. A optimizao das condies de hibridao selectiva, nomeadamente a temperatura, permitir distinguir o DNA mutado do selvagem. Os rendimentos geralmente obtidos em fago mutado so baixssimos. Esta fraca eficincia de mutao tem vrias causas. A eficcia varivel da reaco de polimerizao certamente uma. Como o DNA monocatenrio do fago tambm infeccioso, se a sntese do DNA complementar no for quantitativa as molculas parcialmente monocatenrias, cuja cadeia intacta a no mutada, replicar-se-o, dando origem ao tipo selvagem. Um outro factor que favorece a ocorrncia de clones do tipo selvagem, a correco dos desemparelhamentos na forma replicativa (RF) antes da replicao in vivo. Este fenmeno explica-se pela actividade 3'-exonuclesica ainda presente no fragmento de Klenow da DNA polimerase I, que teoricamente pode digerir o iniciador antes do comeo da sntese do DNA in vitro. Mesmo um heterodplex completo, contendo desemparelhamentos, pode ser reparado por um mecanismo de exciso dos nucleotdeos desemparelhados. Ora, a cadeia
57

sintetizada in vitro o alvo privilegiado destas reparaes, porque no metilado, ao contrrio do DNA parental, visto a metilao ocorrer in vivo aps a replicao. Com efeito, o mecanismo de reparao in vivo baseia-se, pelo menos em parte no reconhecimento do nvel de submetilao. A cadeia no metilada portanto um bom substrato para o mecanismo de reparao. Numerosas estratgias foram desenvolvidas para superar estes problemas e elevar o rendimento em molculas mutadas, diminuindo de preferncia a necessidade de escrutinar ou purificar laboriosamente os mutantes. Este objectivo tanto mais importante que a relao entre o nmero de clones que necessrio escrutinar para ter uma probabilidade de 90 % de obter um mutante, e a ineficcia da mutao, logartmica (Fig. 90.II.). Uma das estratgias adoptadas recorre utilizao de DNA parental no metilado que pode ser facilmente obtido atravs de estirpes de E. coli mutantes dam- que so deficientes no mecanismo de metilao. Um inconveniente deste sistema a elevada frequncia de mutaes e de recombinaes in vivo. Foi desenvolvido um outro mtodo que recorre a dois iniciadores oligonucleotdicos. O segundo iniciador, que no introduz mutaes, dirigido para uma regio da cadeia de DNA monocatenrio do fago em 5' do oligonucleotdeo mutagnico. O primeiro iniciador prolongado em presena do fragmento de Klenow da DNA polimerase, de DNA ligase e de nucleotdeos trifosfatos. Este mtodo visa proteger o oligonucleotdeo mutagnico da actividade exonuclesica 5' 3' contaminante, da polimerase. Esta estratgia no impede no entanto completamente o deslocamento do segundo oligonucleotdeo pela polimerase. A fim de remediar o problema de reparao dos desemparelhamentos, foi estudado o sistema do dplex interrompido (gapped duplex). Este pode ser obtido por hibridao com o DNA monocatenrio dum vector que no possui a sequncia clonada. A Fig. 91.II. esquematiza as diferentes etapas deste mtodo. O vector fgico M13 contm uma mutao mbar sem sentido e por consequncia, s pode multiplicar-se num hospedeiro supressor de mbar. O DNA alvo da mutagnese clonado neste fago e obtido na sua forma monocatenria. Ao hibridar este DNA circular, com o DNA linearizado e desnaturado da forma RF, no mbar, do mesmo vector sem DNA estrangeiro, forma-se um dplex parcial na regio do DNA clonado. O oligonucleotdeo mutagnico dirigido para esta regio monocatenria e prolongado por uma polimerase, em presena dos 4 nucleotdeos trifosfatos. Aps ligao, a cadeia mutante poder ser seleccionada num hospedeiro no supressor, porque o vector selvagem no possui a mutao sem sentido. Na prtica, a frequncia de mutantes muito varivel e frequentemente baixa. O mtodo tem ainda a desvantagem de produzir uma descendncia no portadora do marcador sem sentido (mbar), o que obriga a
58

recorrer de novo clonagem no vector mbar, se outras mutaes forem necessrias no DNA clonado. Um sistema engenhoso de seleco, baseado na semelhana das sequncias entre os stios de restrio EcoK e EcoB, possibilita a execuo de vrios ciclos de mutagnese com elevada eficincia. EcoK e EcoB so enzimas de restrio do tipo I, que reconhecem um stio com cerca de 15 pb e cortam a uma distncia de 1000 a 5000 bases dele:

EcoB 5'...... TGA ..... N8 ...TGCT......3' EcoK 5'.. GAAC .... N6 ..GTGCT.........3' Um vector especial foi construdo, que contm um stio nico EcoK num inserto polylinker de 30 pb (vector M13K19 derivado de M13m19, Fig. 92.II.). So utilizados dois iniciadores; um chamado iniciador de seleco modifica a sequncia EcoK em EcoB, e o outro, o mutagnico modifica a sequncia alvo. Os iniciadores so prolongados pelo fragmento de Klenow em presena dos 4 nucleotdeos trifosfatos e de DNA ligase e a molcula bicatenria levada a transformar uma estirpe bacteriana restritiva para EcoK. A descendncia com o stio EcoK no sobreviver e a mutada que contm o stio EcoB e a mutao de interesse ser seleccionada. Esta seleco pode ser repetida com um iniciador de seleco que modifica o stio EcoB em EcoK e uma estirpe bacteriana restritiva para EcoB (Fig. 93.II.). A eficcia pode atingir 70 % de rendimento. Uma outra estratgia visa a destruio da cadeia (+) no interessante. Ela tira partido de um hospedeiro especializado, para a multiplicao do fago antes da mutagnese. O vector fgico monocatenrio multiplicado numa estirpe de E. coli Dut-Ung-. A deficincia no gene dut, que codifica para a dUTPase leva a uma superproduo de dUTP que ser incorporada no DNA no lugar de dTTP. A deficincia em uraciloglicosidase impede a eliminao dos resduos de U do DNA (papel prprio a esta enzima). assim possvel obter um DNA fgico monocatenrio contendo 20 a 30 resduos de uracilo. Este fago ser inactivado por um hospedeiro Ung+. Utilizada como matriz em mutagnese dirigida, em presena de dTTP, a cadeia parental contendo os resduos uracilo ser copiada em cadeia mutada, contendo timidina em vez de uracilo. Multiplicado num hospedeiro Ung+, o fago dar lugar a uma descendncia predominantemente mutada. Devido multiplicao fraca das estirpes DutUng- o rendimento em fago baixo apesar da frequncia de mutao ser elevada (+ 80 %).

59

Uma das estratgias mais eficazes baseia-se na utilizao e nas propriedades dum ismero ptico, de um anlogo de nucleotdeo trifosfato, o ismero Sp do dCTPS que contm um tomo de enxofre, em substituio dum tomo de oxignio, ligado ao fsforo (Fig. 94.II.). Neste mtodo, a cadeia no mutada eliminada in vitro, sendo seleccionado um puro homodplex de DNA mutado. O oligonucleotdeo mutagnico utilizado como iniciador para a polimerizao com o fragmento de Klenow, em presena de T4 DNA ligase. O anlogo dCTPS utilizado no lugar do dCTP e incorporado normalmente, o que permite a eliminao selectiva da cadeia no mutada (Fig. 95.II.). Com efeito, certas enzimas de restrio no clivam o DNA nos stios onde um fosforotioato foi incorporado, mas criam cortes simples na cadeia nativa. Estes cortes so o ponto de partida para a degradao enzimtica parcial, pela exonuclease III, do DNA no mutado. Este pode em seguida ser utilizado como matriz para a reconstruo duma molcula bicatenria circular, que ser por consequncia um homodplex mutado. A eficcia da mutao frequentemente superior a 80 %. Seleco e identificao dos mutantes A tcnica mais directa para escrutinar os clones interessantes a sequenciao do DNA monocatenrio purificado de cada clone, utilizando uma nica reaco, com o didesoxinucleotdeo que diferenciar o tipo selvagem dos mutantes. Se a mutao estiver situada longe no stio de clonagem pode ser necessrio sintetizar um oligonucleotdeo apropriado para ser utilizado como iniciador. Se a mutao desejada criar ou destruir um stio de restrio, a anlise electrofortica da forma RF do DNA, preparado in vitro a partir do DNA monocatenrio, purificado e cortado pela enzima que reconhece o stio, permitir a identificao dos clones mutados. O mtodo de hibridao o mais verstil e possibilita o escrutnio de um grande nmero de mutantes potenciais. Utiliza-se directamente o iniciador mutagnico marcado com 32P, como sonda de hibridao, que pode ser aplicada tanto com colnias bacterianas, como com lisados de fagos. Um desemparelhamento entre o oligonucleotdeo mutagnico e o DNA fgico monocatenrio destabilizar o hbrido. Um aumento progressivo da temperatura dissociar selectivamente a sonda marcada dos clones no mutados, mas permite que a sonda permanea hibridada com os mutantes de sequncia perfeitamente complementar. A reaco de hibridao e as etapas de lavagem a temperaturas crescentes so realizadas com o DNA alvo fixo a um filtro de nitrocelulose ou de nylon.

60

Aplicaes da mutagnese dirigida A mutagnese dirigida um instrumento extremamente poderoso para estudar fenmenos bioqumicos e biofsicos, tais como o stio de ligao com os receptores de protenas biologicamente activas, o stio activo de enzimas (identificando os domnios implicados na interaco com os receptores), porque permite modificar a especificidade das ligaes mediante alteraes pontuais especficas dos genes. O estudo da estrutura e da funo das protenas, assim como a engenharia de protenas com o fim de aperfeioar as suas propriedades, so sem dvida reas de grande aplicao desta tcnica. Um exemplo a mutagnese especfica pontual do gene do interfero humano (IFN-). Este gene foi clonado e abundantemente expresso em E. coli, mas a actividade especfica antiviral da protena apenas 1/10 da da protena nativa glicosilada. O IFN- contm trs resduos de cistena, localizados nos aminocidos 17, 31 e 141. Estas cistenas podem formar pontes dissulfureto intermoleculares, dando origem a dmeros ou oligmeros inactivos. Por outro lado, podem reagir ao acaso intramolecularmente levando formao de trs tipos de molculas, correspondentes s trs ligaes dissulfureto intramoleculares possveis. S uma destas formas possuir a conformao nativa e poder ter actividade biolgica. A substituio duma destas cistenas por um outro aminocido, uma soluo possvel para eliminar a formao de pontes dissulfuretos indesejveis. Para manter as propriedades biolgicas da protena necessrio, por um lado, que o aminocido que substitui uma das cistenas tenha um comportamento prximo do do aminocido original, para no provocar distores relativamente conformao nativa e por outro lado, que a cistena substituda no esteja implicada numa ponte dissulfureto na protena natural. A primeira condio tem grandes probabilidades de ser satisfeita, escolhendo a serina para aminocido de substituio, visto s diferir da cistena pela natureza dum tomo (um tomo de oxignio no lugar de um tomo de enxofre). A deciso de escolher a cistena 17 para alvo da substituio baseada na analogia com o IFN- que possui quatro cistenas implicadas em duas pontes dissulfureto, entre as posies Cys29 - Cys138 e Cys1 - Cys98. Sabe-se por outro lado, que a Cys-141 essencial para a actividade do IFN-, porque a sua substituio por uma tirosina d origem a uma modificao conformacional importante da protena, que perde a especificidade de se ligar a anticorpos dirigidos contra o interfero natural e de competir com os receptores do IFN- nativo nas clulas alvo. A ligao dissulfureto mais provvel no IFN- pois entre a Cys-31 e a Cys-141. A figura 96.II. ilustra a estratgia adoptada para mutagenisar especificamente o gene do IFN-. A substituio pontual foi induzida por um decaheptanucleotdeo G-C-A-A-T-T-T-TC-A-G-A-G-T-C-A-G complementar de 16 nucleotdeos da cadeia no codificante do gene.
61

Um simples desemparelhamento na posio 12 do iniciador (um A no lugar dum T) induz a mutao de cistena em serina. Este gene clonado em E. coli, produz uma protena mutada IFN- Ser-17, que possui actividades biolgicas, incluindo actividade antiviral, em tudo comparveis s da protena natural, em contraste com a protena IFN- Cis-17 produzida pelo mesmo hospedeiro. A protena mutada neutraliza o anti-soro dirigido contra o IFN- com a mesma eficcia que a protena natural, o que indica que as duas protenas possuem determinantes antignicos comuns que so reconhecidos de maneira idntica pelo anti-soro. Os dois interferes so pois imunologicamente semelhantes. A substituio do aminocido Cis-17 por uma serina no causa alteraes importantes na estrutura da protena, que forma a ponte dissulfureto e se enrola correctamente, ao contrrio do IFN- Cis-17 expresso no mesmo hospedeiro. Para alm da recuperao da actividade especfica, o INF- Ser-17 possui uma estabilidade muito superior do IFN- Cis-17 recombinante produzido pela bactria, o qual perde rapidamente a actividade especfica. Este caso concreto aplicado a uma protena de grande interesse teraputico ilustra o potencialidade da mutagnese dirigida em engenharia das protenas. As aplicaes desta metodologia de mutagnese perfeitamente definida e controlada so numerosas, tanto no plano terico de investigao de mecanismos fundamentais, como no plano prtico da produo. Nesta rea da investigao aplicada, descrevemos, como exemplo, a mutao no gene do interfero- que modifica uma cistena em serina. Esta alterao tem como resultado melhorar o rendimento de produo da protena activa por E. coli. A mutagnese dirigida por oligonucleotdeos tem tambm, sido amplamente utilizada na anlise funcional de genes, no estudo de regies reguladoras, de operes, de promotores ou outras sequncias de controlo (como por exemplo a elucidao do papel das sequncias consenso presentes nas junes intro-exo), na elucidao da influncia de sequncias especficas na biossntese de tRNA, no estudo de alteraes das propriedades catalticas de enzimas, na avaliao da influncia da natureza da carga dos aminocidos das sequncias sinal, no transporte das protenas atravs da membrana celular. A aplicao desta tcnica elucidao dos mecanismos de aco das enzimas e das relaes existentes entre a estrutura primria e as funes biolgicas desenvolveu-se rapidamente e tem tido importantes repercusses.

62

4.

A TRANSFORMAO BACTERIANA

As molculas de DNA recombinante formadas in vitro por ligao s comeam a ter interesse depois de introduzidas num hospedeiro biolgico. De facto, a utilizao das novas molculas de DNA formadas por engenharia gentica depende da sua separao e propagao. Por isso, necessrio introduzi-las em clulas (bacterianas, por exemplo) de maneira a poderem replicar-se e serem preservadas e recuperadas facilmente. Um meio de o conseguir recorrer, como vimos, a vectores particulares recombinados com o gene que nos interessa, para o introduzir num hospedeiro biolgico em geral um colibacilo. Uma srie de mtodos foi desenvolvida para assegurar a introduo eficaz de DNA no hospedeiro. Sabe-se que o DNA exgeno pode entrar nas bactrias naturalmente. Estas passam por um estado de competncia que as torna aptas para aceitar o DNA exgeno, fixando o DNA numa forma resistente s nucleases. O estado de competncia pode ser reproduzido artificialmente pela exposio das bactrias ao cloreto de clcio antes da adio do DNA exgeno (plasmdeo recombinante) (Fig. 97.II.). Outro mtodo de transformao recorre electroporao, descrita na Fig. 4.27. Para manter o DNA recombinante nas clulas transformadas e evitar problemas de degradao pelo sistema hospedeiro, as bactrias receptoras so geralmente tornadas deficientes para o sistema de restrio (hsdR-) e por vezes tambm para o sistema de modificao (hsdM-). A proliferao permite a obteno de bilies de cpias idnticas do fragmento clonado.

5.

BANCO DE CLONES DE cDNA

Para construir um clone contendo sequncias derivadas de um mensageiro de eucariota necessrio obter, primeiramente, esta sequncia na forma de DNA. A cpia DNA de um RNA mensageiro chama-se DNA complementar (cDNA). O termo clone de cDNA descreve uma bactria portadora de um plasmdeo que contm a cpia DNA de uma molcula de RNA. Uma clula de eucariota comum contm vrios milhares de sequncias de RNA mensageiros diferentes. Um banco de clones de cDNA, para ser representativo, deve conter um nmero suficiente de transformantes distintos, para que cada RNA mensageiro esteja representado pelo menos uma vez na populao bacteriana. O nmero de transformantes
63

distintos a obter para ter uma elevada probabilidade de identificar o clone que se procura varia entre +5.000 e +100.000, segundo a abundncia relativa dum mensageiro na clula.

Esquema de construo de um banco de clones de cDNA a) Preparao do DNA complementar bicatenrio a partir de RNA poli (A)+ (Fig. 98.II.) A partir de clulas pertencentes a um rgo apropriado isolam-se os RNA totais. Estes so passados numa coluna de oligo-dT celulose de maneira a reter especificamente os RNA poli (A) (hibridao A-T). Um iniciador oligo-dT hibridado com os RNA poli (A) para iniciar a transcrio reversa em DNA complementar monocatenrio, utilizando uma transcritase reversa isolada do vrus aviano de mieloblastose. Para a sntese da segunda cadeia do cDNA, pode utilizar-se a transcritase reversa, o fragmento de Klenow da polimerase I de E. coli (enzima de Kornberg) ou a T4DNA polimerase. Estas ltimas duas enzimas no possuem actividade exonuclesica 5'3' prpria da DNA polimerase I e no degradam o DNA bicatenrio medida que ele sintetizado. Tanto a enzima de Kornberg como a DNA polimerase de T4 requerem um iniciador para a extremidade hidroxlica em 3'. Este iniciador pode criar-se espontaneamente, aps a terminao da cadeia monocatenria do cDNA, em cuja extremidade se forma um gancho (hairpin), que serve de iniciador para a sntese da segunda cadeia de DNA pelo fragmento de Klenow da DNA polimerase I (ou a trancritase reversa ou a T4 DNA polimerase). Este gancho pode ser depois clivado pela nuclease S1, de maneira a produzir um DNA complementar bicatenrio linear. Tambm possvel prolongar a extremidade 3' do cDNA com uma cauda homopolimrica. Neste caso, a sntese da segunda cadeia pode ser iniciada utilizando um iniciador homopolimrico. Uma etapa crtica na sntese do cDNA o tratamento com a S1 nuclease. Existe um processo alternativo, pelo qual o RNA do hbrido RNA-DNA obtido aps a sntese da primeira cadeia retirado, no por um tratamento alcalino, mas antes por um tratamento combinado RNAase H/DNA polimerase I de E. coli. A RNAase H (H de hbrido), que ataca especificamente a cadeia de RNA do hbrido RNA-DNA, introduz um certo nmero de cortes (nicks), i. ., extremidades 3'-hidroxlicas na cadeia de RNA, que servem de iniciadores para a reaco de nick translation catalisada pela DNA polimerase I. Observaes: 1) A origem da regio do gancho em 3' da primeira cadeia do cDNA no est bem elucidada. possvel que muitos mensageiros tenham em 5' uma regio complementar que conduza formao deste gancho.
64
+ +

2)

Se o RNA no possui a regio poli(A)+, esta pode ser adicionada in vitro

extremidade 3' pela enzima poli(A) polimerase, para ser depois utilizada com o iniciador oligo-dT. 3) Se a sequncia nucleotdica do RNA mensageiro for conhecida, pode-se utilizar, para a sntese do DNA complementar, um iniciador oligonucleotdico sinttico complementar da extremidade 3'do RNA mensageiro. b) Insero do cDNA num plasmdeo - Transformao das bactrias Quando se dispe dum DNA complementar bicatenrio, preciso em seguida inseri-lo num vector destinado a transformar o hospedeiro bacteriano. Para isso, adicionam-se extremidades coesivas s molculas de cDNA bicatenrio, segundo um dos esquemas seguintes : 1) 2) Adio de adaptadores sintticos que geram stios de restrio (Fig. 99.II.). Adio de extremidades homopolimricas complementares (Fig. 100.II.).

No termo destas manipulaes dispe-se de um banco de clones de cDNA.

65

6.

BANCOS GENMICOS

Um banco de cDNA de um rgo, ou de uma dada populao de clulas, representativo da populao de genes expressos nestas clulas. Na clula, s alguns milhares, entre centenas de milhares de genes dos cromossomas, so transcritos em mRNA. Um banco representativo do mRNA destas clulas contm forosamente menos clones diferentes que um banco representativo da totalidade dos genes (banco genmico), o que simplifica a procura de um gene. Um banco genmico uma coleco de clones plasmdicos ou de lisados fgicos, que contm molculas de DNA recombinante. A totalidade dos insertos individuais de DNA representa a informao gentica completa dum organismo. A estratgia geral para a construo de bancos genmicos requer primeiro o isolamento de fragmentos de DNA do organismo dado. Estes fragmentos tm, evidentemente, que representar o genoma inteiro e so derivados do DNA genmico total por digesto enzimtica ou ruptura mecnica suave. Estes fragmentos so em seguida introduzidos num vector ad hoc do tipo , ou cosmdeo, afim de assegurar a sua propagao (Fig. 101.II.). O nmero mnimo de clones necessrios para se obter a representao do genoma inteiro dum organismo pode ser calculado. A probabilidade P de se obter um gene especfico numa coleco de clones depende do comprimento dos insertos de DNA e da complexidade do genoma. Quanto maior e mais complexo for o genoma, maior o nmero de clones de um tamanho especfico necessrio para se obter uma representao completa da informao gentica. Este nmero N de clones pode ser determinado utilizando a frmula :

N=

ln(1 P ) ln(1 f )

em que P a probabilidade de se obter uma sequncia particular e f a relao entre o comprimento do inserto e a totalidade do genoma. A tabela 3.II. fornece as valores de N para um inserto de 20 kb e para as probabilidades de 90 % e de 99 % de se obter um clone particular. Estes valores devem ser considerados como uma estimativa por defeito, porque foram obtidos fazendo a hiptese que cada molcula hbrida tm uma capacidade de transformao semelhante e que cada colnia representa uma ocorrncia de transformao independente. A tabela 4.II. fornece o nmero de clones teoricamente necessrios para que o genoma aparea representado pelo menos uma vez, em funo dos tamanhos dos fragmentos clonados e da origem do genoma. No entanto, este nmero mnimo, s representa estatisticamente uma
66

possibilidade em duas de se encontrar o clone alvo. Em geral, necessrio escrutinar de 3 a 10 vezes o nmero mnimo de clones, para se ter uma probabilidade razovel de identificar um gene particular. O esquema de clonagem no DNA de fago e o empacotamento nos invlucros fgicos est ilustrado na Figura 102.II. A eficcia deste tipo de sistema muito elevada; obtm-se da ordem de 108 pfu/g de DNA (pfu = plaque forming units). Em princpio, qualquer gene para o qual existe um sistema de deteco apropriado, por exemplo, uma sonda de hibridao, pode ser isolado de um banco genmico, contanto que o banco satisfaa os critrios mencionados e seja realmente representativo. Se o banco genmico contiver fragmentos de DNA obtidos por digesto parcial, estes fragmentos apresentaro sobreposies e o banco oferecer a possibilidade de examinar a estrutura, no apenas de genes individuais, mas tambm de sequncias vizinhas. Este tipo de anlise conhecido por chromosome walking (Seco 1.1.b.8).

7.

MTODOS DE DETECO E DE ANLISE DE CLONES

Vrias tcnicas so utilizadas para detectar, entre os clones dum banco, os que comportam a sequncia de DNA desejada. a) Hibridao in situ entre o DNA dos clones recombinantes e uma sonda de DNA radioactiva (Fig. 103.II.) A sonda radioactiva pode ser um cDNA purificado, um RNA mensageiro purificado ou um oligonucleotdeo sinttico. Estas sondas so marcadas in vitro com 32P por nick + translation (cDNA) ou por quinao (oligonucleotdeo de sntese, RNA poli (A) ). b) Carta de restrio Os clones positivos por hibridao podem ser analisados por restrio. A carta de restrio em seguida comparada com uma carta conhecida ou terica (derivada da sequncia em aminocidos da protena cujo DNA foi clonado). c) Sequenciao dos nucleotdeos do inserto nos clones positivos por hibridao d) Seleco do mensageiro especfico por hibridao com o DNA recombinante e traduo in vitro Neste mtodo, o DNA plasmdico dos clones isolado e em seguida fixo num filtro de nitrocelulose. Em condies apropriadas de temperatura e de fora inica, hibrida-se com o RNA mensageiro total que serviu para a sntese do DNA complementar. S o RNA mensageiro, que possui sequncias complementares das do DNA imobilizado no suporte,
67

permanecer associado a este. Pode-se assim isolar este RNA mensageiro, extrai-lo do suporte e traduzi-lo num sistema de traduo in vitro. O produto codificado pelo RNA mensageiro em seguida identificado por imunoprecipitao com um anticorpo dirigido contra a protena cujo mensageiro foi clonado (Fig. 104.II.). e) Southern blotting Para localizar sequncias particulares de DNA nos fragmentos de restrio, utiliza-se o mtodo desenvolvido por Southern (Fig. 105.II.). O DNA clivado em fragmentos, que so separados em gel de agarose e em seguida transferidos para uma folha de nitrato de celulose. O filtro depois hibridado com uma sonda radioactiva apropriada. A autorradiografia da folha de nitrocelulose, depois de lavada, revela fragmentos contendo sequncias complementares das da sonda utilizada. Uma tcnica anloga existe para a caracterizao do RNA (chamada neste caso Northern blotting): os RNA totais ou mensageiros so separados em gel de agarose e depois transferidos para um suporte apropriado (nitrocelulose, papel activado, ...). A hibridao com uma sonda marcada permite em seguida conhecer o nmero e o comprimento dos RNA mensageiros complementares da sonda. f) Escolha das sondas de DNA sintticas Oligonucleotdeos sintticos, escolhidos judiciosamente podem ser utilizados para escrutinar um banco de clones por hibridao, ou para isolar um DNA complementar pouco abundante, contanto que se conhea, pelo menos, uma parte da sequncia dos aminocidos da protena, cujo gene se deseja clonar. Uma sequncia de alguns aminocidos suficiente para deduzir todas as sequncias do RNA que podem codificar para este pptido. Com efeito, se s a sequncia proteica for acessvel, a estratgia na escolha dos oligonucleotdeos a utilizar para escrutinar os bancos menos directa. O conhecimento da sequncia da protena no permite deduzir uma sequncia de DNA nica, devido degenerescncia do cdigo gentico. , no entanto, possvel sintetizar todas as sequncias nucleotdicas correspondentes. Uma das estratgias consiste em escolher, como sequncia alvo da sonda oligonucleotdica, uma regio correspondente a uma sequncia de aminocidos pertencendo aos menos degenerados. A Fig. 106.II. exemplifica a aplicao desta estratgia deteco de clones de cDNA da uroquinase humana. No s a complementaridade perfeita da sonda que crtica para obter uma boa hibridao; o seu comprimento igualmente importante. Quanto maior for a complexidade do DNA alvo, maior a probabilidade de nele existir uma sequncia qualquer dada, escolhida ao acaso. 4n o nmero total de sequncias diferentes possveis, constitudas pelos 4 nucleotdeos e com o comprimento de n nucleotdeos. A frequncia com que uma sequncia
68

dada de n nucleotdeos, considerada ao acaso, susceptvel de se encontrar num genoma de 3.5 109pb, como o genoma humano, dada pela equao: 3.510 9 4n Esta frequncia pois, de 1/5 para uma sequncia definida considerada ao acaso de 17 nucleotdeos. Para maior segurana e eliminar problemas de barulho de fundo, escolheu-se no exemplo dado n = 23. corrente utilizar uma mistura de fragmentos sintticos marcados, formada de todas as combinaes correspondentes degenerescncia, para escrutinar um banco de clones. Em condies adequadas, s um oligmero correspondente a uma sequncia clonada se hibridar com esta e dar um sinal aps autorradiografia. No exemplo da figura foi sintetizada uma mistura de 16 oligonucleotdeos, desprezando os codes menos provveis, afim de manter uma concentrao elevada do oligonucleotdeo perfeitamente complementar da sequncia alvo. Com efeito, quanto maior for a ambiguidade ao nvel da utilizao dos codes, mais difcil a utilizao da mistura dos oligonucleotdeos de grande comprimento, porque o nmero de possibilidades aumenta rapidamente e a concentrao do oligonucleotdeo nico, que corresponde verdadeira sequncia clonada alvo, diminui proporcionalmente. Neste contexto, uma outra estratgia, para evitar a sntese de misturas complexas e um grande nmero de desemparelhamentos entre a sonda sinttica e o DNA clonado, consiste em utilizar a desoxiinosina para substituir todas as bases ambguas. Este anlogo tem um comportamento aproximadamente neutro no emparelhamento entre as molculas de DNA e no destabiliza, ou destabiliza pouco, os hbridos.
N HO O N N OH
desoxiinosina

O N H

A especificidade de uma pequena sonda sinttica de cerca de 20 nucleotdeos notvel. Um nico desemparelhamento no interior da regio de emparelhamento, entre a sonda e a sequncia alvo, suficientemente destabilizador do hbrido para provocar a sua dissociao, em condies de temperatura e concentrao salina que mantm o hbrido perfeito estvel. Uma srie de regras, relativamente empricas, determinam a escolha e as condies de utilizao ptimas duma sonda oligonucleotdica. Nomeadamente, a temperatura de
69

hibridao deve ser determinada judiciosamente. Quanto mais baixa for a temperatura maior ser a probabilidade de o oligonucleotdeo se hibridar, no s com a sequncia pretendida, mas tambm com sequncias prximas; por outro lado, a temperatura no pode ser incrementada indefinidamente, dado que a eficincia da hibridao diminui com o aumento da temperatura e s de 50% temperatura de dissociao (Td) do DNA. A regra emprica seguinte permite calcular a temperatura de dissociao de hbridos formados com oligonucleotdeos de comprimento no superior a 18 nucleotdeos:

Td = ( A + T ) x 2 + (G + C ) x 4 C Esta temperatura aumenta 4C por cada par de bases G:C e 2C por cada par T:A hibridados entre o oligonucleotdeo e o DNA alvo, em condies de concentrao salina correntes (6xSSC: NaCl 0.9 M, citrato de Na 50 mM, pH 7). Para sequncias mais compridas conveniente utilizar a frmula seguinte, vlida para oligonucleotdeos de comprimento compreendido entre 14 e 60-70 nucleotdeos: Td = 81.5 16.6(log Na + + 0.41(%G + C ) (600 / N ) em que N o nmero de nucleotdeos. Na prtica, quando existem desemparelhamentos provveis subtrai-se 1C temperatura calculada, por cada 1% de desemparelhamento e efectuam-se as primeiras lavagens ps-hibridao a 1-10C abaixo da Td calculada. todavia possvel adoptar condies em que a temperatura de dissociao independente da proporo de G:C. Este efeito obtm-se utilizando uma concentrao 3M de cloreto de tetrametilamnio (ou de tetraetilamnio) em vez de NaCl, o qual se liga selectivamente s sequncias AT, aumentando a Td do DNA bicatenrio (a temperatura de dissociao de A:T passa a ser igual de G:C). A Tabela 5.II fornece a Td dos hbridos de DNA em funo do comprimento e da composio das sondas, nas condies mencionadas.

70

8.

A SNTESE QUMICA DE GENES

Uma alternativa clonagem de cDNA, ou de um gene a partir de fragmentos do DNA genmico, a sntese total do DNA correspondente a uma protena cuja sequncia conhecida. Esta abordagem vivel graas ao refinamento que atingiu a qumica de sntese dos oligonucleotdeos, tanto no que respeita aos rendimentos, como pureza dos produtos e rapidez da sua obteno, devido nomeadamente aos progressos realizados no campo do automatismo (vd. Seco 1.1.c.). No entanto, dada a impossibilidade de as reaces qumicas atingirem repetidamente rendimentos de 100 %, existe um limite ao comprimento dos fragmentos de DNA que possvel sintetizar quimicamente. A sntese total de um gene realiza-se, por consequncia, por complementao de meios qumicos e de meios enzimticos. Actualmente, possvel obter, em condies optimizadas de sntese, fragmentos de uma centena de desoxinucleotdeos, com um grau de pureza aceitvel. O exemplo das Fig. 107.II, 108.II e 109.II ilustra a sntese do gene do hGRF (human Growth Hormone Releasing Factor, factor de libertao da hormona humana de crescimento), descrita em 1985 e realizada por mtodos manuais. O princpio da sntese do gene permanece vlido. O hGRF uma pequena protena de 44 aminocidos, de cuja sequncia foi deduzida a sequncia nucleotdica das duas cadeias do gene. Foram includos nos fragmentos sintticos, o codo de fim de traduo e um stio Sal I, que servir para a clonagem do gene num plasmdeo linearizado pela mesma enzima. Os fragmentos a sintetizar foram definidos de maneira a que cada um deles seja complementado por hibridao com dois outros, conduzindo, aps a sua mistura em soluo, a uma estrutura correspondente sequncia do gene, mas apresentando ainda nicks entre 2 fragmentos consecutivos. O fecho destes nicks realiza-se com uma ligase, que estabelece enzimticamente a ligao covalente entre o fosfato em 5' e o HO em 3', de dois oligonucleotdeos consecutivos, mantidos nas suas posies correctas por hibridao entre bases complementares (Fig. 108.II.). A figura ilustra esquematicamente as diferentes etapas no sentido antittico, i.., por ordem inversa da realizao, na prtica, da sntese do gene. No sentido sinttico, cada um dos fragmentos purificados, depois de sntese, (excepto os que correspondem s extremidades 5' da construo final) fosforilado enzimticamente. Os fragmentos so em seguida misturados em condies que favorecem a sua hibridao correcta (annealing), e ligados. O fragmento A31 na extremidade 5' do gene possui uma extremidade coesiva prpria para entrar num sitio de restrio NcoI (Fig. 109.II). uma variante da construo indicada na Fig. 107.II (comparar com A27), que ilustra a
71

flexibilidade introduzida pela possibilidade de sintetizar fragmentos de DNA de sequncia definida. Os oligonucleotdeos nas extremidades da construo contm, no s as sequncias prprias ao gene, mas tambm sequncias correspondentes a stios de restrio teis, funcionando, portanto, igualmente como adaptadores, na construo. A clonagem deste gene exemplifica outras aplicaes dos oligonucleotdeos sintticos. Afim de expressar este gene sinttico numa bactria, este inserido num plasmdeo, construdo a partir do vector pCQV2 (Fig. 110.II), no qual o promotor PR de foi substitudo pelo promotor PL de , mais eficiente. Este foi introduzido por ligao de fragmentos sintticos, contendo a sequncia do PL, com o plasmdeo em que foi suprimida a sequncia PR. Os fragmentos sintticos comportam, alm das sequncias do PL, sequncias correspondentes ao stio de fixao do ribossoma (RBS-"Ribosoma Binding Site") e a stios mltiplos de restrio, potencialmente teis para outras construes eventuais. A linearizao do plasmdeo, digerido pelas enzimas NcoI e SalI, expe as extremidades coesivas s extremidades complementares do gene sinttico. Em presena de um excesso deste ltimo, o vector readquire a sua forma circular, ao hibridar as suas extremidades complementares e enfim, a aco enzimtica da ligase estabelece as ligaes covalentes. Aps transformao bacteriana com a mistura de ligao, as colnias transformadas com o plasmdeo que contm o inserto sinttico, podem ser seleccionadas por hibridao com um dos oligonucleotdeos marcados que serviram para a construo do gene. A visualizao, como j vimos, baseada na marcao radioactiva do oligonucleotdeo, por fosforilao enzimtica com uma quinase e 32P-ATP. O oligonucleotdeo marcado hibridar-se- com a sua sequncia complementar, no inserto e s as colnias transformadas pelo plasmdeo contendo o hGRF e imobilizadas num filtro de nylon ou de nitrocelulose emitiro um sinal radioactivo.
Sntese de genes por sntese qumica conjugada com PCR

Esta abordagem mais actual que a acima descrita tira partido das potencialidades da tcnica da PCR (fig. 5.26). A primeira etapa consiste em sintetizar quimicamente um par de oligonucletidos (A e B) que se sobrepem parcialmente por hibridao de bases complementares correspondendo regio central do gene. As extremidades 3 retradas so prolongadas por aco duma polimerase termoestvel em condies de amplificao por PCR. Oligonucleotdeos sintticos (C e D) complementares das extremidades do produto do primeiro ciclo de PCR so adicionados, formando-se molculas que se sobrepem parcialmente como anteriormente, aps desnaturao e re-naturao. As extremidades recessivas so preenchidas durante a amplificao por PCR, como na etapa precedente. Seguidamente so adicionados mais dois oligonucleotdeos (E e F) que se sobrepem s extremidades do produto do segundo ciclo de PCR e um terceiro ciclo efectuado. O produto PCR final uma molcula de DNA bicatenrio com uma sequncia definida e especfica de
72

nucleotdeos. Os pares de letras com ou sem linha (ex., A e A) representam oligonucleotdeos complementares, sem linha sintetizado quimicamente, com linha intoduzido exclusivamente por PCR.

9.

SISTEMAS DE EXPRESSO: ORGANISMOS HOSPEDEIROS - VECTORES

Um certo nmero de produtos biolgicos no pode ser obtido em quantidade suficiente para permitir um estudo pormenorizado da sua estrutura e da sua funo. Clonar o DNA correspondente a estes produtos no basta, tambm preciso poder express-los em abundncia. Como vimos, um gene no unicamente uma sequncia de DNA codificando para uma sequncia de aminocidos, mas comporta ainda um conjunto de sinais moleculares, que diferem de um organismo para outro (idnticos ou parecidos, por exemplo, entre mamferos, mas diferentes na levedura ou no colibacilo). Estas diferenas tm que ser consideradas para optimizar a expresso, tanto para fins de produo como de investigao. Alm disso, os vectores possuem a sua prpria coerncia gentica e no so capazes de se multiplicar em qualquer hospedeiro (so-no em geral s no hospedeiro de origem).
a. Expresso em E. coli

Vectores de expresso em E. coli O colibacilo o hospedeiro mais utilizado, tirando a sua supremacia das vantagens inerentes sua gentica relativamente bem conhecida, facilidade de ser cultivado, recuperado e lisado; tem sido utilizado para a produo em massa de algumas protenas. Exemplos de vectores de expresso muito utilizados em E. coli so os plasmdeos multicpias, comportando um promotor forte de origem bacteriana ou fgica (trp, lac, lpp, PR ou PL de ). A existncia deste promotor forte assegura a transcrio eficaz do gene clonado a jusante, mas no garante necessariamente a sua expresso eficaz. , evidentemente, necessrio que os sinais moleculares apropriados estejam presentes: o promotor que indica o local onde a cpia do gene em mRNA comea, a sequncia de Shine-Dalgarno, stio de fixao reconhecido pelos ribossomas, o local da iniciao da traduo do mRNA em protena, os sinais de fim de transcrio e de traduo. Alm disso, preciso conceber o sistema de tal maneira que o produto resultante da expresso do DNA clonado seja autntico, e no na forma de fuso com um fragmento proteico codificado pelo plasmdeo.
73

igualmente necessrio evitar a presena e o efeito de sinais de terminao fortuitos da transcrio (efeitos polares), assegurar-se da estabilidade do RNA mensageiro resultante da transcrio do gene clonado, assim como da protena sintetizada e enfim, do efeito letal potencial do produto superexpresso, no crescimento do organismo hospedeiro. O vector de expresso ideal deve teoricamente possuir as seguintes propriedades: 1. Ser estvel, para no se perder nem modificar o gene estrangeiro. 2. Estar representado em nmero elevado e constante em cada clula, para aumentar o nmero de cpias do gene, susceptveis de serem traduzidas em protenas. 3. Poder funcionar como vector vaivm (shuttle), quer dizer poder multiplicar-se em mais de um tipo de hospedeiro. 4. Possuir genes marcadores de seleco, como por exemplo de resistncia aos antibiticos. 5. Possuir um sistema de expresso potente (promotor forte), que permita uma produo abundante de protena. 6. No possuir sequncias terminadoras que interrompam prematuramente a transcrio. 7. Ser concebido de maneira que se possa inserir nele, facilmente e correctamente (em fase de leitura), o cDNA ou o gene que se deseja expressar. 8. Possuir as instrues moleculares, as sequncias de DNA que permitam a sntese de uma protena que seja segregada para fora da clula, para facilitar o seu isolamento e purificao. Esta ltima propriedade proporcionada por uma curta sequncia de aminocidos, que precede a sequncia da protena propriamente dita, a sequncia sinal. Ela orienta a sntese da protena nascente para a secreo para fora da clula. Esta sequncia clivada, perdida, durante a passagem da protena atravs da membrana. A obteno da protena no meio extracelular tm vantagens na produo industrial, porque facilita a sua purificao, j que no fica perdida no meio da massa de protenas celulares. Por outro lado, uma toxicidade eventual da protena em relao ao hospedeiro ser reduzida. Enfim, mesmo pequenos pptidos que seriam normalmente destrudos no seio da clula, podem ser produzidos. O vector de expresso ideal no existe. Para optimizar a expresso de um gene e o rendimento de obteno duma protena particular, necessrio dispor de um bom sistema expresso-hospedeiro que no forosamente universal.

74

1) Construo de vectores de expressobaseados no promotor lac O DNA que se pretende expressar (um cDNA por exemplo) removido do plasmdeo de clonagem original por digesto enzimtica (por exemplo, PstI, Fig 111.II). Um local de restrio em seguida colocado na proximidade do codo de iniciao ATG. O DNA primeiramente submetido aco combinada das enzimas ExoIII e S1, ou de Bal31. As condies de digesto dependem da distncia entre o local de clivagem inicial (neste exemplo PstI) e o codo ATG, e devem ser ajustadas separadamente para cada caso particular. O fragmento de DNA em seguida ligado com linkers, neste exemplo EcoRI, de maneira a poder ser inserido no local EcoRI de um vector adequado. Antes da clonagem, o fragmento digerido por EcoRI e outra enzima de restrio que cliva no local X, no interior do gene. Obtm-se assim fragmentos com uma extremidade direita definida, que pode ser utilizada para mais tarde reconstruir o gene inteiro. Se bem que a extremidade esquerda seja definida pelo local EcoRI, a distncia entre este local e o codo de iniciao ATG varia duma molcula para outra. A ligao a um vector adequado dar origem a uma gama larga de clones diferentes, nos quais a distncia entre o local EcoRI e ATG varia. Certos insertos podero no estar na fase de leitura correcta. Os clones na fase correcta de leitura podero, todavia, ser identificados, explorando o fenmeno da complementao (vd. Seco 1.1.b.2). Para isso, como no caso da clonagem em M13, foram construdos vrios plasmdeos da srie pUC (Fig. 112.II). Estes plasmdeos possuem a regio de regulao lac e uma parte do gene lac Z que codifica os 59 aminocidos N-terminais da -galactosidase. A estirpe hospedeira (JM 83) possui a eliminao M15 do opero lac, correspondente remoo dos aminocidos 11-44 da -galactosidase, mas conserva a parte C-terminal completa da enzima. Todos os genes lac Z incompletos expressaro um polipptido inactivo. Todavia, estes polipptidos podero complementar a parte C terminal da enzima produzida pela bactria, na forma de agregados. A actividade enzimtica resultante poder ser detectada em placas com indicador X-gal. Os plasmdeos pUC 7, 8, 9, 12, 13, 18 e 19 contm polilinkers no interior da regio do gene lac Z, correspondente aos 59 aminocidos N-terminais. Estes polilinkers possibilitam a clonagem de fragmentos de DNA comportando diferentes extremidades. Os polilinkers no interferem com a complementao , se a fase de leitura correcta for preservada. Quando os fragmentos de cDNA de diferentes comprimentos, descritos acima (Fig. 111.II), so inseridos no polilinker dum plasmdeo pUC, unicamente os clones possuindo inseres na fase de leitura correcta, relativamente -galactosidase, originaro colnias azuis. O comprimento mximo dum inserto, que d ainda lugar complementao , no conhecido; , pois, prefervel clonar fragmentos de DNA relativamente curtos. A intensidade do azul dos diferentes clones bastante varivel; os de colorao mais intensa apresentam um nvel de expresso mais elevado e podem ser seleccionados para receberem a parte do gene
75

que falta, para a produo da protena completa fusionada. As protenas fusionadas, com longas sequncias peptdicas que incluem a parte N-terminal da -galactosidase ( 600 aminocidos), so, em geral, insolveis no interior da clula bacteriana, o que as protege da degradao proteoltica e pode facilitar a purificao. , geralmente, possvel detectar determinantes antignicos na protena fusionada. No entanto, a protena pretendida deve poder ser separada da componente bacteriana, do produto quimrico fusionado. A clivagem com o brometo de cianognio (vd. mais abaixo) limitada s protenas que, tais como a proinsulina, no possuem metioninas internas. Caso contrrio, necessrio recorrer clivagem enzimtica, que exige construes comportando codes codificando sequncias de aminocidos especficos (p. ex., Arg e Lys, tpicos da clivagem trptica, i. ., pela tripsina), sensveis a proteases, que evidentemente no podem estar presentes na sequncia da protena fusionada. Duma maneira geral, este sistema de expresso de protena fusionada til para a produo de pequenas protenas e de pptidos. Para produzir directamente protenas no fusionadas, a sntese proteica deve ser iniciada, no na primeira metionina do pptido guia procaritico, tal como lac Z ou trp E, mas na primeira metionina do prprio pptido pretendido. As construes biologicamente activas possuem pois, em geral, promotores procariticos indutveis e um stio de fixao ribossmico hbrido, constitudo pela sequncia bacteriana de Shine-Dalgarno e por um codo ATG, correctamente distanciado, que no tem que ser necessariamente de origem bacteriana. No caso duma protena eucaritica, este ATG pode constituir o prprio codo de iniciao do gene eucaritico. 2) Vectores baseados no promotor PL de O plasmdeo pAS1, representado na Fig. 113.II, deriva do plasmdeo pBR322 e comporta sinais de regulao derivados do fago . O promotor PL foi escolhido em particular, porque a eficcia com a qual ele permite a transcrio parece superior da maioria dos promotores bacterianos (lac, por exemplo). A fim de poderem controlar a transcrio iniciada a partir de PL, os inventores do vector introduziram um sistema de represso na bactria hospedeira, cujo genoma comporta um profago contendo um repressor cI termo-lbil, cI857. Nas bactrias lisognicas, a transcrio a partir de PL inibida pelo repressor cI, em contnuo, mas unicamente a 30C, i. ., a temperaturas em que o repressor termo-estvel. Um simples aumento da temperatura de crescimento das bactrias (32C 42C) desencadeia a transcrio a partir de PL, visto que, nestas condies, o repressor desactivado e deixa de bloquear o promotor.

76

Na prtica, as bactrias portadoras do vector pAS1 podem ser cultivadas em massa a 30C, sem que haja expresso do gene clonado a jusante do promotor, e serem em seguida induzidas a 42C, para sintetizar o produto do gene. Esta possibilidade de controlar a expresso do gene clonado no vector, e de o poder induzir rapidamente, permite obter uma super-expresso dos produtos clonados num prazo curtssimo. Estas propriedades so particularmente importantes para a expresso de produtos que poderiam ser txicos para o hospedeiro no qual eles so sintetizados, e/ou cuja estabilidade no hospedeiro pouco elevada. Alm disso, o vector pAS1 concebido de maneira a assegurar uma transcrio eficaz, por intermdio de PL, atravs de qualquer sequncia de DNA clonada a jusante. Para isso, o vector comporta, a jusante de PL, os stios nut (utilizao de N, stio de reconhecimento necessrio para a aco de N) e a bactria lisognica fornece o produto N (protena antiterminadora). A expresso de N, no hospedeiro lisognico, suprime a polaridade transcricional, permitindo RNA polimerase ler atravs de tL e tR (terminadores esquerdo e direito) e impede, por consequncia, qualquer paragem fortuita da transcrio, na unidade de transcrio PL e na sequncia de DNA clonada a jusante. de notar, que um terminador natural tR1 de , derivado da construo, existe no vector e que o seu efeito contrariado por N e nutR. Por fim, o vector pAS1 comporta os sinais de regulao da traduo, necessrios expresso de sequncias de DNA que no possuam estas informaes. Para este efeito, no gene cII de , gene expresso eficazmente, foi suprimida a sua sequncia codificante, de maneira a manter unicamente a regio de Shine-Dalgarno e o triplet de iniciao. Imediatamente adjacente ao triplet ATG, foi introduzido um local de restrio nico, prtico (BamH1), que permite a fuso directa de qualquer sequncia codificante, a jusante do ATG, e a obteno duma juno na fase correcta de leitura, mediante adaptaes para cada caso particular. Em certos casos, a utilizao do vector de expresso pAS1 conduz produo de 10 a 20 % da protena desejada, em relao s protenas totais. 3) gt11 - vector de expresso derivado do fago Este vector, representado na Fig. 114.II., comporta um local de restrio nico, EcoRI, que permite a insero de DNA exgeno (possuindo extremidades EcoRI naturais ou adicionadas) no gene da -galactosidase (lacZ). Esta insero conduz sntese de protenas hbridas (em fuso com a -galactosidase), sob a aco do promotor lac, em presena do indutor IPTG (indutor gratuito que desactiva o repressor, impedindo-o de se fixar ao operador
77

de Z-lac, Y-permease e A-transacetilase, ao mesmo ttulo que o indutor natural, a lactose, mas sem ser consumido pela enzima; vd. Seco 1.1.b.2). Como a protena fusionada perde a actividade -galactosidsica, possvel, em presena de Xgal, distinguir os fagos recombinantes (placas brancas) dos fagos no recombinantes (placas azuis com indicador Xgal). O vector comporta ainda o repressor cI termo-lbil (cI857) e uma mutao sem sentido no gene S de , que torna a lise defectiva (na ausncia de supresso pelo hospedeiro, supF). Por consequncia, as bactrias lisognicas podem ser induzidas a 42C, para acumularem grandes quantidades de produtos fgicos, sem que haja lise. Esta pode ser efectuada expondo as colnias a vapores de clorofrmio. Por outro lado, o hospedeiro bacteriano possui o repressor do gene lac Z, que impede a expresso da protena fusionada, durante as primeiras horas do crescimento. s no momento apropriado, que se desactiva este repressor com o indutor IPTG, levando produo macia da protena fusionada. A eficcia de clonagem do sistema gt11 de + 107 pfu/g de DNA. O escrutnio dos fagos recombinantes pode realizar-se de duas maneiras: 1) 2) por hibridao com uma sonda de DNA marcada; por deteco imunolgica.

A expresso correcta do DNA clonado no gt11, depende da orientao e da fase de leitura do inserto em relao s do gene lac Z.

Identificao das placas produtoras Um dos mtodos de deteco das protenas produzidas pelo fago recombinante baseia-se na interaco dessas protenas com anticorpos dirigidos contra elas. Na prtica, reveste-se um suporte slido, inerte, com esses anticorpos e em seguida expe-se esta matriz s colnias (placas), lisadas in situ. Os stios de fixao do antignio podem ser detectados por incubao com o anticorpo marcado (com 125I ou com peroxidase, por exemplo). A autorradiografia do suporte slido, ou a reaco corada com um substrato cromognico da peroxidase, revela as colnias produtoras do antignio que se procura (Fig. 115.II.). Alternativamente, o mtodo de western blotting permite identificar o antignio produzido no seio duma populao de protenas. Este mtodo baseia-se na separao dos componentes proteicos dum extracto total, derivado de bactrias, por exemplo, por electroforese em poliacrilamida e em seguida, na transferncia elctrica destas protenas para uma folha de nitrocelulose, onde elas aderam fortemente. A folha de nitrocelulose embebida num
78

anticorpo, especfico da protena que se procura identificar e em seguida, aps lavagem, tratada com um segundo anticorpo, dirigido contra a parte constante do primeiro anticorpo e marcado com a peroxidase. Por fim, um substrato cromognico permite revelar os complexos imunoespecficos (Fig. 116.II.).

Limitaes da produo na bactria E. coli tm, no entanto, vrios inconvenientes, derivados da sua incapacidade em processar as protenas, realizar modificaes ps-traducionais, que so muitas vezes necessrias para a sua actividade biolgica (p. ex., glicosilao, fosforilao, carboxilao), e em segregar certas protenas para fora do citoplasma, que por vezes se acumulam em grandes quantidades no citoplasma, de forma insolvel e inactivas, cuja renaturao extremamente difcil. Estes agregados tm o nome de corpos de incluso (inclusion bodies), partculas constitudas essencialmente de protena recombinante ou polmeros derivados, no reductveis e de protenas endgenas, tais como RNA polimerase, protenas de membrana e de rRNA e de DNA plasmdico. Para libertar a protena usual recorrer a agentes caotrpicos fortes, tais como a ureia 6 M ou o cloridrato de guanidina 8 M. O enrolamento correcto da protena depois de remover o agente desnaturante, frequentemente um passo bastante difcil, por vezes impossvel, nomeadamente com protenas de elevado peso molecular e numerosas pontes dissulfureto. Por consequncia, protenas, como o activador tissular de plasminogneo (t-PA) ou o factor VIII da coagulao sangunea, so produzidas de preferncia em cultura de clulas de mamferos. Certas protenas, tais como o interfero-2 (IFN-2), o interfero (IFN-) ou a protena MX (induzida pelo interfero), que formam agregados insolveis e so inactivas, quando produzidas em culturas de E. coli a 37C, podem ser obtidas na forma solvel e activa, quando a temperatura da cultura de 30C ou abaixo. Uma medida possvel para obter protenas solveis , portanto, diminuir a temperatura de crescimento das culturas e evitar vectores plasmdicos indutveis termicamente. A protena exgena, formada no citoplasma da clula bacteriana, que um meio redutor menos estvel que o citoplasma das clulas de mamfero e sujeito a variaes de composio, para manter o pH e as propriedades osmticas, apresenta-se na sua forma reduzida. S depois da lise bacteriana, a molcula pode formar as pontes dissulfureto, o que pode ser uma dificuldade suplementar na aquisio da conformao correcta, tanto menos provvel quanto o nmero de tomos de S for maior. Alm disso, pequenos pptidos de E. coli, como por exemplo o glutatio, podem fixar-se nos tomos de enxofre livres e perturbar a formao das
79

pontes S-S, conduzindo a protenas anormalmente enroladas. Sabendo-se que, a menor anomalia em relao molcula nativa pode influir nas suas propriedades imunognicas e que uma protena produzida, para ser utilizada com fins teraputicos, no pode provocar o aparecimento de anticorpos, podem-se prever impasses frequentes. Assim, apesar dos sucessos obtidos na sntese de algumas protenas de mamfero, na forma solvel, em E. coli, outras vias tm sido exploradas para forar a sua secreo para fora do citoplasma. E. coli e, em geral as bactrias gram-negativas, possuem uma membrana, que se pode considerar dupla, constituda por uma parede interna rgida, coberta por uma camada exterior menos espessa, composta por protenas, lipoprotenas e lipopolissacridos. As protenas segregadas para fora do citoplasma acumulam-se, em geral, neste espao periplasmtico que constitui um meio mais favorvel ao seu enrolamento correcto. Existem exemplos que demonstram que esta abordagem uma alternativa interessante. A protena, para ser segregada para o periplasma, deve possuir uma sequncia sinal, que dirija a cadeia polipeptdica atravs da parede interna da membrana. O pptido sinal , normalmente, clivado, durante a travessia para o espao periplasmtico, por uma protease que reconhece uma sequncia particular de aminocidos. Produo da hormona de crescimento humana (hGH) Um exemplo de produo em E. coli, escala industrial, de uma protena segregada no espao periplasmtico, o da hGH. Esta hormona um polipptido de 191 aminocidos, segregada pela hipfise. utilizada para estimular o crescimento de crianas, cuja deficincia parcial ou total em hGH se traduzir na idade adulta por uma altura abaixo do mnimo, ou por uma estatura de ano. A aco da hormona de crescimento no se limita estimulao do crescimento do esqueleto. Ela permanece pela vida inteira, mesmo aps a interrupo do crescimento. A hGH est, com efeito, implicada no crescimento da massa de todos os tecidos do corpo. Ela parece tambm poder ser utilizada eficazmente no tratamento de fracturas, de queimaduras e de lceras. Esta hormona especfica de espcie (a hormona de crescimento isolada de diferentes espcies sem aco na espcie humana), razo pela qual, a sua nica fonte, antes do advento das tcnicas de engenharia gentica, provinha da hipfise extrada de cadveres humanos. Para alm da insuficincia do material assim obtido, para curar todos os casos de deficincia, existe ainda o risco de contaminaes, provenientes de purificaes insuficientes de hGH, a partir de glndulas infectadas. A cadeia polipeptdica, no momento da sua sntese na hipfise, na forma de precursor, comporta 217 aminocidos. Os 26 aminocidos suplementares em relao protena madura, correspondem sequncia sinal. O enrolamento no espao, preciso e complexo, cuja
80

estabilizao , em parte, assegurada por duas pontes S-S, est representado na Fig. 117.II, de maneira muito rudimentar. Uma primeira abordagem, para a clonagem e a expresso do DNA que codifica a hGH, ignora a sequncia sinal e visa a produo no citoplasma da protena madura. A clonagem recorre combinao de dois mtodos. Por um lado, um DNA complementar foi obtido por cpia do RNA mensageiro da hGH, derivado da hipfise; por outro, um fragmento de DNA correspondente aos aminocidos 1 a 24, provido com um triplet de iniciao, foi sintetizado quimicamente (Fig. 118.II.). Os dois fragmentos foram introduzidos, aps ligao, num vector de expresso, a jusante dum promotor forte (lac). O plasmdeo recombinante foi em seguida utilizado para transformar um hospedeiro bacteriano. Os clones obtidos foram seleccionados pela resistncia a um antibitico e caracterizados por hibridao com sondas radioactivas apropriadas. Os clones que contm a informao gentica da hGH produzem a hormona de crescimento humana, cuja actividade biolgica foi demonstrada por imunoensaio e por testes in vivo, em ratos desprovidos de hipfise. A actividade biolgica manifesta-se por um aumento de peso e um crescimento, nos ratos, da cartilagem das tbias. A natureza do produto clonado idntica do produto natural, no que respeita actividade biolgica. No entanto, a metionina presente na extremidade NH2 da protena (derivada do codo de iniciao ATG e que, durante o processo natural, eliminada com o pptido sinal) no clivada na bactria. A protena expressa no pode, por consequncia, ser considerada rigorosamente autntica, visto possuir um aminocido a mais (met-hGH). A percentagem de expresso varia de 2 a 30 % de protenas solveis, segundo o tipo de promotor utilizado. Neste exemplo, a hGH produzida no citoplasma e no segregada. No entanto, ao contrrio doutras protenas super-expressas na bactria, a hGH permanece solvel e produzida por fermentao a grande escala e purificao em grandes quantidades (Tabelas 6.II. e 7.II.). A quantidade obtida, a partir dum fermentador de 500 litros, equivalente obtida por extraco de 12.000 hipfises de cadveres. A met-hGH clinicamente activa, se bem que, a longo termo, a experincia clnica revele o aparecimento de anticorpos no neutralizantes, em quantidade reduzida. O seu efeito, ao longo de vrios anos de tratamento, uma incgnita. O aparecimento de anticorpos pode estar correlacionado com um perfil antignico particular da hGH produzida por engenharia gentica. A presena da metionina excedentria poderia, por exemplo, conferir uma estrutura terciria particular hormona e criar um stio antignico novo. O enrolamento diferente da met-hGH poderia ser, igualmente, causado pelo facto de as pontes dissulfureto, S-S (que estabilizam normalmente a molcula enrolada), se formarem unicamente no momento da lise da bactria (devido ao meio redutor do citoplasma). No momento da lise, pequenos pptidos de E. coli podem-se fixar ao nvel dos tomos de enxofre das cistenas e perturbar a formao das pontes S-S internas,
81

conduzindo a molculas anormalmente enroladas. Uma contaminao, mesmo fraca, da hormona, por produtos bacterianos, pode tambm ser responsvel pela resposta imunitria. Uma segunda abordagem recorre clonagem do DNA completo, incluindo a sequncia que codifica para o pptido sinal da hGH (Fig. 119.II.). Esta sequncia sinal de mamfero reconhecida pelos mecanismos celulares bacterianos, que presidem expulso das protenas para fora do citoplasma. A hGH acumula-se no espao periplsmico, libertada da sequncia sinal, clivada durante a travessia da parede interna da membrana citoplsmica (Fig. 120.II.). Ela comporta, por consequncia 191 aminocidos, como a molcula natural. possvel extrair a hormona acumulada no periplasma, sem ter que recorrer lise das clulas bacterianas (Fig. 121.II.). Utiliza-se a tcnica do choque osmtico, que consiste num primeiro tempo, em mergulhar as bactrias numa soluo muito concentrada de soluto. Nesta soluo hipertnica, a clula retrai o citoplasma, aumentando por consequncia o espao periplsmico, onde se acumulam as molculas de hGH. Num segundo tempo, as bactrias so transferidas bruscamente para um meio muito pouco concentrado de soluto. Nesta soluo hipotnica o citoplasma aumenta brutalmente de volume, reduzindo o espao periplsmico ao mnimo e forando as molculas de hGH a atravessar os poros da parede exterior da membrana. A protena recuperada do meio extracelular muito pouco contaminada por protenas bacterianas. As anlises fsicas e qumicas da hGH, obtida por esta metodologia, revelaram propriedades idnticas s da protena natural. As anlises clnicas tendem a comprovar que no h desenvolvimento de anticorpos nas crianas tratadas com este produto. A secreo da hGH para o meio de cultura de E. coli a terceira via possvel. Um exemplo desta abordagem recorre transformao de E. coli com dois vectores, um dos quais, pOmpA-hGH2, expressa a protena hbrida, constituda pela sequncia sinal de OmpA (Outer membrane protein A, protena cuja expresso regulada pela osmolaridade do meio) e da cadeia polipeptdica da hGH (a Fig. 122.II. esquematiza os passos essenciais da construo deste vector) e o outro, pJL3 expressa a BRP (Bacteriocin Release Protein), protena que activa a fosfolipase A da membrana externa, permeabilizando as membranas interna e externa. A sequncia sinal de OmpA guia a cadeia polipeptdica atravs da membrana interna e a BRP leva formao de zonas permeveis nas membranas celulares, atravs das quais a hGH pode passar e ser libertada no meio de cultura. A Fig. 123.II. ilustra alguns elementos essenciais dos vectores utilizados. O vector de secreo, pOmpA-hGH2, possui o sistema promotor-operador lpp-lac, que regulado pelo repressor lac. A induo parcial da sntese de hGH, em E. coli, provocada, cultivando as clulas em meio rico, (TY), que contm lactose, ou em presena de nveis fracos ou moderados de IPTG. O vector contm ainda a sequncia ompA que codifica o pptido sinal, o
82

qual, fusionado ao DNA da hGH, orienta a sua secreo. Este plasmdeo, pOmpA-hGH2, comporta o gene de resistncia ampicilina. O plasmdeo pJL3 possui o mesmo hbrido, composto do promotor de lipoprotena (lppp) e do promotor-operador lac (lacpo) de E. coli, que o vector de secreo, e que dirige a expresso do gene de BRP clonado a jusante. A expresso desta protena tambm regulada pelo repressor lac, codificado pelo gene lacI. O cloranfenicol utilizado como marcador de resistncia. Os dois plasmdeos so compatveis, e aps co-transformao de E. coli, os transformantes so seleccionados com base na resistncia dupla aos antibiticos. Os dois genes, de BRP e de hGH, so pois regulados pelo repressor lac. Em presena de uma concentrao baixa de isopropil-1-tio--D-galactopiranosdeo (IPTG, 20 mM), tanto a BRP, como a protena hbrida OmpA-hGH se expressam e a hormona de crescimento madura libertada no meio de cultura, processada correctamente. Com efeito, a sequncia de aminocidos N-terminal correcta, o que indica que o pptido sinal foi clivado como se esperava (Fig. 124.II.). O nvel de produo situa-se na ordem de 4,5 mg/ml. Apesar de ser mais baixo que o rendimento da secreo periplsmica (10-15 mg/ml), a purificao, numa nica etapa, por HPLC, em coluna de fase reversa, atinge 98 %. Este sistema tm a vantagem de no requerer, nem a lise das clulas bacterianas, nem operaes suplementares para permeabilizar ou romper a membrana exterior, necessrias no caso da produo periplsmica. Um dos interesses maiores desta tcnica a possibilidade terica de poder, no futuro, assegurar uma produo em contnuo a partir de clulas de E. coli, imobilizadas num suporte slido. necessrio, evidentemente, avaliar previamente o comportamento imunognico da protena in vivo. Outros sistemas de secreo no meio de cultura de E. coli tm sido estudados, que favorecem a permeabilizao da membrana exterior, recorrendo a mutaes especficas ou hiper-expresso de outras protenas que alteram a permeabilidade da membrana, tais como o pptido kil. Este pptido induz a secreo de protenas heterlogas ou homlogas, em duas etapas, primeiro actuando sobre a membrana citoplsmica, em seguida permeabilizando a membrana externa.

Hormonas de crescimento animais Para alm da hGH, outras hormonas de crescimento de origem animal (porco, boi...) foram objecto de trabalhos de clonagem. Visto ser a hormona de crescimento especfica de espcie, a produo de hormona de crescimento de porco e de boi, com fins veterinrios,
83

impunha-se. A estratgia adoptada paralela que conduziu produo da hGH. O RNA mensageiro foi extrado a partir de hipfise de porco e de boi, e o DNA complementar foi sintetizado e clonado num vector plasmdico. A anlise das sequncias nucleotdicas mostrou que os dois cDNA so muito homlogos (+ 90 %). As hormonas diferem apenas em 18 aminocidos. As duas sequncias contm uma sequncia sinal, que codifica um pptido (27 e 20 resduos) implicado na secreo da hormona pelas clulas somatotrpicas. Para expressar os cDNA em E. coli, recorreu-se, como acima descrito com a hGH, a uma construo que comporta adaptadores sintticos, contendo um codo ATG em 5' e a sequncia de bases correspondente aos primeiros 24 aminocidos da hormona. Estes fragmentos sintticos foram, depois de associados e ligados, fusionados num vector de expresso. A expresso, obtida em elevado nvel, em E. coli leva produo da hormona sem sequncia sinal.

Produo de insulina humana A insulina uma hormona peptdica segregada pelas clulas pancreticas e presente na circulao sangunea. A insuficincia em insulina conduz ao diabete, perturbao grave do metabolismo dos glcidos, dos lpidos e dos prtidos. Esta hormona, antes da aplicao das tcnicas da engenharia gentica, era isolada a partir das fontes convencionais, para ser utilizada no tratamento do diabete. Ela comporta um pptido sinal, que permite o transporte da molcula atravs das membranas intracelulares. Durante o transporte, este pptido sinal clivado. O resto da molcula , em seguida, armazenado nas vesculas ligadas membrana das clulas pancreticas. A forma acumulada nas vesculas, chamada proinsulina, difere da insulina fisiologicamente activa (Fig. 125.II.). A proinsulina um polipptido simples, enrolado numa forma particular, que estabilizado por 3 pontes dissulfureto. A insulina madura , pelo contrrio, constituda por duas cadeias separadas, uma de 21 aminocidos (cadeia A) e a outra de 30 aminocidos (cadeia B), mantidas associadas pelas mesmas pontes S-S. A proinsulina convertida em insulina, no seio das vesculas pancreticas, por maturao enzimtica do precursor e libertao dum polipptido excedentrio, de 33 aminocidos (pptido C). A insulina madura , em seguida, acumulada na forma de complexo com ies de zinco, pronta para ser exportada. Resumindo, a insulina existe em 3 formas: a pr-proinsulina (produto de traduo original), a proinsulina (destituda de pptido sinal) e a insulina activa. A insulina produzida actualmente em E. coli, programada por tcnicas de DNA recombinante, numa forma idntica da insulina natural. Conhecendo a sequncia de
84

aminocidos das cadeias A e B da insulina humana, possvel reconstituir, por sntese, os fragmentos de DNA correspondentes (cadeia A: 63 pares de bases e cadeia B: 90 pares de bases). Cada fragmento de DNA provido, em 5', com um codo especificando a metionina, e em 3', com um codo de fim de cadeia (TGA). Cada um dos genes sintticos, A e B, em seguida fusionado em fase com o gene da -galactosidase (ou pelo menos com uma parte deste), contido num plasmdeo de expresso. Os plasmdeos recombinantes so, em seguida, utilizados na transformao de E. coli, replicam-se, e o RNA mensageiro, sob controlo dos sinais de regulao do gene -gal (promotor, sequncia Shine-Dalgarno), traduzido em protena hbrida, comportando uma parte da -galactosidase e a cadeia da insulina, A ou B. Como a insulina no contm metioninas, com excepo da que foi deliberadamente introduzida em 5', durante a sntese das cadeias A e B, possvel clivar a protena fusionada, com brometo de cianognio (que cliva especificamente ao nvel das metioninas), de maneira a libertar a insulina dos fragmentos de -galactosidase. Depois da purificao, as duas cadeias A e B, ao serem misturadas, associam-se correctamente, formando as trs pontes dissulfureto. O resultado uma insulina pura e biologicamente activa (Fig. 126.II.). Alternativamente, a insulina humana pode ser produzida a partir dum clone comportando o DNA complementar, derivado do mRNA da insulina (proinsulina) (Fig. 127.II.). O RNA mensageiro que codifica a proinsulina isolado e copiado em cDNA. Imediatamente a montante do codo correspondente ao primeiro aminocido da pro-insulina, introduz-se um triplet ATG que codifica a metionina. Este DNA complementar em seguida ligado ao gene -gal, contido num plasmdeo de expresso. As bactrias transformadas pelo plasmdeo recombinante produzem uma protena hbrida, que contm um fragmento de -galactosidase e a proinsulina. Esta libertada da fuso, por clivagem com o brometo de cianognio (que destri a metionina), purificada e obtida na forma enrolada natural, com 3 pontes S-S correctas. em seguida submetida a uma clivagem enzimtica, in vitro, para originar a insulina biologicamente activa.
b. Expresso na levedura

A levedura Saccharomyces cerevisiae um dos organismos eucariotas mais teis para estudar a regulao da expresso dos genes. Devido ao seu genoma relativamente pequeno (4 vezes o de E. coli) e do seu tempo de gerao relativamente curto, a levedura pode ser manipulada to comodamente como a maioria dos procariotas. A gentica da levedura relativamente bem conhecida; foram isoladas, caracterizadas e mapeadas centenas de mutaes por mtodos genticos convencionais e, actualmente, a sequncia do seu genoma (de S. cerevisiae) est totalmente determinada. Alm disso, a levedura possui a propriedade de se propagar de maneira estvel do estado haplide ao estado diplide, o que permite a complementao entre marcadores genticos por conjugao de estirpes haplides,
85

portadoras cada uma de um dos dois marcadores que se pretende analisar. O diplide resultante da conjugao pode ser depois induzido afim de regenerar haplides, por meiose (tetrada), os quais podem ser manipulados e tratados isoladamente. No que respeita clonagem, um dos meios originais de identificao dos genes de levedura consiste em complementar mutaes nos genes correspondentes de E. coli. O genoma inteiro da levedura pode ser clonado em plasmdeos (banco genmico), os quais, nesta forma recombinante, podem ser utilizados para transformar estirpes bacterianas portadoras de diferentes mutaes. Vrios genes de levedura que codificam enzimas do metabolismo dos aminocidos ou dos cidos nucleicos foram assim clonados directamente (p. ex., LEU2, URA3). evidente que, se bem que a RNA polimerase de E. coli transcreva fragmentos de DNA, seja qual for a sua origem, o RNA correspondente a um gene de levedura s ser traduzido correctamente se o gene em questo no comportar intres. Este mtodo foi, no entanto, substitudo pela clonagem de genes de levedura por complementao directa de mutantes. Esta abordagem foi implementada graas ao desenvolvimento de mtodos de introduo de DNA na prpria levedura. Um DNA exgeno introduz-se relativamente facilmente na levedura, eliminando a parede celular para formar esferoplastos (digesto dos polissacridos por enzimas especficas). Em presena de ies de clcio e de polietilenoglicol (PEG) os esferoplastos absorvem o DNA. Aps regenerao da parede celular o crescimento das leveduras transformadas pode ser iniciado. Este mtodo baseia-se igualmente na utilizao de plasmdeos vaivm que contm, simultaneamente, sequncias necessrias replicao do DNA em E. coli e replicao na levedura. Os fragmentos de DNA de levedura podem ser assim introduzidos por ligao nestes plasmdeos vaivm e propagados em E. coli. A populao heterognea dos plasmdeos recombinantes em seguida introduzida nos esferoplastos de levedura. Qualquer plasmdeo recombinante que complemente uma mutao no hospedeiro, em condies apropriadas de seleco, pode ser identificado, reintroduzido em E. coli e multiplicado vontade (Fig. 132.II.). Os vectores de expresso de S. cerevisiae A maioria das estirpes de levedura contm naturalmente um plasmdeo chamado 2m, constitudo por uma molcula de DNA bicatenrio, circular, com 6300 pb, localizado no nucleoplasma razo de 60 a 100 cpias por clula, e dotado de replicao autnoma. 2m comporta uma origem de replicao e codifica trs funes REP que determinam a amplificao quando o nmero de cpias baixa. Em condies normais, o crculo 2m replica-se a velocidade idntica do resto do genoma; quando o nmero de cpias diminui,
86

as protenas REP dissociam a replicao do plasmdeo da do genoma e iniciam ciclos repetidos de replicao independente do 2m, at que a quantidade de cpias atinja de novo o nmero de + 60 a 100 por clula. Este sistema de regulao assegura a propagao do plasmdeo 2m em nmero elevado de cpias durante o ciclo celular da levedura (Fig. 133.II.). Na figura esto indicados a origem de replicao e os trs genes conhecidos, codificados por 2mREP1, REP2 e REP3 que so necessrios conservao dum nmero elevado de cpias. FLP determina a passagem da forma (A) forma (B) do crculo 2m. O DNA transformante pode-se estabelecer na levedura, quer por integrao no genoma, quer por replicao autnoma, na qualidade de epissoma. A presena ou a ausncia de sequncias particulares, chamadas ARS (Autonomously Replicating Sequence), determina o destino do DNA transformante. Um vector plasmdico para clonagem na levedura replicar-se de maneira autnoma, contanto que possua as sequncias ARS. Estas sequncias tm um comprimento de 60 pb, so ricas em AT (80 %) e possuem uma sequncia consenso AAATATAAA C Normalmente, durante a diviso celular, os plasmdeos que se encontram na levedura no segregam regular e uniformemente. Na ausncia de presso de seleco, as leveduras perdem o plasmdeo durante o crescimento. Para remediar esta situao tira-se partido de sequncias de DNA derivadas da regio centromrica dos cromossomas de levedura. As sequncias CEN asseguram naturalmente a ligao dos cromossomas rede fibrosa do aparelho mittico e contribuem para a repartio igual dos cromossomas quando a clula de levedura se divide. Clonadas num plasmdeo, estas sequncias CEN asseguram a sua permanncia na clula durante a diviso. O conjunto das condies descritas est resumido na Fig. 134.II, dentro do contexto da construo dum vector plasmdico ideal para a clonagem do DNA na levedura. Este vector ideal deveria portanto comportar: 1) uma sequncia derivada do plasmdeo pBR322 que permita a replicao e a seleco na bactria (AmpR); 2) uma sequncia ARS que permita a replicao autnoma na levedura; 3) uma sequncia CEN que assegure a conservao do plasmdeo durante a diviso da levedura; 4) um marcador de seleco para a levedura (por exemplo o marcador nutricional LEU-2, que complementa uma mutao auxotrfica no hospedeiro); 5) um ou vrios locais nicos de restrio para a introduo de DNA exgeno.
87

Exemplos de vectores de expresso para produo de protenas exgenas em leveduras Uma srie de vectores plasmdicos destinados a clonar e a expressar um DNA heterlogo na levedura foram construdos. Um exemplo est representado na Fig. 135.II.). Este vector vaivm possui o gene amp utilizado para seleco na bactria, a origem de replicao especfica de E. coli, um marcador de seleco (LEU2) adequado para a levedura, a origem de replicao prpria da levedura (2 parcial ou 2 completo) e uma cassete de expresso ARG3. Esta cassete contm o promotor ARG3, derivado do gene de levedura ornitina carbamil transferase e a sequncia terminadora, derivada do mesmo gene. A actividade do promotor ARG3 regulvel; em presena de concentrao elevada de arginina este promotor reprimido; quando a concentrao baixa desbloqueado. Estas duas sequncias, promotora e terminadora esto flanqueadas por locais de restrio que permitem remover os sinais promotor ou terminador ARG3 e substitui-los por outros. Por outro lado, no vector pRIT10774 um local BamH1, situado entre o promotor e o terminador, permite a insero e a expresso dum DNA heterlogo possuindo o seu prprio sinal de iniciao ATG. A verso pRIT10779 comporta ainda um local NcoI entre o promotor e o terminador que permite a introduo de DNA desprovido do sinal de iniciao ATG. Um exemplo de aplicao prtica de S. cerevisiae como organismo hospedeiro de expresso de DNA exgeno a produo industrial dum antignio de superfcie, HBsAg, do vrus da hepatite B, capaz de induzir a produo de anticorpos protectores e comercializado recentemente como vacina. A expresso deste antignio sob controlo do promotor cromossmico, altamente eficiente, de levedura, TDH3 (triosefosfato desidrogenase), constitutiva durante a multiplicao celular. Em 3' um sinal eficaz de terminao de transcrio de ARG3 assegura um nvel elevado de mRNA estvel. LEU-2 utilizado como marcador de seleco (Fig. 136.II.). Vrias outras protenas de mamferos foram expressas na levedura (Tabela 9.II.). Algumas so produzidas em quantidade suficiente e possuem actividade biolgica suficiente para serem comercialmente viveis. A levedura pode efectuar as modificaes postraducionais de acetilao, fosforilao e glicosilao, frequentemente necessrias para obter completa actividade biolgica das protenas. O grau de glicosilao , no entanto, bastante varivel, diferente da realizada nas clulas de mamfero e por vezes observada hiperglicosilao (sobretudo N-glicosilao com manose pesado), o que pode originar instabilidade e antigenicidade. Muitas das protenas produzidas pela levedura possuem alguma actividade biolgica, o que pressupe uma conformao tridimensional correcta. Nalguns casos a formao de pontes dissulfureto faz-se ao acaso, como acontece por exemplo com o t-PA (tissue
88

plasminogen activator), expresso em quantidade elevada mas pouco activo biologicamente e no segregado para fora da clula. No que se refere secreo das protenas pela levedura foram construdos vrios vectores que contm sinais de secreo de ferromonas, tais como o factor sexual , que induz o acoplamento entre o dois tipos sexuais e a e naturalmente segregado pela estirpe haplide. O gene da protena que se deseja fazer segregar para meio inserido naquele vector, imediatamente a seguir ao sinal de secreo. Algumas protenas activas maduras foram assim recuperadas no meio de cultura, se bem que os rendimentos sejam em geral modestos. A maioria das protenas estrangeiras no produzida em S. cerevisiae com nveis de expresso elevados. A protena endgena correspondente da levedura expressa por vezes neste organismo, sob controlo dos seus prprios promotores, de 15 a 50 vezes mais intensamente. Com efeito, se bem que cassetes de expresso, comportando os sinais de comeo e de fim de transcrio dos genes (da gliclise da levedura, por exemplo), sejam extremamente eficazes num sistema homlogo (para expressar um gene de levedura), elas funcionam em geral com um rendimento muito menor para expressar um gene estrangeiro. Qualquer "coisa" na regio codificante do gene de levedura facilita a sua transcrio ou aumenta a estabilidade dos mensageiros. Estes sinais, ausentes nos genes estrangeiros so objecto de pesquisas intensivas. A levedura Pichia pastoris metilotrfica (metabolisadora de metanol) outro sistema de produo de protenas com grandes potencialidades. As regies reguladoras de genes implicados na via de utilizao do metanol foram isoladas. Por exemplo, sequncias que regulam a expresso das enzimas lcool desidrogenase e lcool oxidase, foram utilizadas para controlar a expresso de vrias protenas exgenas importantes. A modulao pela fonte de carbono permite regular os nveis de expresso. Existem vectores de expresso replicativos (de expresso autnoma) e integrativos. A utilizao dos integrativos, capazes de induzir a incorporao de cpias mltiplas de um gene seleccionado no DNA cromossmico do hospedeiro, e a seleco de estirpes recombinantes com capacidade para se multiplicarem mais rapidamente, so desenvolvimentos que levaram em certos casos obteno de nveis de expresso elevadssimos. Exemplos da aplicao deste sistema produo de protenas de interesse em medicina so a expresso do antignio de superfcie do vrus da hepatite B (HBsAg), o factor de necrose tumoral (TNF), a estreptoquinase e o t-PA. Assim, o gene do HBsAg, controlado pelo promotor regulado pelo metanol, da lcool oxidase I (AOX1) e flanqueado em 3' pelas sequncias terminadoras do mesmo gene AOX1, constitui uma cassete de expresso que foi inserida no plasmdeo pBSAGI51 (Fig. 137.A.II.).
89

O gene his4 de P. pastoris em 3' desta cassete funciona como marcador de seleco na transformao duma estirpe auxotrfica que requer histidina por ser deficiente em histidinol desidrogenase (HIS4). Para inserir a cassete no genoma de P. pastoris, recorre-se ao mtodo de substituio de gene, j anteriormente utilizado em S. cerevisia, pelo qual os fragmentos de DNA clonados vo substituir sequncias genmicas nativas por um mecanismo que implica uma recombinao estimulada por sequncias flanqueantes, homlogas de regies genmicas (Fig. 137.B.II.). Neste exemplo, o gene AOX1 genmico foi o alvo da substituio pela construo cassete de expresso - HIS4. A insero da cassete no genoma hospedeiro elimina problemas potenciais de instabilidade dos plasmdeos. A cultura do P. pastoris recom(-HAUT-) utilizando fontes de carbono repressivas, tais como glucose ou glicerol, leva acumulao duma massa ilimitada de clulas, sem seleco significativa de mutantes deficientes em expresso gentica heterloga. Quando se adiciona metanol, depois de deixar esgotar a fonte de carbono repressor, induz-se a expresso do gene heterlogo controlado pelo promotor AOX1. A limitao do perodo de expresso de HBsAg, graas possibilidade de regulao pelo metanol, minimiza as probabilidades de seleco de mutantes no expressores. O nvel de expresso em produo escala industrial atinge 0,4 g de HBsAg por litro de cultura (3 a 4 % da massa proteica total). Esta protena parece ter as mesmas propriedades antignicas in vitro e in vivo (induz anticorpos neutralizantes no rato) que a protena nativa e constitui uma concorrente potencial produzida por S. cerevisiae e j utilizada como vacina humana. A aplicao das tcnicas da engenharia gentica s leveduras no tm unicamente a finalidade de clonar e expressar DNA heterlogos. Muitas informaes fundamentais tm sido obtidas sobre a estrutura dos cromossomas dos eucariotas e sobre a organizao e a regulao dos genes de levedura. Exemplos: 1) A integrao dirigida O DNA introduzido nos esferoplastos, pode-se integrar nos cromossomas de levedura. Este processo efectua-se por recombinao entre sequncias homlogas presentes no DNA transformante e no cromossoma. Um plasmdeo de levedura pode-se integrar nos cromossomas, contanto que seja desprovido da sequncia ARS. No entanto, a frequncia da integrao de molculas de DNA circulares fraca, ao contrrio dum plasmdeo previamente linearizado que se integrar com uma frequncia 100 vezes superior forma circular. A integrao do plasmdeo no cromossoma da levedura pode ser dirigida pelo local do corte de linearizao com a enzima (Fig. 138.II.). Esta propriedade de dirigir a integrao do DNA
90

num stio especfico pode servir para substituir um gene normal por um gene mutado. Este processo, chamado substituio allica, permite estudar os efeitos duma mutao especfica num gene, realizada in vitro, na expresso deste gene na levedura. Pode-se, por exemplo, modificar in vitro por mutagnese dirigida, a sequncia do DNA que codifica para a actina. Este DNA "mutante", transportado por um plasmdeo de integrao e linearizado por corte no gene da actina, num stio apropriado, ser reintroduzido na levedura e integrar-se- no lugar da actina. Os efeitos da mutao na expresso do gene da actina podem assim ser medidos in vivo. No caso deste exemplo, os efeitos da modificao introduzida por mutagnese dirigida so recessivos e letais, indicando que a levedura no sobrevive se a actina no for funcional. 2) O isolamento de alelos mutantes Pode-se tirar partido do processo de integrao do DNA nos cromossomas de levedura para isolar alelos mutantes, contanto que o gene selvagem clivado esteja disponvel. Toda a regio codificante do gene, flanqueado pelas sequncias no codificantes em 5' e em 3', excisado do plasmdeo portador de um marcador de seleco e de uma ARS. O plasmdeo amputado em seguida introduzido na levedura; para se replicar ele tm que ser reparado e recircularizado, o que s acontece por recombinao das sequncias flanqueantes, presentes no plasmdeo, com as sequncias homlogas que delimitam o gene mutado presente no cromossoma. Assim, durante a duplicao, o gene mutado ser introduzido no plasmdeo. Este contm, pois, uma cpia do alelo cromossmico que poder replicar-se e propagar-se (Fig. 139.II.). 3) Regulao da expresso dos genes na levedura Ao contrrio do que acontece com as bactrias, os genes cujo controlo se efectua de maneira coordenada no so obrigatoriamente contguos e podem, at, estar localizados em cromossomas diferentes. Assim, por exemplo, trs genes de levedura que intervm na biossntese da histidina encontram-se em cromossomas diferentes. As regies que flanqueiam estes trs genes em 5' tm muito pouco homologia e h pouco tempo, pelo menos, desconhecia-se como se efectua a coordenao da expresso. Cada gene contm, no entanto, sequncias de controlo essenciais para haver expresso normal. Um tipo de sequncia assegura um nvel de transcrio baixo (nvel basal) e um outro tipo de sequncia desencadeia uma transcrio abundante (regulao positiva em condies de carncia) (Fig. 140.II.). O fenmeno de regulao a longa distncia da expresso dos genes de levedura j foi evocado. Por exemplo, a expresso do tipo "mating" na levedura faz intervir mecanismos de insero de gene afastados num determinado locus de expresso.

91

4) Um intro codifica para uma protena reguladora Certos genes de mitocndria de levedura possuem propriedades genticas complexas, que s puderam ser elucidadas por anlise molecular de DNA. O gene box que codifica para o citocroma b existe em duas verses : a) um gene "longo", de 1155 pb codificantes, distribudo ao longo de 6400 pb em 6 exes (B1 a B6) e 5 intres (I1 a I5); b) noutras estirpes, este gene "curto"; as sequncias correspondentes aos 4 primeiros exes do gene "longo" so contguas no gene "curto". As duas formas do gene box expressam-se de maneira idntica. O gene box "longo" (Fig. 141.II.). Os RNAs correspondentes a este gene existem em vrios tamanhos distintos. O mais curto tm 3300 pb e corresponde ao RNA mensageiro (incluindo as sequncias flanqueantes em 3' e 5'). Os RNAs de comprimento superior contm uma ou vrias sequncias correspondentes aos intres. O transcrito primrio tm um comprimento de 8500 pb. Um certo nmero de mutaes no gene box foram isoladas e caracterizadas. Distribuemse por grupos separados e por distncias bastante grandes. Uma primeira classe de mutaes afecta a protena directamente; o RNA mensageiro normal mas durante a traduo h interrupo prematura, sem sentido (nonsens), ou incorporao errada (missence). Estas mutaes situam-se nos exes B1, B3, B4 e B6. Um outro grupo de mutaes, box9 e box2, possui caractersticas particulares, provocando a sntese de RNA anormais. Estas mutaes situam-se todas no intro 4. As mutaes box9 esto situadas a +350 pb a jusante da extremidade 5' do intro e as mutaes box2, a 25 pb a montante da extremidade 3' do intro. Os dois grupos de mutaes impedem o splicing e a juno dos exes B4 e B5. Mutaes em stios especficos podem impedir o reconhecimento das junes de splicing, mesmo estando relativamente afastadas destas junes. Por outro lado, as mutaes de tipo box3, 10 e 7 esto localizadas nos intres I2, I3 e I4. Nenhuma pode complementar outra mutao do mesmo tipo, mas podem, no entanto, complementar mutaes noutros clusters. Isto significa que os grupos box3, box10 e box7 codificam para um produto difusvel, distinto do cromossoma b, que actua em trans e necessrio para a sntese do citocroma b. Cada um dos trs intres I2, I3 e I4 comporta sequncias que codificam para um produto cuja existncia independente e que desempenha um papel regulador na produo do citocroma b. Com efeito, estas mutaes bloqueiam a maturaodo RNA mensageiro do
92

citocroma b o que provoca a acumulao dos seus precursores. Cada grupo de mutaes bloqueia a maturao numa fase particular do processo desactivando um produto difusvel necessrio ao splicing dum intro. O produto difusvel uma RNA maturase. provvel que esta protena reconhea as extremidades intrnicas e assegure a execuo dum splicing correcto. A anlise da sequncia ncleotdica do gene box d peso a esta hiptese. Com efeito, o primeiro exo (B1) codifica para os primeiros 139 aminocidos do citocroma b (417 pb); segue-se um intro (I1) de 765 pb sem fases de leitura aberta, a seguir um segundo exo (B2, 15 pb ou seja 5 codes) e, finalmente, o segundo intro (I2) cujas 840 primeiras bases esto em fase em relao s do exo precedente (Fig. 142.II.). As mutaes box3 criam codes sem sentido na fase de leitura aberta do intro I2. Por consequncia, o produto codificado por esta fase de leitura no sintetizado e o splicing deixa de ser correcto, o que provoca a acumulao do RNA precursor. Na ausncia da mutao box3, supe-se que a traduo que conduz formao da RNA maturase comea no exo B1 e continua atravs de B2 e do intro I2, contanto que o primeiro intro tenho tido um splicing correcto. A RNA maturase seria assim constituda por 424 aminocidos [139 (B1) + 5 (B2) + 279 (I2)]. Se efectivamente a RNA maturase necessria para o splicing do intro I2, a aco desta enzima implica um mecanismo de retro-controlo negativo bastante sofisticado (Fig. 143.II.). A eliminao do intro 2 pela RNA maturase suprime a sua prpria sntese, visto que parte do RNA que codifica para ela neste intro desaparece. necessrio que se estabelea um equilbrio entre as duas formas de RNA que esto sendo alvo do splicing e a RNA maturase. Aparentemente este mecanismo no nico e poderia existir noutros genes tais como o oxy3 (subunidade 1 da citocroma-oxidase). 5) Estrutura do gene da ferromona de levedura (MF) A conjugao na levedura parece facilitada por factores peptdicos chamados ferromonas, que bloqueiam as clulas de tipo conjugativo oposto, numa fase particular da diviso celular. As clulas haplides produzem o factor com 12 a 13 aminocidos de comprimento (2 formas). As clulas haplides a produzem o factor a, com 11 aminocidos de comprimento (2 formas). As clulas diplides /a no produzem ferromonas e no so sensveis a elas. Devido ao seu tamanho pequeno, e por analogia com outras situaes, era de admitir que estas ferromonas derivassem de precursores muito maiores cujo processamento conduzisse
93

forma biologicamente activa (analogia com precursores de hormonas). A clonagem do gene da ferromona confirmou esta hiptese. A estratgia desenvolvida para clonar este gene foi a seguinte: certas estirpes de levedura mutadas produzem o factor , mas no o segregam porque ele degradado muito rapidamente na clula. Todavia, o gene clonado num plasmdeo multicpia deveria expressar-se abundantemente e em quantidade suficiente para saturar a actividade de degradao e conferir um fentipo produtor de que fosse facilmente identificado. Por conseguinte, o DNA plasmdico isolado dum banco genmico de levedura foi utilizado para transformar as leveduras no secretoras de (mat2, leu2). Os transformantes, seleccionados para leu+, foram escrutinados para a secreo do factor por um processo que faz intervir clulas a sensveis ao factor (produo de um halo ao contacto dos transformantes secretores de com as clulas a). Um plasmdeo recombinante superprodutor de foi identificado e caracterizado. O gene de estrutura do factor codifica para um precursor de 165 aminocidos (prepropoli F) (Fig. 144.II. e 145.II.). A extremidade N-terminal do precursor contm uma sequncia sinal hidrfoba e comporta trs stios de glicosilao. A extremidade C-terminal contm quatro cpias do factor maturado unidas por pptidos relativamente homlogos. Maturao do precursor de O processamento do precursor requer a glicosilao dos trs stios na regio guia, entre o sinal e a primeira unidade e em seguida a protelise entre as quatro unidades tornandoas biologicamente activas (Fig. 146.II.). A protelise realiza-se por etapas; corte a jusante da regio Lys-Arg por uma endopeptidase (KEX2), eliminao das sequncias C-terminais por uma carboxipeptidase e, enfim, eliminao dos aminocidos excedentes Glu-Ala no termino NH2 por uma dipeptidilaminopeptidase.
c. Expresso em clulas de mamferos

Os nveis de expresso e secreo variam de um organismo para outro, segundo a protena; esta uma dificuldade maior que est por resolver em todos os sistemas hospedeirovector conhecidos presentemente. Muitos dos produtos farmacologicamente relevantes, recentemente descobertos e identificados no podem ser produzidos na sua forma fisiologicamente activa pelas bactrias ou at pelas leveduras. A capacidade dos organismos para sintetizarem protenas com a conformao correcta natural, para as glicosilarem correctamente, processarem com todas as modificaes secundrias necessrias para a sua funo e estabilidade, a sua inocuidade e actividade biolgica, limitada. Em muitos casos, as protenas produzidas por micrbios tm
94

que ser enroladas correctamente in vitro e as processadas incorrectamente tm que ser removidas. Esta purificao no muitas vezes possvel, ou insuficiente e, alm disso, substncias contaminantes pirognicas tm que ser eliminadas, em particular das protenas produzidas por E. coli. As clulas de mamferos efectuam um processamento ps-traducional eficaz durante a biossntese de protenas e de pptidos, o que pode favorecer fortemente a estrutura natural do produto derivado do DNArec, influenciando, por consequncia, a sua homogeneidade, estabilidade e eficcia. Os produtos perfeitamente homlogos da protena natural humana so sempre preferveis, afim de garantirem uma actividade farmacolgica, especfica e uma compatibilidade clnica ptima durante as aplicaes. A expresso de DNA recombinante em cultura de clulas de mamferos , em princpio, o melhor mtodo para produzir quantidades suficientes de substncias complexas glicosiladas, com a condio de no estarem contaminadas com, por exemplo, vrus latentes, ou outras substncias potencialmente perigosas. A cultura de clulas animais tm vindo a impor-se como uma tecnologia das mais importantes para investigao e desenvolvimento em biologia celular, virologia e imunologia, assim como em investigao na rea tumoral. So utilizadas, por exemplo, linhagens celulares de macaco e de hamster que no tm grandes exigncias de meio de cultura e crescem em grande quantidade. Qualquer gene de mamfero, tanto na forma genmica como na de cDNA, pode ser colocado num vector de expresso adaptado s clulas de mamferos. Pode ser flanqueado dos seus prprios sinais de regulao, ou doutros mais potentes e complementados eventualmente com um sinal de secreo. Estes vectores funcionam bem nas clulas em que so introduzidos, e os genes de que so portadores expressam-se normalmente. As protenas produzidas so segregadas no meio de cultura e so correctamente processadas, diferindo pouco do produto segregado pela clula de origem. Assim, por exemplo, a glicosilao efectuada pela clula de rato difere um pouco da realizada por clulas humanas, mas esta diferena sem significado nas propriedades fisiolgicas e imunolgicas do produto final. Actualmente, a expresso nas clulas de mamferos em cultura constitui a nica maneira de produzir, numa escala relativamente grande, protenas de organismos superiores que exigem, para serem activas, modificaes ps-traducionais. o caso de certos factores de coagulao do sangue, do activador tissular do plasminogneo, de hormonas, de interleucinas, etc. Os problemas inerentes expresso nas clulas de mamferos decorrem, primeiramente, dos vectores prprios deste tipo de clulas. Como se integram quase sempre nos cromossomas, o nmero de cpias activas nas clulas limitado. Existem excepes, tais como a dos vectores derivados do vrus do papiloma bovino (Fig. 149.II.). Existem, no entanto, mtodos para amplificar o nmero de cpias do gene que se deseja expressar. A
95

segunda dificuldade de ordem econmica, porque a cultura das clulas de mamferos nem sempre fcil. Apesar dos enormes progressos realizados na simplificao dos meios de cultura, no aumento da massa de clulas, graas ao crescimento em suportes slidos, no melhoramento das tcnicas de fermentao etc..., a produo industrial de clulas animais ainda relativamente dispendiosa e reservada a produtos de alto valor acrescentado. de assinalar, todavia, que a cultura in vitro das clulas animais tm progredido a ponto de se poder utilizar clulas normais no transfectadas para produzir substncias interessantes, tais como HBsAg segregada por clulas hepticas ou ainda factores imunolgicos, como a interleucina 2 ou os interferes. possvel que, graas a progressos futuros nas tcnicas de cultura das clulas de mamferos, as clulas normais no manipuladas possam vir a suplantar as linhagens celulares transfectadas com vectores de expresso recombinados. Transferncia de genes nas clulas de mamferos (transfeco) O estudo da expresso dos genes de eucariotas evoludos no teria sido possvel sem o desenvolvimento de tcnicas que permitissem a introduo do DNA nas clulas. O processo natural de absoro de DNA viral pelas clulas muito pouco eficaz, e s foi possvel melhor-lo recorrendo ao mtodo de co-precipitao DNA-clcio. O DNA purificado precipitado em presena de ies de clcio e os grnulos assim formados so fagocitados pelas clulas em cultura; uma pequena fraco deste DNA susceptvel de se integrar no DNA cromossmico das clulas. Afim de identificar as clulas que integraram este DNA foi preciso desenvolver tcnicas de seleco apropriadas. Um sistema muito utilizado recorre ao isolamento de linhagens celulares deficientes em timidina kinase, enzima que intervm na biossntese das pirimidinas. Esta enzima fosforila a timidina proveniente da degradao do DNA celular; a TMP formada em seguida transformada em TTP e reincorporada no DNA. Esta via metablica no , no entanto, essencial para a sobrevivncia da clula que utiliza habitualmente a dCDP. portanto possvel obter clulas tk- perfeitamente viveis. O isolamento de mutantes tk- efectua-se segundo o esquema da Fig. 150.II. Em presena de bromodesoxiuridina, as clulas cuja tk funcional so inviveis porque esta enzima fosforila o composto anlogo, que incorporado no DNA, tornando-o hipersensvel radiao ultravioleta. As raras clulas deficientes em tk sobrevivem a este tratamento. No entanto, as clulas tk- morrem no meio HAT (meio que contm hipoxantina, aminopterina e timidina), porque a aminopterina bloqueia a utilizao normal de dCDP obrigando a clula a recorrer aco da timidina kinase, nica via possvel para sintetizar a TTP. Existe, portanto, um sistema de seleco de clulas tk+ (Fig. 151.II.). O gene tk pode,

96

portanto, ser utilizado como marcador de seleco para a integrao, no DNA de clulas de mamferos, doutros genes que lhe esto ligados. O sistema de seleco baseado no gene tk apresenta certos inconvenientes. preciso, primeiramente, tornar a linhagem tk- e, por outro lado, obter uma mutao tk-, cuja frequncia de reverso seja muito baixa. Foram, por isso, desenvolvidos sistemas melhores, que se baseiam na utilizao de genes de procariotas associados aos sinais de controlo dos eucariotas (Fig. 152.II.). Um dos vectores portador dum gene bacteriano XGPRT (utilizao de xantina como fonte de purinas, xantina guanina fosforribosil transferase). Este gene foi inserido entre o promotor e o stio de adio de poli A do gene de SV40, que codifica para o grande antignio T (a clula contm o gene HGPRT, utilizao de hipoxantina e praticamente de nenhuma xantina). Uma grande quantidade de XGPRT bacteriana produzida sob aco do promotor muito eficaz. pois possvel seleccionar o fentipo HGPRT+ em meio HAT nas linhagens celulares HGPRT-; mesmo nas linhagens selvagens, HGPRT+, possvel seleccionar o fentipo HGPRT+, em presena de xantina e de cido micofenlico que bloqueia a enzima celular HGPRT, porque as clulas portadoras do vector so capazes de utilizar a xantina, graas enzima codificada pelo vector. O segundo vector contm o gene procariota que confere resistncia neomicina (inactivao da neomicina por fosforilao enzimtica). Este gene tambm inserido entre o promotor e o stio de adio poli A de SV40. As clulas eucariotas so sensveis a um anlogo da neomicina, G418; este anlogo tambm desactivado pelo produto do gene NeoR. Este vector SVneo pode, portanto, ser utilizado na transformao de clulas de eucariotas, seleccionadas pela resistncia ao G418. Co-transformao Na prtica, no necessrio ligar, por ligao in vitro, o fragmento de DNA que se deseja introduzir nas clulas com o marcador de seleco. Basta co-precipit-los com ies de clcio e transfectar as clulas. O DNA exgeno encontra-se na forma de longo concatmero que se integra ao acaso e em bloco no cromossoma (Fig. 153.II.). Micro-injeco Outra alternativa a introduo do DNA em clulas em cultura por microinjeco no ncleo celular. Este mtodo, se bem que sofisticado e delicado, muito eficaz, pois 50 % das clulas microinjectadas integram e expressam os genes injectados. Alm disso, este mtodo no requer nenhuma presso de seleco para manter o gene transfectado e permite em princpio injectar qualquer DNA em qualquer clula.
97

Isolamento dos genes transferidos A possibilidade de transferir genes para as clulas de mamferos fornece, ao mesmo tempo, os meios de os isolar. Uma abordagem possvel est ilustrada na Fig. 154.II. O DNA genmico cortado em fragmentos por uma ou vrias enzimas que se sabe no afectarem o gene que se pretende transferir. Este DNA em seguida ligado a um DNA heterlogo (por exemplo pBR322), de maneira a marcar todos os fragmentos de DNA genmico com um DNA procariota. Aps tranfeco e seleco, o gene que se pretende isolar integrado no cromossoma das clulas receptoras na vizinhana imediata deste marcador. Isola-se ento o DNA das clulas transformadas e prepara-se um banco genmico, num fago ou num cosmdeo. Este banco em seguida escrutinado com uma sonda caracterstica do marcador utilizado. de esperar que o clone positivo para o marcador, contenha igualmente o gene seleccionado (no exemplo da figura trata-se da adenosina fosforribosil transferase). Uma outra abordagem possvel, chamada rescue, baseia-se na adio dum DNA funcional ao DNA que se pretende transferir, por exemplo, uma resistncia a um antibitico ou um supressor procariota como supF (tRNA) (Fig. 155.II.). Depois da transfeco, o DNA das clulas seleccionadas cortado por uma enzima que no afecta o gene que se pretende isolar, recircularizado e utilizado na transformao de bactrias. A seleco de resistncia a um antibitico (ampicilina, por exemplo) fornece os clones portadores do gene pretendido. As tcnicas de transfeco e de isolamento dos genes transferidos permitiram identificar, nomeadamente, sequncias de DNA responsveis pelo controlo da expresso de certos genes de eucariotas. No caso preciso do vrus MMTV (Mouse Mammary Tumor Vrus), a expresso do DNA controlada pelas hormonas glucocorticides. O provrus clonado, introduzido nas clulas de rato em cultura, contendo o receptor hormonal ad hoc continua a responder hormona. A transcrio do DNA proviral transferido nas clulas aumenta de 5 a 10 vezes em presena da hormona. O stio sensvel ao efector foi identificado e localizado no long terminal repeat (LTR) do provrus (sequncias que intervm na insero viral nos cromossomas celulares) (Fig. 156.II.). Existem outros genes eucariotas, activveis ou desactivveis por diferentes factores; so exemplos o gene da 2-globulina de rato, sensvel insulina, o gene da metalotionina, induzido pelo cadmium. Em todos estes casos, os elementos de regulao esto localizados na proximidade do prprio gene. As tcnicas de transferncia de genes permitiram identificar e clonar genes implicados na formao de cancros. Estas experincias comearam a desenvolver-se quando se observou que o DNA extrado de tumores pode transformar clulas normais e torn-las malignas (Fig. 157.II.).
98

Estas clulas transformadas, injectadas em ratos, levam formao de tumores. A concluso 1) que, com estes tumores pelo menos, o fentipo dominante, isto , devido presena e no ausncia dum produto especfico; 2) que o fentipo transformado das clulas induzido pela expresso dum s gene. , com efeito, pouco provvel que a transformao das clulas se pudesse realizar se ela exigisse a transferncia e a expresso simultnea de dois genes. Clonagem de oncogenes humanos Vrios oncogenes humanos foram clonados por uma das tcnicas j referidas anteriormente e que esto ilustradas nas Fig. 158.II. e 159.II. Assim, os oncogenes presentes nas linhagens cancerosas derivadas de tumores da bexiga, do neuroblastoma, de tumores do clon ou do pulmo foram clonados e caracterizados. Estes genes tm comprimentos compreendidos entre + 5 e 45 kb. Apresentam todos um arranjo intro-exo idntico: quatro exes codificam para protenas similares mas distintas, de massas moleculares de cerca de 21.000 daltons. Estas protenas, chamadas p21, geralmente associadas membrana plasmtica das clulas cancerosas so assaz homlogas dos produtos dos oncogenes j identificados nos retrovrus. O gene do cancro da bexiga, por exemplo, muito semelhante ao do oncogene ras encontrado no genoma do vrus HSV (Harvey Sarcoma Vrus), enquanto que o oncogene do cancro do pulmo muito parecido com o oncogene ras do vrus KSV (Kirston Sarcoma Vrus). Estes oncogenes humanos, assim como os oncogenes virais, tm os seus homlogos celulares normais de que eles derivam aparentemente por mutao. O oncogene do carcinoma da bexiga, por exemplo, difere do seu equivalente celular normal numa nica mutao pontual (Gly12Val12 na p21). Est, no entanto, por demonstrar que esta mutao pontual seja a causa nica do cancro de bexiga. Tambm no se conhece o papel da protena p21, nem no estado normal, nem no estado mutado. Vectores virais utilizados para transfectar as clulas de mamferos A infeco viral um processo natural muito eficaz que conduz introduo de vrias cpias dum mesmo gene em cada clula receptora. O genoma viral comporta promotores muito potentes, susceptveis de expressar eficazmente os genes que dependem deles e de produzir RNA e as protenas correspondentes em abundncia. Estas propriedades conduziram naturalmente construo de vectores derivados de vrus para introduzir DNAs heterlogos nas clulas animais.

99

Vector SV40 Foram adoptadas duas vias para tirar partido do DNA viral como vector. A primeira

consiste em construir recombinantes entre o DNA de SV40 e um fragmento de DNA heterlogo, e introduzir em seguida as molculas hbridas nas clulas receptoras afim de sintetizar as partculas virais que contm o DNA recombinante. a) Substituio da regio tardia de SV40 Quando se substitui o DNA de SV40, correspondente s funes tardias (implicadas na sntese da cpsula viral), por um fragmento de DNA heterlogo necessrio complementar estas funes perdidas pelas fornecidas por um vrus amputado das funes precoces (implicadas na replicao do DNA viral). Transfectam-se, simultaneamente, as clulas pelo DNA de SV40 recombinante e o DNA helper; um fornece as protenas da cpsula, o outro, as funes de replicao. Resulta uma populao viral mista, difcil de separar. Utiliza-se, ento, a mistura de partculas virais, para re-infectar outras linhagens celulares e acumular o produto do gene clonado (Fig. 160.II.). b) Substituio da regio precoce de SV40 Quando se substitui o DNA de SV40, correspondente s funes precoces por um DNA heterlogo, a produo de partculas virais intactas depende da complementao pelas protenas precoces, os antignios T. possvel evitar a utilizao dum vrus helper introduzindo o DNA de SV40 recombinante nas clulas COS de macaco. Estas clulas j foram transformadas por um vrus SV40 portador de DNA codificando para as funes precoces, mas deficiente em relao origem de replicao viral. Por consequncia, nestas clulas, o vrus SV40 fornece os antignios T mas no se pode replicar independentemente dos cromossomas da clula (Fig. 161.a.II.). Quando um DNA de SV40 recombinante, deficiente em funes precoces, introduzido nas clulas COS, a origem de replicao que ele contm ser reconhecida pelos antignios T celulares e o vrus poder replicar-se e fornecer uma descendncia viral normal (Fig. 161.b.II.) A vantagem deste mtodo que todas as partculas virais produzidas contm o DNA recombinante e no ha contaminao pelo vrus helper. possvel, por outro lado, utilizar unicamente a origem de replicao do SV40 para transfectar clulas. Constri-se um DNA recombinante portador desta origem e dum fragmento de DNA heterlogo. Nas clulas COS, os antignios T celulares induzem a replicao da molcula recombinante na forma plasmdica, at um nmero de cpias muito elevado. O DNA heterlogo replicar-se- pois, pelo menos de maneira transitria, independentemente do DNA celular, produzindo uma alta percentagem de mensageiro correctamente processado (Fig. 162.II.).
100

Vector vaivm derivado de SV40 Um plasmdeo, portador da origem de replicao SV40 ligada a um marcador de

seleco de eucariota, levado a integrar-se no DNA cromossmico de clulas de rato. Quando se fusionam estas clulas com clulas COS, os antigneos T que estas produzem difundem-se no ncleo das clulas de rato e induzem a replicao na origem de replicao de SV40 presente nos cromossomas. Esta replicao bidireccional conduz produo de molculas de DNA circulares que se soltam dos cromossomas e podem ser isoladas facilmente. Se a origem de replicao procaritica e um marcador de seleco para procariota estiverem presentes, na vizinhana da origem de SV40, estas molculas circulares podem ser utilizadas para transformar bactrias e recuperar o plasmdeo de partida (Fig. 163.II.). Este um exemplo de vector vaivm capaz de se replicar, tanto em clulas animais, como em bactrias. Habitualmente, os vectores derivados de SV40 possuem, para alm da origem de replicao SV40, sequncias virais estimuladoras (enhancers). Estas sequncias esto localizadas a montante do promotor do gene T de SV40, elas estimulam a expresso de qualquer promotor contido num plasmdeo no qual elas foram clonadas.
Vector BPV (Bovine Papilloma Virus) O vrus BPV responsvel pelas verrugas do gado bovino tem um genoma de 8 kilobases.

O DNA circular de BPV capaz de transformar certas linhagens celulares de rato em fentipo maligno. Nestas clulas, o DNA do BPV permanece circular e extra-cromossmico, razo de 30 a 100 cpias por clula (situao anloga dos plasmdeos). Pode-se clonar DNAs heterlogos num genoma de BPV e introduzi-los desta maneira em clulas de rato em cultura (Fig. 164.II.). Se sequncias apropriadas de pBR322 forem clonadas no DNA de BPV, obtm-se um vector vaivm capaz de se manter na forma plasmdica nas bactrias e nas clulas de rato. Na prtica, no se utiliza o DNA completo do BPV, mas antes um fragmento correspondente a 69 % do genoma, fragmento dotado da capacidade de transformao das clulas e de replicao autnoma extra-cromossmica. Afim de facilitar a identificao das clulas transformadas pelo vector BPV, introduz-se um marcador de seleco dominante, como por exemplo, a resistncia neomicina (na realidade resistncia a um anlogo G418). Um dos vectores derivados do BPV, correntemente utilizado para expressar DNAs heterlogos est ilustrado na Fig. 165.II.
Vectores derivados de retrovrus Vimos que o genoma dos retrovrus constitudo por uma molcula de RNA semelhante

a um RNA mensageiro, possuindo a estrutura cap em 5' e uma cauda poli A em 3'. Um retrovrus tm um nmero restrito de genes, para alm do gene pol, responsvel pela sntese
101

da enzima caracterstica dos retrovrus, possui um gene gag que governa a sntese de protenas estreitamente associadas ao genoma viral e um gene env, que determina a sntese das protenas do invlucro; por fim as sequncias ditas LTR, nas duas extremidades do genoma, que intervm na insero do vrus nos cromossomas das clulas. O RNA do retrovrus copiado em DNA bicatenrio, que se integra no genoma das clulas infectadas. Uma vez integrado, o provrus transcrito como um gene celular. O provrus integrado possui em cada uma das suas extremidades uma sequncia LTR, onde fica localizado o nico promotor conhecido para a expresso dos genes virais. A produo dos diferentes RNAs que codificam para as diferentes protenas virais regulada ao nvel do splicing do transcrito primrio. Os provrus clonados podem ser utilizados para introduzir DNAs heterlogos nas clulas de mamferos, se se substituir um dos genes virais por um fragmento de DNA estrangeiro (Fig. 166.II.). As clulas infectadas por um retrovrus recombinante produziro grandes quantidades do novo RNA mensageiro cuja transcrio comea no LTR. Com a complementao dum vrus helper, so fornecidas as funes necessrias ao encapsulamento do RNA do retrovrus recombinante e por consequncia produo de partculas virais. Na Fig. 167.II. esto representadas duas maneiras de produzir retrovrus. Na parte A da figura est representado um primeiro mtodo, segundo o qual se faz penetrar (transfeco), por um mtodo fisico-qumico, o DNA dum retrovrus no qual se introduziu um gene estrangeiro (este ocupa, por exemplo, o lugar do gene pol), numa clula dita assistente que , por outro lado, infectada por um vrus selvagem. Este poder dirigir a sntese de novas partculas virais infecciosas selvagens e, alm disso, fornecer as molculas de transcritase reversa s partculas virais, que incorporaram o RNA que veicula o gene estrangeiro, o qual foi sintetizado graas ao DNA integrado nos cromossomas da clula. Estas ltimas partculas virais podero ser utilizadas, conjuntamente com as selvagens, para infectar clulas alvo, tais como clulas de embrio de mamfero. O mtodo representado na parte B da figura uma verso aperfeioada da precedente. Visa produzir unicamente partculas virais contendo o genoma viral que veicula o gene estrangeiro. Para isso, prepara-se um DNA mutado, a partir do selvagem, amputado duma sequncia nucleotdica que intervm no empacotamento do RNA viral pelas partculas do invlucro. O mtodo consiste em fazer penetrar numa clula assistente, uma cpia de DNA viral amputado da sequncia e uma cpia de DNA viral que veicula o gene estrangeiro (contendo a sequncia ). As cpias do DNA vo-se alojar nos cromossomas da clula e dirigir a sntese dos diferentes elementos das partculas virais (RNA e protenas). As partculas infecciosas, finalmente formadas, comportaro unicamente o RNA que veicula o gene estrangeiro, porque s este foi empacotado.
102

frequente que os retrovrus, uma vez inseridos no cromossoma, activem genes vizinhos. Estes genes, que eram silenciosos antes da insero do retrovrus, podem revelar-se proto-oncogenes e induzir a transformao cancerosa da clula infectada. Um certo nmero de cancros animais so o resultado deste gnero de mecanismo. Os retrovrus so relativamente instveis e, mesmo quando foram tornados no infecciosos pela eliminao do gene da transcritase reversa, podem, uma vez alojados nos cromossomas duma clula, produzir de novo um vrus infeccioso recombinando-se a vrus latentes presentes nas clulas hospedeiras. Por estas razes, outras vias tm sido estudadas, tais como o recurso aos AAV (Adeno-Associated Virus) que parecem inserir-se de maneira estvel e sem inconvenientes no genoma das clulas que ele infecta.
d. Expresso em clulas de insectos

As clulas de insectos podem ser uma alternativa s clulas animais em cultura. Vectores derivados de vrus de insectos podem ser utilizados para a produo notvel de protenas tais como interleucinas, interferes, vrias protenas derivadas dos vrus HIV, da hepatite B, etc. O sistema que tm sido utilizado com sucesso baseia-se na utilizao de vectores de Autographa californica, vrus das poliedroses nucleares mltiploas (AcMNPV), prottipo da famlia Baculoviridae, que possui um largo espectro de hospedeiros, infectando mais de 30 espcies de lepidpteros, assim como, tricpteros, himenpteros, dpteros e crustceos. A. californica, assim como os outros membros do subgrupo A dos baculovrus, formam ocluses constitudas por protenas virais, com a configurao de cristais ou corpos oclusivos, chamados corpos poliedrais ou poliedros, encerrando cada um, um nmero elevado de partculas virais. Os corpos poliedrais consistem, pois em grupos de nucleocapsdeos (viries oclusos) embebidos em vrias orientaes numa matriz de poliedrina. Esta protena principal dos poliedros de MM de 29.000 daltons produzida intensamente, acumulando-se, por exemplo, nas culturas celulares de Spodoptera frugiperda, correntemente utilizadas, a nveis elevadssimos de 1 mg/ml por 1-2 106 clulas infectadas, representando, pelo menos, 15 % das protenas da clula detectveis em gel de poliacrilamida-SDS. O ciclo de vida do baculovrus est representado na Fig. 175.II. Os corpos polidedrais so libertados no meio ambiente aps lise das clulas e morte do organismo hospedeiro. O poliedro protege os viries da desactivao por agentes ambientais. Aps ingesto subsquente por um hospedeiro susceptvel, a poliedrina solubilizada e os viries entram nas clulas do intestino e dirigemse para o ncleo onde o ciclo infeccioso se inicia. Durante os ltimos estdios do ciclo infeccioso do baculovrus a protena poliedrina produzida em quantidades massivas. Especificamente, a sntese de poliedrina comea cerca de 36 a 48 horas aps a infeco e continua por 4 a 5 dias, at ruptura das clulas infectadas e o organismo hospedeiro morre.
103

O promotor do gene da poliedrina (polyh) excepcionalmente forte. Alm disso, no necessrio produo viral. Assim, concebeu-se a substituio do gene da poliedrina pela sequncia codificante de uma protena heterloga, seguida de infeco de clulas de insectos em cultura com a finalidade de produzir elevadas quantidades de protena recombinante. Alm disso, dada a semelhana dos sistemas de modificao ps-traduo entre insectos e mamferos de esperar que a protena recombinante tenha uma forma muito prxima, seno idntica da protena original. Com base nestas premissas, foi desenvolvido um vector para expresso no sistema baculovrus-clulas de insecto. A linha celular mais correntemente utilizada para a engenharia recorrendo a AcMNPV derivada da lagarta Spodoptera frugiperda. Nestas clulas, o promotor da poliedrina excepcionalmente activo e durante as infeces com baculovrus selvagem so sintetizados elevados nveis de poliedrina. A aplicao mais atraente do baculovrus, enquanto sistema de vector em tecnologia do DNA recombinante, o seu potencial para expressar grandes quantidades de produtos de genes estrangeiros. A poliedrina expressa-se em abundncia superior de qualquer outra protena em clulas de eucariotas infectadas por vrus. Mais de 15 % da massa total de protena encontrada em clulas de larvas infectadas por NPV constituda por poliedrina. Para alm de sequncias promotoras fortes, que do a vantagem aos vectores de expresso deste vrus de expressar protenas recombinantes a elevados nveis, comparados com os sistemas bacterianos, de levedura ou de mamferos, os baculovrus possuem vrias outras caractersticas que os tornam interessantes para a clonagem e expresso de DNA estrangeiros: 1) No so patognicos para os vertebrados ou as plantas porque no se replicam nestes tipos de clulas, no sendo necessrio recorrer a clulas transformadas ou a elementos transformantes, como o caso com os sistemas de expresso das clulas dos mamferos. 2) Possuem um espectro de hospedeiros limitado a certos invertebrados. 3) O genoma conhecido e caracterizado em relao actividade transcricional. 4) Os vectores do baculovrus utilizam muitos sistemas de modificao, processamento e transporte de protenas que ocorrem nas clulas superiores de eucariotas, que podem ser essenciais para as funes biolgicas completas das protenas recombinantes. Estas so, consequentemente, com frequncia, antigenicamente, imunologicamente e funcionalmente semelhantes s suas homlogas autnticas. 5) O invlucro do baculovrus pode empacotar pelo menos dois comprimentos genmicos, o que sugere que capaz de inserir famlias de genes, ou um grande nmero de genes.
104

O genoma do AcMNPV consiste num DNA circular, super-enrolado, bicatenrio, com um comprimento de cerca de 128 kilobases. O gene da poliedrina do AcMNPV foi mapeado e sequenciado. Foi demonstrado que no essencial para a replicao ou a produo de vrus extracelular em clulas em cultura. A eliminao ou a desactivao insercional do gene da poliedrina leva produo de vrus de ocluso negativa (Occ-), que formam placas de lise distintas das formadas pelos vrus selvagem de ocluso positiva (Occ+). Estas morfologias distintas das placas fornecem um meio de escrutinar visualmente os vrus recombinantes, nos quais o gene da poliedrina do tipo selvagem AcMVPV foi substitudo por um outro gene, ou por um hbrido. A natureza no essencial e os elevados nveis de expresso do gene da poliedrina, aliados facilidade com a qual os vrus recombinantes Occ- podem ser detectados, tornam o promotor deste gene particularmente apropriado para a construo dum vector de expresso. Construo dum vector de transferncia do baculovrus A maioria dos vectores de transferncia contm sequncias do AcMNPV que incluem o promotor do gene da poliedrina e vrias percentagens do DNA viral, que flanqueia em 5' e em 3' o gene da poliedrina, clonado num plasmdeo bacteriano de nmero elevado de cpias. As sequncias do gene estrangeiro no plasmdeo recombinante podem ser transferidas para o AcMNPV por recombinao homloga, no interior de uma clula transfectada com os DNAs do plasmdeo e do vrus selvagem. O vector de transferncia um plasmdeo baseado em E. coli que contm um segmento de DNA de AcMNOV composto pela regio promotora da poliedrina e a montante uma poro adjacente do DNA de AcMNPV, um stio mltiplo de clonagem, as regies de terminao e sinal de poliadenilao da poliedrina e a jusante uma poro adjacente do DNA de AcMNPV. A regio codificante do gene das poliedrina foi eliminado deste bloco de DNA. Os segmentos de DNA de AcMNPV a montante e a jusante fornecem as regies para a recombinao homloga com AcMNPV. O gene de interesse clonado na orientao correcta entre as sequncias do promotor e do terminador da poliedrina e a construo propagada em E. coli. Clulas de insecto (S. furgiperda) em cultura so co-transfectadas com uma mixtura de DNA viral (AcMNPV) e o vector de transferncia contendo o gene clonado. Dentro de algumas clulas duplamente cotransfectadas, um acontecimento de dupla recombinao ocorre e o gene clonado com as regies do promotor e do terminador integra-se do DNA de AcMNPV com a concomitante perda do gene da poliedrina. Os viries a que faltar este gene (Occ-) produzem zonas de lise celular distintas (placas de ocluso negativas), identificadas

105

visualmente ou por hibridao com uma sonda de DNA, a partir das quais o baculovrus recombinante isolado e purificado at atingir a homogeneidade. A Fig. 176.II. esquematiza a sequncia de etapas de clonagem de um gene estrangeiro e o escrutnio de placas recombinantes. Um fragmento apropriado de gene estrangeiro inserido num vector de transferncia na orientao correcta a jusante do promotor da poliedrina. Clulas de insecto (S. furgiperda) em cultura so co-transfectadas com uma mixtura de DNA viral (AcMNPV) e de plasmdeo e a progenitura viral plaqueada. Os recombinantes virais Occ- so identificados visualmente e purificados a partir da placa, at atingirem a homogeneidade. A identificao visual das placas Occ- morosa e subjectiva. Por isso a hibridao com uma sonda da DNA ou uma anlise PCR podem ser utilizadas para detectar os baculovrus recombinantes. Alm disso se o gene lacZ de E. coli que codifica a -galactosidase colocado sob o controlo dum promotor de baculovrus que ligado durante as fases precoce e tardia do ciclo ltico e que esta construo inserida na unidade de DNA que incorporada no genoma de AcMNPV, as placas recombinantes tornam-se azuis quando o um substrato cromognico X-gal da -galactosidase adicionado ao meio. Ciclos adicionais de infeco de clulas de insecto com vrus das placas Occ- levam a um aumento da concentrao de vrus recombinantes. O baculovrus recombinante independente de helpers produz uma protena recombinante 48-72 horas aps a infeco, a qual essencialmente ltica aps 4-5 dias. A protena heterloga recuperada 4 a 5 dias aps as clulas hospedeiras serem infectadas com um stock de baculovrus recombinante de ttulo elevado. O sistema de vector de expresso de baculovrus tem sido usado para produzir mais de 500 protenas heterlogas diferentes. Um vector de transferncia utilizado para a introduo de genes estrangeiros no AcMNPV o pAC373 (Fig. 177.II.). Deriva dum plasmdeo constitudo por um fragmento EcoRI de 7kb contendo o gene da poliedrina de AcMNPV clonado no fragmento EcoRIHindIII de pVC8. Aps mutagnese com Bal31 e adio de linkers BamHI (CGGATCCG), obtm-se o plasmdeo pAC373 que contm a eliminao duma sequncia entre a posio -8 (8 bases a montante do ATG do gene da poliedrina e aproximadamente 40 bases a jusante do stio de iniciao de transcrio) e os locais naturais BamHI no ncleotdeo +121. Uma boa expresso de protenas estrangeiras no fusionadas requer que os genes estrangeiros tenham uma sequncia condutora curta. Os comprimentos das sequncias no codificantes em 3' e 5' (cuja influncia em relao aos nveis de expresso se desconhece) dos genes expressos em vectores dos baculovrus tm variado de 3 a 400 bases. Como a sequncia condutora da poliedrina muito rica em AT, recomenda-se, geralmente, que sequncias guias ricas em G-C ou demasiado compridas, sejam truncadas, tanto quanto possvel, antes do gene estrangeiro ser inserido no vector de transferncia.
106

Todos os vectores de transferncia tm o sinal de poliadenilao da poliedrina intacto. Bons nveis de expresso foram obtidos com genes que possuem os seus prprios stios de poliadenilao adicionados aos do gene da poliedrina. Todos os genes expressos com nveis elevados foram derivados de cDNA ou de clones de genomas que no contm intres. Foram construdos vrios outros vectores de transferncia apropriados para a produo de protenas fusionadas ou no fusionadas. Actividade biolgica das protenas recombinantes As protenas recombinantes produzidas nas clulas de insecto, em vectores de baculovrus, so biologicamente activas e a maioria processada ps-traduo, produzindo produtos recombinantes muito semelhantes s protenas autnticas. As protenas recombinantes podem ser segregadas, dirigidas para o ncleo, para a superfcie da clula, associadas em complexos oligomricos e em dmeros ligados por pontes dissulfureto, clivadas proteoliticamente, fosforiladas, N-glicosiladas, O-glicosiladas, miristiladas ou palmitiladas. Estes produtos so antigenicamente, imunologicamente e funcionalmente semelhantes aos seus anlogos naturais. Todavia, muito est ainda por elucidar acerca da natureza da glicosilao nas clulas dos insectos. A capacidade destas clulas para efectuarem a N-glicosilao implica a adio de oligossacardeos do tipo manose pesado. Estudos efectuados com linhagens celulares de Aedes aegypti e Aedes albopictus (mosquitos), mostraram que os oligossacardeos ligados Asparagina so deficientes em cido silico, galactose e fucose. Assim, a converso de manose pesado em complexos oligossacardicos ligados a N parece no se efectuar naquelas clulas de insectos. Nas clulas de mosquitos a ausncia de complexos N-glicanos foi confirmada pelos baixos nveis de N-acetilglucosaminil-, galactosil- e sialitransferases, responsveis pela maturao dos manose-N-glicanos pesados das glicoprotenas dos mamferos. Est ainda por elucidar se esta diferena aparente ou potencial na via do processamento oligossacardico entre insectos e vertebrados um factor importante na produo de glicoprotenas nas clulas de insectos, ou se diferentes linhagens de clulas de insectos apresentam capacidades diferentes para glicosilar protenas estrangeiras. Alguma investigao ainda necessria para elucidar os detalhes moleculares do processamento, transporte e conduo das protenas recombinantes produzidas por clulas de insectos.

107

f.

Introduo de genes estrangeiros em vulos fertilizados. Animais transgnicos

A transfeco de clulas em cultura fornece um instrumento indispensvel ao estudo da regulao dos genes de eucariotas. Esta abordagem , no entanto, limitada a clulas muito diferenciadas e no fornece nenhuma indicao sobre os mecanismos moleculares responsveis pelo controlo da expresso dos genes num dado tecido celular, nem sobre a evoluo deste controlo durante o desenvolvimento embrionrio. Uma maneira de abordar estes problemas baseia-se na introduo de genes estrangeiros, facilmente identificveis, em zigotos ou embries precoces e na anlise da sua expresso nos tecidos destes embries ou dos animais deles nascidos. O mtodo, simples no seu princpio, consiste na deposio duma soluo dos genes clonados no ncleo dum ovo (de rato por exemplo) recentemente fecundado (a deposio no citoplasma conduz frequentemente degradao rpida do DNA por enzimas). Mais precisamente, a soluo de DNA microinjectada num dos pro-ncleos pertencentes s clulas sexuais, antes que elas se associem no ovo fecundado. O pro-ncleo macho, pertencente ao esperma, habitualmente escolhido para a micro-injeco, porque de maiores dimenses e permanece durante algumas horas perto da superfcie do vulo fecundado (Fig. 168.II.). Os ovos de mamfero (rato, porco, etc.) assim injectados so, ou reintroduzidos no oviducto duma fmea portadora, preparada hormonalmente para o efeito, ou desenvolvidos in vitro, em cultura, at ao estado blastocito antes de serem implantados no tero (Fig. 169.II.). Este gnero de experincias foi realizado com vrios genes clonados, correspondentes hormona de crescimento, ao interfero, insulina, globina, timidina kinase, etc. De 200 a 30.000 molculas de DNA, de comprimento varivel entre 5 e 50 kbases so injectadas por ovo. A percentagem de sobrevivncia dos ovos injectados de rata de 10 a 30 % e a proporo de ratas que integram o DNA injectado nos seus cromossomas de cerca de 40 %. A percentagem de sucesso parece, no entanto, depender da estirpe de rato e da espcie utilizada. A tcnica muito menos eficaz quando aplicada ao carneiro, vaca, ao porco e ao coelho. Na maioria dos casos analisados, vrias cpias de DNA micro-injectado encontram-se integradas num dos cromossomas dum par de cromossomas, no rato adulto. Duma experincia para outra a integrao ocorre num cromossoma qualquer, o que mostra que o processo de integrao no especfico. O DNA integrado encontra-se habitualmente tanto nas clulas somticas como nas clulas germinais (vulos e esperma). Ele , portanto, transmitido por intermdio destas como um carcter mendeliano (Fig. 170.II.), o que implica que o acontecimento de integrao se passa muito cedo durante o desenvolvimento embrionrio, antes de a populao de clulas germinais se separar das clulas somticas de origem. O DNA estrangeiro pode-se transmitir durante vrias geraes; integra-se, portanto,
108

de maneira estvel, no genoma do rato, sem no entanto lhe conferir nenhuma vantagem selectiva. Os pontos fracos deste mtodo de micro-injeco so a impossibilidade de prever qual o nmero de cpias de um dado gene que se vai inserir no patrimnio gentico do animal e a localizao da insero, que se faz ao acaso, o que tm, por vezes, como efeito, desactivar certos genes da clula hospedeira e provocar anomalias morfolgicas mais em menos graves. Alm disso, o nvel de funcionamento do gene estrangeiro totalmente imprevisvel. Expresso do DNA estrangeiro nos animais transgnicos Os vulos micro-injectados que chegam ao seu termo normal de desenvolvimento so unicamente aqueles cujo desenvolvimento embrionrio no perturbado pela integrao do DNA estrangeiro. , pois, necessrio que o DNA integrado o seja de forma passiva, seja geneticamente silencioso e no expresso, ou controlado normalmente na sua expresso. O exemplo seguinte mostra que a expresso do DNA integrado pode ser especfica de tecidos celulares. Quando um plasmdeo, portador do promotor da metalotionena (MT) a montante da sequncia que codifica para a timidina kinase, microinjectado em embries de rato, prev-se que a expresso do gene da timidina kinase seja controlada por sinais moleculares que desencadeiam a aco do promotor da metalotionena, por ies Cd, por exemplo (o papel fisiolgico de metalotionena de fixar ies de metais pesados, sendo o promotor MT induzido por estes ies) (Fig. 171.II.). A exposio dos ovos micro-injectados a estes ies metlicos conduz, com efeito, sntese de timidina kinase. Por outro lado, os ovos micro-injectados, aps reimplantao em fmeas portadoras, do origem a uma descendncia que possui o gene MT-tK integrado no cromossoma numa proporo de 10 a 15 %. A injeco de sulfato de cdmio nestes ratos conduz sntese de timidina kinase, mas a expresso do gene integrado especfica de um tecido dado, neste caso, o fgado, o que corresponde localizao natural da metalotionena no rato. Durante as geraes seguintes, uma parte da descendncia perde o gene MT-tK. Entre os ratos que herdaram o gene, certos deixam de o expressar e outros expressam-no com abundncia superior dos pais. Aparentemente, durante a passagem pelo vulo e pelo esperma e durante o desenvolvimento embrionrio, acontecimentos importantes levaram extino ou amplificao da expresso do gene integrado. Numa outra abordagem experimental, um plasmdeo, portador do promotor da metalotionena de rato e do DNA genmico que codifica para a hormona de crescimento (GH) de rato, foi micro-injectado em vulos de rata (a hormona de crescimento, sintetizada normalmente na hipfise encontra-se no fgado onde desencadeia a sntese de somatomedinas que estimulam o crescimento muscular, sseo e cartilaginoso) (Fig. 172.II.). Este plasmdeo
109

contm os sinais de regulao MT e o DNA genmico que codifica para a GH, como o sinal de iniciao AUG, os exes e os intres correspondentes e o sinal de poliadenilao. A transcrio deste DNA fusionado conduz sntese de um RNA que codifica para a hormona de crescimento do rato. Na micro-injeco utiliza-se o plasmdeo linearizado, que se integra melhor que a molcula circular, razo de 600 cpias por pro-ncleo macho. Foram injectados e implantados 170 ovos no tero de ratas portadoras, das quais 21 chegaram ao seu termo. Sete ratos em 21 tinham o DNA integrado em vrias cpias num cromossoma. Seis destes 7 ratos desenvolveram-se mais rapidamente que os outros, mesmo na ausncia de induo do promotor MT com ies de cdmio. Como previsto, a hormona de crescimento nestes 6 ratos expressa-se 100 a 800 vezes mais que em ratos de controlo. A acelerao do crescimento nestes ratos transgnicos resulta, por consequncia, da integrao e da expresso do gene fusionado MT-GH (Fig. 173.II.). No domnio da micro-injeco de genes, os trabalhos que se desenvolvem actualmente visam essencialmente definir as mudanas moleculares que ocorrem durante a diferenciao e correlacionar estas modificaes com as alteraes da expresso dos genes integrados. A utilizao dos retrovrus Um outro tipo de experincias tira partido das propriedades dos retrovrus, afim de os utilizar como vectores que veiculam genes estrangeiros nos animais. Por exemplo, o DNA proviral do vrus MLV (vrus da leucmia de rato) pode ser integrado em embries de rato de duas maneiras diferentes: 1) infectando os embries com o vrus para desencadear a sntese de DNA proviral bicatenrio que seguida de integrao num cromossoma; 2) micro-injectando directamente o DNA proviral clonado nos embries. No primeiro caso, os resultados obtidos diferem completamente segundo o estado de desenvolvimento do embrio (32 clulas ou embrio de 8 a 10 dias) (Fig. 174.II.). A anlise da descendncia resultante da integrao no embrio de 32 clulas mostra que o DNA proviral est integrado em algumas clulas pertencentes a diferentes tecidos e, sobretudo, que este DNA proviral est intensamente metilado e no expresso. Na descendncia derivada da infeco de embries mais velhos, o DNA proviral encontra-se em todos os tecidos sob forma no metilada e muito expresso. Estes resultados sugerem que a metilao do DNA integrado determina, pelo menos parcialmente, a ausncia de expresso do gene. Parece, pois, evidente que os embries tardios no possuem mais a capacidade para metilar e, portanto, suprimir geneticamente, a expresso do DNA proviral. Numa segunda experincia, o DNA proviral, clonado a partir de clulas de um dos ratos da experincia precedente, foi injectado, 1) nos ncleos de vulos fertilizados, ou 2) no
110

citoplasma destes vulos. A descendncia resultante da micro-injeco no ncleo contm vrias cpias do DNA proviral em todas as clulas, altamente metiladas e no expressas. A descendncia derivada da micro-injeco no citoplasma, em compensao, contm uma s cpia de DNA proviral por clula e em todas as clulas. Alm disso, 10 % dos ratos produzem RNA mensageiro correspondente ao vrus MuLV, localizado em quantidade muito varivel em todos os tecidos. O stio de integrao no cromossoma parece, pois, influenciar a expresso do DNA viral duma maneira especfica de tecido. Concluses e resumo 1) possvel introduzir genes por micro-injeco em clulas somticas e germinais. 2) O stio cromossmico no qual se integra o DNA e o grau de metilao deste DNA influenciam a activao do gene durante o desenvolvimento. A ausncia de metilao pode ser correlacionada com a expresso do gene. 3) O grau de expresso do gene integrado tambm influenciado pela diferenciao celular e pode ser especfico do tecido. 4) Genes estrangeiros podem ser colocados sob controlo regulatrio normal das clulas hospedeiras.

111

10. ENGENHARIA GENTICA DE PLANTAS

O melhoramento gentico das espcies vegetais uma prtica milenria, cujos princpios s comearam a ser racionalizados com Mendel. No entanto, uma interveno racional no patrimnio gentico de plantas, s nas ltimas duas dcadas tm sido objecto de experincias laboratoriais, com um impacto, actualmente, j muito importante nas aplicaes de campo e com um futuro altamente promissor. Com efeito, os numerosos mtodos desenvolvidos nestas ltimas dcadas, que visam regenerar plantas a partir de clulas vegetais em cultura, conjugados com as tcnicas de DNA recombinante, abriram perspectivas novas para o melhoramento de plantas, nomeadamente no que respeita ao seu contedo em aminocidos essenciais, e resistncia a doenas, a pragas, a herbicidas e a factores ambientais. No mbito desta disciplina sero abordados unicamente os grandes princpios da manipulao do DNA vegetal.
Agrobacterium tumefaciens

Agrobacterium tumefaciens uma bactria gram fitopatognica, do solo, que infecta um certo nmero de plantas causando a formao de tumores, sobretudo no colo das dicotiledneas. A excrescncia, ou galha, que se desenvolve no colo da planta tm o nome corrente ingls de crown gall (galha do colo). Esta bactria vive habitualmente no solo e penetra na planta por uma ferida, em geral durante um Inverno rigoroso, exercendo o seu poder patognico nos tecidos que apresentam leses provocadas pela geada. O crescimento do tumor, em geral, s se termina com a morte da planta ou do rgo atingido (Fig. 178.II.). As clulas destes tumores assemelham-se fortemente s clulas cancerosas do tipo animal, tendo adquirido a propriedade de se multiplicarem de maneira independente e incontrolada. Em cultura, as clulas crown gall aglomeram-se formando um calo, isto , uma massa no organizada e pouco diferenciada de clulas, mesmo na ausncia de fito-hormonas (auxina, citoquinina) que so indispensveis cultura in vitro de clulas vegetais normais. Uma das primeiras contribuies importantes da cultura in vitro dos tecidos vegetais foi a de demonstrar que as clulas atingidas de crown gall contm substncias especficas que no existem nas clulas normais: as opinas, derivadas da arginina. Por um lado, estes compostos que nunca se encontram nas plantas ss, so utilizados pela bactria como fonte de carbono e de azoto. Por outro, o carcter tumoral das clulas de crown gall permanente, e independente da presena das bactrias que provocaram o aparecimento do tumor. Na realidade, o agente tumorgeno na bactria um plasmdeo, que funciona
112

integrando uma parte do seu DNA nos cromossomas das clulas vegetais hospedeiras e que expressa as funes necessrias para a induo e a metabolizao das opinas. As clulas da planta invadida por A. tumefaciens so incapazes de utilizar as opinas. Por consequncia, a infeco bacteriana no s induz um tumor na planta, mas ainda desvia o seu metabolismo para fabricar aminocidos que s podem ser consumidos pela bactria. descoberta, nas estirpes patognicas de A. tumefaciens, dum plasmdeo dum comprimento nunca antes observado noutro organismo (circular, 200 kbases, + 112 108 daltons, 3 a 5 % do cromossoma bacteriano) (Fig. 179.II.), seguiu-se rapidamente a demonstrao de que era ele que conferia o carcter patognico bactria; da o seu nome Ti, indutor de tumor (tumor inducing). Existem essencialmente dois tipos de plasmdeos Ti, caracterizados pela natureza da opina que induzem: plasmdeo octopina e plasmdeo nopalina (Fig.17.6). A bactria A. tumefaciens s pode conter um tipo de plasmdeo Ti. A sequncia em bases do DNA dos plasmdeos Ti pouco conservada, com excepo de quatro regies de elevada homologia, das quais uma, como foi demonstrado, se integra no genoma das clulas de crown gall. Ela corresponde a um fragmento de Ti, chamado T-DNA (DNA transferido). este T-DNA que, integrado no genoma da clula vegetal, confere clula, ao expressar-se, o carcter tumoral e a propriedade de sintetizar opinas. Vrias funes foram identificadas e estudadas no plasmdeo Ti. A funo Vir de virulncia, responsvel pela transferncia do T-DNA para a clula vegetal, a funo oncognica, Onc, responsvel pela proliferao tumoral, a funo ou as funes que especificam a sntese das opinas, Ops, e as funes catablicas (Opc: opine catabolism) que conferem estirpe bacteriana a possibilidade de degradar as opinas produzidas pelo tumor (Fig. 17.3). Convm distinguir bem dois tipos de funes: as funes situadas fora do T-DNA (Vir, Opc, etc.), que se expressam na bactria e no so propriamente patognicas, e as funes contidas no T-DNA, que se expressam na clula vegetal depois da transferncia deste fragmento (Onc, Ops) (Figs. 179.II. e 180.II.). A bactria, em si, no tm efeito patognico, no segrega toxinas, nem enzimas que dissolvam as paredes celulares, como outras bactrias fitopatognicas. A sua aco limita-se transferncia de um fragmento de DNA, o T-DNA, cuja expresso na clula vegetal responsvel pela doena. A eliminao, no plasmdeo Ti do segmento correspondente funo Onc, ou a desactivao, por mutao, dos seus genes, torna a bactria que o contm perfeitamente inofensiva, sem no entanto suprimir a propriedade de poder transferir o DNA para uma clula de planta.
113

Assim que se transfere para a clula vegetal o T-DNA expressa a suas funes. A funo oncognica (Onc) responsvel pela proliferao celular que conduz ao desenvolvimento do tumor. Esta proliferao a consequncia da sntese de auxina e de citoquinina, dois factores fito-hormonais que so em geral necessrios para a multiplicao e a diferenciao das clulas vegetais. Aqui se encontra a explicao do facto de as clulas crown gall em cultura no terem necessidade de fito-hormonas no meio. Estas hormonas determinam, uma, o aparecimento dos rebentos e, a outra, a formao das razes. Nas clulas normais, o equilbrio entre auxinas e citoquininas controla a via de diferenciao. Nas clulas de crown gall estas duas hormonas so produzidas em grande excesso, mantendo as clulas num estado indiferenciado. As funes Ops esto implicadas na sntese das opinas; no so patognicas, visto que o tumor se desenvolve perfeitamente quando elas so desactivadas por mutao e, por outro lado, a sua expresso na ausncia da funo Onc perfeitamente compatvel com o desenvolvimento normal das clulas ou das plantas que as comportam. O significado biolgico da correlao entre a sntese de opinas nos tumores e a sua degradao pelas bactrias fornecido pelo carcter parasitrio da bactria, que realiza uma manipulao gentica natural para criar o seu nicho ecolgico, fazendo a planta produzir substncias que lhe servem de alimento. De facto, a sntese das opinas constitui um desvio duma parte da actividade fotossinttica da planta em proveito da bactria (Fig. 181.II.).

O plasmdeo Ti como vector

O processamento e a transferncia do T-DNA so mediados por um sistema bacteriano, que reconhece as sequncias flanqueantes de T-DNA, de 23 pb cada. a regio compreendida entre estes limites que transferida e se integra no genoma da planta. Foi demonstrado que nenhum dos genes do T-DNA necessrio para o desenrolar deste processo e que qualquer gene estrangeiro colocado entre aquelas sequncias transferido com o TDNA para a clula vegetal. Para fazer funcionar, numa clula vegetal, um gene estrangeiro introduzido pelo T-DNA e pr em evidncia a sua expresso, foi efectuada uma primeira experincia fazendo intervir o crown gall de tabaco e um gene bacteriano (de E. coli) que confere resistncia ao antibitico cloranfenicol. Para obter a transcrio do gene na clula do tabaco, o promotor de E. coli foi substitudo por um promotor reconhecido pela RNA polimerase do tabaco, neste caso, o do gene da nopalina sintetase, proveniente do T-DNA de A. tumefaciens. O gene quimrico introduzido no plasmdeo Ti expressa, aps inoculao duma estirpe de Agrobacterium em plntulas de tabaco, a actividade de cloranfenicol transacetilase em
114

extractos dos tumores formados. Esta experincia demonstrou, pela primeira vez, que a expresso dum gene estrangeiro numa clula vegetal era possvel. Neste exemplo, as clulas transformadas eram tumorais e eram incapazes de regenerar um indivduo inteiro. A experincia fundamental seguinte utiliza um T-DNA "desarmado" dos genes tumorais, para veicular um gene de resistncia canamicina (Fig. 182.II.). O gene quimrico foi construdo associando in vitro a sequncia que codifica para a neomicina fosfotransferase (NPT), que confere a resistncia canamicina, uma sequncia promotora e uma sequncia terminadora do gene da nopalina sintetase (NoS) do T-DNA de A. tumefaciens. O gene assim construdo foi introduzido no plasmdeo Ti desarmado das funes Onc, o qual foi por sua vez integrado em A. tumefaciens. A bactria , em seguida, levada a infectar protoplastas de tabaco (, geralmente, mais prtico infectar clulas vegetais em cultura que induzir tumores numa planta inteira). O mtodo consiste em converter clulas derivadas de folhas de plantas em protoplastas, (clulas destitudas de membrana) que so infectados com A. tumefaciens portador do plasmdeo Ti recombinante e que, em cultura, regeneram a parede celular e se dividem. Aps algumas horas, as bactrias de A. tumefaciens so mortas adicionando um antibitico e as clulas, depois de algumas semanas de cultura em meio contendo fito-hormonas, formam amontoados celulares, ou calos. Neste momento, o meio de cultura substitudo por um meio sem hormonas, em presena de um agente selectivo que permita seleccionar as clulas que receberam o plasmdeo Ti. Estas sobrevivem, multiplicam-se e sintetizam opinas. Em certos casos regeneram espontaneamente rebentos e plantas inteiras. Algumas devem ser resistentes canamicina; sendo frteis, a transmisso do carcter de resistncia descendncia pode ser estudada, semeando as sementes resultantes duma autofecundao, num meio contendo canamicina. A observao do comportamento selectivo particularmente simples porque a canamicina interfere com o desenvolvimento dos cloroplastas (lugar de fotossntese). As plntulas sensveis aos antibiticos permanecem brancas. As plantas resistentes possuem a NPT que desactiva a canamicina e assegura o funcionamento do sistema cloroplstico, apresentam uma cor verde e continuam a desenvolver-se, enquanto que as plntulas brancas, incapazes de efectuar a fotossntese, morrero. Cerca de um quarto das plntulas no possui o gene de resistncia. Esta a proporo esperada para a segregao dum gene qualquer segundo as leis de Mendel. O gene introduzido comporta-se como os prprios genes de planta, fazendo parte do seu patrimnio gentico. O plasmdeo Ti possui duas caractersticas ideais para promover a introduo de DNA heterlogo em clulas de plantas.

115

1) A. tumefaciens pode infectar praticamente todas as plantas dicotiledneas e em certas condies monocotiledneas, tais como o trigo e o milho. 2) O T-DNA integrado nos cromossomas de plantas transmite-se de maneira mendeliana. Os genes contidos no T-DNA so, ainda, portadores dos seus prprios promotores aos quais se podem associar genes estrangeiros e que podem dirigir a expresso destes. A maneira mais simples de introduzir o T-DNA nas clulas vegetais consiste em infectlas com A. tumefaciens portador do plasmdeo apropriado e deixar agir a natureza. Bastaria, como vimos, inserir os genes de interesse na regio T do plasmdeo Ti. No entanto, isto no muito cmodo, devido ao tamanho enorme deste plasmdeo. Com a descoberta da propriedade, que possuem as funes de virulncia, de agir distncia, foram desenvolvidos sistemas binrios de transferncia de genes que, como o nome indica, fazem intervir dois plasmdeos. Um dos plasmdeos o Ti sem T-DNA. O outro um pequeno plasmdeo que serve de vector aos genes a introduzir. Este segundo plasmdeo tm, alm disso, a propriedade de se poder multiplicar, tanto em E. coli, como em A. tumefaciens. Esta propriedade, assim como o seu tamanho relativamente pequeno, simplifica consideravelmente as manipulaes para a realizao de construes de genes a introduzir nas plantas. A abordagem utilizada est representada nas Figs. 183.II. e 17.7. O T-DNA primeiramente excisado do plasmdeo Ti por digesto com enzimas de restrio e, em seguida, introduzido num vector de procariota, como o pBR322. O T-DNA clonado pode assim ser amplificado e isolado. Na etapa seguinte, um gene dado inserido no T-DNA, sem afectar as funes essenciais deste DNA. O hbrido , em seguida, introduzido nas bactrias de A. tumefaciens contendo o plasmdeo Ti intacto. Por recombinao gentica homloga entre o T-DNA hbrido e o T-DNA do plasmdeo Ti, obtm-se plasmdeos Ti completos portadores do T-DNA hbrido. Alternativamente, basta fornecer um Ti contendo unicamente a regio vir, para assegurar a transformao das plantas; neste caso, deixa de haver recombinao homloga mas existe somente complementao de funo. Tambm possvel transformar protoplastas vegetais com o DNA do plasmdeo Ti recombinante; este mtodo , no entanto, muito menos eficaz que o precedente, mas mostra que a bactria A. tumefaciens no essencial para a transformao e o seu papel s de facilitar a introduo do plasmdeo Ti nas clulas. A regenerao de plantas inteiras e frteis, a partir de clulas tumorais, no , como vimos, geralmente, possvel se se utilizar o plasmdeo Ti intacto. No entanto, certos mutantes Ti contm eliminaes na regio T, que suprimem a capacidade para formar tumores mas
116

mantm a sntese de opinas. As clulas vegetais transformadas por este plasmdeo Ti mutante comportam-se, em cultura, como clulas normais e podem ser regeneradas em plantas frteis. A ttulo de exemplo, a Fig. 184.II. descreve um sistema de vectores correntemente utilizado que consiste, por um lado, num vector vaivm do tipo pBR322 e por outro lado, num vector Ti aceitador no oncognico. Este vector excisado dos genes que impedem a diferenciao das clulas transformadas (funes responsveis, como vimos, pela sntese de fito-hormonas). Os genes removidos do T-DNA so substitudos pelo plasmdeo pBR322. A extremidade direita do T-DNA residual codifica a enzima nopalina sintetase. Esta actividade enzimtica serve de marcador para a seleco das clulas transformadas. O gene heterlogo que se pretende introduzir na planta , primeiro, clonado no vector vaivm derivado do pBR322 e, em seguida, inserido no plasmdeo Ti onc-, aceitador, por recombinao homloga. Um simples crossing-over conduz co-integrao do vector vaivm no Ti onc-, entre as regies flanqueantes do T-DNA. Se um marcador de seleco apropriado (resistncia a um antibitico) for utilizado no vector vaivm, poder-se- seleccionar para este acontecimento de recombinao em A. tumefaciens (pBR322 no se replica em A. tumefaciens). Pode-se, por exemplo, introduzir no vector vaivm, o promotor vegetal (NOS) associado a um gene de resistncia canamicina, nas plantas, seguido das regies (NOS) que codificam para o splicing e a poliadenilao dos mensageiros. Por consequncia, esta unidade de transcrio funcionar na planta e permitir seleccionar para a resistncia canamicina, i. ., para os transformantes.
Expresso controlada pela luz e especfica de rgo, dum gene de trigo em plantas de tabaco

A transformao das monocotiledneas com A. tumefaciens no corrente. Aparentemente, o processo de transformao pelo plasmdeo Ti falha ao nvel do colo. Ora, uma grande parte dos vegetais de consumo corrente pertencem famlia das monocotiledneas, tais como os cereais milho, trigo, arroz. , no entanto, possvel expressar e controlar normalmente genes de monocotiledneas em plantas dicotiledneas. A introduo do gene de trigo que codifica para uma protena do complexo de assimilao da luz (cab) no genoma do tabaco, pelo sistema Ti, e a regenerao de plantas inteiras, um exemplo. Na primeira etapa, deriva-se do genoma de trigo o DNA genmico que codifica para a protena Cab e clona-se num vector vaivm, do tipo pBR322, contendo um sistema de seleco para procariotas (SpcR / StrR), um sistema de seleco para clulas vegetais (NOS/NPTII) (resistncia canamicina), uma regio de homologia com o plasmdeo Ti e a regio do T-DNA (Fig. 185.II). Este plasmdeo recombinante , em seguida, mobilizado na
117

bactria A. tumefaciens "desarmada", i. ., contendo um Ti Onc-. Os protoplastas de tabaco so transformados e as clulas resistentes canamicina seleccionadas. Aps a obteno de calos, as plantas completas so regeneradas em condies apropriadas. Pode-se em, seguida, verificar que o gene cab, integrado nas plantas transgnicas, expresso e controlado pela luz de maneira idntica da planta de origem. Para isso, expem-se as plantas transgnicas a perodos variveis de iluminao ou de obscuridade, em seguida, extrai-se o RNA mensageiro das folhas e doseia-se por hibridao com um fragmento de DNA radioactivo (Northern blotting), derivado do gene cab. Os resultados mostram que o gene cab do trigo se expressa, pois o RNA mensageiro detectado correctamente transcrito, processado e poliadenilado. Alm disso, a percentagem do mensageiro cab claramente funo do tempo de exposio luz; decresce quando as plantas permanecem na obscuridade e aumenta quando so iluminadas. Constata-se, por outro lado, que a sntese do produto codificado pelo gene cab nas plantas transgnicas especifico de rgo; encontra-se uma grande quantidade de mensageiros nas folhas e praticamente nenhum nos caules, razes e ptalas (Fig. 186.II.). Estes resultados mostram que o gene cab do trigo transcrito correctamente e se expressa selectivamente nas plantas transgnicas e que, portanto, o sistema de transcrio nuclear das dicotiledneas reconhece as regies reguladoras do gene cab derivado duma monocotilednea. Para que este tipo de manipulao apresente um interesse agronmico preciso identificar, isolar e clonar genes susceptveis de melhorar plantas cultivadas. Se os caracteres tiverem uma base gentica complicada isto pode constituir uma tarefa difcil. O rendimento de produo ou a resistncia duma planta ao frio, por exemplo, so provavelmente caracteres governados por numerosos genes que no sero, sem dvida, durante bastante tempo, objecto de manipulaes. Em compensao, quando se trata dum gene microbiano ou mesmo dum gene vegetal, cujo produto (uma enzima ou uma protena de estrutura) conhecido e, de preferncia, abundante ou fcil de purificar, o objectivo mais fcil de atingir: o gene pode ser isolado, a sua sequncia determinada, pode ser manipulado in vitro, sinais apropriados de expresso podem ser-lhe associados e a introduo numa planta, efectuada nas condies definidas acima.
Plantas transgnicas

a) Resistncia a herbicidas O milho naturalmente resistente a uma famlia de herbicidas, as triazinas. As condies de produo deste cereal foram altamente melhoradas pela possibilidade de utilizar estes herbicidas para matar as ervas daninhas nos milheirais. A resistncia do milho s triazinas o
118

resultado duma desintoxicao enzimtica da molcula herbicida. O gene responsvel por esta desintoxicao foi recentemente clonado e de prever que seja introduzido noutras plantas que, como o soja, esto frequentemente associadas ao milho no afolhamento. O estudo e a utilizao de genes quimricos que conferem resistncia aos herbicidas, so objecto de importantes projectos industriais. Um dos resultados mais espectaculares foi obtido pela introduo no tabaco, na batata, no tomate, no colza, na beterraba, por exemplo, de um gene de resistncia a um herbicida no selectivo correntemente utilizado, a fosfinotricina. O gene que confere a resistncia a este herbicida foi isolado a partir de Streptomyces hygroscopicus. Ele codifica para a fosfinotricina acetiltransferase que acetila os grupos NH2 livres da fosfinotricina e, consequentemente, impede naturalmente a autotoxicidade da fosfinotricina em Streptomyces. As plantas transgnicas sintetizam a enzima codificada pelo gene transferido e suportam o herbicida pulverizado em doses dez vezes superiores s normalmente utilizadas na agricultura. As plantas assim manipuladas transmitem descendncia o gene nelas expresso (Fig. 187.II.C). As consequncias agro-econmicas derivadas deste gnero de manipulao so fceis de imaginar. As previses so, alis, pouco ecolgicas, se elas se traduzirem unicamente pela generalizao da utilizao de herbicidas. Em compensao, as perspectivas parecem mais favorveis na luta contra insectos nocivos ou contra vrus, fungos ou bactrias. b) Resistncia a insectos Preparaes comerciais de esporos da bactria Bacillus thuringiensis tm desempenhado um papel importante no controlo biolgico de insectos nos campos. Elas associam uma elevada toxicidade para com os insectos e uma segurana biolgica em relao ao meio ambiente. B. thuringiensis no afecta todos os insectos e completamente no txico para os vertebrados. As incluses cristalinas produzidas durante a esporulao contm protenas insecticidas que afectam o epitlio do tracto intestinal de certos insectos, nomeadamente as larvas dos lepidpteros. Os cristais dissolvem-se nas condies alcalinas do tracto intestinal do insecto e libertam protenas que so processadas proteoliticamente pelas proteases do insecto, produzindo fragmentos polipeptdicos txicos, de massa molecular compreendida entre 65.000 e 160.000 daltons. O gene bt2 de B. thuringiensis codifica uma protena Bt2, que uma toxina potente para as larvas de vrios lepidpteros, tais como Manducta sexta, que uma praga da planta do tabaco. Bt2 uma protoxina que gera um polipptido de menor tamanho (60.000), que conserva ainda uma plena actividade txica. Nas experincias de transformao da planta do tabaco foram utilizados vrios genes quimricos contendo a sequncia completa de bt2, assim como genes excisados.
119

As construes no T-DNA incluem, para alm das sequncias de bt2, o gene da neomicina fosfotransferase (neo), marcador de seleco de resistncia canamicina (NPTII), um promotor constitutivo do gene 2, que dirige a expresso da manopina sintetase no TR DNA do plasmdeo pTiA6 (Fig. 188.II.) e sinais de terminao e de poliadenilao da extremidade 3' do gene. Os plasmdeos resultantes destas construes no T-DNA dos vectores de expresso em plantas, pGSH160 ou pGSH150 (Fig. 189.II), foram mobilizados em A. tumefaciens, receptor que contm um plasmdeo Ti octopina (pGV2260), do qual a regio T-DNA foi excisada e substituda por pBR322. Recombinaes entre o pGV2260 e o vector de expresso, atravs das sequncias homlogas de pBR322, produziram plasmdeos Ti contendo as vrias construes incluindo o gene bt2 e seus derivados excisados (Fig. 190.II.). As plantas de tabaco transgnicas foram obtidas por infeco de discos de folhas de Nicotiana tabacum. Rebentos resistentes canamicina foram seleccionados em todas as experincias de transformao, indicando que os genes fusionados conferem, com efeito, actividade NPTII s clulas das plantas transformadas. As plantas transformadas foram cultivadas individualmente e controladas, subsequentemente, em relao resistncia canamicina, testando a sua capacidade para produzirem calos a partir de discos de folhas em concentraes crescentes de canamicina. As folhas das plantas transgnicas, que contm os vrios tipos de construo do gene de B. thuringiensis, foram dadas como alimento s larvas de M. sexta, a fim de avaliar se os nveis de toxina expressos na planta tinham efeitos insecticidas. Observou-se 75-100 % de mortalidade das larvas, num quarto das plantas que expressavam a protena fusionada BtNPT23 mais longa e em dois teros das que expressam a fuso menor Bt-NPT860 (Fig. 190.II). A toxicidade para com os insectos est directamente correlacionada com o nvel de resistncia canamicina. Constatou-se, ainda, que s os genes bt2 incompletos expressam nveis de protena fortemente insecticidas nas plantas transgnicas de tabaco, sendo a fuso de menor comprimento a que produz os maiores nveis de protena biologicamente activa. Os resultados de experincias visando a determinao da real eficcia de proteco contra os estragos causados pelos insectos esto exemplificados nas Fig. 187.II.A e B e 191.II. Eles mostram que possvel proteger plantas transgnicas programadas para produzirem toxinas contra pragas de origem larvar. Para verificar se esta propriedade hereditria a descendncia F1 destas plantas transgnicas foi testada, tanto em relao resistncia canamicina, como toxicidade para com as larvas de M. sexta. A actividade insecticida revelou-se idntica observada nas plantas parentais, confirmando o carcter hereditrio da proteco.
120

O exemplo da construo de plantas de tabaco resistentes s larvas de M. sexta, descrito com certo pormenor, ilustra as potencialidades ofertas pelas manipulaes genticas das plantas. Outros estudos sobre a proteco contra doenas fngicas, bacterianas ou virais tm sido desenvolvidos. Assim, por exemplo, resultados obtidos com o vrus do mosaico do tomate, o vrus do mosaico da luzerna, o vrus do mosaico do pepino ou o PVX de batata mostram que, quando um gene codificando uma protena da cpsula do vrus se expressa nas plantas transgnicas, estas adquirem uma proteco considervel contra a infeco viral. c) Resistncia a vrus O princpio de proteco viral de plantas atravs da inoculao de estirpes atenuadas de vrus ou de virides, a fim de impedir a infeco por estirpes mais virulentas, conhecido dos agricultores, que o tm aplicado desde h muito tempo. uma prtica que foi utilizada para reduzir os prejuzos provocados em culturas de tomates, de batatas ou em citrinos, por exemplo e causados pelos vrus do mosaico do tomate (TMV), pelo viride fusiforme do tubrculo e o vrus da tristeza dos citrinos. Esta prtica, denominada proteco cruzada, tm vrios inconvenientes e insuficincias, tais como o risco de mutao da estirpe atenuada numa estirpe mais virulenta, ou o desenvolvimento duma condio patognica derivada de uma eventual sinergia entre a estirpe atenuada do vrus e um outro vrus presente na cultura, que tenha caractersticas mais severas que a causada por cada um dos vrus ou, ainda, o risco de o vrus protector duma planta poder ser um patgeno severo para outra. A estirpe protectora pode ainda causar um prejuzo significativo, mesmo reduzido. Fazer expressar na planta o princpio activo da proteco, inscrito definitivamente no seu genoma e, consequentemente transmissvel hereditariamente, resolveria os problemas inerentes proteco cruzada, com a vantagem suplementar de propagar definitivamente s geraes futuras as caractersticas protectoras. O desenvolvimento da engenharia gentica aplicada s plantas permitiu realizar progressos notveis, tambm nesta rea. Foi, com efeito, demonstrado que a expresso constitutiva, numa planta transformada geneticamente, da protena do invlucro dum vrus, ou protena capsdica (CP), assegura a imunizao da planta contra a infeco por esse vrus. Este fenmeno, ainda mal compreendido, parece ser geral e foi posto em evidncia em vrias espcies vegetais, tais como a planta do tabaco, a luzerna, o pepino, a batata. Analisemos em mais detalhe um exemplo de transformao duma variedade de batata (Russet Burbank), que confere planta transgnica resultante a resistncia dupla aos vrus PVX e PVY. Estes vrus causam baixas importantes de rendimento de produo da batata, que podem atingir 80 %, sobretudo o PVY.
121

O PVY possui um RNA nico de cerca de 10.000 nucleotdeos de comprimento. Possui uma pequena protena (Vpg) ligada covalentemente sua extremidade 5' e a extremidade 3' poliadenilada. O genoma expressa-se na forma de precursor de poli-protena que processada ps-traduo em protenas singulares. A protena CP do invlucro gerada por clivagem da poli-protena por uma protease viral. Ao contrrio do PVX, que s se transmite mecanicamente, o PVY transmitido tambm por afdeos. O PVX possui um RNA monocatenrio nico, de 6.4 kbases, com estrutura chapu em 5', uma sequncia poli A em 3' e cinco fases abertas de leitura. A sua sequncia nucleotdica era conhecida antes da do PVY. Esta foi determinada a partir do cDNA obtido num banco construdo em gt10, preparado utilizando um iniciador oligo T e escrutinado com um oligonucleotdeo sinttico degenerado. A sequncia desta sonda foi deduzida da sequncia dos aminocidos N-terminais da protena do invlucro. Os clones de cDNA identificados com esta sonda foram sub-clonados no mp19 e as suas sequncias nucleotdicas determinadas. A sequncia do RNA da protena CP de PVY constituda por 801 nucleotdeos traduzida em 267 aminocidos que constituem a protena. Para expressar o cDNA da CP do PVY nas plantas transgnicas, a sequncia codificante foi alterada por mutagnese dirigida a fim de criar uma sequncia de comeo de traduo, no incio da sequncia codificante, e um stio de restrio para clonar o cDNA em vectores de expresso de plantas. Um stio NcoI foi criado a montante do codo do aminocido N-terminal, alanina e um stio BglII foi introduzido 11 pares de bases a montante do stio NcoI (Fig. 192.II.). A criao dum stio NcoI introduz um codo de metionina na extremidade N da CP de PVY. O DNA mutagenizado, comportando 326 pb da sequncia no traduzida em 3', foi inserido no vector pMON906, entre a sequncia estimulada do promotor 35S do CaMV (vrus do mosaico da couve-flor) e a sequncia 3' terminal E9 do gene da RuBP carboxilase (pequena subunidade da ribulose-1,5-bifosfato carboxilase de ervilha -rbcS), dando origem ao vector pMON9892. A sequncia estimulada do promotor 35S do CaMV uma construo obtida por duplicao de 250 pb a montante do promotor, as quais actuam como sequncias estimuladoras (enhancers), aumentando de 10 vezes a actividade da transcrio natural do promotor. A sequncia que codifica para a CP do PVX situa-se na regio 3' do genoma que traduzida, in vivo, a partir dum RNA sub-genmico. A sequncia nucleotdica deste gene comporta 711 pares de bases e codifica para uma protena de 237 aminocidos. Para construir o vector pMON9898 que contm as sequncias codificantes da CP de ambos os vrus, o gene da protena do invlucro de PVX foi removido do vector 9809 e ligado no pMON893 que um derivado do pMON200, que contm a extremidade 3' da protena de reserva 7S do soja e desprovido do gene da nopalina sintetase. Um fragmento HindIII de DNA, que contm o
122

promotor estimulado 35S do CaMV, o gene da CP do PVY e a extremidade 3' da rbcS E9, foi excisado de pMON9892 e ligado ao pMON9896. O vector resultante, pMON9898, foi utilizado para transformar a batata Russet Burbank, recorrendo a um sistema de transformao mediado por A. tumefaciens cujo princpio descrevemos acima. A Fig. 193.II. mostra os resultados das anlises, por Northern blotting, dos transcritos de PVX e de PVY obtidos por purificao do RNA total extrado de folhas de plantas transgnicas e a Fig. 194.II., as anlises, por Western blotting, da expresso das CP de PVX e de PVY separadas da mistura de protenas extradas das folhas das mesmas plantas. Os nveis de expresso das protenas de invlucro de PVX e de PVY situam-se entre 0.05-0.2 % e 0.010.05 % do total das protenas das folhas, respectivamente. Estas protenas exognicas asseguram a proteco das plantas transgnicas contra as infeces por PVX e por PVY. Foi, com efeito, demonstrado em experincias de challenge nas quais, concentraes crescentes de vrus foram inoculadas em folhas de batata, que as plantas transgnicas possuem uma excelente resistncia infeco (Fig. 195.II). No entanto, a maior parte das linhagens transgnicas sensvel infeco simultnea pelos dois vrus, o que confirma observaes anteriores de que a infeco mista da batata, por PVX e PVY, causa um acrscimo sinergtico da severidade da doena. S uma linhagem se revelou resistente infeco simultnea pelos dois tipos de vrus, tanto por via mecnica, como por intermdio de afdeos. No parece existir correlao entre o nvel de expresso das protenas do invlucro e a capacidade de resistncia. Esta observao sugere que factores, tais como expresso especfica de um tipo de tecido ou de clula, ou a localizao sub-celular da CP, podem ser importantes para determinar o nvel de resistncia. Como foi demonstrado com outros exemplos, que as caractersticas de resistncia viral so herdadas de maneira estvel atravs de vrias geraes, esta abordagem poder ter um desenvolvimento geral importante na construo de plantas transgnicas resistentes a vrus. Qual o princpio que preside a este fenmeno de resistncia concedida pela expresso nos tecidos das plantas, da protena do invlucro viral?. Uma das hipteses avanada para explicar a proteco mediada pela CP afirma que o despojamento do invlucro do vrus impedido pela protena do invlucro. Algumas observaes, demonstrando a perda da resistncia infeco por inoculao do RNA viral, so compatveis com este mecanismo mas no excluem outras hipteses, tais como o impedimento pela CP da penetrao do vrus, ou a possibilidade de que, o impedimento do vrus perder o invlucro diminua a sua capacidade de disseminao de clula em clula, no caso da deslocao se fazer na forma de virio.

123

Observaes feitas com outros tipos de vrus levaram no entanto a resultados opostos, tendo sido posta em evidncia a proteco contra a infeco pelo RNA. Pode-se, neste caso, fazer a suposio de que a CP se liga ao RNA do vrus impedindo a traduo da replicase ou interferindo com a replicao. , pois, provvel, que os mecanismos de proteco variem com o tipo de vrus. d) Produtoras de pptidos Um dos resultados mais espectaculares obtidos com a construo de plantas transgnicas demonstra a possibilidade de fazer produzir pptdos de aplicao farmacutica por sementes. A experincia diz respeito ao neuropptido Leu-encefalina, pentapptido de sequncia TyrGlyGlyPheLeu, detentor de actividade opicea. A estratgia adoptada consiste em substituir uma parte do gene da protena de reserva albumina 2S de Arabidopsis thaliana, pelos codes correspondentes Leu-encefalina, numa regio menos conservada entre as diferentes espcies, a fim de tirar partido da presena abundante das albuminas 2S (de 20 % a 60 % do total das protenas de sementes em vrias espcies), para explorar a possibilidade de produzir quantidades grandes de pptidos na forma de protenas quimricas de reserva de plantas. A regio escolhida de insero na albumina 2S bastante varivel em comprimento e sequncia, portanto, pouco susceptvel de afectar a estrutura secundria e a estabilidade da protena. A substituio foi realizada de maneira a fazer corresponder os resduos 35-41 da protena resultante encefalina flanqueada por resduos lisina, necessrios para realizar a clivagem do pptido do restante da albumina 2S. A construo do gene hbrido foi efectuada substituindo parte do gene da 2S, clonado num plasmdeo, por mutagnese dirigida utilizando um oligonucleotdeo sinttico. A construo final do gene quimrico no vector T-DNA, utilizado para transformar a planta, compreende, nomeadamente, o gene quimrico, os genes neo e hph, marcadores de seleco de resistncia canamicina e higromicina, as extremidades 3' do gene da octopina sintetase e do gene 7 do T-DNA, o promotor bi-direccional, PTR, do T-DNA (Fig. 196.II.). O plasmdeo pGSATE1, construdo, foi mobilizado em A. tumefaciens e as plantas transgnicas Arabidopsis foram obtidas por infeco em disco de folha e seleco, subsequente, com canamicina. As sementes obtidas a partir das plantas regeneradas foram germinadas em presena de canamicina. A protena foi extrada a partir das sementes provenientes desta segunda gerao, purificada e tratada enzimaticamente para extrair a Leu-encefalina. O rendimento obtido com este exemplo de 200 nmol/g de semente.

124

As plantas monocotiledneas

At h pouco tempo pensava-se que s a classe das dicotiledneas podia ser transformada por A. tumefaciens, sendo as monocotiledneas resistentes ao crown gall. Mostrou-se, no entanto, que esta limitao no absoluta, pois certas monocotiledneas, como o espargo ou o narciso, so permeveis transformao por A. tumefaciens. No que respeita aos cereais, comeou a poder-se realizar transformaes sem recorrer a A. tumefaciens, adicionando o DNA no integrado num organismo ao meio de cultura de protoplastas de cereais. Clulas transformadas em cultura, resistentes canamicina, podem ser assim obtidas. O mtodo utilizado, ao comeo, com as dicotiledneas, consiste em fazer penetrar o DNA purificado nos protoplastas. Diferentes tcnicas tm sido utilizadas, entre as quais a electroporao parece particularmente eficaz.
Outros mtodos de transformao

O princpio da electroporao consiste em submeter os protoplastas a uma forte descarga elctrica de curta durao, que cria na membrana poros minsculos, pelos quais o DNA pode penetrar (Fig. 4.27). Para alm da electroporao, outros mtodos, que no so limitados pela espcie vegetal, e que podem ser utilizados com tecidos de plantas de razes, caules ou folhas, so por exemplo a micro-injeco, o bombardeamento de microprojcteis e a precipitao com o fosfato de clcio. A transformao por bombardeamento de microprojcteis, tambm chamada biolstica, foi desenvolvida com o objectivo de transformar cereais, como o trigo, que dificilmente so atacados por Agrobacterium. Este mtodo consiste em disparar directamente sobre as clulas ou tecidos vegetais, minsculas esferas de metal revestidas com DNA. As esferas utilizadas so de ouro ou tungstnio e tm, normalmente, dimetros entre 0,4 e 1,3 m. O aparelho que efectua o bombardeamento designado canho de partculas (figs. 11.15. e 17.9) e utiliza plvora, ar comprimido ou hlio para projectar as micropartculas, a velocidades de 300 a 600 m/segundo, sobre o material exposto. O fragmento de DNA utilizado pode ser linear ou circular, e pode incluir apenas o gene de interesse e o gene marcador de seleco. As partculas de metal so revestidas com o DNA por precipitao com CaCl2, espermidina ou polietileno glicol e, quando bombardeadas sobre o tecido vegetal, as micropartculas penetram nas clulas, atravessando a parede celular e a membrana. Atravs de um processo desconhecido, o DNA integrado no genoma da clula, dando origem a clulas transformadas com uma certa frequncia. O bombardeamento de partculas pode ser utilizado para transformar clulas em suspenso, tecido caloso e explantes intactos e pode ser tambm utilizado para a integrao de genes no genoma de cloroplastos e mitocndrias. Este mtodo , hoje em dia, amplamente
125

utilizado para a obteno de plantas e clulas vegetais transgnicas em vrios laboratrios, quer em estudos aplicados quer na investigao fundamental da fisiologia vegetal.
Insero do transgene no genoma do cloroplasto

As clulas vegetais possuem um grupo de organelos que no surge nas clulas animais os plastdeos. Nos rgos fotossintticos das plantasas folhasos plastdeos designam-se cloroplastos e a sua funo principal a realizao da fotossntese. semelhana das mitocndrias, os cloroplastos tiveram origem em clulas procariticas, pelo que possuem o seu prprio genoma do tipo procaritico, constitudo por um cromossoma circular. A transformao de uma clula vegetal pode ser feita, no s atravs da insero de um gene de interesse no genoma nuclear, mas tambm atravs da sua insero no genoma do cloroplasto (plastoma). Os cloroplastos so organelos de grande dimenso e esto presentes nas clulas da folha em grande nmerocerca de 100 por clula (Fig. 11.19). Como tal, so um alvo fcil para o bombardeamento de partculas revestidas de DNA, o qual poder ser incorporado no plastoma, caso possua sequncias e sinais especficos para o genoma do cloroplasto. A transformao de cloroplastos tm envolvido o bombardeamento de partculas como o nico mtodo de transformao. O fragmento de DNA utilizado para a transformao plastideal (Fig. 11.20) inclui o gene de interesse e um marcador de seleco sob o comando de promotores ou sinais de expresso tpicos do genoma de plastdeos (exemplo: o promotor do opero do RNA ribossmico Prrn). O conjunto dos dois genes por sua vez flanqueado por duas sequncias de DNA homlogas de sequncias contguas do cromossoma do cloroplasto, sequncias essas que vo mediar a integrao do fragmento de DNA por recombinao homloga (Fig. 11.20). A possibilidade de transformao do genoma de cloroplastos possui vrias vantagens significativas, algumas delas com implicaes importantes para a aplicao da tecnologia da transgnese em plantas: 1) os plastdeos, alm de estarem presentes em grande nmero por clula vegetal, possuem, tambm, um elevado nvel de ploidia, com at 100 cpias de genoma por organelo, isto significa que podem ser integradas nos plastdeos de uma s clula, de forma estvel, at 10 000 cpias de um transgene (Fig. 11.19); esta situao pode conduzir, assim, a nveis muito elevados de expresso do transgene, o que nem sempre fcil de obter quando o transgene inserido no genoma nuclear; 2) a transformao com genes de origem bacteriana facilitada, pois estes possuem codes que so de difcil expresso no ncleo, mas no no cloroplasto, uma vez que este tem origem procaritica (devido ao codon usage); 3) o fenmeno de silenciamento de genes no ocorre nos plastdeos e, portanto, a expresso do transgene estvel na prognie das plantas transplastmicas; 4) uma vez que a integrao do transgene no plastoma ocorre por recombinao homloga num local
126

determinado, no ocorrem efeitos de posio, como acontece com frequncia na insero ao acaso durante a transformao nuclearesta incerteza , alis, uma das crticas levantadas s plantas transgnicas; 5) por ltimo, mas no menos importante, os plastdeos so herdados por via materna na maior parte das espcies agronmicas, significando que esto ausentes no plen e que , portanto, evitada a possibilidade de disperso do transgene por cruzamentos imprevistos. A transformao de plastdeos uma tcnica de desenvolvimento recente, e esto ainda a ser desenvolvidos protocolos eficientes de transformao e regulao da expresso do transgene. Por outro lado, o nmero de espcies susceptveis de serem regeneradas com sucesso, a partir de clulas em cultura, aumenta constantemente graas aos progressos da cultura in vitro. Ao mesmo tempo desenvolvem-se as tcnicas que permitem transformar, tanto clulas sexuais, como os tecidos embrionrios que so normalmente programados para regenerar um indivduo completo. Em paralelo com as aplicaes de finalidades mais imediatas, a investigao fundamental continua a desenvolver-se, tendo por objectivo a compreenso dos mecanismos que regulam a expresso dos genes. Estes mecanismos, ainda pouco conhecidos, controlam propriedades importantes, como a sntese de um pigmento, a de uma protena de reserva na semente, ou o desenvolvimento dos tecidos ou dos rgos. evidente que, compreender estes mecanismos significa adquirir os meios para manipular as propriedades que deles emanam.

127

11. O DNA RECOMBINANTE E O DIAGNSTICO EM MEDICINA

A tecnologia do DNA recombinante tm tambm aplicaes importantes no campo do diagnstico. O princpio geral que preside a esta nova metodologia do diagnstico a deteco de sequncias, de fragmentos de DNA resultantes de rearranjos ou de mutaes, de uma maneira geral (inseres, substituies ou eliminaes), responsveis por anomalias genticas, ou a deteco, em tecidos ou em fludos biolgicos, de sequncias tpicas do genoma de organismos infecciosos de origem viral, bacteriana, fungal ou de parasitas. Existem pelo menos trs categorias de alteraes genticas: cromossmicas, monognicas e multifactoriais.
a.
ALTERAES CROMOSSMICAS

A maioria dos defeitos cromossmicos incompatvel com a vida, assero que confirmada pela observao da correlao, que excede 50 %, entre a frequncia deste tipo de anomalias e o nmero de abortos espontneos ocorridos no primeiro trimestre da gravidez. Alguns tipos de defeitos cromossmicos menos deletrios, so caracterizados por aberraes numricas dos autossomas ou dos cromossomas sexuais e resultam de falhas de disjuno durante a diviso meitica. Pertencem a esta categoria de anomalias a sndrome de Down (trisomia 21), a sndrome de Klinefelter (47, XXY) e a sndrome de Turner (45, XO). Os pacientes com o caritipo XXY so fenotipicamente machos, apresentando dignese testicular e infertilidade. Os indivduos com o caritipo XO so fmeas estreis deficientes no seu desenvolvimento sexual secundrio. Uma outra forma de anomalias cromossmicas observadas em certas doenas so as translocaes: durante o fenmeno natural de translocao recproca, os segmentos de dois cromossomas diferentes permutam. Bastante frequente no homem, este fenmeno manifestase por uma percentagem elevada de abortos e anomalias congnitas. Foram registadas mais de 300 translocaes recprocas no homem e as clulas dos indivduos afectados existem em coleco. Vrias leucmias e linfomas esto associados a este gnero de ocorrncia. Um exemplo a leucmia mielognica crnica, resultante da translocao do brao comprido do cromossoma 22 para o brao comprido do cromossoma 9. Esta anomalia estrutural conhecida por cromossoma de Filadlfia. Em certos casos, parece existir uma relao directa, entre uma translocao cromossmica especfica e um carcter maligno. A hiptese supe que a translocao leva ao deslocamento de oncogenes no expressos de um cromossoma dado para locais de um outro cromossoma, onde eles seriam activados e expressos. Esta hiptese foi confirmada com um
128

linfoma humano, o linfoma de Burkitt, que conduz ao desenvolvimento de tumores dos linfcitos B. O gene c-myc, no expresso em situao normal, transposto do seu stio normal, o cromossoma 8, para uma regio de cromossoma 14 que codifica para as cadeias pesadas das imunoglobulinas (Fig. 197.II.). Nas clulas B tumorais, a regio do DNA que codifica para as cadeias pesadas das imunoglobulinas est sujeita a recombinaes frequentes. bastante provvel que uma recombinao aberrante, ocorrendo com baixa frequncia, leve colocao dum promotor activo das cadeias pesadas a montante do gene cmyc e conduza sua expresso e transformao maligna.
b. CARTOGRAFIA DOS CROMOSSOMAS HUMANOS

A obteno de cartas genticas detalhadas de cada cromossoma humano poder em breve fornecer um instrumento essencial para o diagnstico das doenas genticas. Vrios genes foram localizados em cromossomas humanos utilizando a gentica mendeliana clssica. Depois do aparecimento das tcnicas de fuso celular entre espcies diferentes e das tcnicas de DNA recombinante, o estabelecimento de cartas genticas ao nvel dos cromossomas acelerou-se consideravelmente. Existem actualmente vrios mtodos que permitem fusionar clulas humanas em cultura com clulas de outras espcies. Por outro lado, possvel transferir em clulas humanas e animais, em cultura, fragmentos de DNA do tamanho dum cromossoma ou limitados a um gene particular. A explorao destes mtodos de trocas genticas artificiais permite posicionar um gene humano num cromossoma particular ou num fragmento de cromossoma particular. Quando se fusionam clulas humanas com clulas de rato, os hbridos resultantes sobrevivem e dividem-se mas perdem, no entanto, progressivamente, os cromossomas humanos. possvel correlacionar a presena duma protena humana, com base em testes que recorrem expresso do gene nas clulas hbridas, com a presena dum cromossoma humano particular (Fig. 198.II.). Na realidade, este mtodo sofre dum condicionamento importante, visto ser necessrio dosear uma actividade enzimtica ou proceder a uma identificao imunolgica para identificar o produto do gene que se quer mapear. Ele foi, no entanto, amplamente utilizado e permitiu localizar mais de 100 genes humanos em diferentes cromossomas. Quando um gene foi cartografado num cromossoma dado, qualquer outro gene ligado geneticamente ao primeiro (com base em estudos genealgicos) pode ser igualmente atribudo a esse cromossoma. A combinao dos mtodos de fuso celular e das tcnicas de DNA recombinante oferece possibilidades bem mais amplas, pois baseada na utilizao dum gene ou dum
129

fragmento de DNA clonado, como sonda, para procurar sequncias homlogas nas clulas hbridas. Neste caso, deixa de haver dependncia em relao expresso do gene. O primeiro exemplo deste tipo de abordagem a localizao do gene da globina no cromossoma 11 (Fig. 199.II.). Depois deste primeiro sucesso, numerosos outros genes humanos foram atribudos por este mtodo a um ou outro cromossoma (Fig. 200.II., Tabela 10.II.). Depois de atribuir um gene a um cromossoma, necessrio posicion-lo em relao a outros genes situados no mesmo cromossoma. Em gentica clssica, a localizao determinase pela medida das frequncias de recombinao, durante a meiose, entre pares ou grupos de genes. Quanto mais prximos estiverem dois genes, menor a frequncia com que eles se recombinam. Em gentica das clulas somticas recorre-se a outros mtodos tais como a induo de eliminaes, de translocaes recprocas ou de fragmentao de cromossoma. Assinalmos, mais acima, a existncia das translocaes recprocas espontneas e a correlao estabelecida entre este fenmeno e o aparecimento dum carcter maligno veiculado por um oncogene, posicionado em situao propcia para ser activamente expresso. A posio das translocaes recprocas pode ser identificada devido alterao observvel ao microscpio, provocada na distribuio das bandas dos cromossomas, corados por um processo apropriado. , assim, possvel atribuir um gene a um fragmento particular dum cromossoma (Fig. 201.II.). O exemplo ilustrado na figura refere-se ao posicionamento do gene da insulina na parte distal do segmento curto do cromossoma 11. Alternativamente, pode-se induzir uma fragmentao aleatria dos cromossomas nas clulas somticas por irradiao aos raios X e, em seguida, fusionar estas clulas com clulas receptoras, acompanhando, no hbrido celular, a reteno de dois genes mapeados previamente num mesmo cromossoma (mede-se, neste caso, uma actividade enzimtica tpica destes dois genes). Quanto mais prximos estiverem estes genes no cromossoma, mais frequentemente permanecero retidos juntos nos hbridos, visto estarem situados no mesmo fragmento (Fig. 202.II.). No exemplo da figura foi demonstrado que os genes humanos tk e gk esto separados por cerca de 1,2 106 pares de bases no cromossoma X. A cartografia fina dos genes num cromossoma dado pode ser estabelecida directamente, in situ. Para isso, utiliza-se um DNA radioactivo clonado, para marcar, por hibridao, a posio dum gene num cromossoma. Praticamente, preciso bloquear as clulas humanas no estado mittico, de maneira a que cada cromossoma da clula seja claramente identificvel por microscopia. O DNA clonado radioactivo ento hibridado in situ com os cromossomas e a posio do gene determinada por autorradiografia e por quantificao da granulometria da autorradiografia. A localizao faz-se em relao a um clich dos cromossomas expostos em srie e corados. O exemplo da Fig. 203.II. ilustra a atribuio dos genes do interfero ao cromossoma 9.
130

Graas ao desenvolvimento das tcnicas de DNA-recombinante, nomeadamente de sequenciao, foi possvel , recentemente, concluir a sequenciao total do genoma humano o que permitir, em breve obter uma carta gentica detalhada completa de cada cromossoma
c. MAPEAMENTO DO GENOMA HUMANO POR RFLP

A organizao estrutural dos genes em genomas de grande comprimento, como o humano, pode ser elucidado utilizando o polimorfismo dos fragmentos de restrio (Restriction Fragment Length Polymorphisms - RFLP). O polimorfismo um fenmeno conhecido h bastante tempo na rea das protenas, sendo um dos exemplos mais conhecidos o dos grupos sanguneos de histocompatibilidade. Quando existem modificaes ligeiras na estrutura primria de protenas originrias de diferentes indivduos da mesma espcie, que tm funes e localizaes cromossmicas idnticas, estas protenas apresentam um carcter polimrfico. As diferenas nas estruturas primrias das protenas manifestam-se no nvel do DNA e podem ocasionalmente originar novos locais de restrio. A Fig. 204.II. esquematiza duas molculas de DNA diferentes, codificando para um mesmo gene hipottico X, flanqueado por locais de clivagem para as enzimas A e B. Os dois alelos so idnticos em relao posio dos locais de clivagem da enzima A, mas diferem em relao posio dos locais de clivagem da enzima B. O padro de separao por electroforese dos fragmentos de DNA, observado aps hibridao com uma sonda do gene X, marcada radioactivamente, mostra uma banda quando a enzima A utilizada para clivar o DNA celular e duas bandas com a enzima B. No segundo caso, as duas bandas diferem no comprimento e correspondem a duas formas allicas diferentes. O gene X dito polimrfico em relao ao local alvo da enzima B. Na maioria dos casos, estes polimorfismos, tambm chamados variaes allicas, so causados por simples substituies de bases que destroem ou criam um local de restrio, mas, ocasionalmente, os RFLPs podem ser ocasionados por eliminaes ou inseres. Os polimorfismos de DNA possuem um certo nmero de vantagens para o mapeamento do genoma. O nmero de marcadores conhecidos de DNA excede o das protenas e alm disso a sequncia de DNA no necessita de expressar obrigatoriamente uma protena para ser identificada por locais de clivagem polimrficos. Os polimorfismos de DNA podem, evidentemente, ocorrer em qualquer sequncia de DNA e em particular em intres. Se os marcadores de polimorfismo esto muito prximos dum gene, isto , so herdados juntos, o RFLP pode tambm ser utilizado para mapear genes e portanto para caracterizar anomalias genticas, mesmo quando o gene em questo completamente desconhecido. A Fig. 205.II. mostra dois marcadores de polimorfismo, A e B, localizados perto dum gene. Neste exemplo, o alelo normal est situado no cromossoma do macho e o alelo mutado
131

no da fmea. A me heterozigtica e o pai homozigtico em relao variante normal. Segundo as regras de Mendel, estes quatro alelos (dois paternos e dois maternos) do origem a quatro combinaes possveis na descendncia. Se o marcador A e o gene defeituoso esto a curta distncia um do outro, sero co-transmitidos, isto , todos os filhos que herdarem o defeito gentico herdam igualmente o alelo A do marcador. A presena do marcador de polimorfismo A no implica forosamente a presena da anomalia gentica. Esta correlao s se aplica a situaes em que o gene e o marcador de polimorfismo esto situados muito perto um do outro. Se esto bastante separados, podem-se realizar recombinaes com mais frequncia relativa, colocando o gene defeituoso no cromossoma que contm o marcador B. A probabilidade de existirem trocas genticas aumenta com a distncia entre o marcador e o gene em questo. Quanto mais perto estiverem os marcadores mais conclusivas sero as correlaes observadas. , portanto, possvel seguir a transmisso de qualquer marcador de polimorfismo por anlise genealgica e correlacionar a sua presena com a expresso fenotpica dum defeito gentico, se o marcador estiver situado suficientemente perto do gene mutado. Na prtica, o DNA dum grande nmero de indivduos, pertencentes a uma linhagem, clivado com uma enzima de restrio que reconhece um polimorfismo na regio da sonda de DNA que ser utilizada ulteriormente. Sero obtidos aproximadamente um milho de fragmentos diferentes de DNA, que podem ser separados por electroforese em gel de agarose e submetidos a anlise por Southern blotting. Vrias centenas de sondas RFLP foram j identificadas e utilizadas para mapeamento.
d. ANOMALIAS MONOGNICAS E MULTIFACTORIAIS

As anomalias monognicas so causadas por mutaes em genes nicos. As suas caractersticas mendelianas de transmisso hereditria so autossmicas dominantes, autossmicas recessivas ou ligadas ao cromossoma X. As aberraes autossmicas dominantes manifestam-se mesmo quando um s dos dois alelos dum gene particular afectado. No caso das doenas autossmicas recessivas, pelo contrrio, necessrio que ambos os alelos dum gene sejam afectados, para haver manifestao clnica de doena. Os efeitos das anomalias ligadas ao cromossoma X so diferentes nas fmeas e nos machos, visto estes ltimos possurem um s cromossoma X. Uma fmea com dois cromossomas X, pode ser homozigtica ou heterozigtica em relao a um gene mutado, ligado ao X, e a expresso pode ser dominante ou recessiva. Qualquer que seja o modo de expresso nas fmeas, um carcter ligado ao X ser sempre expresso de maneira dominante nos machos (que possuam um s cromossoma X).

132

Cerca de 1400 doenas genticas conhecidas so causadas por mutaes em genes nicos. Em geral, a prevalncia fraca (como ilustrado nos exemplos da Tabela 11.II.), se bem que correspondam de 5 % a 10 % de todos os casos registados em pediatria. As leses bioqumicas de mais de 250 destas doenas so conhecidas. Elas afectam sobretudo enzimas, mas existe igualmente uma variedade de outras protenas implicadas, tais como factores de coagulao do sangue, protenas de transporte, hormonas peptdicas, receptores. As doenas monognicas podem no ser herdadas, mas serem antes o resultado de uma nova mutao no indivduo afectado. A frequncia da ocorrncia deste gnero de mutaes foi calculada como sendo de 5 x 10-6 mutao por gene e por gerao. Aproximadamente um em cada 100.000 recm-nascidos deveria, portanto, possuir uma nova mutao num qualquer locus gentico. Mas, visto que muitas destas mutaes so ou recessivas, ou geneticamente silenciosas, porque no afectam a funo da protena correspondente, as novas mutaes com manifestao clnica devem ser extremamente raras. Pensa-se, por exemplo, que todos os casos de Huntington's chorea (vrias dezenas de milhar) tiveram origem num pequeno nmero de indivduos afectados (provavelmente com mutaes independentes), que puderam ser rasteados at ao sculo XVIII. Casos assinalados de doenas genticas aparecendo subitamente na descendncia de pais no afectados podem-se explicar, na maioria dos casos, mais provavelmente, por paternidade extra-conjugal do que por aquisio duma nova mutao. Nas perturbaes multifactorias esto includas uma grande variedade de doenas, tais como o cancro, diabetes mellitus, hipertenso etc. A predisposio para ser afectado por este tipo de doenas parece ser geneticamente transmissvel. So enfermidades polignicas; visto que o nmero de genes implicados frequentemente desconhecido, o risco individual difcil de avaliar. Contudo, este risco , em geral, consideravelmente menor (1 a 5 %) que o de aquisio de doenas monogenticas a partir de pais afectados (25 % ou 50 %), porque necessrio que vrios genes sejam simultaneamente afectados. S algumas destas predisposies podem ser actualmente diagnosticadas. Entre o pequeno nmero de loci associados de maneira relevante com predisposies para vrias doenas figuram os do complexo de histocompatibilidade, HLA (Human Leukocyte Antigen). Consiste em quatro loci genticos distintos comportando, cada um, alelos mltiplos que codificam para protenas diferentes. Um conjunto particular , por exemplo, o HLA-B27, associado com um maior risco de contrair a espondilite ancilosante. O risco de contrair esta doena grave 90 vezes mais elevado para os indivduos HLA-B27 positivos do que para os HLA-B27 negativos. Se bem que esta predisposio possa ser diagnosticada, no existe terapia para a doena, propriamente dita, devido sua natureza gentica multifactorial.
133

e. O DIAGNSTICO DE DEFEITOS GENTICOS

O diagnstico e a preveno de doenas genticas podem ser realizados a diferentes nveis. Se a base molecular de um defeito gentico no for conhecida, os dados disponveis s podem servir para avaliar estatisticamente o risco de vir a ter uma criana com a doena familiar. Um conhecimento profundo da doena ao nvel molecular, conjugado com tcnicas apropriadas de deteco do defeito molecular, permite pelo contrrio, identificar de maneira segura uma leso num dado indivduo. Isto pode ser realizado ao nvel das protenas, analisando, por exemplo, espcimes de sangue fetal. As tcnicas de clonagem permitem actualmente a deteco dum defeito gentico at ao nvel do gene. Como estas anlises podem ser efectuadas com quantidades nfimas de tecidos, obtidas, por exemplo, por amniocentese ou biopsia corinica, as doenas genticas podem ser diagnosticadas numa fase muito precoce da gravidez (Fig. 206.II.). Em funo do resultado dos testes, a interrupo voluntria da gravidez pode ser realizada com um mnimo de risco. Se um defeito gentico que se pretende diagnosticar conduz no expresso do gene, ser evidentemente impossvel detectar o produto deste. A identificao duma protena mutada no permite definir a natureza da mutao dum gene, no indica se o defeito afecta um sinal de regulao, ou o transporte duma protena, ou a sequncia codificante.
1) RFLP (Restriction Fragment Length Polymorphism)

Os RFLPs so particularmente teis para identificar defeitos genticos no homem e podem ser aplicados com fins de diagnstico, contanto que as alteraes no DNA implicado no ocorram vrias vezes e que estejam associadas unicamente a genes nicos. A maioria dos RFLPs conhecidos ocorreram ao acaso e no tm relao com os genes vizinhos. Um exemplo importante da aplicao desta metodologia a deteco dum marcador da Huntington's chorea, doena caracterizada pela degenerescncia irreversvel das clulas nervosas, que ocorre com uma frequncia de 1 em 10.000 indivduos. O DNA proveniente de duas linhagens genealgicas portadoras desta anomalia gentica foi analisado por hibridao de sondas radioactivas com fragmentos de restrio originados por clivagem em locais polimrficos (chamados marcadores polimrficos) conhecidos, sem se saber partida se um qualquer destes marcadores polimrficos se situava na vizinhana do gene de Huntington e segregava com ele. Observou-se, no entanto, que uma das sondas reconhecia um polimorfismo que obedecia quelas condies, causado por dois locais HindIII, cuja presena ou ausncia d origem ao padro de hibridao representado na Fig. 207.II. A presena ou a ausncia do primeiro local HindIII cria fragmentos de comprimento de 15 ou 17.5 kb, respectivamente, enquanto que a
134

presena ou ausncia do segundo local HindIII gera fragmentos de 3.7 e de 4.9 kb, respectivamente. Existem, portanto, 4 padres de fragmentao possveis, chamados haplotipos A, B, C e D. Como h sempre dois alelos num gene dado duma clula somtica, os quatro haplotipos geram dez combinaes duplas diferentes. A frequncia destas combinaes duplas numa populao normal varivel. A anlise da rvore, representada na Fig. 208.II, revelou que o haplotipo C (presena dos dois locais HindIII) segrega sempre com a doena. Como este haplotipo tambm ocorre na populao normal, a nica concluso plausvel que um membro da famlia, que no herdou o haplotipo C dos pais, tem uma grande probabilidade de no ser afectado pela doena; por outro lado, um indivduo com o haplotipo C no poder ter a certeza de que a doena se manifestar. S aproximadamente 25 % da populao normal tem o haplotipo C; portanto, a probabilidade de um indivduo de haplotipo C, pertencente a uma famlia de risco, desenvolver a doena bastante alta. Destas observaes pode-se tirar a concluso de que predies conclusivas s podem ser feitas aps uma anlise genealgica. Como o haplotipo C tambm ocorre na populao normal, o facto de ser identificado num indivduo pertencente a uma famlia sem predisposio, no tm grande sentido. A associao observada entre o locus marcador G8 e a doena no significa que o gene responsvel pela doena tenha sido identificado. Foi observado um nico recombinante na rvore genealgica analisada, que provm duma translocao do gene de Huntington para um cromossoma de haplotipo A. A partir desta ocorrncia nica, conclui-se que a distncia entre o gene responsvel pela doena e o marcador de ordem de pelo menos 2000 kb. As aplicaes do RFLP no se restringem ao mapeamento de defeitos genticos mas intervm tambm, como vimos, na construo dum mapa gentico de cromossomas humanos. A descoberta dos RFLPs e a generalizao das suas aplicaes tm consequncias prticas importantes. A determinao do polimorfismo de dadores de orgos para transplantaes, realizada actualmente por tcnicas serolgicas, poder ser ultrapassada por determinaes mais rigorosas e rpidas de polimorfismos de DNA. Ser, tambm, possvel detectar correlaes entre a predisposio de alguns indivduos para certas doenas e a sua constituio gentica.
2) Diagnstico de mutaes identificadas

Se o gene responsvel duma dada doena gentica estiver identificado pode-se, a partir dum clone correspondente ao gene normal, determinar a sua sequncia nucleotdica e estabelecer uma carta de restrio detalhada. Por outro lado, o gene normal pode ser utilizado como sonda para identificar e isolar o gene correspondente, presente no DNA das clulas
135

fetais. Comparando as sequncias e as cartas de restrio possvel identificar as mutaes que afectam o gene fetal. O exemplo mais estudado o das -talassemias.
-talassemias As pertubaes genticas da sntese de hemoglobina, chamadas talassemias, foram

estudadas em detalhe ao nvel do DNA. As hemoglobinas humanas so codificadas por duas sries de genes: os genes de tipo , localizados no cromossoma 10 e os genes de tipo , localizados no cromossoma 11 (Fig. 209.II.) Estas regies foram clonadas e sequenciadas. A hemoglobina normal dum indivduo adulto constituda por duas cadeias e duas cadeias . As talassemias so patalogias caracterizadas pela ausncia total ou parcial de sntese de um tipo de globina. O resultado um desequilbrio entre as cadeias e e uma anemia, mais ou menos pronunciada, segundo o tipo de talassemia. Estes estados tm origem numa deficincia de transcrio do DNA, ou num defeito de maturao do RNA, ou numa instabilidade do RNA ou, ainda, numa incorreco na traduo do RNA. Estes defeitos podem resultar de mutaes pontuais que conduzem a um desfasamento da traduo ou ao aparecimento prematuro de sinais de fim de cadeia ou, ainda, derivar de eliminaes do gene, no seu todo ou parciais. As -talassemias homozigticas so caracterizadas por anemias bastante severas e ausncia total ou quase total de globina . A doena fatal nos primeiros anos de vida porque as cadeias de globina s so activas depois do nascimento. Normalmente, o feto no afectado porque utiliza as cadeias de globina fetais. Em certos casos, os indivduos talassmicos adultos (privados de globina ) podem permanecer de boa sade porque conservam uma percentagem de hemoglobina fetal elevada (persistncia hereditria de hemoglobina fetal). a) Mutaes sem sentido e frame shift (Tabela 12.II) A -talassemia, caracterizada pela ausncia total da sntese da globina , resulta duma mutao pontual no codo correspondente ao aminocido 17 ou no correspondente ao aminocido 39. Nos dois casos, a mutao d origem a um codo sem sentido. Para alm de serem intraduzveis, os RNA mensageiros correspondentes so muito instveis in vivo. Outras talassemias de tipo resultam de eliminaes ou de inseres na sequncia que codifica para a globina ; o resultado uma deslocao da fase de leitura do RNA mensageiro.

136

b) Mutaes que afectam a transcrio Num dos casos, uma substituio do nucleotdeo em posio -87 em relao ao local de chapu do mensageiro conduz a uma percentagem muito fraca de mensageiro de globina; no segundo caso, uma mutao na TATA box em posio -30 bloqueia a iniciao da transcrio. c) Mutaes que afectam a maturao do RNA Um certo nmero de talassemias resultam dum splicing anormal dos transcritos primrios da globina. O gene contm dois intres cujo splicing necessrio para a maturao do mensageiro (Fig. 210.II.). Nestes tipos de talassemias, a sequncia GT que se encontra sempre presente em 5' da juno do splicing mutada em AT, no primeiro ou no segundo intro. O splicing correcto no se realiza; no seu lugar so utilizadas outras sequncias semelhantes normalmente implicada no splicing. O resultado um RNA mensageiro intraduzvel e de estrutura incorrecta. Por outro lado, certas talassemias resultam de mutaes no interior de um intro, que criam uma sequncia de splicing 3' (aceitador) que entra em competio com a sequncia natural e provoca um splicing incorrecto. Outras mutaes aparecem na regio codificante do gene e criam locais de splicing do tipo 5' que entram em competio com o local normal. O resultado , evidentemente, mais uma vez, a formao de RNAs mensageiros que no podem ser traduzidos correctamente. O diagnstico pr-natal das talassemias pode ser, actualmente, efectuado por anlise de Southern blotting do DNA amnitico. Um padro anormal de fragmentos de DNA aparece quando genes de globina so suprimidos, como no caso de -talassemia. A deteco pr-natal da -talassemia mais complexa, porque muitas mutaes diferentes podem dar origem sntese da cadeia de -globina defeituosa. Algumas mutaes alteram os locais de reconhecimento de enzimas de restrio, directamente, e podem ser detectadas por anlise de restrio (vd. exemplo da anemia falciforme mais adiante), outras no. Para fazer um diagnstico, nestes casos, pode-se recorrer identificao dos cromossomas que contm as mutaes talassmicas, estabelecendo relaes com locais de restrio polimrficos que se situam ao longo do cluster do gene da -globina (vd. mais acima RFLP). Foi, no entanto, desenvolvida uma abordagem mais directa que recorre deteco de mutaes pontuais que provocam -talassemias, por hibridao com oligonucleotdeos sintticos.

137

d) Utilizao dos oligonucleotdeos sintticos Uma das aplicaes mais interessantes dos oligonucleotdeos sintticos de sequncia definida a sua utilizao como sondas para diagnosticar doenas genticas em fase prnatal. Esta rea de aplicao s pde, evidentemente, ser desenvolvida graas tecnologia do DNA recombinante. A especificidade duma pequena sonda sinttica de cerca de vinte nucleotdeos notvel. Um nico desemparelhamento (mismatch), no interior da regio de associao entre a sonda e o DNA alvo, suficientemente destabilizador do hbrido para poder ser posto em evidncia. este o princpio bsico da deteco e do diagnstico, mesmo em fase pr-natal, de mutaes genticas pontuais (Fig. 211.II). Esta tcnica foi aplicada para detectar, no DNA, substituies de um nucleotdeo que provocam a talassemia de tipo +. Um exemplo est ilustrado na Fig. 212.II que mostra a transio de G em A na posio 110 da regio IV S-1 do gene. Uma sonda oligonucleotdica de sequncia perfeitamente complementar do DNA normal, marcada por quinao com um radioistopo (32P), hibridar-se- com o fragmento de 1,8 kb produzido por digesto BamHI do genoma e a hibridao ser revelada por emisso radioactiva. A sonda formar um desemparelhamento C-A com a sequncia mutada e, em condies de temperatura de hibridao selectivas, o hbrido dissociar-se-, libertando a sonda. O resultado prtico ser ausncia de sinal radioactivo na autorradiografia. Pelo contrrio, uma sonda de sequncia homloga da regio mutada do gene dar um resultado simetricamente oposto, com o gene normal e o gene mutado. O conjunto da informao permitir diagnosticar rigorosamente se um indivduo homozigtico normal ou mutado, ou se heterozigtico. A fotografia dum gel electrofortico do DNA de indivduos duma famlia de risco, digerido por BamHI e hibridado com as duas sondas oligonucleotdicas, ilustra esta anlise (Fig. 213.II). A banda de 1.8 kb do DNA do pai hibrida-se com a sonda normal e com a mutada. A da me responde de maneira semelhante. Os pais so, portanto, os dois heterozigticos para a mutao. O DNA do filho, pelo contrrio, s se hibrida com a sonda mutada. , pois, homozigtico para esta mutao. Outro exemplo o da deteco da talassemia , que resulta duma mutao sem sentido no aminocido 39; a glutamina do codo CAG mutada em codo de fim de cadeia TAG, causando a terminao prematura da traduo da -globina. Esta mutao a causa predominante da -talassemia na Sardenha e est espalhada por toda a regio mediterrnica. A sequncia de DNA correspondente ao codo mutado no comporta locais de reconhecimento por enzimas de restrio.

138

Num estudo modelo, dois nonadecmeros sintticos foram utilizados (sublinhados na Fig. 214.II.) para diagnosticar a presena de mutao em casos de gravidez, em que os fetos apresentavam de risco de -talassemia. 20 ml de fludo amnitico foram tirados na 18 semana de gestao e o DNA isolado e digerido por BamHI. Aps separao por electroforese e hibridao do gel, sequencialmente, com as duas sondas marcadas, o hbrido, ou a ausncia de hbrido radioactivo formado com a banda de 1,8 kb, permite fazer um diagnstico. Num caso, ambas as sondas se hibridam com o DNA (Fig. 215.II.), o que implica um diagnstico de -talassemia heterozigtica (A). Nos outros dois casos, s a sonda A se hibrida com o DNA, indicando que os fetos eram normais (AA). e) Anemia falciforme A anemia falciforme uma doena hereditria que resulta duma mutao que muda um resduo de cido glutmico (GAG) em valina (GTG) na posio 6 da cadeia -globina da hemoglobina. A consequncia desta modificao a sntese duma hemoglobina que tem tendncia para cristalizar nos glbulos vermelhos; as clulas tornam-se menos flexveis e so eliminadas do sangue ao nvel do bao, o que conduz anemia. A mutao de bases A T suprime um local de restrio no DNA do gene da globina . , pois, fcil detectar a mutao por anlise de restrio do DNA fetal. Um DNA normal contm o local de restrio, enquanto que no DNA mutado este local est ausente. Na prtica, esta modificao manifesta-se por uma distribuio anormal dos fragmentos de restrio (Fig. 216.II). Praticamente digere-se o DNA, extrado de clulas derivadas dum doador normal e dum indivduo anmico, pela enzima de restrio DdeI (sequncia reconhecida CCTGAG) ou, melhor, por MstII (sequncia reconhecida CCTNAGG), em seguida separam-se os fragmentos em gel de agarose e transferem-se para uma membrana de nitrocelulose (Southern blotting). O comprimento dos fragmentos formados por digesto detectado por hibridao com o DNA complementar de globina marcado com 32P.
A deficincia hereditria de 1-antitripsina

Os indivduos deficientes em 1-antitripsina tm uma forte predisposio para desenvolver enfisema pulmonar ou cirrose infantil do fgado. A 1-antitripsina uma protena sintetizada no fgado e presente no plasma. O seu papel inibir a elastase, protena implicada na perca da elasticidade dos tecidos pulmonares. Nos indivduos normais o equilbrio entre 1-antitripsina e elastase controlado; nos deficientes hereditrios, pelo contrrio, a elastase no inibida e destri os tecidos pulmonares. A anlise dos genes normais (M) e mutados (Z) mostra que eles s diferem numa nica base, G A. Esta transio provoca a substituio dum resduo glutmico por um resduo
139

lisina, em posio 342 da protena. Esta substituio no cria nem destri locais de restrio, de maneira que impossvel utilizar o polimorfismo dos fragmentos de restrio na regio codificante para revelar a mutao do gene. No entanto, possvel tirar partido de sondas de DNA sintticas para diagnosticar a doena (Tabela 13.II), sintetizando, por exemplo, um oligmero de 19 nucleotdeos, no qual a base G ou a base A flanqueada de um lado e de outro pelas 9 bases correspondentes sequncia de DNA da 1-antitripsina. Estas sondas marcadas com 32P por quinaao foram testadas por hibridao com o DNA clonado da 1antitripsina. Uma escolha judiciosa das condies de hibridao permite obter um sinal diferencial (Fig. 217.II.). As duas sondas reconhecem o DNA normal da 1-antitripsina a 45C; todavia, a 55C s a sonda totalmente homloga ao DNA da 1-antitripsina d um sinal de hibridao. Em funo destas condies, possvel utilizar o oligmero correspondente ao DNA da 1-antitripsina normal, para testar a hibridao com o DNA derivado de indivduos deficientes em 1-antitripsina. O DNA genmico derivado das clulas de indivduos MM, MZ e ZZ, digerido pelas enzimas de restrio HindIII/XbaI ou BamHI/XbaII, e transferido para uma folha de nitrocelulose em seguida hibridado com o oligmero sinttico marcado, em condies previamente determinadas (55C para a hibridao e a lavagem) (Fig. 218.II.). Os fragmentos do DNA MM normal, com o qual a sonda completamente complementar, e que contm a regio correspondente ao aminocido 342 (fragmento de 2,4 ou de 2,6 kbases), do um sinal positivo forte. O DNA MZ heterozigtico d um sinal reduzido e o DNA ZZ homozigtico no d sinal. Este mtodo , pois, capaz de distinguir os indivduos ZZ dos indivduos MM ou MZ e pode ser utilizado para o diagnstico pr-natal da deficincia em 1-antitripsina. Tambm neste caso existe a possibilidade de diagnosticar a deficincia em 1antitripsina pela anlise do polimorfismo dos fragmentos de restrio, se se estudar o gene inteiro incluindo os intres. Com efeito, existe um polimorfismo de restrio para trs enzimas SstI, MspI e AvaII, que pode ser posto em evidncia por hibridao com sondas de fragmentos de DNA genmico clonados, segundo o princpio e tcnicas previamente descritos. Os mtodos de diagnstico que recorrem anlise do DNA por hibridao com sondas moleculares so de aplicao geral e tanto mais precisos quanto mais completo for o conhecimento ao nvel molecular dos defeitos do DNA geneticamente transmissveis.
f. DETECO DE MUTAES SOMTICAS

A deteco de mutaes com sondas oligonucleotdicas no esgota as suas potencialidades com as doenas genticas. tambm possvel detectar mutaes somticas
140

que conduzem a transformaes oncognicas. A famlia dos genes humanos ras constitui um exemplo. Estes genes em nmero de 3, H-ras, K-ras e N-ras codificam protenas de 21 kdaltons, localizadas na parte interna da membrana celular, que parecem estar implicadas na transduo de sinais de receptores celulares de superfcie para os seus alvos intracelulares. Uma percentagem importante de linhagens celulares tumorais e de tecido tumoral possui um gene ras activado. Estes genes caracterizam-se pela propriedade de induzirem uma transformao oncognica em clulas em cultura. Em quase todos os casos analisados a activao foi correlacionada com mutaes pontuais dos codes 13 ou 61 dos genes ras, as quais levam substituio de um aminocido na protena. A sua natureza pontual e fixa torna possvel a utilizao de oligonucleotdeos sintticos para escrutinar, directamente, no DNA genmico, a presena das mutaes responsveis pela activao destes genes. Por exemplo, uma abordagem utilizada para escrutinar mutaes no codo 61 do gene humano N-ras recorre sntese de quatro grupos diferentes de icosmeros (Fig. 219.II.). O primeiro oligonucleotdeo (N61-I) tem uma sequncia idntica a um segmento de 20 nucleotdeos que inclui o codo 61 (CAA) do gene N-ras normal. N61-II uma mistura de 3 oligonucleotdeos que diferem de N61-I pela natureza do primeiro nucleotdeo do codo 61, em que o C do tipo selvagem foi substitudo por A, por G ou por T. Este grupo de oligonucleotdeos formar sempre um hbrido imperfeito com o gene N-ras normal. Contudo, se o codo 61 apresenta uma mutao na primeira posio, um dos oligonucleotdeos do grupo N61-II formar um emparelhamento perfeito com o gene mutado. De maneira anloga, no grupo N61-III, o segundo nucleotdeo G, T ou C substitui o A na posio 2 do codo. Por fim, os dois icosmeros do grupo N61-IV possuem um T, ou um C, no lugar do A natural na terceira posio do codo (a substituio por G origina uma mutao silenciosa). As sondas oligonucleotdicas foram marcadas com elevada actividade especfica, incorporando vrios nucleotdeos marcados com o radioistopo 32P. O mtodo utilizado recorre sntese qumica prvia de oligonucleotdeos anti-sentido (i. ., complementares e orientados em sentido oposto) em relao s sequncias das sondas e de um octmero complementar da extremidade 3' dos icosmeros. O radioistopo introduzido prolongando o octmero, que funciona como primer, com a DNA polimerase I e (-32P)dNTPs, utilizando os icosmeros anti-sentido como matrizes da polimerizao.
5'

TACTCTTCTTGTCCAGCTGT- OH -32PdNTPs 3' HO- GGTCGACA-p 5'

3'

Polim I

5'

TACTCTTCTTGTCCAGCTGT-OH ATGAGAAGAACA GGTCGACA p 5'

3'

* * * * * *** * * * *

Como o octmero portador dum fosfato 5' terminal, o icosmero marcado radioactivamente pode ser separado da matriz no fosforilada, num gel electrofortico de poliacrilamida-ureia.
141

Para escrutinar e determinar a natureza das mutaes, o DNA genmico digerido por uma enzima de restrio e fraccionado num gel de agarose 0.5 %, desnaturado in situ e seco. O gel seco humidificado em gua destilada e posto directamente em hibridao com os oligonucleotdeos marcados. O gel resistente s diferentes manipulaes de hibridao e lavagem e permite a deteco directa de um gene cpia nica, a partir de uma quantidade de DNA genmico de 1 a 5 g, eliminando a necessidade de transferncia para uma membrana de nylon ou de nitrocelulose (Southern blotting). Em condies salinas apropriadas, a temperatura de dissociao observada de um hbrido perfeitamente emparelhado, formado entre os icosmeros e o DNA genmico, de 61-62C, e a de um hbrido contendo um desemparelhamento de 55-56C. Realizando a hibridao a 50C e as lavagens a 59C, possvel detectar especificamente um hbrido perfeito, enquanto que os hbridos com um desemparelhamento se dissociam. A Fig. 220.II. mostra o resultado das hibridaes dos oligonucleotdeos marcados N61-I (painel I), N61-II (painel II), N61-III (painel III) e N61-IV (painel IV), com o DNA genmico (10g), digerido por PstI e fraccionado electroforeticamente, isolado das linhagens celulares MOLT-4 (corredor-1), HL60 (corredor2), Rc-2a (corredor 3), K562 (corredor-4), HT1080 (corredor-5) e RD301 (corredor 6), ou dos plasmdeos pAT8.8 e pSVN-ras (corredores 7 e 8). Forma-se um fragmento de 3.6 kb a partir do DNA genmico e fragmentos de 4.4 kb e de 2.8 kb a partir do DNA clonado, respectivamente no pAT8.8 e no pSVN-ras, contendo todos o codo 61 do gene N-ras. Todas as linhagens celulares contm um alelo normal N-ras, dando um sinal positivo por hibridao com o oligonucleotdeo perfeitamente complementar N61-I, aps lavagem a 59C (painel I). O painel II mostra que s o DNA das clulas HT1080 se hibrida com a mistura N6-II e o painel III, que s o DNA das clulas HL60 se hibrida especificamente com a mistura N61-III. O painel IV mostra por seu lado, que a mistura N61IV se hibrida exclusivamente com o DNA de RD301. Este resultado implica que, na protena N-ras de RD301, a glutamina natural (CAA) foi mutada em histidina (CAC ou CAT). Pode-se ainda concluir que, tanto HT1080, como HL60, possuem a mesma mutao pontual no codo 61 que os genes isolados dos transfectantes celulares e clonados nos plasmdeos. Com efeito, os DNAs isolados de HT1080 e de HL60 hibridam-se com N61-II e N61-III, respectivamente, assim como com o DNA dos plasmdeos pAT8.8 e pSVN-ras, os quais contm partes dos genes N-ras activados isolados de transfectantes, respectivamente com as mutaes conhecidas CAA61 AAA e CAA61 CTA. Conclui-se, ainda, que estas trs linhagens celulares contm, para alm do gene N-ras mutado, um alelo N-ras normal.

142

No foram detectadas mutaes nas linhagens MOLT-4 e Rc-2a com os oligonucleotdeos utilizados, o que significa que, provavelmente, as mutaes podem estar localizadas no codo 13 ou numa outra posio. Um problema geral, associado com este mtodo de deteco de mutaes no DNA genmico com oligonucleotdeos sintticos, decorre da fraca sensibilidade (cf. o complicado mtodo de marcao para obter sondas de alta actividade especfica, descrito mais acima) e o elevado barulho de fundo devido a hibridaes inespecficas (Figs. 213.II, 215.II e 218.II).
g. AMPLIFICAO ENZIMTICA DE DNA (PCR)

As limitaes de sensibilidade e de barulho de fundo, inerentes necessidade de detectar modificaes pontuais com pequenas sondas cuja marcao forosamente reduzida, em presena de um nmero enorme de sequncias de DNA genmico, foram ultrapassadas com o desenvolvimento duma tcnica extremamente poderosa (denominada PCR: Polymerase Chain Reaction) que permite amplificar enzimaticamente fragmentos de comprimento bem definido, a partir de quantidades nfimas de DNA. A reaco de polimerizao em cadeia um mtodo enzimtico de amplificao de fragmentos especficos de DNA, que revolucionou o diagnstico molecular e abriu numerosos campos da biologia molecular, anteriormente inacessveis devido inexistncia de mtodos analticos suficientemente sensveis. Se a sequncia nucleotdica de pequenos segmentos flanqueando a regio alvo da deteco for conhecida, pode-se sintetizar dois oligonucleotdeos, de cerca de 20 bases, complementares de cada uma das cadeias do DNA, de um lado e de outro da regio alvo da amplificao, e que podem ser prolongados por polimerizao enzimtica em sentidos opostos e convergentes. A amplificao comporta vrios ciclos (Fig. 221.II.) compostos, cada um, das seguintes etapas: 1) desnaturao do DNA, 2) hibridao com os oligonucleotdeos sintticos e 3) polimerizao enzimtica com uma polimerase e dNTPs. Os oligonucleotdeos orientados com a extremidade 3' na direco do alvo da amplificao servem de iniciadores da polimerizao a partir das cadeias opostas do DNA. No fim do segundo ciclo obtm-se molculas de DNA com uma extremidade bem definida. No fim do 3 ciclo formam-se fragmentos de DNA com as duas extremidades definidas. Para alm do DNA ter sido amplificado 8 vezes, a sequncia alvo foi extrada do DNA total. Como os fragmentos sintetizados por polimerizao contm as sequncias complementares dos iniciadores, a utilizao dum excesso destes e de dNTPs conduz a uma amplificao unicamente limitada pelo nmero de ciclos e pela actividade da polimerase. Em cada ciclo sucessivo a quantidade do DNA sintetizado duplica, o que leva acumulao exponencial do fragmento alvo segundo a lei aproximada 2n, em que n o nmero de ciclos.
143

A eficcia da amplificao aumenta com a utilizao duma polimerase termo-estvel, a Taq polimerase, isolada de Thermus aquaticus, organismo que vive em condies de temperatura elevada. O facto de se poder efectuar a polimerizao a temperatura elevada (p. ex., a 70C) aumenta a especificidade da hibridao dos oligonucleotdeos, eliminando associaes parasitas, e permite a realizao dum grande nmero de ciclos de amplificao (20 a 60, por exemplo), sem necessidade de voltar a adicionar a enzima em fases intermdias, como o caso com a polimerase I (fragmento de Klenow) que vai perdendo progressivamente a actividade. Este desenvolvimento importante tm como consequncia um aumento considervel da especificidade, do rendimento, da sensibilidade e do comprimento dos fragmentos alvos da amplificao. Segmentos de DNA de comprimento que pode variar de uma centena (ou menos) de pares de bases at mais de 2000 pb, podem assim ser amplificados mais de 10 milhes de vezes com grande especificidade, a partir de quantidades extremamente pequenas de DNA. A tcnica do PCR tm sido utilizada na anlise de variaes de sequncias nucleotdicas, nomeadamente na deteco de mutaes e de rearranjos cromossmicos, em clonagem de sequncias genmicas com alta eficcia, na sequenciao directa de DNA mitocndrico e genmico, na deteco de organismos patognicos ou contaminantes (virais, bacterianos, incluindo micloplasmas, fngicos e parasitas). A ttulo de exemplo descrevemos, a seguir, a aplicao da tcnica do PCR anlise de 2 mutaes da -globina humana. 1) Deteco da anemia falciforme e da hemoglobina C por PCR As mutaes correspondentes anemia falciforme e hemoglobina C situam-se, ambas, no codo 6 do gene da -globulina. A Fig. 222.II. representa uma regio do gene de 110 pb, no centro do qual se situa o codo 6 alvo da deteco por hibridao com sondas oligonucleotdicas sintticas marcadas radioactivamente, 19A, 19S e 19C (complementares do alelo normal, do alelo da anemia falciforme e do alelo da hemoglobina C, respectivamente). Esta regio amplificada a partir de dois iniciadores, PC03 e PC04, de 20 nucleotdeos cada, que flanqueiam a sequncia alvo da amplificao e que esto orientados em sentidos opostos e convergentes na direco da polimerizao (5' 3'). O DNA extrado de seis amostras de sangue de indivduos potencialmente mutados no codo 6, de um indivduo normal e da linhagem celular GMZ2064 (que contm uma eliminao homozigtica do gene) submetido a 25 ciclos de amplificao. Em seguida, 33 ng (1/30) dos produtos das amplificaes so aplicados, na forma de dot blot, num filtro de nylon, a partir do qual foram preparadas trs rplicas. Cada um destes trs filtros hibridado, em condies de temperatura selectivas (que dissociam os hbridos no perfeitamente
144

emparelhados), com uma das trs sondas marcadas com 32P. O autorradiograma (Fig. 223.II.) mostra claramente a existncia de 6 combinaes diplodicas AA (homozigtico normal, AA), AS (heterozigtico para a mutao da anemia falciforme, AS), SS (homozigtico para a anemia falciforme, SS), SC (simultaneamente heterozigtico para as mutaes da anemia falciforme e da hemoglobina C, SC), CC (homozigtico para a mutao da hemoglobina C, CC), AC (heterozigtico para a hemoglobina C, AC) e confirma a eliminao do gene nas clulas GMZ2064 (XX). Por anlise dos produtos da amplificao, clonados, pode-se avaliar a 1 % a frequncia do fragmento de -globina amplificado, o que representa um enriquecimento superior a 105 em relao ao DNA genmico no amplificado. esta reduo substancial da complexidade que permite a aplicao de sondas de 19 nucleotdeos, marcadas por simples fosforilao em 5' com uma quinase, deteco de mutaes utilizando a tcnica extremamente simples do dot blot. Desenvolvimentos mais recentes da PCR mostram que possvel explorar a elevada sensibilidade deste mtodo para detectar colorimetricamente mutaes genticas. Assim, o gentipo relativo anemia falciforme pode ser determinado utilizando 3 tipos de iniciadores para a amplificao do mesmo DNA. Dois destes iniciadores (decapentmeros) so conjugados de maneira covalente a grupos fluorescentes e so dirigidos para a regio do codo 6 do gene da -globina. Um, perfeitamente complementar da sequncia normal, est ligado fluorescena e o outro, conjugado rodamina, difere do primeiro num nucleotdeo e complementar da mutao da anemia falciforme. O terceiro iniciador, correspondente sequncia da cadeia oposta e situado a montante do codo 6, utilizado como iniciador desta cadeia, sendo o seu par na reaco de amplificao, ora o iniciador marcado com a fluorescena, ora o marcado com a rodamina. Este mtodo baseado no princpio duma maior eficcia da PCR quando um dos iniciadores completamente complementar da sequncia com que se hibrida do que quando apresenta um desemparelhamento. Quando o DNA normal amplificado, o iniciador complementar da sequncia prolongado. Como este iniciador est marcado com a fluorescena, o DNA amplificado emite uma cor verde luz ultravioleta. Quando o DNA amplificado provm dum feto ou dum paciente com anemia falciforme, s o iniciador marcado com a rodamina, complementar da mutao, prolongado, e o DNA amplificado fluoresce com cor vermelha. Quando o DNA provm dum indivduo heterozigtico, ambos os iniciadores, marcados cada um com o seu prprio grupo fluorescente so prolongados e o DNA amplificado apresenta uma cor amarela resultante da fluorescncia complementar dos dois corantes. A cor do produto amplificado pode ser analisada, aps electroforese em gel de agarose (Fig. 224.II.), por laser de comprimento de onda dupla (vd. seco sobre a
145

sequenciao automtica) ou por filtrao num sistema de microfiltrao selectivo que permite eliminar o excesso dos iniciadores do meio reaccional e reter o DNA amplificado. Este em seguida analisado por laser ou luz UV. Estes desenvolvimentos permitem a automatizao do diagnstico, em rotina, de doenas genticas, em fase pr-natal, de maneira rpida precisa, sensvel e simples. 2) Deteco de doenas infecciosas por PCR Entre as numerosas aplicaes da tcnica do PCR, a deteco de infeces numa fase precoce, tm uma importncia particular. Por exemplo, o diagnstico de infeces microbacterianas ou microplsmicas por vezes longo e laborioso, necessitando a cultura do microorganismo, frequentemente difcil e longa (vrias semanas), ou um aumento significativo do ttulo de anticorpos para fazer um teste serolgico. Foi demonstrado que a introduo da PCR ao diagnstico da tuberculose, amplificando um fragmento de 383 pb que em seguida hibridado com oligonucleotdeos especficos, permite a deteco rpida de Mycobacterium tuberculosis. A mesma abordagem, aplicada deteco de Mycoplasma pneumonia, responsvel de vrias doenas respiratrias, revelou que possvel detectar at 102 organismos, aps lavagens bronco-alveolares, com grande especificidade. O diagnstico de infeces virais assume um relevo especial pela importncia, por vezes crtica, em detectar a presena de vrus o mais cedo possvel no organismo supostamente exposto, afim de poder aplicar mais eficazmente uma terapia ou tomar medidas preventivas contra a disseminao e conter um risco epidemiolgico. Dois exemplos caractersticos so o do HPV (Human Papilloma Vrus, vrus humano do papiloma) e o do HIV (Human Immunodeficiency Vrus, vrus humano da imunodeficincia). Deteco de HPVs Os vrus humanos do papiloma apresentam-se na forma de viries icosadricos contendo um DNA de cerca de 8 kb. Cerca de 60 tipos distintos de HPV foram descritos, estando muitos associados a sintomas clnicos particulares ou a manifestaes patolgicas bem definidas. Por exemplo, cerca de 20 tipos de HPV foram identificados em leses benignas em pacientes com epidermodisplasia verruciforme ou com simples verrugas comuns. Dentro deste grupo foram particularmente identificados 2 tipos, HPV5 e HPV8, presentes em cerca de 90 % dos casos de cancro da pele. Dentro do grupo dos HPVs que ocorrem em leses genitais (pelo menos 7) dois tipos, HPV16 e HPV18, foram encontrados associados a uma percentagem elevada de cancros do crvix uterino ou a outros cancros anogenitais (HPV16 a mais de 50 % e HPV18 a cerca de
146

20 %). Sendo, actualmente, correntemente, admitido que estes tipos de vrus so um cofactor etiolgico importante na patognese destes cancros e, HPV16 e HPV18, nomeadamente, na dos cancros anogenitais, torna-se evidente a importncia da sua deteco precoce. No existindo, actualmente, sistemas de cultura apropriados para replicar os HPV, nem testes serolgicos disponveis, numerosos esforos foram desenvolvidos para detectar a presena do vrus por hibridao molecular e, em particular, mais recentemente, por PCR, nos tecidos de risco. Um dos factores importantes a ter em considerao para a escolha dos segmentos de DNA viral, alvos da amplificao, o da integridade dessa regio, no decorrer do processo infeccioso. Sabe-se, com efeito, que no caso das leses malignas o DNA viral se integra frequentemente no DNA genmico das clulas hospedeiras, conduzindo a eliminaes ou a rupturas de sequncias virais. Contudo, duas regies do vrus, correspondentes aos genes que codificam para as protenas E6 e E7 so invariavelmente conservadas e constituem portanto um alvo privilegiado da amplificao. Uma escolha judiciosa dos iniciadores de amplificao, dirigidos para sequncias pouco conservadas dos diferentes tipos de vrus, e iniciadores da amplificao de fragmentos de DNA de comprimento facilmente separveis por anlise electrofortica e de sequncias diferenciveis com sondas oligonucleotdicas especficas, permite detectar e identificar especificamente a presena e o tipo de vrus infectando potencialmente tecidos de risco. Exemplo desta abordagem a deteco dos HPV11 e 16 no DNA celular obtido a partir de esfregaos cervicais de mulheres suspeitas de possurem anomalias citolgicas. Os iniciadores sintticos utilizados para a amplificao enzimtica obedecem aos critrios definidos acima (Fig. 225.II.). So dirigidos para uma regio do gene E6 dos vrus HPV11, 16 e 18, so especficos de cada um dos vrus e amplificam segmentos de comprimento diferente (90, 120 e 100 pb, respectivamente). A Fig. 226.II. atesta a especificidade destes iniciadores utilizados na aplicao da PCR ao DNA isolado de linhagens celulares que contm DNA do HPV16 (CaSki), do HPV18 (HeLa) ou aos DNAs de HPV11, 16 e 18 clonados em plasmdeos. Os iniciadores dirigidos para o HPV16 iniciam a amplificao do DNA de CaSki e do DNA de HPV16 clonado (corredor 1 e 2), mas no o do HPV11 ou o do das clulas HeLa (corredores 3 e 4), os iniciadores dirigidos para o DNA de HPV11 amplificam um segmento deste DNA clonado (corredor 5) mas no o das clulas CaSki (corredor 6) e os iniciadores especficos de HPV18 iniciam a amplificao do DNA de HeLa e do DNA de HPV18 clonado, (corredores 7 e 8), mas no do DNA de CaSki (corredor 9). Os fragmentos amplificados, analisados por electroforese em gel de poliacrilamida e visualizados com o brometo de etdeo, separam-se nitidamente, correndo em funo do comprimento respectivo
147

(90, 100 e 120 pb). Este resultado confirmado por anlise por Southern blotting hibridando os fragmentos amplificados com sondas oligonucleotdicas especficas, marcadas com 32P. A Fig. 227.II. ilustra o resultado do diagnstico da infeco por HPV em esfregaos do crvix uterino. O espcimen 47 negativo para HPV16 (Fig. 227.II.A) e positivo para HPV11 (Fig. 227.II.B) e os espcimes, 76, e 84 so positivos para HPV16, apresentando bandas amplificadas de intensidade varivel. Os espcimes 38, 43 e 47 so positivos para HPV11, que est normalmente associado com leses benignas (condilomas). Os espcimes 1, 7 e 87, submetidos amplificao por PCR com uma mistura de pares de iniciadores especficos de HPV11 e de HPV16 revelam-se infectados por ambos os vrus. Trs controlos figuram nos corredores centrais (Fig. 227.II.B). Podem, pois, ser efectuadas reaces com iniciadores mltiplos para a deteco simultnea de diferentes tipos de HPV na mesma amostra clnica. Anlises com uma amostragem mais ampla mostram que todas os mulheres que apresentam uma citologia cervical anormal esto infectadas, unicamente com o HPV16 ou simultaneamente com o HPV16 e o HPV11, mas nunca s com o HPV11. A enorme sensibilidade (1 molcula de DNA de HPV em 105clulas), a especificidade elevada, a possibilidade de utilizar quantidades nfimas de material (< 0,5 g de DNA celular) para as anlises de rotina e de detectar simultaneamente mais de um tipo de HPV, so propriedades que fazem desta tcnica, no s um poderoso meio de diagnstico, mas igualmente um instrumento de investigao epidemiolgica sobre o potencial oncognico dos HPVs. Deteco de HIV Uma outra aplicao de grande actualidade e enorme interesse a deteco dos vrus HIV. Foi, com efeito, demonstrado que a tcnica PCR permite identificar indivduos infectados com HIV antes de estes terem desenvolvido anticorpos. Sendo a deteco de anticorpos a base actual do diagnstico de rotina, compreensvel que numerosos desenvolvimentos sejam realizados para permitirem a adopo em rotina de anlise clnica por PCR. Estando bem documentada a existncia frequente de casos de pessoas infectadas com HIV que no desenvolvem anticorpos antivirais por perodos para cima de um ano, no deve ser excepcional que dadores de sangue infectados escapem ao diagnstico. Um outro grupo importante so as crianas de mes seropositivas para o HIV e cujo diagnstico serolgico no possvel durante vrios meses antes do desenvolvimento do sistema imunolgico. O HIV um vrus de RNA do tipo dos retrovrus. Como vimos, o genoma destes vrus copiado em DNA complementar por uma transcritase reversa e eventualmente integrado, na
148

forma de DNA, no DNA cromossmico das clulas infectadas e, em particular, no caso dos HIVs, nos linfcitos T, nos macrfagos e nas clulas microgliais do crebro. O vrus pode ser identificado por PCR, nomeadamente no sangue de indivduos de risco. Dada a heterogeneidade do genoma viral, bem caracterizada por sequenciao de vrus isolados de vrios indivduos ou do mesmo indivduo, a tempos diferentes do processo infeccioso, importante escolher para alvo da amplificao uma regio do genoma cuja sequncia seja perfeitamente conservada. este o caso do gene gag de HIV1, dentro do qual foram seleccionadas duas sequncias em cadeias opostas para a hibridao com dois oligonucleotdeos sintticos, iniciadores de amplificao de um fragmento de 213 pb. A amplificao aplicada deteco directa do HIV em amostras de sangue, para ser eficaz, tm que ser altamente sensvel porque, em geral, s uma pequena percentagem de linfcitos T est infectada. A Fig. 228.II.A ilustra a sensibilidade da amplificao aplicada ao segmento de 213 pb, a partir de 2 picogramas de DNA de HIV clonado num plasmdeo, em funo do nmero de ciclos. A deteco efectuada por hibridao de uma amostra diluda de 1/70 de meio reaccional, aplicada numa membrana de nitrocelulose, com uma sonda oligonucleotdica de 19 nucleotdeos, marcada com 32P (dot blot). A verificao do comprimento do segmento amplificado efectua-se por electroforese num gel de agarose 2 % de uma amostra do meio reaccional, seguida de autorradiografia. A radioactividade provm da incorporao de um nucleosdeo trifosfato (por exemplo 32PdCTP), adicionado mistura dos restantes 3 nucleosdeos trifosfatos durante a reaco de polimerizao (Fig. 228.II.B). Uma quantificao do nmero de molculas de DNA detectveis d a medida da sensibilidade deste mtodo. A Fig. 228.II.C. mostra que possvel detectar at 4 molculas de DNA. Este resultado foi obtido amplificando uma mistura composta de uma quantidade fixa do DNA do HIV plasmdico (4 x 105 molculas) e de quantidades crescentes (a partir de 1g) de DNA humano de controlo que serve de meio de diluio serial. Esta sensibilidade de 4 molculas corresponde possibilidade de detectar 1 molcula de DNA de HIV em cerca de 106 linfcitos. Aplicada identificao de HIV em indivduos seropositivos, a amplificao enzimtica confirma inequivocamente a infeco. A Fig. 229.II. representa o resultado da hibridao de DNA, proveniente de sangue de trs indivduos seropositivos, amplificado e aplicado numa membrana, com a sonda oligonucleotdica. O nmero de ciclos de amplificao necessrios para obter um sinal varivel de indivduo para indivduo e reflecte provavelmente a abundncia de linfcitos T no sangue destes pacientes.

149

Os resultados mais importantes deste estudo aparecem na Fig. 230.II. Entre um grupo de risco constitudo por 16 pessoas seronegativas, parceiras de indivduos seropositivos, 5 revelaram-se inequivocamente infectadas por HIV. Uma anlise electroforetica do DNA amplificado destes indivduos confirma plenamente estes resultados (Fig. 231.II.). A deteco directa do DNA viral pode, pois, antecipar-se ao desenvolvimento de uma reaco serolgica positiva. Este mtodo foi, tambm, aplicado com sucesso identificao do DNA de HIV no sangue de crianas com menos de 18 meses nascidos de mes seropositivas. Utilizado a grande escala este teste constituir, sem duvida, um progresso importante para conter a disseminao, controlar a epidemia e determinar estratgias teraputicas.

150

12. REGULAMENTAO BIOLGICOS

SOBRE

UTILIZAO

DE

ORGANISMOS

GENETICAMENTE MODIFICADOS E A PROTECO CONTRA OS RISCOS

As aplicaes dos organismos recombinantes que podem beneficiar as nossas sociedades so, como vimos, numerosas e abrangem importantes sectores econmicos e sociais. No entanto, como qualquer outra actividade humana, a que recorre utilizao dos organismos geneticamente modificados no isenta de riscos. Estes riscos potenciais de futuras aplicaes foram, pela primeira vez, objecto de preocupaes expressas publicamente pelos prprios cientistas, em 1974, em carta dirigida Academia das Cincias dos Estados Unidos da Amrica. Foi primeiramente pedido que fosse observado uma moratria, aplicando-se s experincias de clonagem que envolvessem os genomas de certos vrus animais, de determinantes de resistncia a antibiticos, de toxinas e de oncogenes. Foram, em seguida, elaboradas, pela primeira vez, em 1976, pelo National Institutes of Health (NIH), uma srie de directivas que foram actualizadas em 1986, que definem categorias de confinamento biolgico e fsico a que os investigadores desta rea se devem submeter. Estes diferentes nveis de confinamento so definidos em funo do tipo de vector e da origem do DNA objecto da recombinao. O novo conceito de confinamento biolgico preconiza a utilizao de sistemas vectorhospedeiro "desarmados", que s podem sobreviver em condies laboratoriais especiais. A noo de confinamento fsico estabelece quatro nveis de segurana, que vo das prticas laboratoriais microbiolgicas de base (BL-1 = Biosafety Level-1) at s mais sofisticadas medidas e condies de proteco do pessoal e do meio ambiente (BL-4), por imposio de progressivas barreiras fsicas (presso negativa, portas duplas e hermticas, autoclaves, filtrao do ar de sada, descontaminao rigorosa de todo o material e dos efluentes, etc.) Estas recomendaes levaram ao desenvolvimento de sistemas vector-hospedeiro sem risco para o tipo de actividade em vista (ensino, investigao acadmica ou industrial, produo...). Um certo nmero de estirpes bacterianas foram modificadas de maneira a tornlas no viveis fora do laboratrio. Por exemplo, a estirpe X1776, derivada de E. coli K12, possui uma exigncia metablica (biossntese da lisina), que no pode ser compensada pelas substncias presentes no intestino humano (acido diaminopimlico). Alm disso, esta estirpe possui uma membrana celular frgil que se desagrega em presena de detergente ou de fora inica fraca. A esta estirpe seguiram-se outras derivadas de K12, de utilizao mais cmoda, mas tambm incapazes de sobreviver fora do laboratrio.
151

Os plasmdeos tambm foram modificados para serem incapazes de se transferirem de uma estirpe para outra e no poderem disseminar a resistncia aos antibiticos. Quanto aos fagos, uma srie de mutaes sem sentido nos genes de associao, torna-os incapazes de se multiplicarem fora dum hospedeiro de laboratrio apropriado. Os riscos potenciais do DNA recombinante continuam a pertencer ao domnio da especulao, na medida em que os milhes de experincias realizadas nos ltimos 25 anos no permitiram nunca pr em evidncia riscos biolgicos causados por uma bactria, vrus, fungo, ou clula portadores de DNA recombinante, para alm dos perigos inerentes natureza da molcula de DNA recombinante. Isto , a recombinao gentica no levou at hoje ao desenvolvimento de novas propriedades inesperadas nos organismos recombinantes. Como no , no entanto, possvel demonstrar a segurana absoluta duma construo gentica particular em todas as circunstncias que se possam imaginar, normal e aconselhvel, que as experincias envolvendo organismos geneticamente modificados se efectuem adoptando medidas de precauo definidas por directivas compulsrias, em particular as experincias de maior risco, pelo impacto que podem vir a ter no meio ambiente, ou as que levantam problemas de ordem tica, tais como: -fermentaes a grande escala de organismos contendo DNA recombinante, -a libertao deliberada no ambiente de organismos geneticamente modificados, -a transferncia de genes em clulas embrionrias de mamferos e criao de animais transgnicos, -a terapia gentica e a clonagem de seres humanos. Em 1990, o Parlamento Europeu aprovou duas directivas, uma relativa utilizao confinada de microorganismos geneticamente modificados e outra relativa libertao deliberada no ambiente de organismos geneticamente modificados, propostas pelo Conselho das Comunidades Econmicas Europeias, que definem a legislao que os Estados Membros devero implementar. Esta legislao apresentada, na sua forma integral, em anexo.

152

ANEXO

Directivas do Conselho da CEE

153

S-ar putea să vă placă și