Documente Academic
Documente Profesional
Documente Cultură
Tcnicas
Bibliotecas de cDNA: transformar mRNA em DNA.
Posso fazer um primer (poliT: TTTT) e colocar polimerase para sintetizar uma molcula
complementar. cDNA no tem mais os ntrons. Isso ento diferente de um DNA genmico, que
tambm uma molcula dupla-fita mas tem ntrons. Posso pegar cDNA e jogar num plasmdeo. Ao
grudar essa seq em um plasmdeo, posso inserir plasmdeo numa bactria e deixar ela duplicar. Ela
duplica e gera mais plasmdeos ainda.
Bibliotecas de cDNA esto intimamente ligadas a sequenciamento Sanger.
Para conseguir sequenciar um transcriptoma precisava de mRNA maduros, fazer bibliotecas e da
sequenciar. Os primeiros transcriptomas foram feitos usando bibliotecas de cDNAs (que levavam
2-3 anos pra fazer processo difcil, exaustivo, porm necessrio no primeiro cenrio). E muitas
vezes se descobre que se sequenciou o que no se queria ser sequenciado.
ESTs: quando coloco oligoT (primer) e sintetizar no sentido oposto. Molcula complementar tinha
s um pedao. Esses so os ESTs.
A partir de primers aleatrios era possvel codificar (ORESTES). Consigo pegar seqs de outras
regies da sequncia que os ESTs no conseguiam. ORESTES tiveram papel importante na tarefa
de fechar o sequenciamento do genoma humano.
Microarray: olho s mRNA. Vou colocar amostras em contato com uma lmina que j tem
previamente selecionados os genes que vou estudar. Essa lmina de microArray tem regies onde
tem um rob que coloca molcula na lmina. Lmina tem regies chamadas spots (cada uma com
um gene: G1, G2, G3 chega a at 44 mil genes para estudar uma anlise de transcrio de uma
amostra).
Primeiro ponto de bioinfo: escolher no genoma quem sero os genes estudados. Esses genes devem
ser traduzidos em oligos nucleotdeos (pensando em especificidade).
Hoje em dia podemos comprar microarrays. Exoma: defino quais xons estou estudando. Deve-se
ter cuidado com o que comprar pois o que se quer estudar pode no estar l. Os chips de exomas
no tem codificantes.
Fazer a bioinfo: definir o que se vai estudar e garantir que se vai estudar o que se quer.
Tenho uma lmina com genes limitados a serem estudados. Ela deve ser muito bem pensada para se
garantir que se vai estudar o que se quer.
Vamos hibridizar a amostra (h RNA na amostra, que instvel: se transforma eles em cDNAs).
Coloco sopa de amostras na lmina. Probabilisticamente todos os RNAs se encontram nos spots.
Garantia de que a intensidade de florescncia corresponde da amostra. Consigo olhar ao mesmo
tempo para at 44mil xons diferentes. uma tcnica de triagem.
Na clnica: spots com (genes interessantes com) marcadores interessantes para poder identificar
doenas. H perfil gnico agora. Mdico tem um conjunto de genes que se vai olhar e identificar
tipo de cncer por exemplo. H um software por trs, pois probabilstico.
SAGE: assim como ESTs, sequencio a partir do poliT uma sequncia, mas nesse caso a seq.
menor. Caiu em desuso muito rpido pois a seq. muito pequena. Mas trouxe algo importante: os
tiling arrays (arrays sequenciais que cobre genoma inteiro) trouxeram perfil de expresso onde
vemos que h muita coisa no codificante. H no codificante de forma muito mais forte que
imaginvamos (mRNA no codificantes). mRNA mesmo, pois h poliA, no ntron. H regies
descritas como transcritas que no so codificantes. Da vieram as tcnicas de sequenciamento.
RNA-Seq: pirossequenciamento, usar sequenciadores, para RNA. No preciso mais de bibliotecas
de RNA. Muito mais rpido. Mesmo problema De Novo vs sequenciamento (?). Info mais ntegra:
quando consigo mapear meu genoma. Se no, preciso de algo equivalente ao De Novo.
Novamente, 1o problema: contaminante. Tiro contaminantes e remonto.
(Sequenciamento sanger no larga escala)
Muitos no codificantes so micro RNAs. um problema em aberto descobrir o algoritmo.
Microarrays: https://www.youtube.com/watch?v=ePFE7yg7LvM
Saio do dado bruto, passo para normalizaes genes diferencialmente expressos
busca por grupo diferencialmente expressos
Modelo estatstico para cada grupo diferente
Microarray: primeira etapa tem todo um trabalho de bioinfo para determinar ao que cada um dos
spots corresponde (xon? Seq. inteira?).
Depois que tenho lmina higienizo amostras e hibridizo na lmina.
Scaneio lmina com laser e vejo comprimentos de onda.
Em microarray trabalhamos muitas vezes com razo de expresso. Quanto um gene est expresso.
Sempre preciso de uma referncia
Objetivos finais de uma anlise de dados de microarray. Pode ser que no estejam representados os
genes que respondam tais questes na plataforma de microarray! desafio
R+bioconductor: traz qualidade, pois aberto. Pacote de bioinformtica. Robustez muito boa.
BASE: aberta tambm mas usa banco de dados por trs (engessa forma que voc enxerga o
experimento).
MIDAS e spotfire pago
Vrias ferramentas pra fazer esse tipo de anlise.
Dado bruto: matriz de expresso onde para cada gene h 2 informaes pelo menos
Depois posso fazer uma busca gene a gene ou uma busca em grupos. Em grupos: pensando em gene
anthology. Se ver a via inteira alterada: mais significativo. Em um gene diferente, outra viso.
Dado bruto: no array, posso ter para cada spot, a prpria hibridizao dos reagentes com a lmina
(hibridizao: mexer os reagentes com os spots para garantir que os reagentes se liguem aos spots)
causava um background. Sinal: leitura do sinal menos o background (ex: se background (rudo) era
15 e sinal 10, isso no significativo). Isso vale pra cDNA microarrays.
Plataformas atualmente de oligoarrays, nem olha-se mais tanto o background (reagentes no
deixam o background muito grande). Info ainda existe. EX: se algum encosta na plataforma isso
interfere no sinal entra o background. Se houver isso, devo tirar essa informao (devo subtrair
do sinal). Ento background ainda muito informativo na qualidade do sinal inicial.
1a etapa de normalizao: retirada de background desnecessrio (cabelo, dedo, etc). Ou fazer
subtrao ou tirar esse sinal.
Ainda tem problema nas cores.
MAplot (prova): grfico que permite visualizar razo de expresso por intensidade
log2 (R/G) ; R red; G green
log2(R*G) = intensidade
Grfico razo de expresso por log2(R*G) = intensidade
Corante verde incorpora mais (brilha mais) que corante vermelho!
2a etapa de normalizao: corrigir incorporao de diferencial dos corantes.
Fao isso atravs do grfico de Maplot.
O mtodo usado de chama lowess: janela deslizante que se passa no grfico MAplot, calculo mdia
para janela e trago nuvem para ficar centrada no 0.
Para comparar lminas que vm de diferentes lugares e obtidas de diferentes formas entre si:
primeiro precisamos usar uma referncia em comum. Em seguida, centralizo essas amostras.
Grfico de bloxpot: mostra a distribuio de dados. Seu meio a mediana.
Se duas lminas tm medianas com diferena muito grande, pode ser erro experimental (lote de
reagentes, laser utilizado, etc). Mas isso no esperado. O esperado que todas fiquem muito
prximas, tanto a mediana como a distribuio.
3a etapa de normalizao: normalizao entre arrays (between arrays). Tratar de lminas diferentes
do padro das outras.
Posso usar o lowess aqui.
Depois de fazer essas 3 etapas de normalizao, posso fazer a anlise.
1a anlise: teste-t: teste paramtrico, mas expresso de um gene leva a uma distribuio normal? A
princpio no se sabe. Mas uma forma de comear.
Mas existem testes no paramtricos, que so o ideal, porque expresso de gene no
necessariamente normal.
E anlise com grupos?
NCBI: search com tudo vazio: vejo todas as bases de dados
GEO Datasets dataset browser (mostra j alguns experimentos).
GSE18198: um experimento de microarray tenho plataforma
Reference Series: abre em uma nova aba
Platform (1): ''
Data table: quando se compra o array, escolhe tais propriedades
Clica em cluster analysis
Tem perfil de expresso de todos os genes. D pra ver como cada gene est. Preto: menos diferena
entre os experimentos. Mas no tem probabilidade agregada.
Preciso do p-valor.
Data analysis tools
Compare 2 sets of samples
Atravs desse gene chegar no pubmed (na publicao). Separar ento 3 publicaes vinculadas.
Seq 2: responder quantos genes esto l. Jogar seq nos programas (as respostas podem ser
diferentes) e responder.
(Mapear no refseq para tirar a dvida).