Documente Academic
Documente Profesional
Documente Cultură
.
BIOINFORMÁTICA E O MOVIMENTO
DO SOFTWARE LIVRE
Os pequenos conjuntos de dados podiam ser
trabalhados em microcomputadores que usavam
linguagem de programação BASIC e Pascal.
Como resultado, softwares
populares de análise de sequência
feitos para microcomputadores
nem sempre eram compatíveis com
servidores e vice-versa
COMPUTADORES DESKTOP E NOVAS
LINGUAGENS DE PROGRAMAÇÃO
• Perl (Practical Extraction e Reporting Language) é uma
linguagem de scripting de alto nível que foi criada em
1987 por Larry Wall como uma adição ao sistema
operacional GNU para facilitar a análise e o relatório de
dados de texto.
• Até o final dos anos 2000, Perl foi a lingua franca da
bioinformática, devido à sua grande flexibilidade.
• sua sintaxe altamente pontuada, pode resultar em baixa
legibilidade do código, dificultando a manutenção do
código Perl, especialmente para atualizar o software
após vários meses ou anos.
COMPUTADORES DESKTOP E NOVAS
LINGUAGENS DE PROGRAMAÇÃO
• O lançamento do BioPerl em 2002 contribuiu para a
popularidade de Perl no campo da bioinformática.
Essa interface de programação Perl fornece módulos
que facilitam tarefas típicas como:
• (i)Acessar dados de sequência de bancos de dados
locais e remotos;
• (ii)Alternar entre diferentes formatos de arquivo;
• (iii)Pesquisas de similaridade;
• (iv)Anotar dados de sequência.
COMPUTADORES DESKTOP E NOVAS
LINGUAGENS DE PROGRAMAÇÃO
• O Python, assim como o Perl, é uma linguagem de
programação multiparadigmática de alto nível que foi
implementada por Guido van Rossum em 1989.
• O Python foi projetado para ter um vocabulário e uma
sintaxe mais simples, simplificando a leitura e a
manutenção do código (às custas da flexibilidade).
• No entanto, não foi antes do ano 2000 que bibliotecas
especializadas de bioinformática para Python foram
implementadas, e não foi até o final dos anos 2000
que o Python se tornou uma importante linguagem de
programação em bioinformática.
1990–2000: GENÔMICA,
BIOINFORMÁTICA ESTRUTURAL E A
SUPERESTRADA DA INFORMAÇÃO
AMANHECER NA ERA GENÔMICA
Em 1995, o primeiro sequenciamento completo do genoma de um
organismo de vida livre (Haemophilus influenzae) foi sequenciado
pelo Instituto de Pesquisa Genômica, liderado pelo geneticista J.
Craig Venter. No entanto, o ponto de inflexão que iniciou a era
genômica, como a conhecemos atualmente, foi a publicação do
genoma humano no início do século XXI.
AMANHECER NA ERA GENÔMICA
O Projeto Genoma Humano foi iniciado em 1991 pelos Institutos
Nacionais de Saúde dos EUA e custaram US $ 2,7 bilhões durante
13 anos. Em 1998, a Celera Genomics liderou um esforço rival e
privado para sequenciar e montar o genoma humano com um
custo de 1/10 do financiado pelo National Institutes of Health
(NIH)
AMANHECER NA ERA GENÔMICA
Na época tiveram rendimento máximo de 96 leituras de 800 pb de
comprimento por corrida, ordens de grandeza menores do que os
sequenciadores de segunda geração que surgiram no final dos
anos 2000. Assim, o sequenciamento do genoma humano (3,0
Gbp) exigiu um mínimo aproximado de 40 000 corridas para obter
uma cobertura apenas de uma vez
BIOINFORMÁTICA ON LINE
World Wide Web, um sistema global de informações feito de
documentos interligados, permitiu a criação de muitos recursos de
bioinformática acessíveis em todo o mundo, tal como o primeiro
banco de dados de seqüências de nucleotídeos do mundo, o EMBL
Nucleotide Sequence Data Library (que incluía vários outros bancos
de dados, como o SWISS-PROT e o REBASE), em 1993
BIOINFORMÁTICA ON LINE
Em 1992, o banco de dados do GenBank passa a ser de responsabilidade
do NCBI (antes era contrato do Laboratório Nacional Los Alamos).
No entanto, o GenBank era muito diferente de hoje e foi distribuído
como um CD-ROM em seu primeiro lançamento. O site do NCBI foi
disponibilizado on-line em 1994 (incluindo a ferramenta BLAST, que
permite realizar alinhamentos em pares de forma eficiente).
BIOINFORMÁTICA ON LINE
(i) Requer conhecimento prévio de sistemas
operacionais semelhantes ao UNIX;
Um software de (ii) Requer a utilização de linhas de comando
bioinformática (para instalação e uso)
frequentemente: iii) Requer a instalação de várias bibliotecas
de software (dependências) antes de serem
utilizável, o que pode ser pouco intuitivo
mesmo para bioinformáticos experientes.
https://www.ncbi.nlm.nih.gov/sra https://www.ebi.ac.uk/ena
BIG DATA BIOLÓGICO
Tendo em vista a grande quantidade de bancos de dados que
surgem, é importante definir padrões para estruturar esses
novos recursos e facilitar seu uso. O Consórcio de Padrões
Genômicos foi criado em 2005 para definir as informações
mínimas necessárias para uma sequência genômica.
https://press3.mcs.anl.gov/gensc/
COMPUTAÇÃO DE ALTO DESEMPENHO
Em alguns casos e de acordo com os cálculos necessários,
um simples computador de mesa possa bastar, enquanto
outros projetos de bioinformática exigirão infraestruturas
muito mais imponentes, caras e que irão requerer
profissionais especializados.
COMPUTAÇÃO DE ALTO DESEMPENHO
• Compute Canada
(https://www.computecanada.ca)