Bases de Dados Flashcards
Origem da informação nas bases de dados bio
Sequenciação de genomas e transcritos –> Bases de dados de nucleótidos (–> Previsão das bases de dados de proteínas)
Sequenciação de proteínas, Mass-spec, outros –> Bases de dados de Proteínas
A partir da informação disponível
listas de sequencias, estruturas
–> 1. Anotações (automática de ORFs (open-reading frame), por curadores (pesquisa de lit. científica) ou submissão direta pelos autores): espécie, tipo de mol, função, presença de motivos…
–> 2. Ferramentas de pesquisa e análise (de texto (“google”-> browser), de sequências (semelhança), previsão (de estrutura, motivos…)): integradas, externas
c/ algoritmos em difs linguagens
!! Pesquisa por INTERFACE dif base de dados dif algoritmo!
Desenvolvimento de formatos de dados standartizados (flat, FASTA, etc)
Instituições/ repositórios
Centrais:
- NCBI (National Center for Biotechnology Information)
- PubMed.gov (US National Library of Medicine, NIH)
- DDBJ (DNA Data Bank of Japan)
- ENA/EBI (European Bioinfomatics Institute)
1, 3, 4–> INSDC (International Nucleotide Sequence Darabase Collaboration)
Outras instituições: UCSC Genome Bioinf. Sanger Center UK/ Vega Genome Browser Fly Base PROSITE SIB (Swiss Institute of Bioinf)/ ExPASy Bioinfs resource portal