Cours 1 - Banque de données Flashcards
Dans une recherche sur ppubmed ou autre, comment je fais pour que le moteur de recherche inclus un titre PLUS un nom de journal?
Soit on va dans les options de recherche, soit on met un AND entre les items que l’on cherche.
Donner une définition de la bio-informatique.
C’est l’application de méthodes et outils d’analyses
informatiques à la résolution de questions biologiques.
Donner des exemples d’applications de la bio-informatique.
- Confirmer la séquence d’un fragment d’ADN clôné
- Déterminer des amorces pour une amplification PCR
- Identifier des régions conservées entre plusieurs
séquences - Analyser les lectures de séquençage d’un génome
- Prédire l’impact d’une mutation dans l’ADN
- Contrôler l’accès à des données cliniques
Qu’est-ce qu’une bande de données?
Une collection de données reliée qui est structurée, cherchable, mise à jour et cross-référencé. Inclus aussi des outils associés, comme des logiciels, utile pour la régulation de la BD.
Nommer les trois principales BD nucléotidde.
ENA, GenBank, DDBJ (regrouper dans INSDC)
Que comprennent les génomique database?
les séquences EN PLUS des annotations
Qu’est-ce qu’inclus RefSeq?
L’ADN génomique, ARNt, les produits protéiques, prédictions de gènes et annotations mannuelles de la majorité des organismes connus
À quoi fait référence les transcripts sur GENCODE?
Aux isoformes d’un même gènes, donc avant l’épissage alternatif.
À quoi GENCODE est spécifique?
Le génome humain
Décrire la structure d’un gène humain.
- Région promotrice
- Initiation de la transcription qui commence avec UTR 5’, suivi de l’exon 1 avec ATG
- Suite d’introns puis d’exons
- codon STOP, suivi de UTR 3’ avec ou se lie queue poly A
Qu’est-ce qu’un assemblage?
- C’est le nom de « version » d’une séquence génomique
- L’assemblage est une information aussi importante à donner que le nom de la ville lorsque vous donnez rendez-vous à quelqu’un (e.g. au 1234 rue Principale)
Qu’est-ce qui distingue deux assemblages?
Ce sont les mutations, insertions et délétions qui distinguent deux assemblages
Qu’est-ce qui peut changer la position chromosomique d’une séquence?
les insertions et les délétions
Il y a des BD d’épigénomique
Il y a des BD d’épigénomique, donc pour un même génome, j’ai plusieurs épigénome possible
dbSNP est une BD de quoi?
BD général des SNP présent chez l’homme
Est-ce que dbSNP peut aider si on cherche un SNP lié à une maladie particulière?
Non, pas beaucoup de chance de trouver cette information sur dbSNP
Quelle est la limitation de BD de séquence de protéine basé sur des séquences génomiques uniquement?
Ne donne pas d’information sur la protéine après la transcription, donc elle peut être modifiée par ensuite et on le sait pas.
Comment fonctionne Inter Pro?
Donne une analyse des fonctions potentielles d’une protéine en les classant en famille et en prédictant les domaines et les sites importants. Utilise un consortium de BD pour accomplir cette tache.
Quelle est la particuliarité de PDB (protein data bank)?
Seule BD qui donne de l’information sur la structure 3D
Il existe des BD de voie métabolique
Il existe des BD de voie métabolique
qu’est-ce que l’ontologie?
representation of knowledge showing the relationship
between concepts in a particular subject
quelle est la particularité de Gene Ontology?
The Gene Ontology (GO) is a controlled vocabulary, a set of standard terms used for indexing and retrieving information.
Quelles sont les limitations des BD?
- erreurs d’annotation (surtout celles automatiques)
- pas tooutes disponibles sur tous les servers
- sont mise à jour, mais quand …
- il peut ne pas y avoir de comparatif entre deux
Quel mot clé devez-vous utiliser pour chercher les articles scientifiques de l’auteur Fred Sanger sur Pubmed?
=> Entre crochet ; Sanger F [author]
Quelles parties de la séquence de l’ADN génomique n’est pas présentes che ARNm mature?
les introns
pourquoi la séquence de l’ARNm mature n’est pas forcément un multiple de 3?
Car UTR 5’ et tout ce qui suit le codon stop n’est pas traduit.
Les données de Uniprot et les modèles produit par Alphafold sont souvent différentes, expliquer comment cela est possible.
Uniprot prend des données d’article VS AlphaFold qui devine une structure.
- Uniprot peut donc avoir la forme quaternaire d’une prot, pas Alphafold
- Alphafold prend la séquence qu’on donne, donc peut amener un billet (exclus transformation post traductionnelles)
Exercice de longueur de séquence / a.a.
Exercice de longueur de séquence / a.a.
Excercice de position d’un gène
Excercice de position d’un gène