Chap 1 Flashcards

1
Q

Donner la différence entre une banque de données et une base de données ?

A

🔹Banque de données : fichiers texte sans relation entre eux.

🔹Base de donnée : relation entre les données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel est le role des bases de donnée ?

A

▪️Collecter les infos
▪️Stocker et archiver
▪️accès libre et gratuit
▪️facilite l’exploitation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Donner le nom de 3 centres de ressources.

A

🔺EBI (European bioinformatics institute)
🔺NCBI (national center of biotechnology information)
🔺NIG (national institue of genetics)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Donner les caractéristiques d’une banque de donnée généraliste.

A

🔸Fichier texte structuré
🔸Donnée primaire (collecté en raison d’une étude à venir)
🔸Donnée générales (pas de focus sur une application ou un organisme)
🔸Donnée les plus exhaustives possibles (informations hétérogènes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Donner les avantages et les inconvénients d’une banque de donnée généraliste.

A

✅Avantages
Très riche
• Un grand nombre de séquence accessibles
• Grande diversité des organismes représentés (étude évolutive)
• Des infos accompagnent les sequences.

❌Inconvénients
•peu ou pas de contrôles sur la qualité des entrées
•Les auteurs sont responsables des entrée donc beaucoup d’erreurs :
-qualité de l’information hétérogène
-erreur sur la séquence (contamination)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Donner les banques de données généraliste pour les séquences nucléotidiques (en disant par qui elle est diffusée).

A

♦️EMBL (European molecular biology laboratory). Diffusée par EBI.

♦️GenBank diffusée par le NCBI

♦️DDBJ ( DNA Databank of Japan) diffusée par le NIG

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les banques généraliste pour les séquences nucléotidique échangent-elles leurs données ?

A
Oui 👍 
Le but est de rendre le contenue :
✔️Publique 
✔️Accessible
✔️Comparable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle différence trouvé t-on entre les fiches EMBL et les fiches Genbank ?

A

Le format d’écriture varie en fonction des bases des données
🔸genbank : écriture en des mots en entier
🔸EMBL : écriture des mites en diminutif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Donner les noms de banques de données généralistes protéiques.
Et les rôles.

A

🔷TREMBL (traduction automatique des CDS) de EMBL
🔷Genpept (traduction automatique des CDS) de Genbank

➡️ Obtenir une couverture maximale ‼️
•ensemble des séquences protéiques
• annotation automatique non vérifier

🔷PIR : première banque protéique américaine de la banque NBRF

➡️Limite la redondance et travaille à la stabilisation des annotations des protéines.
•classification des proteine en familles en fonction de leur degrés de similarité.

🔷Swiss prot : origine des sequence TREMBL chaques séquences est expertisée par l’annoteur

➡️Banque manuellement annotée, nettoyée, non redondante, haute qualité, intégrés les infos des bases de données : excellence dans la qualité ❤️

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

-Citer la base de donnée qui réunie :
• Swiss prot
•PIR
•TREMBL EBI

-Et dire son rôle.

A

Fournir une seule ressource centralisée pour toutes les séquences protéiques connues permettant

•un accès unifié
•catalogue plus complet
•maintient de 2 sections : -uniprot /Swiss prot
Et uniprot/TREMBL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dire les caractéristiques d’une fiche Swiss prot.

A

🔺même format que sur EMBL
🔺reviewed ⭐️ séquence contrôlée
🔺mention : integrated into Uniprot/swissprot

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Donner les caractéristiques des données spécialistes.

A

🔹Amélioration au regroupement des données issues de banques généralistes
🔹spécificité
🔹Données dédies à un type d’organisme thématiques
🔹Techniques particulière, interêt structuré par un groupe d’individus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Donner le but des banques de données spécialisées de génomes complet.

A

🔸volonté d’intégration maximale de toutes les infos sur les génomes
🔸évolution vers la phylogénétique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Donner deux bases de donnée généraliste sur les génomes complets.

A

♦️ Refseq NCBI : plus ancienne, seule ressource exhaustive.

♦️EnsEMBL génomes : couvrir l’ensemble des génomes complet de non vertébrés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Donner les noms des banques de données spécialisée de génomes complet.

A

🔺 FlyBase : analyse des drosophiles 🦟

🔺MGI (mouse génome informations) génomique fonctionnelles et comparée du génome de la souris 🐁

🔺AceDB : annotation du génome de C.elegans et d’autres organisme eucaryotes et procaryotes.🐉

🔺TAIR (arabidobsis information ressources) : la plupart des infos sur arabidobsis plante.
🌱
🔺SGD ( saccaromyces génome database) ensemble de donnée sur cette levure 🔘

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  • Donner un outils de navigation génomique.
  • Sa définition
  • et les différents types
A

-Génome browser

-Définition :
Puissant outils de visualisation et d’interrogation pour permettre l’analyse des gènes et des protéines dans le génomes dans leur environnement.

  • • UCSC génome browser
    • ERC venir me browser
    • EnsEMBL génome browser
17
Q

Donner les banques de données spécialisée de domaines protéiques.

A

🔹 Pro Dam à partir d’uniprot
🔹 pFam ( proteine family database) outils de classification des proteine en fonction de leur évolutions.
🔹protiste

18
Q

Comment s’appelle la base de donnée qu’à regroupée EBI ? Pour les banques spécialisée de domaines protéiques ?

A

INTERPROFESSIONNEL ( integrated ressources of protéines families )

19
Q

Donnée de banque de donnée spécialité d’élément répétés ?

A

RepBase (pour les eucaryotes)

➡️utiliser pour masquer ces éléments dans le génome eucaryote lors de leurs annotations.

20
Q

Outils d’interrogation les caractéristiques ?

A

🔺 accessible
🔺moteur de recherche sur les bases de données publiques : ENTREZ, SRS, ACNUC
🔺utilisation des requêtes structurée : combinaison de plusieurs termes avec opérateurs logiques.