2.1.Principales bases de données nucléotidique Flashcards
Que signifie que les données ont été obtenue par la recherche publique?
Recherche publique = données publiques
Partage international des données
Evite qu’une expérience soit refaite par différents laboratoires
Permet la comparaison des résultats
Qu’est ce qu’une base de donnée?
Ensemble de données relatif à un domaine défini de connaissances et organisé pour être offert aux consultations d’utilisateurs et analyses
Quels besoins génère le nombre important de données obtenues par l’expérimentation?
Besoin d’outils adaptés à de grands volumes de données
Besoin d’une gestion par des organismes spécialisés
Besoin d’interrogation via Internet (Accès fréquents à ces données)
Quand sont créées les premières banques de séquences nucléiques?
Au début des années 80
D’où viennent es données des banques de données nucléotidiques?
Séquençage de molécules d’ADN ou d’ARN
Quels sont les différents types de données stockées?
Fragments de génomes (un ou plusieurs gènes, un bout de gène, séquence intergénique, etc).
Génomes complets,
ARNm, ARNt, ARNr, … (fragments ou entiers)
Que représente une entrée?
1 séquence + ses annotations = 1 entrée
Les séquences ADN et ARN Sont écrites avec T ou U?
T
Quel brin est donné dans la banque?
Le brin + ou brin direct
Quelles sont les bases de données principales? + régions
-NCBI US
-EMBL-EBI (devenu ENA) Europe
-DDBJ Asie
Quels sont les inconvénients des bases de données généralisées?
Difficulté de mise à jour des données
Forte redondance
Annotations peu normalisées
Annotations peu précises
=> bases spécialisées évitent ces pb
Donner des exemples de bases spécialisées
Human Microbiome Project
FlyBase Database
WormBase