bio info Flashcards
Gène homologue
gène avec le même gène ancestral commun
histoire evolutive commune
gène paralogue
2 gènes issus d’une duplication dans un génome d’un gène ancestral en 2 gènes qui évoluent en parallèle
Gène orthologue
2 version du même gène après un évènnement de spéciation
Alignement Local
identification de motifs communs / conservées
Alignements Global
mesure la distance génétique/évolutive entre 2 gènes homologue
Alignement Glocal
comparer des génomes similaires qui ont subis des réarrangement important
Arbres phylogénétiques
représentation graphique des distance entre les séquences homologues
Méthodes de construction d’arbres phylogénétique
1 : Neighbour Joining (NJ)
–> minimiser la longueur totale des branche de l’arbre
2 : Maximum de parcimonie (MP)
–> minimiser le nombre d’évènements évolutifs
3 : Maximum de vraisemblance (ML)
–> maximiser la probabilité d’un arbre
comment peut-on évaluer la stabilité de la topologie d’un arbre ?
En comparant les arbres reconstruits par plusieurs méthodes de reconstruction d’arbre (ML, MP, NJ)
Comment évaluer la robustesse de chacune de ses branches d’un arbres ?
avec les scores de bootstrap aussi appelé scores de biffurcation
Décompositions en K-mer
Approche efficace pour indexer stocker et aligner des séquences.
Découpe d’une séquences en mots élémentaires qui sont trier et aligner dans un tableau dans l’ordre alphabétique. svp 4-mer
BLAST définition
programme d’alignement local de séquence qui permet de trouver des séquences similaires a une requête courte.
Blast fonctionnement :
1 : Décompose la séquence raquette en mots élémentaires (K-mer)
2 : Compare ces mots a ceux d’une BDD qui est elle aussi indexée en mots élémentaires
3 : Alligne les mots en calculant le score d’alignement, continue l’élongation des séquences autour des mots tant que le score d’alignement augmente.
Blast paramètre Bit-score
reflette la pertinence de la requête, la validité de l’alignement. 2^S alignement nécéssaire avant de trouver 1 avec un aussi bon alignement. Bit-Score augmente avec la taille de la séquence. ne varie pas avec la BDD. + le bit_score est élevée plus il y a d’homologie entre req et résultat.
Blast paramètre E-value = valeur d’espérence
Nbr d’allignement avec un score d’aliment aussi bon que l’on pourrait trouver par chance. E-value diminue avec la longueur de la séquence mais augment avec la taille de la BDD.
Plus la E-value est basse plus le score est significatif.
paramètre d’algorithme K dans Blast
effet si K augmente
la spécificité augmente mais la sensibilité diminue.
Blast X
Réquette ADN avec BDD protéique
la requête est traduit par blast en sequence protéique (6 pistes de lectures)
Blast P
requête protéine avec BDD protéique
tBlastN
requête protéine avec BDD nucléique. BDD traduit en séquence AA. (6 pistes de lectures)
Blast N ou tBlastX
Si recherche dans BDD une séquence qui code la même prot que la requête?
requête ADN et BDD nucléique (ADN)
alors requête et BDD trad en AA –> 6 pistes de lecture
BDD primaires
Tes les séquences sont soumisses et annotés par les utilisateurs et les organisent de manière a être accessible rapidement.
NCBI, EBI, NIH
BDD secondaires
Utilisent certaines données primaires et son réanotté de façon manuelles ou automatique. BDD de référence.
on peut pas les annoter, elles sont plus spécifiques et ce sont des BDD thématiquement ciblée.
- de séquences mais mieux annoter.
RefSeq
BDD secondaire. fait le lien entre le gène, la transcription et la protéine.
BDD SNPs
BDD secondaire qui recense des SNPs
Evaluation d’un alignement
Score attribué a chaque alignement:
- Match : + a
- Mismatch : + b
- Gap :
> Gap opening c (plus chère)
> Gap extension d (mon chère)
Génomique
permet d’étudier un organisme a partir de la sequence de son génome
Transcriptomique
permet d’étudié l’expression des gènes dans 1 génome
–> séquence d’ARN : différence d’expression du génome en fonction des conditions environnementales ou physiologique
Épigénétique
étudie la transformation acquise et transmissible de l’ADN
Métagénomique
séquence d’ADN total extrait d’un environnement
Métatranscriptomique
étudié l’expression des gènes dans plusieurs génomes présent dans 1 échantillon