Phylogénétique Flashcards
But des analyses de phylogénétique ?
Analyser les relations évolutives
Quelles sont les données primaires afin de faire une analyse de phylogénétique ?
Séquence d’ADN et de protéines
Est-il possible de vérifier expérimentalement l’exactitude d’une phylogénie ?
Non
Nommez les 3 domaines de la vie :
Eubactéries, archéabactéries et eucaryotes
Qu’est-ce qu’un noeud terminal dans un arbre de phylogénétique ?
Unités taxonomiques opérationnels
Qu’est-ce qu’un noeud internes ?
Unités taxonomiques hypothétiques
Les branches relient deux noeuds __________.
adjacents
Que veut dire le terme polytomie ?
Ca veut dire que l’ordre exact de divergence de certains taxons demeure incertain
Qu’est-ce qu’un clade ?
Il s’agit d’un groupe de taxons provenant du même ancêtre commun
Qu’est-ce qu’un taxon frère ?
Lorsqu’‘un clade est seulement composé de 2 taxons
Un groupe taxonomique qui partage le même ancêtre qu’un autre groupe taxonomique s’appelle un groupe _________.
paraphylétique
Un goupe de taxons provenant tous d’un même ancêtre commun est appelé un groupe ________.
Monophylétique
Décrivez les cladogrammes :
Ils ne font pas grand chose
Décrivez les arbres additifs :
Ils comportent le nombre de changements génétiques.
Plus une branche est longues, alors plus y a de changements génétiques
Décrivez les arbres ultramétriques :
Exprime le temps évolutif exprimé en nombre d’années
Les arbres phylogénétiques ont pour but de reconstruire l’histoire évolutives d’une espèce ou d’une molécule, mais une contrainte apparait, laquelle ?
Le nombre de topologie croit de manière exponentielle !
Afin de contourner le problème du nombre exponentiel de topologies, quelle méthode d’analyse est utilisée ?
Méthode d’analyse heuristique
Lors d’une analyse phylogénétiques, il faut préparer les données par combien d’étapes principales ?
2
Nommez la première étape de préparation des données :
Les séquences homologues sont alignées avec un logiciel comme CLUSTALW, T-COFFE ou MUSCLE.
Nommez la deuxième étape de préparation des données :
Les régions alignées de manière ambigue (contenant de s indels) sont éliminées avec GBLOCKS
Les logiciels d’alignement alignent les séquences en utilisant un arbre généré par méthode de distance
vrai
Qu’est-ce qu’un indel ?
Nombreuses insertions et délétions de résidus
Pour reconstruire un arbre phylogénétique, il faut faire des hypothèses sur quoi?
Sur le processus substitution des nucléotides et des acides aminés!
Est-ce vrai de dire que tous les substitutions se font à la même vitesse ?
Non
Les transitions sont moins fréquents que les transversions
Faux, plus fréquents
Les substitutions de nucléotides de même groupe sont appelées comment ?
Transition
Les substitutions de nucléotides de différent groupe sont appelées comment ?
Transversion
Nommez les deux éléments du modèle de substitution :
- La matrice donnant la probabilité de toutes les substitutions de nucléotides ou d’acides aminés possibles.
- La vitesse relative des substitutions entre les différents sites du jeu de données.
Nommez le modèle le plus simple, mais le moins réaliste en ce qui a trait la substitution d’acides aminés :
Le modèle de Jukes-Cantor
Quelles sont les modèles les plus utilisés ?
Kimura, HKY et GTR.
Ces modèles assument que les substitutions peuvent se faire à de vitesses différentes.
(General-Time non-Reversible)
Quel modèle de substitution faut-il utiliser ?
Il faut avoir recours à un programme !
Nommez 2 programmes qui aident à découvrir le modèle de substitution optimal :
JMODELTEST (pour les données de nucléotides)
PROTTEST (pour les données d’acides aminés)
Quel est le critère souvent utilisé dans les programmes utilisés afin d’obtenir le modèle optimal ?
Le maximum de vraissemblance
Tous les programmes d’analyse utilise la troisième position d’un codon
Faux !
Décrivez le modèle de vitesse I
Invariant : Estime la proportion des sites qui ne sont pas libres de varier, les autres sites varient de manière égale.
Décrivez le modèle de vitesse G ou T
Variation de vitesse suit un modèle gamma
Pour la plupart des gènes le paramètre alpha est supérieur à 1
Faux
Il y a 3 méthodes pour construire un arbre phylogénétique nommez-les :
- Méthode de distance
- Méthode de maximum de parcimonie
- Méthode de maximum de ressemblance
- Méthode bayésienne
Les méthodes de distance sont basé sur :
des mesures de dissimilitude
Les méthodes MP et ML utilisent simultanément :
tous les caractères
En ce qui concerne la méthode par distance, est-ce vrai de dire que les distances évolutives sont calculées pour toutes les paires de séquences possibles, puis un arbre de phylogénétique est reconstruit par un algorithme utilisant la matrice de distance ?
Oui
Les méthodes ML sont plus rapide que les méthodes de distance.
Faux
Nommez les algorithmes disponibles pour reconstruire un arbre à partir d’une matrice de distance:
Neighbor-Joining
Fitch-Margoliash
Minimum Evolution
Quel algorithme est le meilleur pour reconstruire un arbre à partir de matrice de distances ?
NJ
Est-ce vrai de dire que la probablitié de substituion multiple grandit avec le temps ?
Oui
Décrivez la méthode MP :
Arbre avec le moins de changements évolutifs
Décrivez la méthode ML :
Arbre le plus susceptible de conduire aux données étant donné le modèle choisi
Dans la méthode MP, l’algorithme cherche l’arbre avec le moins de ..
substitutions
Le méthode ML tente de trouver, parmi tous les arbres possibles, celui qui a la valeur L(likelihood) la _____ élevé.
Plus
Est-ce que chaque site évoluent indépendamment ?
Oui
Le likelihood est évalué comment ?
Par une transformation logarithmique
L’arbre avec la plus grande valeur Inl est-il celui qu’il faut privilégier ?
Oui, il s’agira du meilleur arbre ML
À partir de combien de taxons que la recherche exhaustive commence à être impossible à pratiquer ?
À partir de 15 taxons.
Décrivez comment se produit le processus de recherche heuristique.
Tout d’abord, seulement une partie des arbres est examinée. Ensuite, on construit un arbre de départ en utilisant par exemple la méthode NJ. On recherche ensuite l’arbre le plus court en examinant les arbres qui ont des topologies similaires à l’arbre de départ. Si un arbre plus court est trouvé, alors ce sera sur celui-ci que la prochaine ronde se basera afin de recommencer les recherches. Cette recherche itérative prend fin lorsque plus aucun arbre n’est trouvé.
Nommez les algorithmes de réarrangement des branches :
NNI : Nearest Neighbor interchange
SPR : Subtree Pruning and regrafting
Pourquoi les recherches heuristiques ne trouvent pas toujours le meilleur arbre ?
Parce que l’arbre de départ utilisé influence les résultats
Nommez un outil de ré-échantillonage !
BOOTSTRAP
Quels tests permettent d’évaluer des arbres ML ?
Kishino-Hasegawa ou de Shimaidora-Hasegawa
Nommez la première étape de l’analyse BOOTSTRAP :
- Une série de n échantillon (100-1000) est généré par r-échantillonage (avec remise) des sites d’un jeu de données et à partir de chaque pseudo-échantillon, un arbre bootstrap est généré en utilisant la même méthode que celle utilisée pour inférer l’arbre original
Nommez la deuxième étape BOOTSTRAP
Un arbre concensus de type ‘majority Rule’ est calculé à partir de tous les arbres bootstraps. La valeur de support bootstrap donne le pourcentage des arbres appuyant la monophylie d’un clade donné.