Module 11 Flashcards
Assignations populationnelles et parentales
Objectif: identifier l’origine d’individus spécifiques
> Méthode: assignation populationnelle
Objectif: identifier les parents biologiques
> Méthode: assignation parentale
Assignation populationnelle: principes de base
• Méthodes d’assignation: méthodes statistiques qui utilisent de l’information génétique afin d’établir l’appartenance d’un individu (ou d’un groupe d’individus) à une population
• Information génétique:
– Marqueurs polymorphes (microsatellites, SNP, AFLP)
– Génotype multilocus de l’individu inconnu
– Fréquences alléliques des populations candidates
• Principes généraux
– Les individus appartenant à une même population ont des génotypes plus similaires
– Assigne l’individu inconnu à sa population d’origine en utilisant son génotype et les probabilités d’occurrence de ce génotype dans des populations candidates
Méthodes d’assignation: Statistiques classiques (fréquentistes)
– Testent des hypothèses
• H0: l’individu 1 appartient à la population A
– La probabilité d’appartenance de l’individu à une population est évaluée selon une distribution de fréquences
• À partir des fréquences alléliques de la population A, on obtient une distribution des fréquences génotypiques possibles
– Conclusions avec un p-value ou un intervalle de confiance
• Selon la distribution des fréquences génotypiques de la population A, l’individu 1 provient probablement de la population A selon un p-value de 0.001
– Répond à la question: si l’individu 1 provenait de la population A, à quel point les résultats obtenus sont-ils probables ?
• Ici rejet de H0 par le p-value de 0.001, l’individu 1 n’appartient probablement PAS à la population A. Plus le p-value est faible, plus on a confiance dans le rejet de H0
Comment assigner un individu à sa population d’origine?
Test d’assignation – méthode classique
- Génotyper l’individu inconnu pour tous les loci
- Génotyper un échantillon représentatif de toutes les populations candidates et calculer les fréquences alléliques
- Calculer la probabilité d’occurrence (vraisemblance) du génotype de l’individu inconnu pour toutes les populations candidates et transformation logarithmique
- Rapport de vraisemblance et assignation de l’individu à la population avec laquelle son génotype a la plus haute probabilité d’occurrence (maximum likelihood)
Attention!
– Calculs de fréquences génotypiques:
• Les populations sont à l’équilibre Hardy-Weinberg
• Les marqueurs utilisés ne sont pas en déséquilibre de liaison (sinon, calculs erronés)
– Loci polymorphiques (6 à 10 allèles/locus) en nombre suffisant ou un très grand nombre de SNP (sinon, manque de résolution)
– Toutes les populations candidates ont été échantillonnées (sinon, assignation par défaut)
– Bonne représentativité allélique des populations candidates (N élevé) (sinon, manque de résolution)
À quel point peut-on avoir confiance dans notre assignation?
Par l’utilisation d’analyses de puissance
> Calcule le niveau de confiance de l’assignation
Méthode empirique:
• Réassigne des individus d’origine connue
• Vérifie le nombre d’assignation correcte
Méthode par simulations:
• Simule des génotypes (individus) à partir des fréquences alléliques des populations candidates
• Assigne ces génotypes d’origine connue et vérifie le nombre d’assignation correcte
Analyse de puissance: utilités
– Définir le potentiel d’assignations correctes
– Indicateur du nombre de loci nécessaires pour obtenir une bonne résolution
– Permet de définir un critère de stringence
• Seuil d’assignation selon le rapport de vraisemblance
• Ex: en dessous d’un rapport de vraisemblance de log2 (100x plus probable), l’individu ne sera pas assigné
Exemple d’assignation populationnelle
Objectif: préserver la population de l’Est de la Baie d’Hudson
Sous-objectifs:
• 1. Vérifier si des bélugas de l’EHB sont prélevés hors de leur zone d’estivage (corridors migratoires)
• 2. Si tel est le cas, quantifier les prélèvements
Planification expérimentale:
• Identification de marqueurs génétiques
– Utilisation de 15 marqueurs microsatellites polymorphes (moyenne de 12 allèles/locus)
• Échantillonnage des bélugas (n=739)
– Bélugas chassés dans le corridor migratoire (individus d’origine inconnue) et génotypage
– Bélugas de toutes les populations candidates, génotypage, calcule des fréquences alléliques
• Tests d’assignation (méthode classique)
• Calcule de la proportion de bélugas l’EHB récoltés dans les corridors migratoires
Conclusions de l’étude
• Soupçons confirmés: des bélugas du stock de l’EHB sont capturés dans les corridors de migration
• Les communautés inuites situées à l’est de la Baie d’Hudson et au nord du Québec chassent une proportion non négligeable de béluga provenant de ce stock
Implications
• Les prélèvements actuellement effectués par les Inuits sont suffisants pour précipiter la disparition du stock de l’EHB en moins de 10 ans
• Prélèvements à considérer dans les plans de gestion: doivent absolument diminuer
Assignation populationnelle: applications
- Identification de la population d’origine d’un individu
- Criminalistique, identification de captures illégales
- Mesure du taux de dispersion en temps réel
- Mesure du patron de dispersion (♀ vs ♂; jeunes vs vieux)
Populations non-définies, que faire?
- Il arrive souvent que la structure génétique des espèces soit inconnue
- Pourtant essentiel pour comprendre la dynamique de l’espèce ainsi que permettre la mise en place de plan de gestion et de conservation
Méthodes utilisées
• Méthodes dites de groupement (clustering)
1- Méthodes fondées sur la distance (distance-based method)
2- Méthodes fondées sur un modèle (model-based method)
Utilités
• Définir des groupes génétiques homogènes (cluster)
• Comprendre la dynamique de l’espèce
• Effectuer des analyses d’assignation + évaluer la composition de mélanges génétiques individuels et populationnels
Méthodes fondées sur la distance
1- Méthodes fondées sur la distance
• Utilisent une matrice de distance génétique entre les paires d’individus
• Représentation graphique de ces distances (ex: arbres)
• Les groupes sont identifiés à la main
Positif/négatif
• + Faciles à appliquer et visuellement intéressant
• + Bonnes pour des études exploratoires
• - Les groupes dépendent de la représentation graphique choisie
• - Difficile d’évaluer un niveau de confiance
Ce qu’est le logiciel “Structure”
Méthode
• Utilise une méthode fondée sur un modèle avec des statistiques bayésiennes
• Assigne les individus et en même temps effectue les regroupements
Modèle et paramètres
• Identification de groupes où le déséquilibre de liaison est minimisé ET où l’équilibre de Hardy-Weinberg est respecté
• Utilisation des génotypes de tous les individus d’un échantillonnage global pour identifier les groupes
• Utilisation des fréquences alléliques des groupes pour assigner les individus
Utilités
• Définir des groupes génétiques homogènes (cluster)
• Assignations individuelles
• Vérifie la présence ou l’absence de migrants entre ces groupes et d’hybrides
Exemple d’assignation populationnelle 2
Objectif: étudier la structure génétique de l’épaulard dans le Nord-Est de l’océan Atlantique
Sous-objectifs:
- Estimer le nombre de populations dans le Nord-Est de l’océan Atlantique
- Assigner les individus échantillonnés aux différentes populations identifiées
Planification expérimentale:
• Identification de marqueurs génétiques
– Utilisation de 17 marqueurs microsatellites polymorphes (moyenne de 7,5 allèles/locus)
• Échantillonnage d’épaulards (n=85)
– Norvège (40), Royaume-Uni (10), Islande (8), détroit de Gibraltar (11), îles Canaries (9), captifs (n=5) et Atlantique Ouest (2)
– Pour tous les épaulards échantillonnées: génotypage
• Inférence de la structure de population et assignations individuelles avec le logiciel Structure
Résultats
Nombre de populations retrouvées? → 3 couleurs = 3 populations distinctes
• La population A suit les bancs de hareng dont elle se nourrit
• La population B suit les bancs de maquereau dont elle se nourrit
• La population C suit les bancs de thon rouge dont elle se nourrit
• Les populations A et B se retrouvent partiellement en sympatrie lorsque les bancs de hareng et de maquereau se rencontrent
• Les populations B et C se retrouvent partiellement en sympatrie à certains points de contact
• Les populations A et C ne se rencontrent pas et sont considérées être en allopatrie totale
• Impact sur le niveau de connectivité entre les 3 populations?
> Les populations A et C sont génétiquement éloignées l’une de l’autre
> La population B qui chevauche l’aire de répartition des populations A ET C est moins différenciée de ces deux populations que la A vs la C
Conclusions de l’étude
• Dans le Nord-Est de l’océan Atlantique, 3 populations distinctes ont été identifiées
• L’élément structurant majeur semble être le type de proie et leur répartition géographique
• La structure observée s’explique aussi par la répartition géographique des épaulards eux-mêmes
– Les populations qui se retrouvent à l’occasion en sympatrie sont génétiquement plus semblables (flux de gènes entre celles-ci) alors que celles qui sont en allopatrie sont plus différenciées (absence de flux de gènes)
Assignation parentale: principes de base
• Méthodes d’assignation: méthodes statistiques qui utilisent de l’information génétique afin d’établir l’appartenance d’un individu (ou d’un groupe d’individus) à une population
• Information génétique:
– Marqueurs très polymorphes (microsatellites)
– Génotype multilocus du rejeton inconnu
– Génotypes multilocus des parents candidats
• Principes généraux:
– Les rejetons partagent des allèles communs avec leurs parents (diploïdes : à chaque locus, un allèle est partagé avec la mère et un allèle avec le père)
– Assigne le rejeton inconnu à ses parents en utilisant les génotypes et les probabilités de production du génotype de ce rejeton par les parents candidats
• Méthodes utilisées :
- Méthode d’exclusion
- Méthode d’allocation
a) Catégorique
b) Fractionnelle
Méthode d’exclusion
- À utiliser lorsque : on connait un des 2 parents
- Principe : Un parent et son jeune partagent au moins un allèle par locus. Un parent candidat qui ne partage pas au moins un allèle à chaque locus avec le rejeton est éliminé.
- Avantages:
o Simple d’utilisation - Inconvénients :
o L’exclusion complète peut être difficile dans de grosses populations (beaucoup de parents potentiels et de progénitures)
o Si mutation germinale chez le parent, fausse exclusion
Exemple : la mère est connue
o Chercher les allèles communs entre la mère et le rejeton
o Exclure les pères potentiels qui ne possèdent pas l’autre allèle à chaque locus du rejeton
Voir diapo 49
Méthode d’allocation
a) Catégorique
Exemple : la mère est connue
o Chercher les allèles communs entre la mère et le rejeton
o Choisir le père potentiel qui possède le génotype le plus probable
Voir diapo 51