POLYMORPHISMES, TRAITS COMPLEXES ET PHARMACOGÉNÉTIQUE Flashcards
Quelles sont les différences génétiques inter-individuelles?
La plupart des SNP fréquents avec une fréquence d’allèle mineur (MAF) > 5% se retrouvent dans des populations de plusieurs continents. Ceci reflète la migration et le flux génétique entre les populations, et l’origine relativement récente de l’espèce humaine
85-90% de la variation s’observe à l’intérieur d’une population et à peine un 10-15% supplémentaire est observé lorsque la population humaine globale est prise en compte
Les populations africaines tendent à avoir une plus grande variation que les autres, où la variation retrouvée tend généralement à être un sous-groupe de la variation africaine
Quelles sont les raisons d’une variation présente dans une seule population?
-Apparition récente de la variation (e.g. Hémochromatose)
-Sélection naturelle dans un environnement spécifique (e.g persistance de l’activité de la lactase)
Un exemple de sélection naturelle dans un env. spécifique peut être une variation qui entraîne une persistance de l’enzyme lactase (qui nous permet de digérer le lait). Cette variation dans l’histoire a conféré un avantage aux populations dont les enfants et les adultes consommaient des produits laitiers, principalement des gens descendant des populations européennes et les populations africaines pastorales. DONC cette variation est surreprésentée dans ces populations la et sous-représentée dans les autres
Quels sont les types de polymorphismes et leur fréquence
-CNV
-Microsatellites : 1 chaque quelque kb
SNP : 1 chaque environ 100 bp (donc nous avons beaucoup beaucoup de snp)
VRAI OU FAUX : Un snp non-codant peut influencer l’expression génique
Vrai
Quels sont les pourcentages de variations connues pour CCR5? (Homozygote et hétérozygote)
Infection virale nécessite récepteurs cellulaires : CXCR4 et CCR5
> 20% variations connues de CCR5
10% des européens sont hétérozygotes pour del32
-ralentit l’évolution de la maladie (protection)
1% des européens sont homozygotes
-résistent à l’infection au VIH
Décrire la provenance de la délétion de CCR5 à travers la population
Allèle mutant s’étend dans le Nord de l’Europe x environ 700 ans (épidémies de peste et de variole)
Porteurs avaient résistance à l’infection
Les populations d’Asie + Afrique n’ont pas été exposée aux mêmes épidémies, ce qui explique la rareté/l’absence de la variation dans ces populations
(il y a 700 ans quand il y a eu les épidémies de pestes et de varioles dans l’europe du nord et cette délétion du ccr5 confèrait une résistance à ces infections, donc présumément cest un reflet de bottleneck où les pop avaient été déssimées par des infections puis les gens qui avaient cette délétion avait un avantage de survie et cet allèle se retrouve à être sureprésentée dans la population de descendance européenne maintenant. Cette variation confère aussi des avantages dans le contexte actuelle. C’est la raison pour laquelle cette variation est plus fréquente chez des gens de descendance européenne que chez des gens d’autres descendances)
Définir halotypes
Groupe de SNP liés sur un même segment chromosomique (ils sont en proximité génétique/géographique et donc ils ont tendance à être transmis aux générations successives ensemble ce qui veut dire qu’ils ont tendance à avoir peu d’événements de recombinaison qui feraient en sorte qu’ils ne seraient pas hérités ou transmis ensemble)
Définir génotype
Combinaison des allèles d’un ou de plusieurs gènes (AA, Aa, aa)
Maladies monogéniques vs traits complexes
Maladie monogénique
-gène cause la maladie
-un gène
-mode de transmission clairement identifiable (AD, AR, XL)
-maladies rares
Traits complexes
-gène modifie le risque i.e ne cause pas directement la maladie
-plusieurs gènes +/- environnement
-pas de mode de transmission clairement identifiable
-maladies fréquentes
Nommez des exemples de maladies monogéniques et de traits complexes
Maladie monogénique
-dystrophie musculaire de Duchenne
-fibrose kystique
-chorée de huntington
-anémie falciforme
-tyrosinémie
Traits complexes
-maladies cardiovasculaires
-diabète
-asthme
-obésité
-taille
Décrire les études d’association à l’aide d’un gène candidat
Basé sur hypothèse (on regarde dans une population des polymorphismes sur des gènes en sachant que le patient a le diabète par exemple et on essaie de trouver une association)
Faible besoin de génotypage (on ne regarde pas le génome au complet)
Correction statistique moindre (pas de test ou d’analyses multiples)
Peu de faux positifs, plus de cibles manquées (risque de manquer beaucoup d’associations parce qu’elles n’étaient pas présentes dans l’hypothèse de départ)
Décrire les études d’association pangénomique (GWAS - Genome-wide association study)
Hypothèse préalable non requise (parce qu’on va séquencer un grand nombre de marqueur réparti à travers le génome puis on va aller à la pêche trouver des associations dans le data set)
Grand besoin de génotypage ($)
Correction statistique pour analyses multiples
Plusieurs faux positif, peu de cibles manquées (on va trouver des SNP avec des associations, mais qui finalement ne contribuent pas au risque de la condition multifactorielle)
Étude de liaison vs étude d’association
Analyse d’association
-on va regarder les individus qui sont reliés (familles) ou non reliés
-fractions de recombinaison
-le nbr de marqueur nécessaire est très grand > 100 000
-statistiques beaucoup plus conventionnelles
Analyse de liaison
-on va regarder les individus qui sont reliés
-statistiques d’association
-le nbr de marqueur nécessaire est plus petit < 500 000
-statistiques plus spécialisées
Définir le déséquilibre de liaison
-Assume qu’une mutation chez un fondateur de la population est causal du trait/du gène de susceptibilité/de la maladie
-Assume que dans une région poche de la mutation, les allèles de l’haplotype fondateur vont être maintenus sur le même haplotype à la méïose et transmis aux générations successive en étant peu affectées par la recombinaison
-Association allélique (ou LD) entre les allèles des marqueurs et celui du gène de susceptibilité
-La taille maximale de la région où l’association allélique peut tenir est petite : environ 2cM
Que permettent les études d’associations?
Quels sont les design possibles pour les études d’association?
Déterminer une association statistique entre des variations génétiques ainsi qu’une maladie
Cas-contrôle
Cohortes
Trio (TDT)
Quels sont les prérequis pour les études d’association pangénomiqe (GWAS)?
-Avoir caractérisé un nbr suffisamment grand de SNP pour qu’on puisse aller les génotyper (on a dit qu’il en fallait au moins 100k)
-Avoir les outils technologiques pour tester un grand nbr de SNP simultanément chez un grand nbr de patients (on ne va pas aller génotyper des SNP un par un ou dix par dix s’il en faut un million chez des centaines de personnes)
Qu’est-ce que HapMap?
Déterminer des blocs d’haplotypes (des régions d’un génome qui avaient tendance à être transmises ensemble donc des SNP qui se retrouveraient à l’intérieur de ces blocs là sont des SNP qui sont liés)
Permet de caractériser des millions de SNP ainsi que de caractériser leur transmission
Définir la variabilité génétique
Tous les individus sont uniques dans leur apparence, leur réponse à l’environnement et leur susceptibilité à la maladie
Quel est le nbr de variations chez un individu par rapport au génome de référence?
0.2% de différences (6 millions)
DONC le génome de 2 individus est similaire à 98.2%
Est-ce qu’il y a beaucoup de variations génétiques privées à une population?
Non!
85-90% de la variation s’observe à l’intérieur d’une population et à peine un 10-15% supplémentaire est observé lorsque la population humaine globale est prise en compte (donc la majorité des variations génétiques se retrouvent partagées à travers différentes populations)
Quels sont les différents types de SNP?
rSNP : dans le promoteur, régulateur
cSNP : codant dans les exons
iSNP : intronique
gSNP : génomique. Région intergénique
Quels sont les gènes impliqués dans le VIH?
CXCR4 et CCR5 (gènes codants)
Qu’est-ce que la généalogie génétique?
Si un nbr suffisant de marqueurs (polymorphismes) est analysé, on peut associer une signature de plusieurs marqueurs avec une origine ethno géographique ce qui veut dire que si on génotype un nbr suffisamment grand de SNP, on peut arriver à des profils qui correspondent à une origine spécifique
Par contre, la plupart des gens ne vont pas se trouver dans une catégories, mais ils seront à l’intersection de différentes catégories
Quelles sont les utilisations de généalogie génétique?
Utilisation principalement récréative (/cosmétique)
-pour fournir une estimation des origines ethniques/biogéographiques d’un individu
-pour déterminer des relations entre des individus et permettre le contact
-pour accéder aux données brutes pour analyse par le client avec des outils autres, comme GED match, etc
-validité clinique, validité analytique
VRAI OU FAUX : les traits complexes ont des effets majeurs
FAUX
Ce sont des variations fréquentes qui ont des effets plus faibles
À quoi sert l’analyse des traits complexes?
Évaluer la fréquence de la co-ségrégation du trait/maladie avec des gènes, des marqueurs ou des régions spécifiques du génome
Quelles sont les 2 différentes études d’association?
Gène candidat
Pangénomique (GWAS - genome-wide association study)
Linkage association
Qu’est-ce que les SNP array
Des outils nous permettant d’analyser un grand nombre de SNP simultanément
Nommez les avantages de GWAS
AVANTAGES
-pas besoin d’hypothèse
-utilise des données “additives et digitales” qui peuvent augmentées sans dégradation des données
-ça encourage la collaboration et la formation de consortium
-ça permet d’éliminer des associations génétiques spécifiques en montrant par exemple l’absence d’association entre un allèle commun et un trait avec un odd ratio significatif
-ça permet de fournier le data sur l’héritage de chacun des sujets. Ça peut aider à matcher les cas avec les contrôles
-fournir des données sur la variation des séquences et sur le nombres de copies. Le SNP est une association donc peu importe c’est quoi la cause sous-jacente du trait, on va chercher l’association
Nommez les limites de GWAS
-besoin d’avoir un échantillon d’un grand nbr de cas et de contrôle pour avoir des statistiques qui sont suffisamment puissantes
-on trouve des loci et non des gènes ce qui peut compliquer l’identification des changements pathogéniques sur un halotype associé
-Ça va seulement détecter les allèles qui sont communs dans la population (>5%)
-Besoin de réplication dans des cohortes de grosseur similaire
Nommez les misconceptions de GWAS
-Thought to provide data on all genetic variability associated with disease, when in reality only common alleles with large effects are identified
Thought to screen out alleles with a small effect size, when in reality such findings may still be very useful in determining pathogenic biochemical pathways, even though low-risk alleles may be of little predictive value
Qu’est-ce que le système Hiris-Plex?
Système qui formule de prédictions de pigmentation, de couleur des yeux et de couleurs des cheveux à partir d’un panel de 41 SNPs
Donne les probabilités d’exprimer un phénotype donné en fonction des SNP exprimés parmi les 41
Qu’est-ce qu’un score polygénique PRS?
Utilisation des informations des marqueurs qui ont été préalablement identifiés dans GWAS pour déterminer les probabilités qu’une personne exprime un trait/maladie
Si on a un PRS qu’on établie chez quelqu’un par rapport au diabète ou à une maladie cardio vasculaire et qu’on établie qu’il y a un risque élevé (à cause de son PRS), ça ne veut pas dire qu’il va vraiment développer la maladie (possible qu’il ne développe pas). Même chose pour quelqu’un qui a un risque faible. Il y a d’autres éléments du risque qui ne sont pas capturés par le score. Mais le PRS c’est une façon d’utiliser les données des marqueurs associés à une condition dans une étude de GWAS pour individualisé un risque chez quelqu’un
PRS : le risque de développer une maladie dépend de quoi?
Des variants de risque monogéniques et polygéniques
Comment on fait pour développer un score de risque polygénique?
D’abord, on va avoir des études de GWAS qui vont nous montrer des marqueurs avec des SNP qui ont des associations.
On va faire la réplication de ces SNP la avec l’association.
Ensuite, on va regarder l’association de différents scores polygéniques en même temps. On va prendre l’information de plusieurs marqueurs de SNP en même temps et on va aller voir c’est lesquels dans tout ça qui sont capables de nous donner le plus d’information (lesquels sont les plus discriminants).
Ensuite, on va vouloir valider ces scores dans des cohortes d’individus
Quelles sont les utilités du PRS?
-prédiction de risque
-support au diagnostic
-symptômes précoce, savoir si en lien avec la maladie ou pas
-aide à la décision du traitement
-prognosis : prediction of disease course and outcome