Genome-wide associated studies (GWAS) Flashcards
Hvad er linkage equilibrium?
Når associationen mellem to loci er tilfældig
Hvad er linkage disequilibrium?
Når associationen mellem to loci ikke er tilfældig.
Hvad betyder det når to loci er i linkage disequilibrium?
At den observerede allel frekvens er ikke den samme som den forventede frekvens.
Linkage disequilibrium kan udregnes, hvordan ser den ligning ud?
D = Pab - pa x pb
Pab = frekvensen af haplotypen pa = frekvensen af a allelen pb = frekvensen af b allelen
Hvad kan nogle af grundene være til at der sker linkage disequilibrium i en population?
Mutationer
Migration
Hvilke mutationer har en høj LD og hvilke har en lav LD?
Nye mutationer har en høj LD, da de ikke har været udsat for cross-over lige så meget endnu
Ældre mutationer har en lav LD, da der er sket cross over.
Hvordan kan man bruge LD til at se hvornår en mutation opstod i en familie?
LD vil blive mindre og mindre over tid, og ved at gå tilbage i stamtræet og sammenligne de forskellige LD vil man kunne finde der hvor mutationen opstod.
Hvad er den genetisk arkitektur?
En beskrivelse af den genetiske variation (SNPs eller CNVs) som bridrager til en traits variation.
Hvordan finder man den genetiske variation i traits?
Man identificerer genetiske varianter, som er associerede med traiten, identificerer deres effekt størrelse og deres interaktion imellem eller interaktioner med miljømæssige faktorer.
Hvad betyder association i forbindelse med genome-wide association studies?
Det definerer forholdet mellem to objekter baserede på fælles egenskaber
Når man ser på en association mellem varianter, og man ser en korrelation, betyder det så at det er den association der skaber sygdommen?
Nej, man skal altid tænke logik ind over og tage miljømæssige faktorer under overvejelse
(eksempel med fødselsrate og storken)
Hvilken statistik bruger man til at se på genome-wide association studies?
Korrelation
OR (fishers exact test)
Hvad er Odds ratio?
Er ration af odds af dem med sygdommen blandt de exponerede til odds mod de der har sygdommen som ikke er exponerede.
Hvordan udregnes odds ratio?
OR = a x d / c x b
Hvad betyder det hvis odds ratio er over 1?
Så er allelen muligvis en risiko alllel, man ser denne allel langt hyppigere blandt cases.
Hvad betyder det hvis odds ratio er under 1?
Så er allelen beskyttende. Allelen ses hyppigere blandt kontroller.
Hvad hvis odds ratio kun er lige over 1?
Så betyder det at man måske har nogle fælles varianter som har en lille effekt på outcome.
Hvad GWAS og hvad er formålet med en GWAS?
Er en systematisk analyse af alle varianter uden en forudgående hypotese.
Den har til formål at identificerer risiko varianter for komplekse, multifaktuelle sygdomme.
Hvordan ser man om SNPs for en sygdom har en association?
Man laver en SNP kort og ser på om SNP korrelerer med sygdommen.
Dernæst sammenligner man med gruppe som har sygdommen men ikke samme variant, hvor man udregner odds.
Hvorfor behøver man ikke teste alle 3 milliarder nucleotider?
På grund af linkage disequilibrium, så hvis der er LD mellem to nukleotider, behøver man ikke teste begge men kun den ene.
Hvad gør afstanden mellem to alleler ved LD?
Jo længere væk to alleler er fra hinanden jo mindre LD har de.
Nævn stepsene for at lave en GWAS
Vælg en sygdom eller trait Uddrage genetiske varianter Lav en GWAS analyse Opsummer de 1 million linæere regressioner med et Manhatten plot. Find den kausale variant Udeluk at der er tale om en spurious association Lav en post hoc analyse Find den kausale variant.
Hvilke spørgsmål er vigtige at have i overvejelserne, når man skal vælge en fænotype at lave GWAS på?
Hvad ved man allerede om fænotypen?
Er den arvelig, hvis den ikke er, er der ikke nogen grund til at undersøge den, da der ikke er noget at køre genetik på.
Ved man om den er monogen eller polygen.
Er det en almindelig eller sjælden sygdom? (hvis den er for sjælden, er der måske ikke nok data at lave en GWAS på, eller den vil ihverfald være for usikker).
Hvor mange varianter bliver ofte genotypet?
0.5-1 million
Efter man har genotypet sine varianter skal man lave statistik på det. Man kan lave en linæer regression og en Fishers exact test, men hvilken er bedst?
Fishers exact test er god til at udregne en odds ration for om en bestemt variant giver øget risiko ved mere simple sygdomme. Ved de multifaktuelle sygdomme kan man ikke tage højde for køn, alder eller population, som man kan ved en linæer regression.
Hvad ser man på et Manhatten plot?
Ud af X-aksen har man kromosomerne
Op ad y-aksen har man p-værdien, der er sat i minus log10, dette gør man som et trick for at kunne se meget signifikante værdier.
Hver lille prik i plottet illustrerer en linæer regression for en enkelt SNP.
Øverst i en SNP vil der være en diamant som illustrere den leading SNP, som er den med lavs p-værdi.
Når man har lavet sit Manhatten plot, hvordan undersøger man de kausale varianter?
Ved at zoome ind på en SNP vil man se alle de SNP der er linket til den leading SNP, dem som er i LD. Dette gør at man har flere gener som kan være mulige kandidater. Dem adskiller man ved at undersøge hvert gen for sig ved f.eks. knockdown i frugtfluer.
Hvilken post hoc test laver man i en GWAS?
En gene set enrichment analyse, hvor man ser på om den variant man har fundet, så også hat en betydning for f.eks. proteinet eller metabolitterne den danner.