HC 2 - NGS + Exome (+ HC 1 - Introductie) Flashcards

Hoorcollege 2 (HC1: Introductie)

1
Q

Wat houden omics in?

A

Het meten van nagenoeg alle moleculen in een cel/weefsel/sample

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Functie omics (wat is er zo voordelig aan al die moleculen meten?)

A

Kwantificatie en identificatie van vele metabolieten tegelijk
> bv identificatie variaties en modificaties

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Waarom worden meerdere omics levels gemeten? (genomics, transcriptomics, proteomics, metabolomics)

A

Om interactie tussen de verschillende levels te kunnen waarnemen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Het maakt niet uit waar je de genomics meet. Waar maakt het wel uit?

A

-Bij verschillende soorten tumoren (vergelijking met somatisch DNA)
-Bloedcellen: door verandering in genoom
-Huidcellen: door blootstelling aan UV-straling en verschillen door mutaties

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welke extra dimensies kunnen er nog aan omics metingen worden toegevoegd?

A

Metingen over tijd en ruimte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Stratificatie

A

Detectie van subgroepen
> bv op basis van een diagnose en eventuele mutaties, genomics of moleculaire markers een beste treatment toekennen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Genoom bestaat uit … baseparen

A

3 miljard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoeveel SNPs zijn er ongeveer bekend

A

1 miljard (verschillende plekken waar meerdere allelen voorkomen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Aantal nucleotiden in het humane genoom

A

3 miljard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Aantal genen in het humane genoom

A

20,000

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Innovaties van NGS

A

Het gehele genoom van populaties kunnen sequencen en onderscheiden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Applicaties van NGS

A

-Variant detectie (SNPs, indels)
-Structurele varianten
-Splice varianten
-RNA-seq -> genexpressie
-CHiP-seq -> eiwitinteracties met DNA (TFs)
-Bisulfiet sequencing -> bepalen methylatiepatronen
Metagenomics -> bv alle bacterien in darmflora sequencen en compositie bepalen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Sanger sequencing

A

Eerst amplificatie met de PCR -> van DNA/RNA naar DNA library met ddNTPs
> chain termination
> gelelektroforese
> sequentiebepaling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hoe lang zijn de Sanger DNA fragmenten

A

700-900 bp lang
> gaat wel langzaam

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Automatische dideoxy sequencing

A

Sanger met fluorescente markers ipv aparte kammen per nucleotide

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Illumina sequencing workflow

A
  1. Library prep
  2. Clusteramplificatie
  3. Sequencing
  4. Alignment en data-analyse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Illumina library prep

A

-Fragmenteren (je kunt alleen stukje van 100-300 bp sequencen) met een enzym
> toevoegen adapters aan de flanken > ligatie > sequencing library.

18
Q

Illumina cluster amplificatie

A

-de fragmenten hybridizeren met hun 5’-adapter aan de probes die op de flow cell zitten
> bridge amplification: molecuul gaat buigen en adapter aan 3’kant bindt aan complementaire adapter > initiatie polymerisatiereactie > herhaling > cluster amplificatie tot clusters van fragmenten

19
Q

Illumina sequencing step

A

een pool van fluorescente nucleotides wordt toegevoegd en bindt aan de complementaire strengen van de geamplificeerde DNA op een clusterlocatie en uitscheiding lichtsignaal bij polymerisatiereactie
> tijdelijke blokkering door terminator op de fluorescente nucleotide > foto maken met detector
-wassen > klieving signaal en terminator > herhaal
-Binnen 1 cluster zitten de paired end forward en reverse strengen.

20
Q

Single-end sequencing

A

Sequencen van alleen de forward strengen en de reverse strengen weglaten
> goedkoper en sneller

21
Q

Paired-end sequencing

A

Eerst vanaf de 5’-end sequencen (forward) en daarna voor dezerlfde cluster alle foward strengen weglaten en reverse gebruiken (3’-end)
> accurater

22
Q

Bij welke reads is de accuratie hoger: grote of kleine

A

Korte reads –> alignment op andere plekken > meer betrouwbaarheid omdat elke nucleotide meerdere keren is gesequenceerd

23
Q

Coverage (read depth)

A

Aantal keer dat dezelfde nucleotide door verschillende reads is behandeld, en je streeft naar gemiddelde coverage van 30

24
Q

Bij paired-ends ontstaan er onbekende tussensequenties. Wat zijn deze?

A

Het stuk tussen de forward en reverse read gezien deze ver van elkaar af kunnen liggen.

25
Q

Multiplexing

A

Maximaliseren van de sequencing capaciteit en reduceren van de workflow van sample preperation via barcodes

26
Q

Barcodes

A

Unieke 5-10 basesequenties die aan de 3’-end van de template worden teogevoegd
> uniek per sample: elk fragment is te herleiden naar de sample of persoon bij wie het genoom hoort

27
Q

Sets van tot hoeveel verschillende barcodes zijn ontworpen?

A

96 barcodes voor max 96 individuen

28
Q

Soorten sequencing errors

A

-Incorrectly called bases (tijdens sequencing)
> kan ook voorkomen bij DNA library prep of PCR amplificatie
-Geen nucleotide ingebouwd > combinaties van fluorescentie want niet synchroon lopende cluster, geen goed signaal

29
Q

Is een error individueel te onderscheiden van een SNP?

A

NEE

30
Q

Hoe is het probleem van sequencing errors te overkomen?

A

Vergroten van het aantal reads > vergrootte coverage die inadequate metingen herkenbaar kan maken

31
Q

Mendelian disease soorten

A

-Autosomaal of sex-linked
-dominant of recessief

32
Q

cyctic fibrosis

A

taaislijmziekte
> autosomaal recessief

33
Q

Hoe worden bijzondere en veelvoorkomende allelen van Mendeliane ziekten opgespoord?

A

Bijzonder: exome sequencing
Veelvoorkomend: GWA

34
Q

Verschil tussen een SNP en een mutatie

A

SNP: in >1% van de populatie: komt veel voor
Mutatie: in <1% van de populatie: de novo

35
Q

Waar ga je in het genoom op zoek naar varianten met een grote effect size?

A

In het exoom

36
Q

Stappenplan Exome Sequencing

A
  1. DNA verzamelen van patiënten
  2. Exon capture
  3. Sequencing
  4. Verkrijgen humane DNA sequentie van publieke database (referentie)
  5. Vergelijken van de sequencing resultaten
  6. Filteren van de candidate mutations
  7. validatie in het lab > resultaat: de SNP/mutatie die de ziekte veroorzaakt
  8. Report the clinic
37
Q

Hoe onderscheid je een SNP van een sequencing error?

A

De coverage/read depth

38
Q

Wat verwacht je qua verdeling van de SNP bij een heterozygoot bij een allel

A

50% van de wild type en 50% met de variant

39
Q

Filtering of exome data

A

-Comparison of patients > select candidates if the genes are mutates in almost all the patients
-Synonymous SNPs do not change the protein so these are removed
-Candidates: SNPs between patients but non-synonymous

40
Q

Wat zijn de factoren om rekening mee te houden bij identificatie van causale allelen?

A

-Manier van overerving
-de novo of overerfbaar
-Stamboom van populatiestructuur
-Extensie van de locus heterogeniteit

41
Q

Hoe kan er uit de stamboom een de novo worden onderscheiden van een overerfbare SNP?

A

Mutatie/ziekte niet in de ouders –> de novo (makkelijker te zien als dominant want dan uit het in het fenotype, geen dragers)