HC 6 - From Biology To Data Flashcards
Hoorcollege 6 (37 cards)
Format van sequentie file
tekst format of fasta > met kwaliteit: fastq
Waarmee (welk programma) worden reads tegen een referentie neergelegd met mapping?
bwa
Illumina / NGS tov Sanger qua read length
kortere reads
Waarom is het niet logisch om Sanger sequencing te gebruiken voor mutatie/variant detectie?
Het zegt niets over de positie van de mutatie
Standaard volgorde stappen omics
Sampling > processing > measurement > identification/delineation/quantification
Verschilt de processing stap bij verschillende -ome’s?
Ja, door het verschil in diversiteit
> het metabolome is het meest divers
> targeted approach: het meest informatieve deel wordt gemeten
Manieren om een specifiek deel van het genoom te targeten bij genomics
-Probes: specifieke hybridisatie
-Primers: targeten sequenties
-Adapters: plakken DNA aan de flow cell
Hoe weet je dat de nucleotiden uit dezelfde read komen bij Illumina sequencing?
Ze zitten op dezelfde plek (spot) op de flow cell waar de kleuren worden uitgezonden (cluster)
Hoe zijn forward en reverse reads te onderscheiden op de flow cell?
Niet, ze zitten op dezelfde plek in het cluster
Hoe weet je uit welk sample een read komt?
Barcode (in de multiplexing adapter) die specifiek is voor de sample van waar de reads afkwamen
Waarvoor dient een UMI?
Een UMI wordt in de adapter aan DNA geplakt en zo weet je dat twee reads hetzelfde DNA molecuul representeren
Hoe weet je of twee reads van hetzelfde chromosoom zijn?
Mapping/alignment aan het referentiegenoom
Wat zie je in de software (IGV) als iemand heterozygoot is voor een SNP?
Op de bovenste grijze balk: een samenvatting van de reads: ongeveer de helft van allel A en andere helft van allel B.
Kwantificeren van copy number variations in een Manhattan Plot: hoe ziet dat eruit?
Alle varianten gezet over de positie en hoe vaak de copy number variation te zien is (bolletjes in een staaf omhoog), en hoe erg is het geassocieerd met een bepaalde ziekte/conditie
Wat is er nodig bij kwantificatie van copy number variations?
Veel mensen die met de ziekte zijn bestudeerd
> in kaart brengen verschillende fenotypes die apart worden gecorreleerd aan copy number variations bij bepaalde genen.
> kan ook 0 zijn = deletie
> de kwantificaite bij genomics is copy number variations
Is kwantificatie belangrijker bij genomics of transcriptomics?
Bij transcriptomics om genexpressie te kwantificeren
Waarom kunnen genomics en transcriptomics gekoppeld worden?
Voor bestuderen of een SNP effect heeft op de mate van genexpressie van het gen
Wat is een eQTL?
Een expression Quantative Trait Locus
> SNPs die bepalen in hoeverre een gen tot expressie komt
cis-eQTL
SNP X heeft effect op lokale gen A
> enhancers in upstream en downstream regio
> zitten vaak in de genregio dichtbij de TSS (transcription start site)
> kan ook upstream liggen bij TF-binding sites dichtbij de TSS
> soms best ver weg
trans-eQTL
SNP heeft effect op distaal gen B via een intermediate
> de intermediate kan expressie van een transcriptiefactor zijn
trans-eQTL: directe TF regulatie
de SNP zit in het gen van de TF en zorgt voor upregulatie: de TF verhoogt expressie van gen X
trans-eQTL: indirecte TF regulatie
Er zit nog een gen tussen distaal gen B en de transcriptiefactor
> SNP in gen Y > coregulatie gen Y-TF > upregulatie TF > upregulatie gen X
of
> SNP in TF gen > upregulatie TF > bindt bij gen Y > coregulatie Y-X > upregulatie gen X
Coregulatie tussen cis- en trans-eQTL
Door dezelfde eQTL, bv
- SNP in TF gen > upregulatie TF > bindt bij gen Y > coregulatie Y-X > upregulatie gen X
Noem een aandoening waarbij eQTLs betrokken zijn
T1D: diabetes type 1