HC 6 - From Biology To Data Flashcards
Hoorcollege 6
Format van sequentie file
tekst format of fasta > met kwaliteit: fastq
Waarmee (welk programma) worden reads tegen een referentie neergelegd met mapping?
bwa
Illumina / NGS tov Sanger qua read length
kortere reads
Waarom is het niet logisch om Sanger sequencing te gebruiken voor mutatie/variant detectie?
Het zegt niets over de positie van de mutatie
Standaard volgorde stappen omics
Sampling > processing > measurement > identification/delineation/quantification
Verschilt de processing stap bij verschillende -ome’s?
Ja, door het verschil in diversiteit
> het metabolome is het meest divers
> targeted approach: het meest informatieve deel wordt gemeten
Manieren om een specifiek deel van het genoom te targeten bij genomics
-Probes: specifieke hybridisatie
-Primers: targeten sequenties
-Adapters: plakken DNA aan de flow cell
Hoe weet je dat de nucleotiden uit dezelfde read komen bij Illumina sequencing?
Ze zitten op dezelfde plek (spot) op de flow cell waar de kleuren worden uitgezonden (cluster)
Hoe zijn forward en reverse reads te onderscheiden op de flow cell?
Niet, ze zitten op dezelfde plek in het cluster
Hoe weet je uit welk sample een read komt?
Barcode (in de multiplexing adapter) die specifiek is voor de sample van waar de reads afkwamen
Waarvoor dient een UMI?
Een UMI wordt in de adapter aan DNA geplakt en zo weet je dat twee reads hetzelfde DNA molecuul representeren
Hoe weet je of twee reads van hetzelfde chromosoom zijn?
Mapping/alignment aan het referentiegenoom
Wat zie je in de software (IGV) als iemand heterozygoot is voor een SNP?
Op de bovenste grijze balk: een samenvatting van de reads: ongeveer de helft van allel A en andere helft van allel B.
Kwantificeren van copy number variations in een Manhattan Plot: hoe ziet dat eruit?
Alle varianten gezet over de positie en hoe vaak de copy number variation te zien is (bolletjes in een staaf omhoog), en hoe erg is het geassocieerd met een bepaalde ziekte/conditie
Wat is er nodig bij kwantificatie van copy number variations?
Veel mensen die met de ziekte zijn bestudeerd
> in kaart brengen verschillende fenotypes die apart worden gecorreleerd aan copy number variations bij bepaalde genen.
> kan ook 0 zijn = deletie
> de kwantificaite bij genomics is copy number variations
Is kwantificatie belangrijker bij genomics of transcriptomics?
Bij transcriptomics om genexpressie te kwantificeren
Waarom kunnen genomics en transcriptomics gekoppeld worden?
Voor bestuderen of een SNP effect heeft op de mate van genexpressie van het gen
Wat is een eQTL?
Een expression Quantative Trait Locus
> SNPs die bepalen in hoeverre een gen tot expressie komt
cis-eQTL
SNP X heeft effect op lokale gen A
> enhancers in upstream en downstream regio
> zitten vaak in de genregio dichtbij de TSS (transcription start site)
> kan ook upstream liggen bij TF-binding sites dichtbij de TSS
> soms best ver weg
trans-eQTL
SNP heeft effect op distaal gen B via een intermediate
> de intermediate kan expressie van een transcriptiefactor zijn
trans-eQTL: directe TF regulatie
de SNP zit in het gen van de TF en zorgt voor upregulatie: de TF verhoogt expressie van gen X
trans-eQTL: indirecte TF regulatie
Er zit nog een gen tussen distaal gen B en de transcriptiefactor
> SNP in gen Y > coregulatie gen Y-TF > upregulatie TF > upregulatie gen X
of
> SNP in TF gen > upregulatie TF > bindt bij gen Y > coregulatie Y-X > upregulatie gen X
Coregulatie tussen cis- en trans-eQTL
Door dezelfde eQTL, bv
- SNP in TF gen > upregulatie TF > bindt bij gen Y > coregulatie Y-X > upregulatie gen X
Noem een aandoening waarbij eQTLs betrokken zijn
T1D: diabetes type 1
Bij welke omics hoort ‘Relatief aantal van alle mRNA moleculen van een gen bepalen’?
Transcriptomics
Bij welke omics hoort ‘Abundantie en variatie/modificaties van vele eiwitten tegelijk bepalen’?
Proteomics
Bij welke omics hoort ‘Kwantificatie en identificatie van vele metabolieten tegelijk’?
Metabolomics
Bij welke omics hoort ‘Nucleotidevolgorde van volledig- of deel van DNA meten’?
genomics
Waarom is het transcriptoom makkelijker te meten dan het proteoom?
Er is minder diversiteit
> proteoom zegt echter meer over de staat van de cel
Hoe ingewikkelder het systeem, des te … de correlatie tussen mRNA en eiwit aantallen
minder
Correlatie van mRNA en eiwit abundantie is afhankelijk van:
-Half-lifes: mRNA is gemiddeld minder stabiel dan eiwitten
-mRNA ratio: meer eiwitten in de cel dan mRNAs
Als je de half-life van mRNA tegen de half-life eiwit tegen elkaar uitzet en verschillende eiwitten als stippen invult in de grafiek, kun je vier gates maken. Benoem deze met hun functie:
- Centrale metabolisme: hoog stabiele mRNA en eiwit
- RNA processing: instabiel mRNA en stabiel eiwit
- signaling / adaptation: stabiel mRNA en instabiel eiwit
- proliferatie: instabiele mRNA en eiwit
Verklaar de gate van de proliferatie eiwitten
Voor de proliferatie moet alles instabiel zijn want het signaal moet snel uitdoven, anders krijg je maligniteit
Verklaar de gate van de signaleringseiwitten
De snel moet snel op een signaal kunnen reageren, maar dit signaal moet wel meer snel uitdoven (denk aan spasme)
> stabiel mRNA al aanwezig in de cel
> instabiele eiwitten voor snelle signaaluitdoving
Verklaar de gate van het centrale metabolisme
Dit omvat essentiële processen die vaak continu zijn, dus moet er stabiel mRNA en eiwit zijn
Verklaar de gate van RNA processing eiwitten
Er moeten stabiele eiwitten zijn die hun functie kunnen uitoefenen en het RNA wordt gecontroleerd door het systeem van de eiwitten en is daarom instabiel
Kleine p-waarde in een correlatie vakjes tabel (negatieve z-transformatie in p-waarde) betekent:
significante relatie van een gate (mRNA/eiwit half-life) met de biologische functie / eiwitten