postseq Flashcards
hvorfor leser man av reads på begge endene til et fragment?
Leser av på begge ender siden vi da kan bruke begge reads for å sjekke hvilken som hører sammen, eks ved mutasjon, er en dobbel sikkring
hva er fastq filformat?
består av fire linjer for hvert reads.
Fastq er leslig imotsetning til blc som bare er binære koder. Består av en id, sekvens og noe om kvaliteten på dna.
den angir sannsynligheten for at en base er feil
hva gjøres i alignment?
i alignment vil man sjekke hvor hvert reads tilhører, er det eks i kromosom 1 eller 4 eller 9 osv
gjøres ved at man har to filer SAM og BAM. sam er en leselig fil som forteller om
navne på readen og om de er flagga, hvilke kromosom tilhører dette reade til, kvaliteten og informasjon om hvor det andre readparre er
i tilegg har vi BAM som er en binær komprimert versjon av SAM.
denne visualiserer reade slik at vi kan se hvor det har opstått en mutasjon/hvor readsene er annerledes fra referansegenet
hva skjer ved variant calling?
her ser vi posisjon, variant, sekvenseringsdybde, genotype og kvaliteten på variantene vi har funnet.
med variant vil det si de forskjellige resultater vi har fått fra reads.
eks er det en homozygot mutasjon/heteromutasjon, hvor mange reads påviser dette, i hvilke posisjon er dette osv.
hva skjer i annotering av varianter?
- Hente inn mest mulig informasjon om variantene
- Mange mulige annoteringer som kan skreddersys hvert
enkelt prosjekt
Noen annoteringer: - Hvilket gen (referansesekvens)
- Hvor i genet (ekson, intron, 5UTR, 3UTR)
- Hvilken endring, på DNA og protein nivå
- Hvilken type variant (eks frameshift, synonym
(«stille»), ikke-synonym) - Allelfrekvens (gnomAD og inhouse)
hva er funsjonell annotering?
- Funksjonell annotering er prediksjon av effekt
som varianten kan ha på proteinfunksjon.
hva er viktige punkter å se på hver filtrering i diagnostikk av arvelig kreft?
Har et eget kreftpanel som har 80 gener. og vi har en bryst/eggstokk panel som er 21 gener fra det arvelige kreftpanelet.
når det gjelder filtrering så er det viktig å se på klasse, frekvens og region. for det vil si noe om sjansene for patogen vekst.
hvordan klassifiseres varianter?
- ACMG klassifiseringsmetode
- Standardiserer tolkning
- Bevis for nøytrale varianter (klasse 1 og 2)
- Bevis for patogene varianter (klasse 4 og 5)
- Vektes som sterke, moderate eller støttende
bevis. - Bevisene summeres og varianten vil havne i en
av de fem klassene der 1= ikke sykdomsgivende, 2=sannsynlig ikke sykdomsgivende, 3=variant med usikker klinisk betydning (VUS), 4=sannsynlig sykdomsgivende, 5= sykdomsgivende
hvilke 5 klasser har man av varianter?
– Klasse 1: Nøytral sekvensvariant
– Klasse 2: Sannsynlig nøytral sekvensvariant
– Klasse 3: Sekvensvariant av usikker klinisk betydning
– Klasse 4: Sannsynlig patogen sekvensvariant
– Klasse 5: Patogen sekvensvariant