Eksamensspørsmål Flashcards
Hva er høykapasitetsteknologi innen molekylærbiologi?
Molekylærbiologi; delen av biologi som forklarer levende organismers fx som et samarbeid mellom ulike molekyler. Den molekylære genetikken refererer til å detektere samspillet mellom nuleinsyrer og proteiner i arvelighetsfenomener.
Høykapasitetsteknologi innen molekylærbiologi refererer til nye teknologier som gir oss mulighet til å raskt og effektivt analysere store mengder med molekylær data, som DNA-sekvenser. Slik får vi mulighet til å studere genetisk variasjon på et helt nytt nivå, ved analysering av lange DNA-sekvenser, opptil hele genomer. Dette bidrar til økt biologisk forståelse, hvor vi får mye ny kunnskap om til eksempel sykdomsmekanismer.
Hvordan kan høykapasitetsteknologi benyttes innen diagnostikk og forskning?
Diagnostikk:
Rask og effektiv analyse av store mengder pasientprøver (molekylær data). Kan til eksempel identifisere sykdomsmarkører i form av genetiske mutasjoner assosisert med bestemte sykdommer. Ikke bare vil man kunne få en tidligere diagnose, men man vil også kunne diagnostisere mer presist og dermed gi en mer persontilpasset behandling (presisjonsmedisin).
Forskning:
Større skala i studier av genetiske variasjoner og mutasjoner. Øker forståelsen for biologiske prossesser og sykdomsmekanismer. Denne kunnskapen er nyttig i utvikling av nye medisiner/behandlinger. Identifikasjon av nye genetiske markører er nyttig i utvikling av mer presise diagnostiske verktøy.
Hovedtrekk i NGS fra blodprøven taes, til en variant er oppdaget
- Genetisk veiledning
- Prøvetaking (helst av en affisert (syk)) og frakt til lab´en
- DNA-isolering og kvantitering, kvalitetskontroll (måle DNA-konsentrasjon)
- Bibliotekspreparering
a. Bibliotek
i. Tagmentering av genomisk DNA - Merking og kutting (350bp) av DNA i én og samme rx.
ii. Rensing (fjerne fragmenter som er kortere/lengre enn 350bp)
iii. PCR-amplifisering med index-merking - Primer med 3 deler (komplementær sekvens til adaptor, index og komplementær sekvems til oligoene på flowcellen)
iv. Rensing - Kontrolleres ved hjelp av chipbasert kapillærelektroforese-system
v. Multiplexing (slå sammen prøver)
b. Target enrichment
i. Hybridisering av oligoer (DNA må denatureres siden oligoer bare binder til ss-DNA) Gjøres over natten for best resultat - Oligoer komplememtære med sekvensene i genene vi vil gå videre med merket med biotin hybridiserer (binder seg) med de delene av.
ii. Capture - Drar ut de hybridiserte oligoene vi vil gå videre med ved hjelp av streptavidin, som binder til biotin.
iii. PCR-amplifisering av enriches bibliotek
iv. Rensing med magnetiske kuler, og måling av gjennomsnittlig lengde på bibliotekene (kontroll for at man har amplifisert rett fragmentlengde (350bp).
v. Slår sammen 12´plexene i 48´plexer - NGS-sekvensering
a. Cluster generation (oppnå høyt nok lyssignal)
i. Hybridisering (binder ss-DNA til oligoer på flowcellen)
ii. Danner komplementær DNA-tråd (polymerase)
iii. Vasker vekk original DNA-tråd
iv. Bro-amplifisering (klonal amplifisering vha polymerase) - Får en forward og en revers strand
- Gjentas til man oppnår høyt nok signal
v. Kutter revers strands av og vasker de vekk - Står igjen med bare forward stranden (sense tråden)
b. Sequencing by synthetis
i. 2 reads; - Read 1: sensetråd
- Read 2: reverstråd
- 1 og 1 base settes på, og det tas et bilde for hver base som settes på, signalet forteller hvilken base som er satt på
- Databehandling
a. Raw-reads; .bap fil
i. Alle avleste baser med kvalitet. Binær fil.
b. Leselig versjon av .bap; .fastq
i. Konverteres av program (eks bcl2fastq), demultiplexer også prøven
ii. 4 linjer per read (sekvens-ID, sekvens, mellomrom, kvalitetsscore (Sannsynligheten for at ne base er feil))
c. Alignment, variant calling og annotering for å få noe nyttig ut av .fastq-fila
i. Aligment: Mapper reads etter hvor de hører hjemmepå genet (vha referansesekvens) - Gir 2 filer; sam og bam. BAM = binær, kompakt versjon av SAM, kan viasualiseres vha dataprogram
ii. Variant calling: Detekterer områder med varianter, og i hvor mange reads de er tilstede (hetero/homozygot) - Gir VCF-fil. Stor fil med alle varianter og mye informasjon (posisjon, variant, sekvenseringsdybde, genotype, kvalitet)
iii. Annotering: finner ut alt vi kan om variantene. Skreddersyr prosjektet. - Gen, hvor i gen (exon, 5´/3´UTR, intron), type endring på DNA eller proteinnivå, type variant (frameshift, missens, non-sens…), allelfrekvens
- Rådata-fil sammenlignes med referansegenom/sekvens
- DNA-variant tolkes. Sykdomsgivende? VUS? Ofte tverrfaglig team
- Rapportering av DNA-variant til rekvirent
Hva er helgenomsekvensering, eksomsekvensering og genpanel?
Helgenom:
Sekvensering av hele genomet til en organisme. Gir komplett oversikt over alle DNA-sekvenser, med både kodende og ikke-kodende sekvenser. Nyttig i undersøkelse av genetisk variasjon og identifikasjon av mutasjoner, i tillegg til studier av evolusjonære forhold og genetiske sykdommer. Gir MYE data.
Eksom:
Sekvensering av den delen av genomet som består av kodende DNA. Fjerner først introns fra RNA-molekylet, for så å sekvemsere det kodende RNA-molekyletv (cRNA). Nyttig i undersøkelse av genetisk variasjon og identifikasjon av mutasjoner.
Genpanel:
Panel sammensatt av bestemte gener som sekvenseres ved bruk av panelet. Kan være gener som er assosierte med en viss familiehistorikk og gir informasjon om en persons risiko for utvikling av visse sykdommer. Spesielt nyttig kan det være ved sykdom som assosieres med mutasjon i flere gener. Gir mye mindre data, nesten bare det vi er interesserte i.
Hva sikter vi til når vi snakker om DNA-kvalitet?
Hovedsakelig høymolekylærvektige fragmenter med en A260/280 ratio mellom 1.8 og 2.0. Det skal også være uten kontaminerende substanser som polysakkarider og fenoler.
A260/280 ratio: forskjell i absorbans ved 260nm og 280nm, sier noe om DNAs renhet.
Ratio <1.8: tilstedeværelse av proteiner
Ratio >1.8: tilstedeværelse av RNA
Hva er bioinformatikk?
Tverrfaglig felt som utvikles og forbedrer metoder for lagring, uthenting, organisering og analysering av biologisk data.
Et bioinformatisk verktøy er et program som utfører en spesifikk oppgave, som kvalitetssjekk, allignment, analyse, generering av figurer og grafer +++. Programmet har en input og en output. Det vi får ut er noe som har mindre plass, gir mer mening for oss, er lettere å dele, mer tilgjengelig, kvalitetssikret og egnet for videre dataanalyse.
Hvorfor er bioinformatikk essensielt innen NGS?
Bioinformatikken gir verktøy og metoder for analysering og forståelse av de enorme datamengdene vi får ut av NGS.
Ved hjelp av bioinformatikken kan vi håndtere og utnytte dataene for å avdekke genetiske variasjoner og mutasjonerm samt undersøke reguleringsmeknismer og andre biologiske prosesser, og med det øke forståelsen for biologiske mekanismer og kunne utnytte kunnskapen i utvikling av nye behandlingsmetoder og legemidler.
En annen fordel med bioinformatiske verktøy er muligheten til å sammenligne sekvenser fra ulike individer eller organismer, og muliggjør slik undersøkelser av genetiske likheter og evolusjonære relasjoner.
Hva er en pipeline innen NGS? Hvilke bioinformatiske trinn gjøres i NGS?
Pipeline:
En serie av trinn som følger hverandre i en fast rekkefølge for å utføre analyse av sekvensdata. Pipelinen består av en samling ulike verktøy og programvarer som benyttes i håndtering, analysering og visualisering av sekvensdata. Pipelinen kan være automatisert, eller mer fleksibel slik at man manuelt kan velge ulike trinn og verktøy etter behov.
- Rådatafilbehandling
a. Få sekvensdata i et format som kan behandles av verktøy for videre analyse - Allignment
a. Sammenligne sekvensdata med et referansegenom/en referansesekvens for å finne ut hvilke sekvenser som kommer fra hvilke gener og andre elementer i genomet - Finne variasjoner
a. Detektere mutasjoner og variasjoner i sekvensdataene sammenlignet med referansen - Ekspresjonsanalyser
a. Undersøke hvordan genene uttrykkes i sekvensdataene (eks hvilke gener er aktive i ulike vev/under ulike forhold) - Visualisering
a. Presentere analyseresultatene på en oversiktlig måte (eks figurer/tabeller)
Hva er de viktigste forskjellene mellom nestegenerasjonssekvensering og sangersekvensering?
- Sekvenseringstid
o NGS kan sekvensere store mengder DNA/RNA på relativt kort tid, og er derfor en rask og kostnadseffektiv teknikk sett i forhold til sangersekvensering, som er mer tidskrevende og krever mer manuelt arbeid (som koster). - Presisjon
o NGS kan sekvensere hele, eller store deler av, genomet. Men målpresisjonen kan være lavere enn ved sangersekvensering, som kan sekvensere enkelte gener eller andre små sekvenser med høy presisjon. - Anvendelse
o NGS er godt egnet for generering av store mengder sekvensdata (genom, eksom, transkriptom, epigenom) på en detaljert måte.
o Sangersekvensering er godt egnet for å sekvensere spesifikke sekvenser med høy presisjon (mutasjoner eller andre variasjoner i enkelte gener)
Sanger
Fordeler:
- Kan sekvensere spesifikke sekvenser med høy presisjon
- Kan sekvensere enkelte gener eller andre små sekvenser med høy presisjon
- Godt egnet i undersøkelse av mutasjoner/variasjoner i enkelte gener
Ulemper:
- Tidkrevende og kostbart
- Krever manuell innsats
- Mindre egnet i generering av store mengder sekvensdata
NGS
Fordeler:
- Mulighet for å sekvensere stor mengder DNA/RNA på relativt kort tid
- Raskt og kostnadseffektivt
- Godt egnet til generering av store mengder sekvensdata (genom, eksom, transkriptom, epigenom) på en detaljert måte
Hva er sekvenseringsdybde i NGS?
Hvor mange ganger hver base i en sekvens er lest (sekvensert).
Høyere sekvenseringsdybde = sikrere resultater av analysen.
Dybden kan variere avgengig av hvilke data man ønsker å generere. Skal man undersøke mutasjoner/variasjoner i et genom på en detaljert måte burde man ha høy sekvenseringsdybde, mens det kan være nok med en lavere sekvensdybde dersom man «bare» skal underslke generelle trekk ved gebomstrukturen.
Sekvenseringsdybde er likevel ikke det eneste som påvirker analyseresultatene. Kvaliteten på sekvensdataene og valg av verktøy og metoder blant annet kan også spille inn.
Hva er forskjellen på et referansegenom og en referansesekvens?
Et referansegenom er et komplett sett av genetisk materiale for en organisme, mens en referansesekvens er en kortere del av genomet som representerer et spesielt gen eller en gruppe av gener.
Referansegenomet gir en standard som kan sammenlignes med andre genomsekvenser for å identifisere mutasjoner og andre variasjoner. Referansesekvensen kan benyttes til identifikasjon av et gen eller kartlegging av dets struktur og funksjon, og sammenligning mot andre gener.
Hva er 16S sekvensering, når benyttes det og hvilke begrensninger har den?
Sekvensering av et kort stykke av ribosomalt RNA, som kalles 16S-RNA. Denne sekvensen finnes i ribosomene hos alle miktoorganismer, og er unik for hver mikroorganisme. Ved å sammenligne sekvensen med en database av kjente sekvenser kan man bestemme hvilken type mikroorganisme som er til stede i et prøvemateriale.
16S rRNA-sekvensering brukes ofte i mikrobiologi og bioteknologi for å undersøke mikrobiell diversitet og sammensetning i ulike miljøer, som jordsmonn, vann, luft og kroppsvæsker hos mennesker og dyr. Det kan også brukes til å studere mikrobiell økologi, dvs. hvordan mikroorganismer samarbeider og påvirker hverandre i et samfunn, og hvordan mikrobiell sammensetning påvirker helse og sykdom hos mennesker og dyr.
Begrensninger:
- Gir bare informasjon om mikroorganismens taksonomi (hvilken gruppe/familie den tilhører), ikke om organismens genomiske sekvens, struktur eller fx, som en fullstendig genomsekvens gjør.
- Kan ikke detektere mikroorganismer som ikke har ribosomer (eks virus)
- Kan ha lavere spesifisitet enn andre metoder for mikrobiell identifiseringm som NGS. 2 mikroorganismer kan ha svært like 16S-sekvenser, og feilaktig identifiseres som samme type organisme.
Tross begrensningen er 16S RBA-sekvensering en nyttig og kostnadseffektiv teknikk i undersøkelse av mikrobiell diversitet og sammensetning i ulike miljøer, når resultatene tolkes på riktig måte og begrensningene hensyntas.
Hvordan utføres 16S sekvensering?
- Prøvetaking av mikroorganismer
- Eks fra jordsmonn, vann, luft eller kroppsvæsker
- Direkte fra miljøet, eller indirekte ved at det kultiveres på laben først (øker mengden mikroorganismer)
- DNA-isolering
- For å få tilgang til 16S RNA sekvensen
- PCR-amplifisering
- Øke mengden 16S RNA
- Sekvensering
- Analyse
- Vha spesialverktøy og programvarer
Hvorfor sekvenseres sars-cov-2 viruset?
For å studere dets genetiske struktur og evolusjon.
- Kan bidra til å forstå hvordan viruset sprer seg, hvordan det muterer og hvordan det påvirker menneskers helse.
- Kan hjelpe med å utvikle bedre diagnostiske verktøy, behandlinger og vaksiner mot covid-19. Ved å kartlegge virusets genetiske struktur, kan man lage mer spesifikke og effektive diagnostiske tester som kan identifisere viruset raskt og nøyaktig.
- Kan hjelpe med å utvikle behandlinger og vaksiner som er mer effektive mot viruset.
- Kan bidra til å spore og kontrollere virusets spredning. Ved å analysere virusets genetiske struktur hos mennesker med covid-19, kan man spore hvordan viruset muterer og sprer seg gjennom befolkningen. Dette kan hjelpe med å identifisere hotspots for viruset og implementere tiltak for å kontrollere spredningen.
Alt i alt er sekvensering av SARS-CoV-2 en viktig del av arbeidet med å forstå, diagnostisere, behandle og kontrollere covid-19 pandemien.