Large scale methods Flashcards
Hur fungerar 454?
- Varje DNA molekyl fästs till bädd, en bädd per brunn
- Pyrosekvensering - detekterar att en pyrofosfatgrupp släpps
Inkorporering av dNTP frisätter Ppi.
Ppi omvandlas till ATP genom ett enzym, ATP sulfurylas
ATP används av ett annat enzym, luciferin för att ge upphov till en reaktion som avger ljus –> detekteras!- Kan läsa 600-700 baser
- Number of reads: 700 000
Hur fungerar Iontorrent?
- Bäddbaserad DNA attachment, påminner om 454
- Detekterar protoner som frigörs vid polymerisation
- Kan läsa 400 bp
- Number of reads: 60 000 000
- Idag används det främst till exon sekvensering - att ex. hitta cancer mutationer
Hur fungerar Illumina?
- Mest populär idag, har i princip monopol.
- DNA molekyl fäst till oligonukleotid i flödescell
- Detektera fluorescent reversibla-terminatorer dNTPs, olika ljus för olika baser
- Paired-end sekvensering
- Read length: upp till 600 baser
- Number of reads: upp till 10^10
Kan läsa ca 50 humana genom i varje runda
Varför kan illuminationer inte sekvenser långa fragment?
- Fenomen som kallas phasing
- Misslyckas inkorporera nukleotid i en molekyl under en cykel –> ur fas med resterande molekyler i samma kluster
- Desto längre read –> större andel av molekylerna är ur fas –> låg kvalitet på resultatet
Begränsad i längd av reads –> phasing - Syntes i kluster ur fas (någon lite efter) –> olika signaler i samma
- Desto längre molekyl = desto mer tid –> mer fel
Hur fungerar paired ends?
Paired ends löser ett stort problem som associeras med short reads! –> ger oss avståndet mellan två positioner
- Provides sekvens-taggar på önskade avstånd
- Undviker gaps
Metod:
1) Fragmentera och välj storlek på DNA
2) Ligera fast cirkuläriserande adaptorer
3) Låt dem binda –> cirkulärt fragment
4) Fragmentera cirkeln
5) Amplifiera och sekvensera från vänster och höger
6) Mappar positionerna!
Hur fungerar PacBio?
Kan hantera långa reads
- En single molecule metod
- Immobilisera DNA polymeras med templat DNA
- Fluorescenta nukleotider
- Kan detektera modifikation på baser
Principen
- Varje flödescell innehåller tio-tusentals nano-brunnar
- Varje brunn lyses upp underifrån, Brunnen är mindre än ljusets våglängd
- Endast den nukleotid som hålls av DNA polymeraset vid botten av brunnen kommer exciteras
- Olika baser är kopplade till olika fluoroforer
Problematisk:
- Om read passar i flera ställen i genomet vet vi inte vilken det är!
Vad gäller för RNA sekvensering?
Den enda skillnaden mellan DNA och RNA sekvensering är att det kräver omvandling från RNA till cDNA
- Mha RNA seq kan transkriptom kartläggas givet olika förutsättningar
- Kan mappa start och stopp för transkript
- Kan mappa ribosomens ockupering längs mRNA
- Kan användas för att identifiera sRNA/miRNA/piRNA och många andra molekyler
RNA sekvensering kan ge mycket information relaterad till funktion (utöver generna i sig)
Hur kan man analysera transkriptenheter?
Om vi vill studera och identifiera transkriptionsenheten: start och slut kan vi variera hur biblioteken görs och anrika olika
Att hitta starten:
- Anrika ppp –> alla reads i början
- Fragmentering och TAP treatment
Att hitta mitten:
- Standard, fragmentera
Att hitta slutet av transkriptet:
- Ligera på 3’ på alla och sedan fragmentera
Vad är Dual RNA-seq?
Används ex. i infektionsstudier
Tidigare: fysisk uppdelning, värdcell och bakterie separat för att studera
- Mycket hinner hända under process, vill ju veta hur interaktionen påverkar
Istället för att separera:
- Fixera RNA –> ta ut allt (bakteria+värd) –> bibliotik –> sekvens
- Körde bra täckning (upprepad sekvensering –> djupt) –> skilja bakterier
- Kolla olika tider –> hur snabbt genuttryck
Invation
Vad är ribosome profiling?
Isolera mRNA fragment som sitter fäst till ribosomen, ger information om
- Lokalisering av ORF
- Position av start och stop kodon
- Hur effektivt ett specifik mRNA translateras
Hög hastighet/ effektiv translation = hög initieringshastighet –> många ribosomer
- Extrahera RNA(:ribosom) –> tar bort oskyddat RNA –> rena ut RNA fragment
- Info om var ribosomen binder –> var ORF finns
Exempel: ribosom profiling för att mappa startkodon
- Trick: använd drog Harringtonine för att frysa ribosomer som befinner sig i initieringssteget
- Harringtonine inhiberar elongering, fryser i initiering
Exempel ribosome profiling
Undersöka och adressera subenhetsstökiometrin i operon
Ser en skillnad mellan antalet reads och ribosom-tätheten
- Lika mycket mRNA men olika mycket protein
○ Olika komponenter behövs olika mycket i komplexet
Varför uttrycks de olika?
- mRNA strukturer
- SD utseende olika –> komplementaritet
- sRNA
- RNA bindande proteiner
- Både cis och transfaktorer
Man ser då en korrelation mellan stökiometrin i det färdiga komplexet och synteshastigheten
Uttrycksfördelningen stämmer med ‘behovet’
Vilken metod kan användas för att identifiera RNA-protein interaktioner?
CLIP-seq
1) Skapa kovalenta bindningar mellan molekyler
- Kan använda formaldehyd
- Belys med UV ljus –> specifika krosslänk mellan RNA och proteiner
–> ögonblicksbild
2) IP, antikropp fångar upp proteinet
3) Tvätta bort skräp, Rnase treatment
4) Märker RNA på 5’ änden.
5) SDS page, ser komplexen på gelen. RNA litet –> går igenom. Proteinet –> omärkt, syns ej
6) Degradera proteinet: proteaser –> bara RNA kvar
7) Sekvensera RNA som finns kvar
Vi vill rena fram proteinet som är bundet till RNA molekylen
- Allt annat vill vi rena bort
Kan mappa våra reads mot genomet –> ser var proteinet binder in!
Skannar genomet
- Jämför kontroll med experiment
- Letar specifik anrikning
Vilken metod kan användas för att studera RNA-RNA interaktioner?
RIL-seq: RNA interaction by ligation and sequencing
Ligera och koppla ihop RNA med ligase
Hur kan DNA-protein interaktioner studeras?
Ofta används ChIP (chromatin IP följd av sekvensering)
- Antikropp fånga upp DNA bindande protein
- Sekvensera DNA sekvensen
Vad är transposon mutagenes?
Transposon = bit DNA som själv kan flytta sig mha enzymet transponas - Ofta kopplad till antibiotikaresistens –> selektiv
För in denna i plasmid –> låter transposonen flytta in. Skapar ett bibliotek med 1 miljon insertions. Har ca 8 bp avstånd mellan insertions –> täckt in alla gener
Om insertion inte ‘finns’ kvar –> genen är vital för överlevnad!
- Ser hur knock-out av absolut nödvändiga gener påverkar överlevnad
- Andra proteiner kan fungera utan vissa domäner
Detta ger information om genomstruktur!
Vad är proteomik?
Mestadels används sofistikeras masspektrometri
Proteomik handlar om
- Vilka proteiner vi har
- Hur mycket vi har av respektive protein
Ger väldigt hög precision och upplösning, används ofta i kombination av genom och transkriptom-data
Peptid-sekvens analyseras mot genom/mRNA information