Genomics Flashcards
Was sind Teilgebiete der Genomics und womit beschäftigen sie sich?
- Genomkartierung: Analyse der genetischen Kopplung von Genen
- Genomsequenzierung und -annotierung: Ablesen der Nukleotidsequenz von DNA und Identifizierung informationstragender Teilsequenzen
- Interaktion zwischen Loci und Allelen innerhalb eines Genoms
- Functional Genomics: genomische Daten, um Gen-Funktionen und Interaktionen zu beschreiben
- Comparative Genomics: beschäftigt sich mit der Beziehung von Genom-Struktur und Funktion zwischen verschiedenen Spezies
Was sind die spezifischen Zielsetzung der industriellen Genomics und wie unterscheiden sie sich von der klassischen Genomics?
Industrielle Genomics
- Genome von industriellen Produktorganismen (Trichoderma, Hefe, Penicillium, Bacillus)
- Einblicke in die Physiologie zur Prozessoptimierung und Stammentwicklung
- funktionelle Genomik zur Produktionsverbesserung
- Organismen erfüllen die Anforderungen an Modellorganismen
Klassische Genomics (Grundlagenforschung)
- Humangenome, Genome höherer Eukaryoten und Modellorganismen
- Phyiologie und Genfunktion zur Prävention und Medikamentenentwicklung
- funktionelle Genomik, um Organismus besser zu verstehen
- Analyse von Modellorganismen, um Rückschlüsse auf Vorgänge z.B. im Menschen zu ziehen
Welche Kriterien werden an Next Generation Sequencing angelegt?
- hohe Genauigkeit
- geringe Probenmenge
- hoher Durchsatz (Miniaturisierung, schnelle Reaktion, lange Sequenzen)
- geringere Fehleranfälligkeit (wenige chemische Schritte während Analyse, einfache Probenvorbereitung)
- tatsächliche Repräsentation der Probe (Vermeidung von PCR-Amplifikationsschritten)
- Kostensenkung
Wie lassen sich Next Generation Sequencing Methoden kategorisieren? Welche Schritte sind typisch für diese Methoden?
Template: Template von einzelnen DNA-Molekülen durch Klonieren amplifiziert, einzelne DNA-Molekül-Template
- emulsion PCR
- solid phase PCR
Sequencing:
- zyklisch reversible Termination
- einzelne Nukleotid-Addition
- Sequenzieren durch Ligation
- real-time sequencing
Imaging:
- Biolumineszenz
- Ein- oder Vier-Farb-Bilder von einzelnen molekularen Reaktionen
Schritte
- Fragmentieren der DNA
- Adaptor Ligation
- Binden an Oberfläche (template Immobilisierung)
- Amplifikation (nicht immer)
- Detektion des Einbaus von einzelnen Nukleotiden
Nennen und erläutern Sie 3 Methoden der Immobilisierung beim Next Generation Sequencing. Welchem grundlegenden Zweck dient dieser Schritt bei den Sequenzierungsmethoden?
Immobilisierung (binden an Oberfläche) → dient zur Vorbereitung der Materials und erlaubt robuste Methoden, bei denen tausende Sequenzierreaktionen simultan erfolgen können → hoher Durchsatz!
Emulsion PCR
- auf jedes primer-umhüllte bead wird ein einzelnes DNA-Molekül gebunden
- beads befinden sich in Wassertropfen in einer öligen Emulsion
- durch PCR werden auf einem bead mehrere tausend Kopien der template DNA erzeugt
- 100-200 Mio. beads → chemisch an Glasoberfläche gebunden
solid-phase amplification
- Vorbereiten der DNA-Probe durch Ligation von Adaptern an beide Enden der Fragmente
- die ssDNA-Fragmente werden an die Oberfläche einer mit Primern hybridisierten Platte gebunden → doppelsträngige Brücken werden gebildet (dNTPs + Polymerase) → bilden Cluster
single molecule: primer immobilized
- einzelne Molekül-Template werden mittels Primer an eine feste Oberfläche gebunden
Nennen und erläutern Sie die 3 Detektionsprinzipien beim Next Generation Sequencing. Welchem grundlegenden Zweck dient dieser Schritt beiden Sequenzierungstechniken?
Bei der Detektion wird die Nukleotidreihenfolge (= Sequenz) des gebildeten DNA-Strangs ermittelt.
Pyrosequencing
- Inkubation der bead in PTP-wells (PicoTiterPlate)
- zusätzliche beads (gekoppelt mit Sulfurylase und Luziferase) werden zugegeben
- DNA-Synthese: Zugabe der dNTPs jeweils nacheinander
- Einbau des richtigen Nukleotids → Lichtblitz (doppelte Intensität bei Einbau von 2 Nukleotiden in einer Reihe)
- Beim Einbau wird Pyrophosphat frei → reagiert durch Sulfurylase zu ATP (in Anwesenheit von APS = Adenosin-5’-Phosphosulfat → treibt Luciferase-Reaktion an → Lichtblitz
- nicht eingebaute dNTPs → durch Apyrase entfernt → Neustart der Reaktion
Single molecule real-time sequencing
- Verwendung eines zero-mode-waveguide design → Reduktion des Beobachtungsvolumens und Zahl der Streuungen fluoreszenz-markierter Moleküle, die die Detektionszone betreten
- am Boden des Lichtleiters DNA-Polymerase fixiert (= Detektionszone)
- Inkubation mit phospho-linked Hexaphosphat-Nukleotiden (mit 4 unterschiedlichen Fluoreszenzfarbstoffen)
- Nukleotid eingebaut - Fluoreszenzpulse in Detektionszone - fluoreszenz-markierter Phospholinker diffundiert weg → Fluoreszenzsignal fällt auf 0
Cyclic Reversible Dye Termination (CRT)
- auf einer Platte immobilisierte und klonierte DNA-Templates bilden Cluster
- Zyklus: Primer, DNA-Polymerase und 4 reversible “Terminator-Basen” (= fluoreszenzmarkierter Nukleotide mit blockiertem 3’-Ende) werden zugefügt
- nach Einbau der richtigen Nukleotid werden nicht eingebaute weggewaschen - Bild des FLuoreszenzmusters
- Farbstoff und Blocker werden entfernt
- Zyklus: DNA-Strang wird synthetisiert - nach jeder Base wird das Fluoreszenzmuster aufgezeichnet
Welcher Kombination von Immobilisierung/Amplifizierung und Detektion bedienen sich der Roche 454 GenomeAnalyzer und der Helicos BioSciences Helsicope?
Roche
- bead-Immobilisierung
- emulsion PCR
- pyrosequencing
Helicos
- single molecule primer immobilization
- keine Amplifizierung
- one colour CRT (cyclic reversible dye termination) sequencing
Welcher Kombination von Immobilisierung/Amplifizierung und Detektion bedienen sich der Illumina Solexa Genome Analyzer und der Sequencer von Pacific Helicos Biosciences?
Solexa (Illumina)
- solid-phase Immobilisierung
- bridge amplification auf Glasperlen
- four-colour CRT (cyclic reversible dye termination) sequencing
Pacific Helicos BioScience
- single molecule: polymerase immobilization
- keine Amplifizierung
- single molecule real-time sequencing
Erläutern Sie einige grundlegenden Unterschiede in der Performance (Sequenzlänge und -anzahl, Fehlerrate und -typ) der wichtigen Next Generation Seuencing Plattformen Roche 454 Genome Analyzer und Illumina Solexa Genome Analyzer!
Roche 454
- Sequenzlänge: 400-700kb
- Sequenzanzahl: 50-900Mb
- Fehlertyp: Indel (Insertion and deletion)
- Fehlerrate: 1%
Illumina Solexa
- Sequenzlänge: 2x150kb
- Sequenzanzahl: 1000 bis 600.000Mb
- Fehlertyp: Substitution
- Fehlerrate: unter 0,1%
Nennen Sie 2 wichtige Methoden für die physikalische Kartierung von Genomen!
Restriktionskarten
- partieller Verdau (ein Restriktionsenzym)
- Restriktionsverdau mit zwei Enzymen
Hybridisierungskarten
- STS Kartierung (Regionen bekannter Sequenzen)
- Hybrid-Fragment-Kartierung
Was sind “Long Jumping Distance Libraries” und wozu dienen sie?
NGS-Sequenzierung: erzeugen Mio. bis Mrd. von einzelnen Sequenzen (reads), wie kann man reads korrekt zusammenfügen?
- Zusammenfügen von langen reads → erzeugt hunderte von Contigs ohne Reihenfolge (zusammenfügen kurzer reads tausende Contigs)
- je größer das Genom, desto mehr Contigs
- korrekte Reihenfolge oder ORientierung dieser Contigs per se nicht möglich (zunächst gibt es keine “Gerüstinformation”)
Long jumping libraries (= “zusammengefügte Fragment-Bibliotheken”)
- Sammlungen von kurzen “sequencing-tags” von sehr langem gDNA-Fragmenten (bis 40kb)
- Bibliotheken ermöglichen Analyse weiter Bereiche eines Genoms
- Jumping library-Klon besteht aus 2 Regionen von DNA, die normalerweise viele kb voneinander entfernt sind → Sequenz dazwischen wird gelöscht
LID = sehr exakte “mate pair” library mit einem Adaptor-Linker
Konstruktion
- zufällige gDNA-Fragmentierung
- Auswahl: Fragment gleicher Größe
- Ligation des Zirkularisierungs-Adaptors (3, 8, 20, 40kb-Fragmente)
- Auswahl der jumping distance (3, 8, 20, 40kb)
- DNA-Zirkularisierung (DNA-Fragmente mit biotinylierten Enden werden ligiert - WW mit Streptavidin
- Fragmentierung der zirkularisierten DNA
- Reparierung der Fragment-Enden
- Ligation des LJD Library-Adaptors
- Library Amplification
- letzte Auswahl der Library-Size
Kombination von verschiedenen libraries - liefern maximale Info über Genom. LJD-Daten bestärken Resultate von Contig-Zusammenfügungen und helfen die Daten zu sortieren (Bereiche zwischen Contigs können durch LJD-Daten aufgefüllt werden)
Nennen Sie mindestens 3 Methoden zur Analyse der Gen-Transkription!
- Northern Blot
- Dot Blot Analyse
- Reverse Transkriptase RT-qPCR
- DNA/RNA Microarray
- Next Generation Sequencing mit RNA/cDNA Transkripten