VL 6 Chip Seq Flashcards
Was wird bei ChiP-Seq untersucht?
- Zielproteine • Transkriptionsfaktoren • Histone (verschiedene Typen und Modifikationen) • RNA Polymerase (indirekte Transkriptionsaktivitätsmesseung) • DNA Polymerase (Analyse der DNA Replikation) • DNA Reparaturenzyme
- … oder modifizierte (z.B. methylierte) DNA-Fragmente
Wofür steht ChIP?
Chromatin Immuno Präzipitation
Wie läuft eine ChIP ab?
- DNA und Proteine werden miteinander vernetzt -> Crosslinking
- Zelle wird lysiert
- Unltraschallbehandlung der DNA-> Fragmentierung
- Antikörper gegen Histonmodifikatioon oder bestimmtes Protein
Wie funktioniert das Crosslinking?
- mit Formaldehyd
- vernetzt Proteine mit DNA, indem es Aminogrippe von Aminosäuren und Aminosäuren von DNA-Basen vernetzt
Wie funktioniert die Immunopräzipitation?
Protein wird mit bestimmten Epitope-Tag markiert
- für den Epitopen gibt es spezifischen Antikörper-> z.B. gegen Histonmodifikation
- Antikörperchen auf bea geladen-> diese binden an Proteine
- Aufreinigung und dann eluieren der DNA
- >Crosslink mit hoher Temperatur rückgängig gemacht
Warum sind kurze reads bei der ChIP-Seq von Vorteil?
-erlaubt eine hohe Auflösung und so eine genaue Bestimmung der Position der Proteine oder Histonmodifikationen
Wie wird die DNA-Library angefertigt nach der ChIP?
- Vorbereiten der DNA.Fragmente:Polymerase fühlt ungenau überhängende Enden auf
- Adapterligation-> Linker mit Barcode, PCR Amplifikation
- Library Sequenzierung
Welche Kontrollen werden für ChIP gemacht und warum?
- Input DNA Chromatin ohne IP-> Fragmente werden unterschiedlich gut mit Adaptoren ligiert und amplifiziert, um potentiellen bias der Sequenzierfähigkeit der DNA aufzudecken
- kein Antikörper oder unspezifischer Antikörper(IpG): DNA und Proteine interagieren unspezifisch miteinander und bead interagiert mit DNA-> Hintergrund von DNA, die präzpitiert wird
es wird gemessen was unspezifisch präzipitiert wird
- kein Tag: IP von Probe ohne getagtes Protein->auch für Sichtbarmachen des Hintergrunds
Workflow ChIP-Seq Data?
-FAstQ->Quality Check->Mapping auf Referenzgenom ->Coverage-Plot: wo sind Anreicherungen
Wie bekommt von Peaks zur Postition des TFs? Warum klappt das nicht immer?
- reads von beiden Strängen zu coverage Graphen
- eigentlich zwei peaks-> einer auf dem - Strang und einer auf dem + Strang
- an unterschiedlicher Position +Strang oder -Strang reads upstream oder downstream vom TF
- bei mehreren Bidestellen mehrere überlappende Maxima
Was ist die Kartierung von Bindestellen mittels Tag-Verschiebung?
reads werden Verschoben um d/2(Hälfte der durchschnittlichen Fragmentlänge)
Was ist eine Normalisierung bei ChIP und warum nicht über FPKM bzw. RPKM? Lösung?
- bei ChIP Experiment sehr starke Signale und bei Input und negativ-kontrolle sehr geringe Signale dazwischen
- so wird noise überschätzt und peaks stechen aus Hintergrund nicht mehr raus
- ausßerdem können kleinere peaks als nicht signifikant gewertetwerden
- Lösung: peak-calling-> peaks aus Normalisierungsanalyse herausgeschnitten
- >
Welche Informationen können genutzt werden, um von einem ChIP-peak zur Funktion zu kommen?
- Position des peaks im Genom(in der Nähe zu TSS oder distale (= enhancer) Region)
- nächste Gene zum peak?
- gibt es genomweit eine Anreicherung von bestimmten Genfunktionen (e.g. GO Kategorien) um die peaks?
- oder bestimmte Sequenzen(k-Mere)
Nachteil beim Fokus auf Gene neben den peaks?
Fokus auf proximale Regionen führt zum Verlust von einer großen Zahl von Bindestellen-> Enhancer können auch auf distale Gene Einfluss haben
- “Nächstes-Gen” Ansatz induziert Bias hin zu Genen mit großen intergenischen Bereichen
- e.g. : “multicellular organism development” : 14% aller Gene, but 33% des Genoms