VL 6 Chip Seq Flashcards
Was wird bei ChiP-Seq untersucht?
- Zielproteine • Transkriptionsfaktoren • Histone (verschiedene Typen und Modifikationen) • RNA Polymerase (indirekte Transkriptionsaktivitätsmesseung) • DNA Polymerase (Analyse der DNA Replikation) • DNA Reparaturenzyme
- … oder modifizierte (z.B. methylierte) DNA-Fragmente
Wofür steht ChIP?
Chromatin Immuno Präzipitation
Wie läuft eine ChIP ab?
- DNA und Proteine werden miteinander vernetzt -> Crosslinking
- Zelle wird lysiert
- Unltraschallbehandlung der DNA-> Fragmentierung
- Antikörper gegen Histonmodifikatioon oder bestimmtes Protein
Wie funktioniert das Crosslinking?
- mit Formaldehyd
- vernetzt Proteine mit DNA, indem es Aminogrippe von Aminosäuren und Aminosäuren von DNA-Basen vernetzt
Wie funktioniert die Immunopräzipitation?
Protein wird mit bestimmten Epitope-Tag markiert
- für den Epitopen gibt es spezifischen Antikörper-> z.B. gegen Histonmodifikation
- Antikörperchen auf bea geladen-> diese binden an Proteine
- Aufreinigung und dann eluieren der DNA
- >Crosslink mit hoher Temperatur rückgängig gemacht
Warum sind kurze reads bei der ChIP-Seq von Vorteil?
-erlaubt eine hohe Auflösung und so eine genaue Bestimmung der Position der Proteine oder Histonmodifikationen
Wie wird die DNA-Library angefertigt nach der ChIP?
- Vorbereiten der DNA.Fragmente:Polymerase fühlt ungenau überhängende Enden auf
- Adapterligation-> Linker mit Barcode, PCR Amplifikation
- Library Sequenzierung
Welche Kontrollen werden für ChIP gemacht und warum?
- Input DNA Chromatin ohne IP-> Fragmente werden unterschiedlich gut mit Adaptoren ligiert und amplifiziert, um potentiellen bias der Sequenzierfähigkeit der DNA aufzudecken
- kein Antikörper oder unspezifischer Antikörper(IpG): DNA und Proteine interagieren unspezifisch miteinander und bead interagiert mit DNA-> Hintergrund von DNA, die präzpitiert wird
es wird gemessen was unspezifisch präzipitiert wird
- kein Tag: IP von Probe ohne getagtes Protein->auch für Sichtbarmachen des Hintergrunds
Workflow ChIP-Seq Data?
-FAstQ->Quality Check->Mapping auf Referenzgenom ->Coverage-Plot: wo sind Anreicherungen
Wie bekommt von Peaks zur Postition des TFs? Warum klappt das nicht immer?
- reads von beiden Strängen zu coverage Graphen
- eigentlich zwei peaks-> einer auf dem - Strang und einer auf dem + Strang
- an unterschiedlicher Position +Strang oder -Strang reads upstream oder downstream vom TF
- bei mehreren Bidestellen mehrere überlappende Maxima

Was ist die Kartierung von Bindestellen mittels Tag-Verschiebung?
reads werden Verschoben um d/2(Hälfte der durchschnittlichen Fragmentlänge)
Was ist eine Normalisierung bei ChIP und warum nicht über FPKM bzw. RPKM? Lösung?
- bei ChIP Experiment sehr starke Signale und bei Input und negativ-kontrolle sehr geringe Signale dazwischen
- so wird noise überschätzt und peaks stechen aus Hintergrund nicht mehr raus
- ausßerdem können kleinere peaks als nicht signifikant gewertetwerden
- Lösung: peak-calling-> peaks aus Normalisierungsanalyse herausgeschnitten
- >
Welche Informationen können genutzt werden, um von einem ChIP-peak zur Funktion zu kommen?
- Position des peaks im Genom(in der Nähe zu TSS oder distale (= enhancer) Region)
- nächste Gene zum peak?
- gibt es genomweit eine Anreicherung von bestimmten Genfunktionen (e.g. GO Kategorien) um die peaks?
- oder bestimmte Sequenzen(k-Mere)
Nachteil beim Fokus auf Gene neben den peaks?
Fokus auf proximale Regionen führt zum Verlust von einer großen Zahl von Bindestellen-> Enhancer können auch auf distale Gene Einfluss haben
- “Nächstes-Gen” Ansatz induziert Bias hin zu Genen mit großen intergenischen Bereichen
- e.g. : “multicellular organism development” : 14% aller Gene, but 33% des Genoms
Was ist DNAseI Hypersensitive mapping?
- Regionen die nicht stark verpackt sind, können von DNAse I(Exonuklease) geschnitten werden
- diese Regionen sind transkriptionsaktiv, da es zur Bindung von funktionellen Proteinen wieTFs eine geringe Verpackung benötigt
- mit DNAse Seq können dann die übrigen Sequenzen sequenziert werden und so bestimmt werden welche Sequenzen aktiv sind
Was ist FAIREseq?
- Formaldehyde-Assisted Isolation of Regulatory Elements
- es wird Formaldehyd genutzt um Proteine und DNA zu vernetzen->stark verpackte DNA bildet DNA-Histon-Verbidnungen
- dann wird ausgenutzt, dass Proteine in Phenol-chlorophorm löslich und DNA nicht-> nur an Protein-gebundene DNA löstsich
- ungebundene DNA kann sequenziert werden
Wie funktioniert ATAC?
- Assay for Transposase-Accessible Chromatin using sequencing
- Transposase(TN5-Transposon) genetisch verändert, dass es viel aggressiver wird
- schneidet an beleiebigen Stellen der DNA und hängt DNA-Fragmente an Schnittstellen 2 Linker an, die fürs Sequenzieren benutztwerden können
Was ist und wie funktioniert 3C?
- chromatin conformation capture
- zur Bestimmungder 3D-Struktur des Chromatins im Zellkern
1. über Crosslink mit Ziel versch. DNA-Bereiche die in der Zelle benachbart sind zu verknüpfen-> zeigt wo versch. chromosomale Berecihe relativ zueinander liegen
2. dann wird geschnitten und ligiert
3. Crosslink aufgelöst
4. Primer für Bereich von Interesse-> unbekannter Bereich amplifiziert
