Systembiologie Fragen Flashcards
Anhand welcher Verteilung können Sie einen p-Wert berechnen
Hypergeometrische Verteilung
Welche Hochdurchsatz-Methode können Sie verwenden, um in diesem Fall genomische Daten zu erheben?
Sequenzierung
Welchen rechnergestützten Ansatz können Sie verwenden, um aus den erhobenen Daten ein Genom zu erhalten? Erläutern Sie, wie dieser Ansatz funktioniert.
Man kann ein Assembly machen. Im Assembly verwendet man Sequenzierdaten um überlappende Sequenzen zu identifizieren und zusammenzufügen. Dies führt zu Contigs. Diese Contigs kann man dann über weiter Methoden, z.B. spezielle Sequenzierdaten noch in
die richtige Reihenfolge und Entfernung voneinander bringen, allerdings mit unbekannter
Sequenzfolge (repräsentiert durch »N«). Diese Sequenzabschnitte, die das Assembly ausmachen, nennt man Scaffolds. Im besten Fall repräsentiert jeder Scaffold ein Chromosom
Was bedeutet es, dieses neue Nashorn-Genom zu annotieren? Womit annotiert
man ein Genom typischerweise und warum?
Man fügt Information hinzu, welche Abschnitte im Genom mit etwas verknüpft werden können. Beispielsweise, welche exprimiert, das heißt, in RNA transkribiert, werden und welche
für Proteine kodieren, also translatiert werden. Auch mit Phänotypen (Merkmalen) kann
man Regionen in Zusammenhang bringen, wenn aus vorherigen Studien solche Zusammenhänge bekannt sind. Für das Nashorn ist das eher unwahrscheinlich.
Wenn das Genom des nördlichen und südlichen Breitmaulnashorns sich an einer
gegebenen Position in einer Base unterscheidet, wie nennt man diese Variation?
Eine Einpunktvariante, oder engl. single-nucleotide variant (SNV)
Welche anderen Arten von genetischen Variationen könnten auftreten?
Indels oder strukturelle Varianten (Insertionen, Deletionen, Inversionen, Duplikationen,
Translokationen)
Welche Arten von Variation(en) auf genomischer Ebene würde(n) wohl dazu
führen, dass sich das nördliche und südliche Nashorn nicht mehr miteinander fortpflanzen
können und warum?
Sehr große strukturelle Varianten wie z.B. Translokationen, die dazu führen, dass die Chromosomen sich vor der Zellteilung nicht mehr paaren können.
Durch welche Datenbank wird die rsID vergeben?
dbSNP
VEP listet zwei mögliche Effekte, also zwei Zeilen. Wieso gibt VEP mehrere
Effekte an?
Für jedes Transkript (bestimmt durch seine entsprechende ENST ID), welches eine Variante
betrifft wird ein Effekt gelistet.
Das gemeinsame Auswerten vieler Transkriptom-Datensätze kann man als TransOMICs-Analyse bezeichnen.
Falsch. Trans-OMICs bedeutet die gemeinsame Betrachtung verschiedenartiger OMICs Daten, z.B. Transkriptomik gemeinsam mit Genomik Daten.
Mittels Biomart kann man herausfinden, welches die voraussichtlich hauptsächlich vorkommende Spleißvariante, d. h. die sogenannte »Prinicpal Isoform« eines Gens ist.
Richtig. Man kann die APPRIS Annotation mit ausgeben, die angibt, welches die voraussichtliche »Principal Isoform« ist.
Reactome ist eine Ontologie.
Falsch. Reactome ist eine Signalwegsdatenbank und keine Ontologie.
Next Generation Sequencing ist eine OMICs-Art
Falsch. Next Generation Sequencing ist eine Technik.
Der Durchmesser eines Netzwerks, welches nur aus einem Knoten und dessen
Nachbarn besteht, ist zwei.
Richtig.
Da es in biologischen Netzwerken sogenannte »Hub Genes« gibt, ist »Network
Diffusion« besser geeignet als kürzeste Pfade, um Auswirkungen eines Gens zu untersuchen
Richtig.