Systembiologie Fragen Flashcards
Anhand welcher Verteilung können Sie einen p-Wert berechnen
Hypergeometrische Verteilung
Welche Hochdurchsatz-Methode können Sie verwenden, um in diesem Fall genomische Daten zu erheben?
Sequenzierung
Welchen rechnergestützten Ansatz können Sie verwenden, um aus den erhobenen Daten ein Genom zu erhalten? Erläutern Sie, wie dieser Ansatz funktioniert.
Man kann ein Assembly machen. Im Assembly verwendet man Sequenzierdaten um überlappende Sequenzen zu identifizieren und zusammenzufügen. Dies führt zu Contigs. Diese Contigs kann man dann über weiter Methoden, z.B. spezielle Sequenzierdaten noch in
die richtige Reihenfolge und Entfernung voneinander bringen, allerdings mit unbekannter
Sequenzfolge (repräsentiert durch »N«). Diese Sequenzabschnitte, die das Assembly ausmachen, nennt man Scaffolds. Im besten Fall repräsentiert jeder Scaffold ein Chromosom
Was bedeutet es, dieses neue Nashorn-Genom zu annotieren? Womit annotiert
man ein Genom typischerweise und warum?
Man fügt Information hinzu, welche Abschnitte im Genom mit etwas verknüpft werden können. Beispielsweise, welche exprimiert, das heißt, in RNA transkribiert, werden und welche
für Proteine kodieren, also translatiert werden. Auch mit Phänotypen (Merkmalen) kann
man Regionen in Zusammenhang bringen, wenn aus vorherigen Studien solche Zusammenhänge bekannt sind. Für das Nashorn ist das eher unwahrscheinlich.
Wenn das Genom des nördlichen und südlichen Breitmaulnashorns sich an einer
gegebenen Position in einer Base unterscheidet, wie nennt man diese Variation?
Eine Einpunktvariante, oder engl. single-nucleotide variant (SNV)
Welche anderen Arten von genetischen Variationen könnten auftreten?
Indels oder strukturelle Varianten (Insertionen, Deletionen, Inversionen, Duplikationen,
Translokationen)
Welche Arten von Variation(en) auf genomischer Ebene würde(n) wohl dazu
führen, dass sich das nördliche und südliche Nashorn nicht mehr miteinander fortpflanzen
können und warum?
Sehr große strukturelle Varianten wie z.B. Translokationen, die dazu führen, dass die Chromosomen sich vor der Zellteilung nicht mehr paaren können.
Durch welche Datenbank wird die rsID vergeben?
dbSNP
VEP listet zwei mögliche Effekte, also zwei Zeilen. Wieso gibt VEP mehrere
Effekte an?
Für jedes Transkript (bestimmt durch seine entsprechende ENST ID), welches eine Variante
betrifft wird ein Effekt gelistet.
Das gemeinsame Auswerten vieler Transkriptom-Datensätze kann man als TransOMICs-Analyse bezeichnen.
Falsch. Trans-OMICs bedeutet die gemeinsame Betrachtung verschiedenartiger OMICs Daten, z.B. Transkriptomik gemeinsam mit Genomik Daten.
Mittels Biomart kann man herausfinden, welches die voraussichtlich hauptsächlich vorkommende Spleißvariante, d. h. die sogenannte »Prinicpal Isoform« eines Gens ist.
Richtig. Man kann die APPRIS Annotation mit ausgeben, die angibt, welches die voraussichtliche »Principal Isoform« ist.
Reactome ist eine Ontologie.
Falsch. Reactome ist eine Signalwegsdatenbank und keine Ontologie.
Next Generation Sequencing ist eine OMICs-Art
Falsch. Next Generation Sequencing ist eine Technik.
Der Durchmesser eines Netzwerks, welches nur aus einem Knoten und dessen
Nachbarn besteht, ist zwei.
Richtig.
Da es in biologischen Netzwerken sogenannte »Hub Genes« gibt, ist »Network
Diffusion« besser geeignet als kürzeste Pfade, um Auswirkungen eines Gens zu untersuchen
Richtig.
Elixir ist eine Datenbank
Falsch. Elixir ist eine europäische Datenbankinitiative bzw. ein Verbund von Life Science
Datenbanken
GRCh37 und GRCh38 sind zwei Versionen von Ensembl-Genmodellen.
Falsch. GRCh37 bzw. GRCh38, für Genome Reference Consortium human 37 bzw. 38, sind
zwei humane Genomassemblies.
Eine differentielle Genexpressionsanalyse, in welcher krankes mit gesundem
Gewebe veglichen wird, verfolgt einen reduktionischen Ansatz.
Falsch. Es handelt sich um einen holisischen Ansatz, top-down Ansatz. Gegeben den Krankheitsstatus werden damit zusammenhängende Genexpressionsänderungen aufgezeigt.
Im Rahmen von GWAS wird getestet, ob Variantenallele mit Krankheiten oder
Merkmalen assoziiert sind.
Richtig
Systembiologie ist eine Teildisziplin der Physik.
Falsch. Sie verwendet interdisziplinäre Methoden, ist aber eine Disziplin der Biologie.
Leben ist beides, komplex und kompliziert.
Richtig
t) Mit welchem englischen Begriff bezeichnet man Punktmutationen?
Single nucleotide variants
Was ist die weit verbreitete Abkürzung für diesen Begriff?
SNV
) Man fasst kleine Insertionen und Deletionen (≤ 50 Basen) unter einem Begriff
zusammen. Wie lautet dieser?
Indel
Wofür steht die Abkürzung GWAS?
Genomweite Assoziationsstudie oder englisch genome-wide association study
Der Zusammenhang zwischen was wird in GWAS genomweit auf statistische
Signifikanz geprüft?
Zwischen Varianten und Phänotypen (z.B. Merkmale oder Krankheiten)
Im Folgenden ist ein Diagram des GWAS Catalog dargestellt. Benennen bzw.
erläutern Sie kurz 1) bis 4). (Siehe Klausur Oktober 2020)
1) Variante/SNP/SNV
2) Chromosom
3) Anzahl signifikant assoziierte Varianten je Phänotyp-Kategorie
4) Phänotyp-Kategorie