Systembiologie Flashcards
Definition System
Gesamtheit von voneinander abhängigen Entitäten, welche über Interaktion ein Ganzes bilden
Definition Komplexes System
System aus vielen Entitäten mit Strukturähnlichkeiten: Modularität, Hierarchie, Kontolle
Definition Systembiologie
Untersuchen von inter- & innerzellulären dynamischen Prozessen über systhemtheoretischen Ansatz
Ziel der systembiologie & welche Daten sind nötig?
Ziel: kausatives Verständnis der molekularen Prinzipien des Lebens
Benötigt: quantitative Daten aus Genomik, Proteomik, Transkriptomik, Klinik
Für welche Teile der Biologie ist Systembiologie interessant?
Enzyme & deren Reaktionen, Pathways, zelluläre Funktionen, Physiologie
Data Mining: Was wird untersucht?
Mustererkennung, Korrelation, Clustering
Systemansatz: Was wird untersucht?
Generelle Prinzipien, Stimulus Response, Modellierung & ggf. Simulation
Modellzyklus
Hypothese -> Experiment -> Daten -> Modell -> Simulation -> Übereinstimmung mit oder Differenz von Hypothese
2 Ansätze zur Modellierung & Startdaten
Top-Down-Modellierung: statistische Daten
Bottom-Up-Modellierung: molekularbiologische Erkenntnisse
Was ist in Systemmedizin mit inbegriffen?
Bioinformatik, Systembiologie & Medizininformatik
Was sind OMICS?
Charakterisierung & Quantifizierung v. biologischen Entitäten, deren Funktion/Struktur/Dynamik
Struktureller Workflow der Ensembl Datenbank
DNA-Sequenz aus öffentlichen Quellen
Sequenzassembly
Verknüpfung mit funktionellen Datenbanken
Darstellung über Web-Interface
Was heißt es wenn Protein CCDS-ID hat?
Findet sich in Genom v. Maus und Mensch -> hoch konserviert, funktionell wichtig
Was bedeuten TSL (Transcription Support Level) 1-5?
1: komplett nachgewiesen/unterstützt
2-4: über Expressed Sequence Tags teils unterstützt
5: nur vorhergesagt
Ensembl Identifier & Bedeutung?
ENSG -> Gene ENSP -> Proteine ENST -> Transkripte ENSE -> Exons Suffix für nicht-humane Proteine
Wieso muss Ensembl möglich dynamisch sein?
Genomassembly iterativer Prozess mit Zufallskomponenten
-> 5% Genom unbekannt, 50% repetetive Elemente (ständig ergänzt)
Was steht in Misc-Tabelle von Ensembl?
Transkripte gruppiert nach Operon
Was steht in ID-Mapping-Tabelle von Ensembl?
Mappt Namen & zugrhörige Transkripte, archiviert Namen
Was steht in External-References-Tabelle von Ensembl?
Links zu externen Datenbanken
Wie reflektiert Datenbank Scaffold-Ansatz d. Shotgun-Sequencing?
Gibt Informationen zu kleinen DNA-Stücken & dann immer größer werdend
Contigs -> Scaffold -> Chromosomes
Wie setzt sich Benennung d. DNA-Stücke in Ensembl zusammen?
Koordinatensystem (t.B. Chromosom, Scaffold, etc.) Assembly Seq_Region Name: Nummer Start: AS-Zahl End: AS-Zahl Strang: 1 oder -1
Datenexport in 4 Schritten bei Ensembl: wonach wird gefiltert?
Data: Datenset
Filters: IDs, Regionen, Domains, best. Expression
Attributes: Homologie, Eigenschaften, Struktur
Results: als Tabellen/Text
Differentielle Genregulation: Was untersucht? Was interessiert?
Bestimmung v. Genen welche mit Phänotyp assoziiert sind
Welche Geneabschnitte werden nach Drug-Behandlung hoch-/runterreguliert?
LIMMA: steht wofür? Was und wie funktioniert es?
Linear Models for Microarray and RNA-Seq Data
T-Test für Microarrays: moddeliert systematischen fehler & schätzt zufällige Variation
Ziel GO (Gene Ontology)
Kontrolliertes Vokabular für Gene & Attribute
Gene & Produkte kommentieren & standardisieren
Zugang zu Datenbank- & Analysetools
Struktur der GO?
Gerichteter, azyklischer Graph mit Knoten=Ontologiebegriffe & Kanten=Verknüpfung
Verknüpfungen “is-a” oder “part-of”
3 Wichtige Unterteilungen für Proteine in GO
Zellkomponent
Biologischer Prozess
Molekulare Funktion
Nachteile GO
Kleinteilig
Wenig Fokus auf Signal Processing
Was ist in Reactome aufgelistet?
Bindung & Dissoziation
Degradation
Transport
Phosphorylierung & Dephosphorylierung
Enrichment Analysis: Wovon geht man aus?
Biolog. Studion hat keinen Zusammenhang mit best. Funktion -> Ergebnis willkürlich (Nullmodell)
Welche Parameter besitzt Fischer-Test?
Gene d. Kategorie t sind in Studie überrepräsentiert
Gesamtpopulation aller Gene m
n signifikante Gene
m(t) signifikante Gene d. Kategorie t
n(t) signifikante Gene & signifikante Gene d. Kategorie t die überlappen
GSEA: steht wofür? Was wird gemacht
Gene Set Enrichment Analysis
Berechnen von Scores für Gengruppen
Workflow d. GESA
Sortieren d. Gene anhand differentieller Regulation
Selektieren d. geclusterten Gen-Sets an Listenende
Signifikanz d. Enrichments aus Permutationstest
p-Wert für Genrnks berechnen: wie?
Randomisierung & wdh d. Genranks
Nullverteilung v. >1000 Werten
Anteil Enrichment Scores, die Enrichment Scores aus Experiment übersteigen
Input in VEP (Variant Effect Predictor)
Genomische Koordinaten
VCF
Varianten-IDs
Output von VEP
Betroffenes Gen/Transkript/Protein Pathogenität Frequenzhäufigkeit Regulatorische & Splicing Effekte Literatursuche
SIFT: steht wofür? Was beeinflusst Entscheidung?
Sorting Intolerant From Tolerant
Ist Position d. AS konserviert?
Ist Position d. AS mit best. chem. Eigenschaft konserviert?
Wie sehr unterscheidet sich AS und mutierte AS?