Biodatenbanken Flashcards
Welche Art von Daten können in Biodatenbanken gespeichert werden?
Rohdaten
Aufbereitete Daten
Wie gelangen Daten in Biodatenbanken?
Submission oder Collection/Crawling
Grade an Strukturiertheit von Biodatenbanken
Reiner Text
Entry-Basiert: Liste v. Zeilen mit bestimmtem Syntax
Relationale: SQL-Datenbank
Objektorientiert
XML: Baumförmige Struktur, schematisch verwaltet
Zugang zu öffentlichen Datenbanken: Wie?
Über Web-Interface
ggf. direkten Zugriff auf SQL-Server
Was ist Flat-File?
Textdatei: jede Zeile ist eigener Datensatz
kein Standard für Formate
je nach Biodatenbank unterschiedlich
Was ist XML (Extensible Marker Language)
Standard zum strukturierten Aufschreiben von Daten
Über Document Type Definition welche Tags in Datei vorkommen & was Bedeutung ist
Dateien recht groß
Protein-Database: Was gespeichert? Wie Zugriff?
Molekülstrukturdaten aus NMR/Kristallo/etc.
Zugriff: ID des Proteins über Web-Interface
Herunterladen der Flat-File/XML d. Struktur über ID
Betrachten d. Moleküls über Browser
Struktur der PDB-Flat-Files
Zeile: max. 80 Zeichen, keine Sonderzeichen/Umlaute
erste 6 Zeichen: spezifizieren Typ d. Zeile
Ensembl: Was gespeichert? Wie Zugriff?
Genomdaten und deren Transkription, Exons, etc.
Zugriff: Web-Interface mit Analyse-Tools, anonymer SQL-Zugang
Hauptschemata in Ensembl
Kern: Genomdaten
Vergelichende Genomik: Homologe, Paraloge, Proteinfamilien
Variationen: SNPs, Mutationen, Strukturvarianten
Regulation: regulatorische Motive
KEGG-Database: Was gespeichert? Wie Zugriff?
Gene und Pathways
Zugriff: Web-Interface für Navigierden d. Pathways
Herunterladen d. Pathways als XML-Files oder KGML-Files (KEGG Markup Language)