Chapter 1 Flashcards
LMMA steht für?
Linear Models gor Microarray and RNA-Seq Data
LMMA basiert auf?
Design/ Contrasf Matrix
- konsistente Definition experimenteller Faktoren & Vergleiche in Multi-faktoriellen Experimenten
LMMA warum?
Modelliert systematische Variation & schätzt zufällige Variation
Students T-Test für Microarrays
Ist bin-negative binomial für RNAseq
T-Test:
Nenner hängt ab von?
- Sample Variabilität
- Anzahl der Replikate
LIMMA berechnend die Varianz für welche Gene im Array?
- Alle
- > hohe/ niedrige Varianzen moderiert
- > moderater t-Statistik
Was ist die Gene Ontology?
Nenne drei Ziele
Bioinformatik-Initiative zur Standardisierung der Darstellung von Genen und Genproduktattributen in verschiedenen Spezies und Datenbanken
Ziele: -Entwicklung/ Bereitstellung kontrollierten Vokabulars (Gene & Attribute)
- Gene und Genprodukte kommentieren & standardisieren
- Zugang Datenbank & Analysetools des Go-Projekts
Gen Ontologie Definition
- formale Bezeichnung und Definition von Typen, Eigenschaften & Wechselbeziehungen der Entitäten die real oder grundlegend für bestimmte Diskursdomänen existieren
- > Fakten und Wissen verknüpfen
Ontologie & Fakten und Wissen
Fakten sind…
Wissen ist…
-bekannt/unbekannt/ wenig bekannt
-unabhängig von Wissenden
Unabänderlich
Wissen:
- verknüpft mit dem Wissenden
- kann verschwinden
Gene Ontologie Terminologie
- kontrollierter Wortschatz: Satz von Standardbedingungen zur Indexierung und Abrufen von Informationen
- Austausch von Wissen durch eindeutige Funktionszuordnung zu biologischen Entitäten
Struktur Gen Ontologie
Ontologien als Graph darstellbar
Graph: verbnd. Durch Knoten und Kanten
Knoten=Ontologiebegriffe
Kanten= Verknüpfung der Begriffe
GO ist gerichteter azyklischer Graph was bedeutet das?
- > jeder Begriff ist mit einem oder mehr Begriffen verknüpft
- > ist ein (is-a) oder „Teil von (Part-of)
Unbekannt vs. Unannotiert
Unbekannt: kuratiert, keine Literatur bekannt
Biological process, molecular Funktion und cellular conponent unknown
Keine annotation: Gen wurde noch nicht begutachtet
Enrichment Analyse: Exakter Test von Fisher
wann sind Gene der Kategorie t in den signifikanten Genen der Studie überrepräsentiert?
Wenn es n signifikante Gene überhaupt und davon mt Gene in der Ktegorie t gibt
Wenn nt davon mit Signifikanten Genen der Studie überlappen
Worüber trifft der Ensemble Variant Effect Predictor (VEP) eine Aussage?
- Vorhersage über funktionale Effekte von grnomischen Varianten
- > SNV, Insertions, Deletions, CNV, Strukturalisten Variants
- Information über Gene, regulatorische Elemente, bekannte Varianten, Splicing
- Entwickelt von Ensembl: Standalone Tool, Weh Interface, APIs (Perl, Restful)
Vorhersagealghorithmus
Integration von Sequenzalignment und Proteineigenschafteb
-> Vorhersage über schwere ( Deleteriousness) einer Mutation
Was ist SIFT?
=Sorting Intolerant drin Tolerant
- Aligmentbasiert mittels Sequenzhomologie
- Score werden mittels positionsspezifischer Scoring Matrices berechnet
Scoring bei SIFT
Mittels:
- Position für einzelne AA konserviert
- Ist die Position für AA mit einer bestimmten chemischen Eigenschaft konserviert
- Wie unterschiedlich ist die mutierte AA von den weiteren AA?
Polyphen2 ist Naiver Bayes Classifer, basierenden auf 11 prädikativen Varianten.
Nenne multiple Sequenzfeatures
- Position-Specific Indipendent Count (PSIC) Score für WT AA
- Sequenz ID zur nächsten Homologie ohne Variante
- Volumen
Polyphen2
Nenne strukturelle Features
- Zugänglichkeit im WT
- Änderung der Hydrophobie
- Kristallographie Beta-Faktor: Änderung der räumlichen Ausdehnung
Polyphen 2
Nenne Output
- Vorhersage als probably/ Possibly Damaging oder Benign
- Scores von 0-1 mit 0,5 als Thresold
Wozu Mutation Assessor
Vorhersage von funktionellem Einfluss von AA
-> Änderungen Fokus Krebs
Errechnet: Erhaltung über Protein Familie
Und spezifität innerhalb Subfamilie
Was ist Predict SNP?
Meta-Prediction Tool
Nutzt Consensus mehrerer Vorhersagen
Was ist das gnomAD Projekt
- Datenbanken zu Populationsgenetik
- Statistische Vorhersagen über Varianten werden möglich
Gene Expression Omnibus (GEO)
- Öffentliche Datenbank, um Genexpressionsdaten zu archivieren
- kuratiert um Genexpression zu suchen, analysieren und herunterzuladen.
- unterhalten von NCBI (National Center for Biotechnology Information)
- Ablegen von Hochdurchsatzdaten in öffentlichen Datenbanken mittlerweile Voraussetzung bei Anträgen/Veröffentlichungen
Netzwerkbiologie als Abstraktion der Zellbiologie
Netzwerke meist groß
Braucht Computer für Überblick
Hierachie & Modularität
Wie bekommt man Hierachie in ein skalenfreies Netz?
Hubs überbrücken Hierachieebenrn
Stattdessen: Modularisierte Netz in Cluster
Hierachie:#Module an denen ein Node teilnimmt
-Niedrige Hierachie: wenige Aufgaben
-Hohe Hierachie: viele Aufgaben