Bioinformatik Flashcards
Zwei Gene (oder Proteine) sind zueinander homolog, …
wenn sie von einem gemeinsamen Vorläufer abstammen
Zwei Sequenzen mit gemeinsamer Herkunft
Zwei Gene sind zueinander paralog, wenn …
.. ihr gemeinsames Vorläufergen eine Genverdopplung durchlaufen hat
Gene, die durch eine Duplikation von genetischem Material, gefolgt von Sequenzdivergenz, entstanden sind
Falls es nach der Genduplikation zu einem Artbildungsereignis kommt, können zwei paraloge Gene in zwei verschiedenen Genomen existieren
-> der letzte gemeinsame Vorfahre von zwei paralogen Genen oder Sequenzen existierte direkt vor dem Duplikationsereignis.
Zwei Gene sind zueinander ortholog, wenn …
… ihr gemeinsamer Urahn ein Artbildungsereignis durchlaufen hat.
Gene, die von einem Artbildungsereignis, gefolgt von Sequenzdivergenz, abstammen
Diese Gene müssen nicht zusammen in demselben Genom existieren
-> der letzte gemeinsame Vorfahre von zwei orthologen Genen oder Sequenzen existierte direkt vor dem Artbildungsereignis.
Pyrosequenzierung
eine Methode zur Sequenzierung von DNA. Der Einbau eines Nukleotids während der DNA-Synthese kann hier durch eine Lichtreaktion gemessen werden. Durch kontrollierten Zufluss der Nukleotide wird auf die Sequenz der DNA geschlossen
Beispielsweise zur Bestimmung der Häufigkeit von bestimmten Genmutationen z.b. bei der Untersuchung von Erbkrankheiten
Gut automatisierbar und eignet sich zur hochparallelen Analyse von DNA-Proben
Ion torrent
eine Technologie zur Sequenzierung der DNA. Sie wurde vom Hersteller ThermoFischer Scientific entwickelt und zählt zum Next Generation Sequencing (NGS). Die Sequenzierreaktion findet auf einem spezifischen Halbleiter-Chip statt. Der Einbau eines Nukleotids kann durch einige leichte pH-Änderung gemessen werden, da bei der Abspaltung von Pyrophosphat auch ein H+-Ion freigesetzt wird. Indem die vier verschiedenen dNTPs nacheinander zugegegeben werden, kann so auf die Sequenz geschlossen werden
Illumina
eine Methode zur Sequenzierung der DNA. Sie wurde vom Hersteller Illumina entwickelt und zählt zum Next Generation Sequencing. Die DNA wird bei diesem Ansatz fragmentiert auf einer Platte aufgetragen und über eine Brücken-PCR vervielfältigt. Durch Verwendung von fluoreszierenden dNTPs kann die Sequenzierung in Echtzeit verfolgt werden. Die dNTPs sind reversible Terminatoren, es wird also immer nur ein Nukleotid einbaut, bevor die Sequenz gemessen wird.
Dot matrix Plots
eine graphische Methode der Bioinformatik zwei biologische Sequenzen miteinander (oder eine Sequenz mit sich selbst) zu vergleichen. Dabei werden die Sequenzen auf die horizontale und vertikale Achse (oben und links) aufgetragen und Übereinstimmungen zwischen einer Zeile und Spalte an der entsprechenden Schnittstelle durch einen Punkt (engl. dot) markiert
dient der Auffindung von ähnlichen bzw. übereinstimmenden Regionen
Sequenzalignment
bezeichnet den methodischen Vergleich zweier oder mehrerer Nukleotid- oder Aminosäuresequenzen in lineare Abfolge
Teilgebiet des Pattern Matching
Es wird in der molekularen Phylogenie verwendet, um die funktionelle oder evolutionäre Verwandtschaft (Homologie) von Nukleotidsequenzen oder Aminosäuresequenzen zu untersuchen. In der Fachsprache werden anstelle des Anglizismus „alignment“ auch die eingedeutschten Begriffe Alignierung oder Alinierung benutzt.
Global alignment
Bei einem globalen Alignment zwischen zwei Sequenzen werden alle Symbole berücksichtigt
Werden hauptsächlich verwendet, wenn die zu untersuchende Sequenzen ähnlich lang sind und starke Sequenzhomologien erwartet werden
Algorithms start at the beginning of two sequences and add gaps to each sequence until the end of one of the sequences is reached
Local alignment
Ein lokales Alignment von zwei Sequenzen S,T ist ein globales Alignment von einer Teilsequenz von S und einer Teilsequenz von T -> d.h. zur Berechnung des optimalen lokalen Alignment zweier Sequenzen müssen die beiden Teilsequenzen gefunden werden, deren optimaler Alignment-Score maximal ist
Local Alignment algorithms find the region(s) of highest similarity between two sequences and build the alignment outward from there
PAM Matrix (Point Accepted Mutation Matrix)
ist eine mit PAM-Werten gefüllte Substitutionsmatrix, die in der Bioinformatik dazu verwendet wird, die Wahrscheinlichkeit einer Veränderung einer Sequenz zu bestimmen. Grundlage zur Erstellung einer PAM-Matrix sind statistisch erfasste Werte über Sequenzunterschiede
Je weiter sich Sequenzen auseinanderentwickeln, desto mehr Mutationen sammeln sich an
BLOSUM Matrix
ist eine evidenzbasierte Substitutionsmatrix, die für Sequenzalignment von Proteinen benutzt wird
verwendet einzelne Blöcke (ohne Lücken) innerhalb der Sequenzen von homologen Proteinen, die verglichen werden
Hidden Markov Model (HMM)
ist ein stochastisches Modell, in dem ein System durch eine Markow-Kette mit unbeobachteten Zuständen modelliert wird
Die Modellierung als Markow-Kette bedeutet, dass das System auf zufällige Weise von einem Zustand in einen anderen übergeht, wobei die Übergangswahrscheinlichkeiten nur jeweils vom aktuellen Zustand abhängen, aber nicht von den davor eingenommenen Zuständen. Außerdem wird angenommen, dass die Übergangswahrscheinlichkeiten über die Zeit konstant sind. Bei einem HMM werden jedoch nicht diese Zustände selbst von außen beobachtet; sie sind verborgen (englisch hidden). Stattdessen sind jedem dieser inneren Zustände beobachtbare Ausgabesymbole, sogenannte Emissionen, zugeordnet, die je nach Zustand mit gewissen Wahrscheinlichkeiten auftreten
Gen Scan
Ein Programm zur Identifizierung vollständiger Genstrukturen in genomischer DNA
Es ist ein GHMM-basiertes Programm, das verwendet werden kann, um die Position von Genen und ihrer Exon-Intron-Grenzen in genomischen Sequenzen von einer Vielzahl von Organismen vorherzusagen
Cis- Element / cis-wirkendes Element
ein bestimmter Abschnitt in der Erbinformation, der für die Regulation eines Gens eine Rolle spielt, das auf demselben DNA-Molekül liegt wie dieser (molekular betrachtet diesseits)
Dieser regulatorische Sequenzabschnitt muss weder RNA noch Protein kodieren und kann in Leserichtung vor oder nach der codierenden Sequenz des zugehörigen Gens liegen, oder auch innerhalb (auch in einem Intron)
Phylogenetik
verwendet heutzutage Algorithmen zur Bestimmung von Verwandtschaftsgraden zwischen verschieden Arten oder zwischen Individuen einer Art aus DNA-Sequenzen, die zuvor per DNA-Sequenzierung ermittelt wurden
Dadurch kann ein phylogenetischer Baum erstellt werden
Cladogram
Is not an evolutionary tree, shows only relations between organism
Phylogram
In addition to that also estimates the substitution rate between organisms
Ultrametric tree
Is the tree build based on assumption of molecular clock, it shows time of divergence
BLAST-Algorithmus (Basic local alignment search Tool)
ist der Überbegriff für eine Sammlung der weltweit am meisten genutzten Programme zur Analyse biologischer Sequenzdaten
wird dazu verwendet, experimentell ermittelte DNA- oder Protein-Sequenzen mit bereits in einer Datenbank vorhandenen Sequenzen zu vergleichen. Als Ergebnis liefert das Programm eine Reihe lokaler Alignments, d. h. Gegenüberstellungen von Stücken der gesuchten Sequenz mit ähnlichen Stücken aus der Datenbank
Quantitative Echtzeit PCR
ist eine Vervielfältigungsmethode für Nukleinsäuren, die auf dem Prinzip der herkömmlichen Polymerase-Kettenreaktion (PCR) beruht, und zusätzlich die Quantifizierung der gewonnenen DNA ermöglich
UPGMA (unweight pair group method with arithmetic mean)
Variante der hierarchischen Clusteranalyse
Basiert auf der Annahme der Molekularen Uhr, d.h. dass alle Taxa mit derselben konstanten Rate envolvieren
Molekulare Uhr
Linearer Zusammenhang zwischen verstrichener Zeit und Anzahl von Mutationen
Voraussetzungen: z.B. keine Selektion, gleiche Generationszeit, gleiche Populationsgröße, Gleichverteilung der beobachteten Mutationen
Eine Methode der Genetik, mit der anhand von DNA-Sequenzierung der Zeitpunkt der Aufspaltung zweier Arten von einem gemeinsamen Vorfahren abgeschätzt wird
Je mehr Mutationen nach der Aufspaltung entstanden sind, desto länger war die Entwicklungszeit (Evolutionsdauer) seit diesem Zeitpunkt
Neigbor-Joining-Algorithmus
Ein mathematisches Verfahren, um Datensätze zu vergleichen und hierarchisch bifurcal (zweigabelig)anzuordnen
Zur Erstellung von phylogenetischen Baumstrukturen, hiermit soll anhand von variierenden Merkmalen in der Datenmatrix die Wahrscheinlichkeit einer Abstammungs- oder Verwandschaftsbeziehung in einer stammbaumartigen Darstellung berechnet werden
Es werden paarweise die DNA-Sequenzen mit der geringsten genetischen Distanz ausgewählt und zu einem Ast des Baums vereinigt
Maximum-Parsimony-Methode
Modell in der phylogenetischen Analyse, die zur Aufstellung eines Sequenzstammbaums davon ausgehen, dass vorgefundene Merkmale/Sequenzunterschiede auf der geringstmögliche Anzahl evolutiver Schritte beruhen
Die meisten Algorithmen für Next-Generation Sequenzierung (NGS) Assemblierung basieren auf..
De Brunjin Graph
Phylogenetische Rekonstruktion
Zielt darauf ab, die evolutionäre Dynamik eines Merkmals (z.B. eines Gens) zu ermitteln
Zu ihrer Durchführung gehört, ein interessantes Gen auszuwählen, seine Homologe zu bestimmen und zu ordnen und abstandsbasierte Methoden anzuwenden. Nach Erstellung des Baums kann man mit dem Bootstrap-Verfahren abschätzen, wie gut das phylogenetische Verfahren die Daten abbildet.
Der letzte gemeinsame Vorfahre von zwei Genen besteht direkt vor einem Artbildungsereignis. Diese Gene sind zueinander..
Ortholog
Beide Professoren kamen aus den USA nach Deutschland. Die USA sind aber nicht ihr Heimatland. Wo sind die beiden aufgewachsen und ausgebildet worden?
Polen und Italien
Nukleotid-Polymorphismen
Sind Variationen in der DNA-Sequenz zwischen Individuen derselben Art
Sind Variationen in der DNA-Sequenz zwischen Individuen verschiedener Arten
Die Genvorhersage-Software Glimmer benutzt
Markov-Modelle
Das Neighbor-Joining-Verfahren für phylogenetische Rekonstruktion ist..
Eine distanzbasierte Methode
Bootstrap ist..
Ein Test für die Zuverlässigkeit eines erstellten phylogenetischen Stammbaums
Wesentliche Elemente von Proteinsekundärstrukturen
Alpha Helix und Beta Faltblatt