Bioinformatik Flashcards
Zwei Gene (oder Proteine) sind zueinander homolog, …
wenn sie von einem gemeinsamen Vorläufer abstammen
Zwei Sequenzen mit gemeinsamer Herkunft
Zwei Gene sind zueinander paralog, wenn …
.. ihr gemeinsames Vorläufergen eine Genverdopplung durchlaufen hat
Gene, die durch eine Duplikation von genetischem Material, gefolgt von Sequenzdivergenz, entstanden sind
Falls es nach der Genduplikation zu einem Artbildungsereignis kommt, können zwei paraloge Gene in zwei verschiedenen Genomen existieren
-> der letzte gemeinsame Vorfahre von zwei paralogen Genen oder Sequenzen existierte direkt vor dem Duplikationsereignis.
Zwei Gene sind zueinander ortholog, wenn …
… ihr gemeinsamer Urahn ein Artbildungsereignis durchlaufen hat.
Gene, die von einem Artbildungsereignis, gefolgt von Sequenzdivergenz, abstammen
Diese Gene müssen nicht zusammen in demselben Genom existieren
-> der letzte gemeinsame Vorfahre von zwei orthologen Genen oder Sequenzen existierte direkt vor dem Artbildungsereignis.
Pyrosequenzierung
eine Methode zur Sequenzierung von DNA. Der Einbau eines Nukleotids während der DNA-Synthese kann hier durch eine Lichtreaktion gemessen werden. Durch kontrollierten Zufluss der Nukleotide wird auf die Sequenz der DNA geschlossen
Beispielsweise zur Bestimmung der Häufigkeit von bestimmten Genmutationen z.b. bei der Untersuchung von Erbkrankheiten
Gut automatisierbar und eignet sich zur hochparallelen Analyse von DNA-Proben
Ion torrent
eine Technologie zur Sequenzierung der DNA. Sie wurde vom Hersteller ThermoFischer Scientific entwickelt und zählt zum Next Generation Sequencing (NGS). Die Sequenzierreaktion findet auf einem spezifischen Halbleiter-Chip statt. Der Einbau eines Nukleotids kann durch einige leichte pH-Änderung gemessen werden, da bei der Abspaltung von Pyrophosphat auch ein H+-Ion freigesetzt wird. Indem die vier verschiedenen dNTPs nacheinander zugegegeben werden, kann so auf die Sequenz geschlossen werden
Illumina
eine Methode zur Sequenzierung der DNA. Sie wurde vom Hersteller Illumina entwickelt und zählt zum Next Generation Sequencing. Die DNA wird bei diesem Ansatz fragmentiert auf einer Platte aufgetragen und über eine Brücken-PCR vervielfältigt. Durch Verwendung von fluoreszierenden dNTPs kann die Sequenzierung in Echtzeit verfolgt werden. Die dNTPs sind reversible Terminatoren, es wird also immer nur ein Nukleotid einbaut, bevor die Sequenz gemessen wird.
Dot matrix Plots
eine graphische Methode der Bioinformatik zwei biologische Sequenzen miteinander (oder eine Sequenz mit sich selbst) zu vergleichen. Dabei werden die Sequenzen auf die horizontale und vertikale Achse (oben und links) aufgetragen und Übereinstimmungen zwischen einer Zeile und Spalte an der entsprechenden Schnittstelle durch einen Punkt (engl. dot) markiert
dient der Auffindung von ähnlichen bzw. übereinstimmenden Regionen
Sequenzalignment
bezeichnet den methodischen Vergleich zweier oder mehrerer Nukleotid- oder Aminosäuresequenzen in lineare Abfolge
Teilgebiet des Pattern Matching
Es wird in der molekularen Phylogenie verwendet, um die funktionelle oder evolutionäre Verwandtschaft (Homologie) von Nukleotidsequenzen oder Aminosäuresequenzen zu untersuchen. In der Fachsprache werden anstelle des Anglizismus „alignment“ auch die eingedeutschten Begriffe Alignierung oder Alinierung benutzt.
Global alignment
Bei einem globalen Alignment zwischen zwei Sequenzen werden alle Symbole berücksichtigt
Werden hauptsächlich verwendet, wenn die zu untersuchende Sequenzen ähnlich lang sind und starke Sequenzhomologien erwartet werden
Algorithms start at the beginning of two sequences and add gaps to each sequence until the end of one of the sequences is reached
Local alignment
Ein lokales Alignment von zwei Sequenzen S,T ist ein globales Alignment von einer Teilsequenz von S und einer Teilsequenz von T -> d.h. zur Berechnung des optimalen lokalen Alignment zweier Sequenzen müssen die beiden Teilsequenzen gefunden werden, deren optimaler Alignment-Score maximal ist
Local Alignment algorithms find the region(s) of highest similarity between two sequences and build the alignment outward from there
PAM Matrix (Point Accepted Mutation Matrix)
ist eine mit PAM-Werten gefüllte Substitutionsmatrix, die in der Bioinformatik dazu verwendet wird, die Wahrscheinlichkeit einer Veränderung einer Sequenz zu bestimmen. Grundlage zur Erstellung einer PAM-Matrix sind statistisch erfasste Werte über Sequenzunterschiede
Je weiter sich Sequenzen auseinanderentwickeln, desto mehr Mutationen sammeln sich an
BLOSUM Matrix
ist eine evidenzbasierte Substitutionsmatrix, die für Sequenzalignment von Proteinen benutzt wird
verwendet einzelne Blöcke (ohne Lücken) innerhalb der Sequenzen von homologen Proteinen, die verglichen werden
Hidden Markov Model (HMM)
ist ein stochastisches Modell, in dem ein System durch eine Markow-Kette mit unbeobachteten Zuständen modelliert wird
Die Modellierung als Markow-Kette bedeutet, dass das System auf zufällige Weise von einem Zustand in einen anderen übergeht, wobei die Übergangswahrscheinlichkeiten nur jeweils vom aktuellen Zustand abhängen, aber nicht von den davor eingenommenen Zuständen. Außerdem wird angenommen, dass die Übergangswahrscheinlichkeiten über die Zeit konstant sind. Bei einem HMM werden jedoch nicht diese Zustände selbst von außen beobachtet; sie sind verborgen (englisch hidden). Stattdessen sind jedem dieser inneren Zustände beobachtbare Ausgabesymbole, sogenannte Emissionen, zugeordnet, die je nach Zustand mit gewissen Wahrscheinlichkeiten auftreten
Gen Scan
Ein Programm zur Identifizierung vollständiger Genstrukturen in genomischer DNA
Es ist ein GHMM-basiertes Programm, das verwendet werden kann, um die Position von Genen und ihrer Exon-Intron-Grenzen in genomischen Sequenzen von einer Vielzahl von Organismen vorherzusagen
Cis- Element / cis-wirkendes Element
ein bestimmter Abschnitt in der Erbinformation, der für die Regulation eines Gens eine Rolle spielt, das auf demselben DNA-Molekül liegt wie dieser (molekular betrachtet diesseits)
Dieser regulatorische Sequenzabschnitt muss weder RNA noch Protein kodieren und kann in Leserichtung vor oder nach der codierenden Sequenz des zugehörigen Gens liegen, oder auch innerhalb (auch in einem Intron)