Klausur Flashcards

1
Q

Was sind verschiedene Ansätze des next generation sequencing?

A
  • Paralleles Sequenzierne mehrer DNA-Stränge
  • Immer nur kurze Abschnitte sequenzieren
  • Sequenzierung ohne Apmlifikation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind die Probleme beim sequence assembly?

A
  • Viele kopien eines Gens
  • Mutationen
  • Fehler bei der sequenzierung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind Dot Matrix Plots?

A

Methode um zwei Sequenzen miteinander zu vergleichen indem man die beiden Sequenzen auf zwei Achsen aufträgt und bei übereinstimmungen einen Punkt macht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist der Windowed score Algorithmus? Welche Parameter gibt es?

A
  • Punktesystem für z.B Dot Matrix Plots

- Parameter: Window size,Step,threshold(Anzahl der nötigen Übereinstimmungen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist Alignment und wie geht man vor?

A

linearer Vergleich zweier Sequenzen mit einem Punktesystem für (Match,Mis-match & gap)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind die unterschiede zwischen global und local aliignment?

A

Global: Startet am Anfang zweier Sequenzen und geht bis zum ende

local: Die Regionen mit der höchsten Übereinstimmung werden gesucht und das Alignment startet von dort aus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind die zwei Arten des gap scoring system?

A

non-affine: Alle Gaps gleicher score

affine: erstes Gap fällt mehr ins gewicht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind die drei Schritte des dynamic programming?

A
  1. Problem → mehrer kleinere Probleme
  2. Kleinere Probleme optimal lösen
  3. Lösung für ursprüngliches Problem verwenden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist das PAM sytem?

A

Eine scoring methode die dem vergleich zweier Aminosäuresequzenzen dient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist das BLOSUM scoring?

A

Eine scoring methode die dem vergleich zweier Aminosäuresequzenzen dient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie wird das BLOSUM scoring berechnet?

A

BLOSUM verwendet einzelne Blöcke homologer Proteine in denen die Frequenzen verglichen werden. Es bezieht dabei auch die Wahrscheinlichkeiten von Änderungen mit ein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was bedeutet die Zahl hinter BLOSUM? (bsp. Blosum 62)

A

Gibt die Prozentzahl an wie sehr die Sequenzen miteinander übereinstimmen müssen bevor der score berechnet wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist query?

A

Eine Sequenz die genutzt wird um eine Datenbank zu durchsuchen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist subject?

A

Die Sequenz die in einer Datenbank gefunden wurde die bestimmte ähnlichkeiten mit der query aufweißt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

was bezeichnet man als hit?

A

Lokales alignment zwichen query und subject

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist BLAST?

A

Ein Algorithmus der Datenbanken auf Grund von alignments von kurzen Stücken durchsucht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wie geht BLAST vor?

A
  1. ) Teilt eingebene Sequenz in viele kurze Abschnitte(“Wörter”) ein die sich überlappen
  2. ) Vergleicht die “Wörter” auf Ähnlichkeiten mit anderen Sequenzen aus der Datenbank
  3. ) Bei Übereinstimungen werden die “Wörter” verlängert und auf weitere Übereinstimmung überprüft
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist das hidden Markov Modell?

A

Ein statistisches Modell auf der Basis von Übergangswahrscheinlichkeiten.

19
Q

Was ist Glimmer?

A

Ein Programm zum finden von Genen in Prokaryoten

20
Q

Auf was basiert Glimmer?

A

Auf dem Markov Modell

21
Q

Was bezeichnet man als Codon-Usage?

A

Das Phänomen, dass unterschiedliche Arten eine Andere Nutzung des genetischen Codes haben ( unterschiedliche Tripplet zur Synthese der gleichen AS)

22
Q

Was ist Genscan? Worauf basiert es?

A

Software zur vorhersage von Genstrukturen. Basiert auf Markov modell fünfter Ordung

23
Q

Woher weiß man, dass eine Sequenz codierend ist?

A

Die Wahrscheinlichkeit dafür, dass ein Sequenz codierend ist ergibt sich aus der Frequenz der Codons, aus denen die Frequenz besteht.

24
Q

Was sind mögliche Strategien zum finden von Genen?

A
  • Vorhanden seien von offenen Leserastern
  • Polyadenylierungssignale
  • Anwesenheit regulatorischer Elemente
  • Suche nach konservierten Regionen
25
Was sind die drei Arten von Baumdiagrammen die in der Phylogentik verwendet werden?
cladogram Phylogram Ultrametric tree
26
Was ist der unterschied zwischen einem Phylogram und einem Ultrametric tree?
Phylogramm → waagerecht: genetische differenz | Ultrametric tree → waagerecht: Zeit
27
Warum braucht man Computer für das aufstellen phylogentischer Stammbäume?
Da die Anzahl möglicher Bäume exponential mit der Anzahl der Taxa steigt
28
was sind die 5 Schritte beim Aufstellen eines phylogentischen Stammbaums?
1. Homologe Sequenzen finden 2. alignement (oft) 3. Aufstellen eines Baums 4. statistischer Test des Baums 5. Interpretationen aus dem Baum ziehen
29
In was für zwei Kategorien lassen sich Methoden zum erstellen eines Stammbaums einteilen?
Character-based → basieren auf alingment | Distance-based → Basieren auf den Anzahl unterschiedlicher AS/ Nukleotide in den Sequenzen
30
Was ist die p-distanz?
Gibt die prozentuale Ähnlichkeit zwischen zwei Sequenzen an
31
Wieso führt die p-Distanz zu einer Unterschätzung der Distanz?
Es wird nicht die absolute Zahl der Mutationen betrachtet (z.B Rückmutationen, mehrere Mutationen ein und der selben Base...)
32
Wann ist der Effekt der Unterschätzung der reellen Distanz am größten?
Bei Arten die nicht nahe Miteinander verwandt sind
33
Welche Distance-based Modells gibt es?
Minimum Evlution UPGMA Neighbor-Joining
34
Worauf basiert das Modell der Minimalen Evolution?
Der Baum mit der kürzesten Länge an branches (→ "Kantenlänge") ist der beste Baum
35
Was ist die Annahme auf der UPGMA basiert?
Evolutionsrate bleibt konstant
36
Wie geht UPGMA vor?
Die zwei ähnlichsten Sequenzen werden bestimmt und dann mit einer dritten verglichen. Diese drei werden wiederrum zusammengefasst und mit einer 4 verglichen...
37
Wie geht Neighbor-joining vor?
Geht von einem sternförmigen Baum aus, wo alle Taxa in der mitte verbunden sind. Paarweise werden die Taxa mit der geringsten genetischen Differenz zusammengefügt.
38
Was ist der Vorteil des Neighbor-joinings gegenüber UPGMA?
Geht nicht von einer konstanten Evolutionsrate aus
39
Welche character-based Methoden gibt es?
Parsimony Methode Maximum likelihood Bayesian inference
40
Was ist der beste Baum bei der Parsimony Methode?
Der Baum, welcher am wenigsten evolutionäre Events benötigt
41
Was ist der beste Baum bei der Maxiumum likelihood Methode?
Der beste Baum ist der mit der höchsten Wahrscheinlichkeit je nach evolutionärem Modell
42
Was ist Bootstrapp?
Eine statistische Methode zur Überprüfung phylogentischer Bäume
43
Wozu dienen Microarrys?
Zur Bestimmung relativer Änderung der Genexpression
44
Wie geht man bei der RNA-Sequenzierung fort (grob)?
Übersetzen der RNA in cDNA mittels reverser Transkriptase. Anschließend cDNA sequenzierung.