Klausur Flashcards

1
Q

Was sind verschiedene Ansätze des next generation sequencing?

A
  • Paralleles Sequenzierne mehrer DNA-Stränge
  • Immer nur kurze Abschnitte sequenzieren
  • Sequenzierung ohne Apmlifikation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind die Probleme beim sequence assembly?

A
  • Viele kopien eines Gens
  • Mutationen
  • Fehler bei der sequenzierung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind Dot Matrix Plots?

A

Methode um zwei Sequenzen miteinander zu vergleichen indem man die beiden Sequenzen auf zwei Achsen aufträgt und bei übereinstimmungen einen Punkt macht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist der Windowed score Algorithmus? Welche Parameter gibt es?

A
  • Punktesystem für z.B Dot Matrix Plots

- Parameter: Window size,Step,threshold(Anzahl der nötigen Übereinstimmungen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist Alignment und wie geht man vor?

A

linearer Vergleich zweier Sequenzen mit einem Punktesystem für (Match,Mis-match & gap)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind die unterschiede zwischen global und local aliignment?

A

Global: Startet am Anfang zweier Sequenzen und geht bis zum ende

local: Die Regionen mit der höchsten Übereinstimmung werden gesucht und das Alignment startet von dort aus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind die zwei Arten des gap scoring system?

A

non-affine: Alle Gaps gleicher score

affine: erstes Gap fällt mehr ins gewicht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind die drei Schritte des dynamic programming?

A
  1. Problem → mehrer kleinere Probleme
  2. Kleinere Probleme optimal lösen
  3. Lösung für ursprüngliches Problem verwenden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist das PAM sytem?

A

Eine scoring methode die dem vergleich zweier Aminosäuresequzenzen dient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist das BLOSUM scoring?

A

Eine scoring methode die dem vergleich zweier Aminosäuresequzenzen dient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie wird das BLOSUM scoring berechnet?

A

BLOSUM verwendet einzelne Blöcke homologer Proteine in denen die Frequenzen verglichen werden. Es bezieht dabei auch die Wahrscheinlichkeiten von Änderungen mit ein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was bedeutet die Zahl hinter BLOSUM? (bsp. Blosum 62)

A

Gibt die Prozentzahl an wie sehr die Sequenzen miteinander übereinstimmen müssen bevor der score berechnet wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist query?

A

Eine Sequenz die genutzt wird um eine Datenbank zu durchsuchen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist subject?

A

Die Sequenz die in einer Datenbank gefunden wurde die bestimmte ähnlichkeiten mit der query aufweißt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

was bezeichnet man als hit?

A

Lokales alignment zwichen query und subject

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist BLAST?

A

Ein Algorithmus der Datenbanken auf Grund von alignments von kurzen Stücken durchsucht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wie geht BLAST vor?

A
  1. ) Teilt eingebene Sequenz in viele kurze Abschnitte(“Wörter”) ein die sich überlappen
  2. ) Vergleicht die “Wörter” auf Ähnlichkeiten mit anderen Sequenzen aus der Datenbank
  3. ) Bei Übereinstimungen werden die “Wörter” verlängert und auf weitere Übereinstimmung überprüft
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist das hidden Markov Modell?

A

Ein statistisches Modell auf der Basis von Übergangswahrscheinlichkeiten.

19
Q

Was ist Glimmer?

A

Ein Programm zum finden von Genen in Prokaryoten

20
Q

Auf was basiert Glimmer?

A

Auf dem Markov Modell

21
Q

Was bezeichnet man als Codon-Usage?

A

Das Phänomen, dass unterschiedliche Arten eine Andere Nutzung des genetischen Codes haben ( unterschiedliche Tripplet zur Synthese der gleichen AS)

22
Q

Was ist Genscan? Worauf basiert es?

A

Software zur vorhersage von Genstrukturen. Basiert auf Markov modell fünfter Ordung

23
Q

Woher weiß man, dass eine Sequenz codierend ist?

A

Die Wahrscheinlichkeit dafür, dass ein Sequenz codierend ist ergibt sich aus der Frequenz der Codons, aus denen die Frequenz besteht.

24
Q

Was sind mögliche Strategien zum finden von Genen?

A
  • Vorhanden seien von offenen Leserastern
  • Polyadenylierungssignale
  • Anwesenheit regulatorischer Elemente
  • Suche nach konservierten Regionen
25
Q

Was sind die drei Arten von Baumdiagrammen die in der Phylogentik verwendet werden?

A

cladogram
Phylogram
Ultrametric tree

26
Q

Was ist der unterschied zwischen einem Phylogram und einem Ultrametric tree?

A

Phylogramm → waagerecht: genetische differenz

Ultrametric tree → waagerecht: Zeit

27
Q

Warum braucht man Computer für das aufstellen phylogentischer Stammbäume?

A

Da die Anzahl möglicher Bäume exponential mit der Anzahl der Taxa steigt

28
Q

was sind die 5 Schritte beim Aufstellen eines phylogentischen Stammbaums?

A
  1. Homologe Sequenzen finden
  2. alignement (oft)
  3. Aufstellen eines Baums
  4. statistischer Test des Baums
  5. Interpretationen aus dem Baum ziehen
29
Q

In was für zwei Kategorien lassen sich Methoden zum erstellen eines Stammbaums einteilen?

A

Character-based → basieren auf alingment

Distance-based → Basieren auf den Anzahl unterschiedlicher AS/ Nukleotide in den Sequenzen

30
Q

Was ist die p-distanz?

A

Gibt die prozentuale Ähnlichkeit zwischen zwei Sequenzen an

31
Q

Wieso führt die p-Distanz zu einer Unterschätzung der Distanz?

A

Es wird nicht die absolute Zahl der Mutationen betrachtet (z.B Rückmutationen, mehrere Mutationen ein und der selben Base…)

32
Q

Wann ist der Effekt der Unterschätzung der reellen Distanz am größten?

A

Bei Arten die nicht nahe Miteinander verwandt sind

33
Q

Welche Distance-based Modells gibt es?

A

Minimum Evlution
UPGMA
Neighbor-Joining

34
Q

Worauf basiert das Modell der Minimalen Evolution?

A

Der Baum mit der kürzesten Länge an branches (→ “Kantenlänge”) ist der beste Baum

35
Q

Was ist die Annahme auf der UPGMA basiert?

A

Evolutionsrate bleibt konstant

36
Q

Wie geht UPGMA vor?

A

Die zwei ähnlichsten Sequenzen werden bestimmt und dann mit einer dritten verglichen. Diese drei werden wiederrum zusammengefasst und mit einer 4 verglichen…

37
Q

Wie geht Neighbor-joining vor?

A

Geht von einem sternförmigen Baum aus, wo alle Taxa in der mitte verbunden sind.
Paarweise werden die Taxa mit der geringsten genetischen Differenz zusammengefügt.

38
Q

Was ist der Vorteil des Neighbor-joinings gegenüber UPGMA?

A

Geht nicht von einer konstanten Evolutionsrate aus

39
Q

Welche character-based Methoden gibt es?

A

Parsimony Methode
Maximum likelihood
Bayesian inference

40
Q

Was ist der beste Baum bei der Parsimony Methode?

A

Der Baum, welcher am wenigsten evolutionäre Events benötigt

41
Q

Was ist der beste Baum bei der Maxiumum likelihood Methode?

A

Der beste Baum ist der mit der höchsten Wahrscheinlichkeit je nach evolutionärem Modell

42
Q

Was ist Bootstrapp?

A

Eine statistische Methode zur Überprüfung phylogentischer Bäume

43
Q

Wozu dienen Microarrys?

A

Zur Bestimmung relativer Änderung der Genexpression

44
Q

Wie geht man bei der RNA-Sequenzierung fort (grob)?

A

Übersetzen der RNA in cDNA mittels reverser Transkriptase. Anschließend cDNA sequenzierung.