Phylogenetic Analysis Flashcards

1
Q

Was sind “leaves”,”nodes”,”root” und “branches”? In einem Stammbaum

A
Leave= sind die Zweigenden
Nodes= die Abzweigungen
Branches= die Äste
Root= Vorfahr
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist das Newick Format der Stammbäume?

A

Das klassische Eckige Format

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist der Unterschied zwischen true und inferred tree?

A

True ist der Evolutionär richtige und inferred ist der nach Daten richtige, sie müssen aber nicht immer das gleiche sein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind die 5 Schritte um einen phylogenetischen Stammbaum zu bauen?

A
  1. Homologs finden
  2. Multiple sequence alignment
  3. Building Tree
  4. Statistical assessment of a tree
  5. Viewing a tree and drawing conclusions
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie findet man die Sequence similarity raus?

1.Schritt

A

Mit Blast Databases wie NCBI/PFAM durchsuchen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist der Unterschied zwischen einem Gene Tree und einem Species Tree?

A

Nur weil ein Gen sich ändert heisst das nicht dass sich direkt die ganze Art aufteilt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie geht man Schritt 2. Multiple Sequence Alignment an?

A
  • mit Dynammic Programming (No nach S)
  • Progressive Alignment
  • interative Alignment
  • Statistical Modeling
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist das Problem des multiple dynamic programming?

Was ist die Lösung dafür?

A

Die Zeit, 8 Sequenzen mit der länge 100 würden 81 Jahre dauern
Lösung: Progressive Alignments

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie funktioniert progressive Alignment?

Worauf muss man achten?

A

Es Alignt die engsten Verwandten Sequenzen und added dann nach und nach die weniger verwandten Sequenzen => Anfangssequenz muss stimmen, sonst Fehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie heisst das schnellste Progressive Alignment Programm?

A

MAFFT (ClustalW/T-Coffee)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie funktioniert das progressive Alignment Programm ClustalW?

A

Mit einem neighbour Joining tree (distance Matrix)

Das Alignment geschieht Paarweise, also an beide Seiten wird eine neue Sequenze gesetzt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Unterschied ziwschen Chracter-based und distance-based Methods im 3.Schritt, der Tree Erstellung?

A

Character based nutzen die Sequenz, also jeden einzelnen Character

Distance-based nutzen paarweise die verschiedenen Buchstaben, betrachten also nicht die Sequenz als Ganzes und benutzen die entstehende Matrix

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist eine p-distance?

A

Die durchschnittliche Unterschieldichkeit der betrachteten Sequenzen
(Anzahl Unterschiedliche Nukleotide geteilt durch Gesamtanzahl an betrachteten Nukleotiden)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist das Gute an Clustering algorithms, was das schlechte?

A

Gut: Geschwindigkeit
Schlecht: Singulary trees die Sternförmig und dadurch schwer vergleichbar sind, außerdem bestimmt der algorithmus die Tree criterions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie funktionieren optimality approaches?

A

Entweder mit Character oder Distance criterions.

Criterion (zb minimum branch lengths, fewest number of events, etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist bei der Distance Method zu beachten?

A

Man nimmt an das jede Veränderung direkt kam und nur 1 mal

Falls fehlerhaft kann der branch ins negative gehen

17
Q

Was ist das Kriterium, was die Vor- und Nachteile von Minimum Evolution?

A

Distances/Optimallity criterion
Der Tree mit der geringsten Gesamtlänge an Ästen wird ausgewählt

Pro:

  • objektiv-vergleichbar
  • schneller als Character based

Kontra:

  • Informationsverlust, weil Nukleotide in Distances umgewandelt werden
  • langsamer als Cluster
18
Q

Was ist das Kriterium, was die Vor- und Nachteile von Clustering Methoden (UPGMA und NJ)?

A

Distance und Cluster
KEIN Kriterium

Pro

  • fastest methods
  • therefore good for large datasets

Kontra
-Similarity und relatinship sind nicht zwangweise das gleiche, also kommt nicht zwangsweise ien evolutionary tree heraus

19
Q

Wovon geht UPGMA aus?

Wie funktioniert es?

A

Von einer constant molecular clock (rate of evolution)

nimmt die 2 Ähnlichsten, bildet einen Wert der dann mit dem dritten verglichen wird usw..

20
Q

Wie funktioniert NJ?

A

Sternförmige Anordnung, startet also nicht mit den 2 Ähnlichsten

21
Q

Was ist das Kriterium, was die Vor- und Nachteile von Parsimony Methods?

A

Criterion/Character

Kriterium:
Der tree mit den wenigsten SUbstitutionen etc ist der richtige

Pro:

  • simple, intuitive and logical
  • can be used on Genes and Phäno

Kontra:

  • Kann durch viele Events verfälscht werden, zb 2 Substitutionen ergeben Urzustand
  • langsamer
22
Q

Was ist das Kriterium, was die Vor- und Nachteile von Maximum Likelihood?

A

Charakter/Creiterion

Modell liegt zu Grunde
Zahlen x Modelprobability

Pro:
-most consistent

Kontra:

  • nicht so intuitiv
  • Kann verfälscht werden durch homoplasy (soppelsubstitution)
  • wenn Modell falsch dann tree falsch
  • sehr langsam
23
Q

Was ist Homoplasy?

A

Mehrere Nukleotid Events die wieder beim Ausgangszustand enden!

24
Q

Was ist das Kriterium, was die Vor- und Nachteile von Bayesian Inference?

A

Basiert auf Bayes’ theorem+

Pro:

  • berechnet die phylogenetische unsicherheit
  • sehr komplexe Modelle darstellbar
25
Q

Welches ist der meiste, in Schritt 4., genutzte statistische Test um einen erstellten Tree zu testen?
Wie funktioniert er?

A

Bootstrap:
Die kleine Zahl an den branches in Prozent, wie oft kam das Ergebnis raus wenn man Statistisch random Schritte wiederholt (ist es realistisch?)

26
Q

Was sind die größten Probleme der Phylogenetischen Analyse?

A

Einige Genevents sind schwer einzubeziehen (unequal crossing over, Viren etc.)