Einfuehrung Flashcards

1
Q

Definition of an algorithm (general)

A

An algorithm is a precise and finite description of a process consisting of elementary steps

Usually we also want: “and (c) solves a given problem”
– But algorithms can be wrong …

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definition of an algorithm (computer science)

A

An algorithm is a precise and finite description of a
computational process that is (a) given in a formal
language and (b) consists of elementary and machineexecutable steps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Euclidean Algorithm

A

Recipe: Given two integers a, b. As long as neither a nor b is 0, take the smaller of both and subtract it from the greater. If this yields 0, return the other number

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Euclidean Algorithm - proof ?

A
  • Assume our function “euclid” returns x
  • We write “b|a” if (a mod b)=0
    – We say: “b teilt a”
  • We define x|0 for any x
  • Note: if c|a and c|b and a>b ⇒ c|(a-b)
  • We prove the claim in two steps
    – We show that x is a common divisor
    – We prove that no greater common divisor
    can exis
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Algorithm properties

terminating?

A

An algorithm is called terminating if it stops after a finite number of steps for every finite input.

– We so-far required that the algorithm (specification) is finite; here we require that the time for execution is finit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Algorithm properties

deterministic?

A

deterministic if it always performs the same series of steps given the same input

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Exemplary questions

  • Give a definition of the concept “algorithm”
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Exemplary questions

  • What different types of complexity exist?
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Exemplary questions

  • Given the following algorithm …, analyze its worst-case
    time complexity
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Exemplary questions

  • The following algorithm … uses a double-linked list as basic
    set data structure. Replace this with an arra
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Exemplary questions

  • When do we say an algorithm is optimal for a given
    problem?
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Exemplary questions

  • How does the complexity of an algorithm depend on (a) the data structures it uses and (b) the complexity of the problem it solves?
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

What is a data structure

A
  • Algorithms work on input data, generate intermediate data,
    and finally produce result data
  • A data structure is the way how “data” is represented
    inside the machine
    – In memory or on disc (see Database course)
  • Data structures determine what algs may do at what cost
    – More precisely: … what a specific step of an algorithm costs
  • Complexity of algorithms is tightly bound to the data
    structures they use
    – So tightly that one often subsumes both concepts under the term
    “algorithm”
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie wurde die Doppelhelix gefunden?

Biophysikalische Daten

A

Biophysikalische Daten (Linus Pauling) –
es gibt mehrere Stränge (erste Vermutungen: 3)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie wurde die Doppelhelix gefunden?

Roentgenkristallografie

A

Roentgenkristallografie – helikale Struktur
(Rosalind Franklin)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie wurde die Doppelhelix gefunden?

Relative Häufigkeit der Basen

A

Relative Häufigkeit der Basen: %A=%T, %C=%G
(Erwin Chargaff)

17
Q

Wie wurde die Doppelhelix gefunden?

Biochemische Modelle

A

(Watson & Crick 1953)

18
Q

Das menschliche Genomprojekt

A
  • Erste Vorschläge 1985/6, gestartet 1990
  • 1,000 Wissenschaftler in 6 Ländern (inkl Teams in Berlin, Braunschweig, Jena)
    – 3 Milliarden US$
  • 1999: Chromosom 22, 2000: Chromosom 21
  • Erste “Arbeitskopie” aller Chromosome wurde 2001 veröffentlicht
  • Gleichzeitig: Sequenzierung durch private Firma (Celera Genomics)
  • 2006: letztes Chromosom (1)
19
Q

Kartierung & Sequenzierung
* Clone-Contig

A

– Benötigt eine genetische oder physikalische Karte
– Kleinere Bereiche zwischen Markern werden kloniert und sequenziert, dann auf den Chromosomen platziert

20
Q

Kartierung & Sequenzierung
* “shotgun” sequencing

A

– Gesamtsequenz wird direkt aus kurzen,
überlapppenden Sequenzen erstellt
– Komplexität wächst quadratisch
– Probleme bei sehr ähnlichen Sequenzen
(repeats)

21
Q

DNA-Sequenzierung
* Entwickelt in den

A

70er Jahren
(Sanger/Maxam-Gilbert)

22
Q

Sanger: Prinzip

A

Kettentermination
– Prinizip: Länge eines einzelsträngigen DNA-Molekuels lässt sich durch GelElektrophorese ablesen (von ca 10-1500 Basen)
– Eine einzelsträngige DNA wird komplementär synthetisiert
– Ein Teil der verfügbaren einzelnen Basen ist mit Farben markiert (d.h. A,C,G,T mit unterschiedlichen Farben)
– Nach Einbau eines farbigen Nukleotids wird die Reaktion abgebrochen

23
Q

Einzelzellsequenzierung

A

Standardsequenziermethoden benötigen große Mengen an DNA (z.T. mehrere Millionen Zellen)
– Problem: begrenztes (Patienten-)Material; Heterogenität
– Zusätzliches Problem: uniforme Amplifizierung des Materials
* Mikrofluidik-Plattformen separieren einzelne Zellen für DNA/RNA-Sequenzierung
– Fluidigm:https://www.youtube.com/watch?v=Yg8yEeKoB2Q
* Erlauben neue Forschungsfragen
– Tumor-Heterogeneität
– Zelltypspezifikation in der Entwicklung Neues internationales Konsortium: Human Cell Atlas

Aktueller Stand: Drop-seq
* Tausende von Zellen, aber:
je mehr Zellen, desto weniger Sequenzen pro Zelle

24
Q

Das zentrale Dogma der Molekularbiologie

A

Hauptaussage: Information kann nicht von Protein zu Protein oder zurück zu
DNA/RNA übertragen werden

Führte oft zu einer engen Sichtweise:
– DNA als Informationsträger,
– RNA als Botenstoff,
– Protein als Funktionsträger (“ein Gen, ein Protein”)

25
Q

Menschen wie viele tRNA Gene?

A

500 tRNA-Gene

26
Q

Identifikation protein-codierender Gene

A
  • Erste Analysen des menschlichen Genoms
    konzentrierten sich auf die Identifikation von
    Proteinen durch
    – Vorhersage von codierenden Bereichen anhand
    der Triplettfrequenzen (“Leserahmen”)
    – Vergleichende Genomik (Konservierung)
    – Transkribierte Bereiche (detektierte RNAs)
  • 2001 initial draft
    – 26,588 + ~12,000 Gene (Celera)
    – 30,000 - 40,000 (International Consortium)
27
Q

Alternatives Spleissen

A

Alternative splicing, or alternative RNA splicing, or differential splicing, is an alternative splicing process during gene expression that allows a single gene to code for multiple proteins. In this process, particular exons of a gene may be included within or excluded from the final, processed messenger RNA (mRNA) produced from that gene.[1] This means the exons are joined in different combinations, leading to different (alternative) mRNA strands. Consequently, the proteins translated from alternatively spliced mRNAs usually contain differences in their amino acid sequence and, often, in their biological functions

28
Q

Das menschliche Genome enthält ? Gene

A

Das menschliche Genome enthält ~21,000 Gene