Failover-Cluster Flashcards

1
Q

Wie kann man Verfügbarkeit definieren?

A
  • ein System ist verfügbar, wenn es in der Lage ist seine Aufgaben zu erfüllen, für welche es vorgesehen ist
  • Verfügbarkeit ist die Wahrscheinlichkeit, dass ein System innerhalb eines spezifischen Zeitraums funktionstüchtig ist
  • Verfügbarkeit wird als Verhältnis von Downtime und Uptime eines Systems gemessen
  • Formel: Verfügbarkeit = Uptime / (Downtime + Uptime)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist die Definition von Hochverfügbarkeit?

A
  • ein System ist hochverfügbar, wenn eine Anwendung auch im Fehlerfall weiterhin verfügbar ist und ohne unmittelbaren menschlichen Eingriff weiter genutzt werden kann
  • der Anwender darf keine oder maximal eine kurze Unterbrechung wahrnehmen
  • Hochverfügbarkeit bezeichnet also die Fähigkeit eines Systems bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Weöche Hochverfügbarkeits-Klassen gibt es?

A
  • wird in 6 Klassen unterteilt
    1. AEC-0 = 99% (3,6 Tage)
    2. AEC-1 = 99,9% (8,76 Stunden)
    3. AEC-2 = 99,99% (52 Minuten)
    4. AEC-3 = 99,999% (5 Minuten)
    5. AEC-4 = 99,9999% (30 Sekunden)
    6. AEC-5 = 99,99999% (3 Sekunden)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist ein Cluster?

A
  • ein Cluster ist ein Zusammenschluss von zwei oder mehr Knoten, die bestimmte Dienste wie z.B. einen NFS oder einen Web-Server auch dann noch zur Verfügung stellen, wenn einer der Knoten ausfällt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist ein Knoten?

A
  • ein physikalischer oder virtueller Computer, der Teil eines Clusters ist, auf dem eine Clustersoftware läuft
  • virtuelle Computer müssen auf verschiedenen physikalischen Rechnern laufen, da andernfalls keine Redundanz gegeben wäre und ein SPOF besteht
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist DRBD?

A
  • Distributed Replicated Block Device
  • Open Source Software von Linbit
  • Stellt Geräte im System zur Verfügung, die als block device eingebunden werden können
  • dabei wird eine Partition von einem aktiven Knoten auf einen anderen passiven Knoten gespiegelt
  • ein Raid 1 über das Netzwerk mit TCP/IP
  • Teil des Linux Kernels
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist eine Ressource?

A
  • kann eine IP-Adresse, die Partition einer Festplatte oder ein Dienst wie z.B. ein Webserver sein, welche von der Clustersoftware verwaltet wird
  • es gibt einfache Ressourcen (primitive) oder Komplexe Ressourcen (Gruppen, Multi-State, Klone)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist ein Failover?

A
  • ein ungeplanter Wechsel zwischen zwei Knoten im Falle eines einseitigen Ausfalls
  • Ziel ist es die Dienste trotzdem verfügbar zu halten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist ein SPOF?

A
  • Singe Point of Failure
  • Systemkomponenten, die im Fehlerfall des Systems nicht mehr betriebsbereit sind
  • im Idealfall müssen so viele Komponenten wie möglich redundant ausgelegt sein, damit der SPOF so weit weg vom System ist wie möglich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist ein Split-Brain?

A
  • wenn die Verbindung zwischen zwei Knoten dauerhaft oder temporär getrennt ist
  • beide Knoten wissen nicht in welchem Status sich der jeweils andere befindet und denken sie wären der Master und verhalten sich als Master um den Dienst fortzusetzen
  • das kann zu Konsistenz-Problemen führen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist ein NFS?

A
  • Network File System
  • ermöglicht Zugriff auf Daten über ein Netzwerk
  • dabei werden die Dateisysteme von entfernten Rechnern auf dem lokalen Dateisystem zugeordnet (gemountet)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie ist ein Failover-Cluster aufgebaut?

A
  • besteht aus mindestens zwei Knoten
  • einer ist aktiv, einer passiv
  • auf dem aktiven laufen die Ressourcen
  • der passive läuft als Reserve-System
  • eine Clustersoftware überwacht den Status der einzelnen Knoten
  • die Festplatten beider Knoten werden über DRBD synchronisiert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was passiert wenn es ein Problem mit einem Knoten im Failover-Cluster gibt?

A
  • wenn auf dem aktiven Knoten ein Problem festgestellt wird, wird der passive Knoten zum aktiven Knoten hochgestuft und die Ressourcen werden auf dem Knoten gestartet
  • Dienste wie NFS oder Webserver können nach kurzer Unterbrechung weiter vom Client verwendet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist das Cluster-Management?

A
  • wird in zwei Komponenten unterteilt:
    1. Cluster Resource Management (CRM) -> Beispiel Pacemaker
    2. Cluster Communication Management (CCM) -> Beispiel Corosync
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist Pacemaker?

A
  • eine Open Source Clustersoftware, die auf Linux-Systemen für Ressourcenverwaltung in Clustern eingesetzt wird
  • Pacemaker empfängt im Zusammenspiel mit Corosync Informationen über mehrere Knoten in einem Cluster und greift im Fehlerfall ein
  • im Fehlerfall sorgt Pacemaker dafür, dass der passive Knoten zum aktiven Knoten hochgestuft wird und die Dienste darauf gestartet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist Corosync?

A
  • eine Open Source Software, die auf Linux-Systemen für die Kommunikation zwischen zwei oder mehreren Knoten im Cluster zuständig sind
  • stellt Schnittstellen und Funktionen zur Überwachung und Steuerung aller im Cluster befindlichen Knoten und Dienste zur Verfügung
  • Dadurch können die Knoten Nachrichten miteinander austauschen
17
Q

Welche Arten von Clustern gibt es?

A
  • es gibt Aktiv/Passiv Cluster und Aktiv/Aktiv Cluster
18
Q

Was ist ein Aktiv/Passiv-Cluster?

A
  • ein Knoten ist aktiv (Master) und stellt die Dienste zur Verfügung
  • ein Knoten ist passiv (Slave) und läuft als Reserve nebenbei
  • bei Ausfall des aktiven Knotens werden die Dienste auf dem Reserve-Knoten gestartet
19
Q

Was ist ein Aktiv/Aktiv-Cluster?

A
  • alle Knoten im Cluster sind aktiv
  • eine Clustersoftware kann für Loadbalancing eingesetzt werden und damit die Lastenverteilung für den angebotenen Dienst verteilen
  • ein Knoten sollte in der Lage sein, alle Dienste zu übernehmen
20
Q

Was sind Vorteile und Nachteile vom Aktiv/Passiv-Cluster?

A

Vorteile:

  1. Failover-Fall sorgt für keine Performance-Einbußen, weil beide Knoten in der Regel die gleiche Hardware haben
  2. einfache Konfiguration, schnell und sichere Lösung

Nachteile:

  1. Passiv-Knoten läuft nebenbei im Standby und liefert keine zusätzliche Performance, durch den Betrieb fallen weiter Kosten an
  2. im Failover-Fall sind die Dienste für die Dauer des Umschaltvorgangs nicht erreichbar
21
Q

Was sind die Vorteile und Nachteile vom Aktiv/Aktiv-Cluster?

A

Vorteile:

  1. durch die Verfügbarkeit von mehreren aktiven Knoten kann die Last auf beide Knoten verteilt werden
  2. bei kurzen Unterbrechungen gibt es in der Regel keine Ausfallzeiten, sondern erhöhte Sicherheit durch Redundanz

Nachteile:

  1. Schwieriger zu konfigurieren als der Aktiv/Passiv-Cluster
  2. Dienste können für Aktiv/Aktiv nicht geeignet sein (z.B. eine Datenbank wo es zu Konsistenz-Problemen kommen würde)
22
Q

Wie ist eine einfache Ressource aufgebaut?

A

Art Name Klassifizierung Provider Ressourcen-Agent Parameter
Beispiel:
primitive cluster_ip ocf:heartbeat:lpaddr \ params ip=”4.4.4.20” cidr_netmask=”24”

primitive -> Klassifizierung, einfache Ressource
cluster_ip -> Name der Ressource
ocf -> Open Cluster Framework, Art von Skript
heartbeat -> Provider
lpaddr -> Name vom Ressource Agent
\ -> Umbruch
params -> Schlüsselwort für Konfigurationsparameter