Failover-Cluster Flashcards

Question 1

Q

Wie kann man Verfügbarkeit definieren?

Answer

A

ein System ist verfügbar, wenn es in der Lage ist seine Aufgaben zu erfüllen, für welche es vorgesehen ist
Verfügbarkeit ist die Wahrscheinlichkeit, dass ein System innerhalb eines spezifischen Zeitraums funktionstüchtig ist
Verfügbarkeit wird als Verhältnis von Downtime und Uptime eines Systems gemessen
Formel: Verfügbarkeit = Uptime / (Downtime + Uptime)

Question 2

Q

Was ist die Definition von Hochverfügbarkeit?

Answer

A

ein System ist hochverfügbar, wenn eine Anwendung auch im Fehlerfall weiterhin verfügbar ist und ohne unmittelbaren menschlichen Eingriff weiter genutzt werden kann
der Anwender darf keine oder maximal eine kurze Unterbrechung wahrnehmen
Hochverfügbarkeit bezeichnet also die Fähigkeit eines Systems bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten

Question 3

Q

Weöche Hochverfügbarkeits-Klassen gibt es?

Answer

A

wird in 6 Klassen unterteilt
1. AEC-0 = 99% (3,6 Tage)
2. AEC-1 = 99,9% (8,76 Stunden)
3. AEC-2 = 99,99% (52 Minuten)
4. AEC-3 = 99,999% (5 Minuten)
5. AEC-4 = 99,9999% (30 Sekunden)
6. AEC-5 = 99,99999% (3 Sekunden)

Question 4

Q

Was ist ein Cluster?

Answer

A

ein Cluster ist ein Zusammenschluss von zwei oder mehr Knoten, die bestimmte Dienste wie z.B. einen NFS oder einen Web-Server auch dann noch zur Verfügung stellen, wenn einer der Knoten ausfällt

Question 5

Q

Was ist ein Knoten?

Answer

A

ein physikalischer oder virtueller Computer, der Teil eines Clusters ist, auf dem eine Clustersoftware läuft
virtuelle Computer müssen auf verschiedenen physikalischen Rechnern laufen, da andernfalls keine Redundanz gegeben wäre und ein SPOF besteht

Question 6

Q

Was ist DRBD?

Answer

A

Distributed Replicated Block Device
Open Source Software von Linbit
Stellt Geräte im System zur Verfügung, die als block device eingebunden werden können
dabei wird eine Partition von einem aktiven Knoten auf einen anderen passiven Knoten gespiegelt
ein Raid 1 über das Netzwerk mit TCP/IP
Teil des Linux Kernels

Question 7

Q

Was ist eine Ressource?

Answer

A

kann eine IP-Adresse, die Partition einer Festplatte oder ein Dienst wie z.B. ein Webserver sein, welche von der Clustersoftware verwaltet wird
es gibt einfache Ressourcen (primitive) oder Komplexe Ressourcen (Gruppen, Multi-State, Klone)

Question 8

Q

Was ist ein Failover?

Answer

A

ein ungeplanter Wechsel zwischen zwei Knoten im Falle eines einseitigen Ausfalls
Ziel ist es die Dienste trotzdem verfügbar zu halten

Question 9

Q

Was ist ein SPOF?

Answer

A

Singe Point of Failure
Systemkomponenten, die im Fehlerfall des Systems nicht mehr betriebsbereit sind
im Idealfall müssen so viele Komponenten wie möglich redundant ausgelegt sein, damit der SPOF so weit weg vom System ist wie möglich

Question 10

Q

Was ist ein Split-Brain?

Answer

A

wenn die Verbindung zwischen zwei Knoten dauerhaft oder temporär getrennt ist
beide Knoten wissen nicht in welchem Status sich der jeweils andere befindet und denken sie wären der Master und verhalten sich als Master um den Dienst fortzusetzen
das kann zu Konsistenz-Problemen führen

Question 11

Q

Was ist ein NFS?

Answer

A

Network File System
ermöglicht Zugriff auf Daten über ein Netzwerk
dabei werden die Dateisysteme von entfernten Rechnern auf dem lokalen Dateisystem zugeordnet (gemountet)

Question 12

Q

Wie ist ein Failover-Cluster aufgebaut?

Answer

A

besteht aus mindestens zwei Knoten
einer ist aktiv, einer passiv
auf dem aktiven laufen die Ressourcen
der passive läuft als Reserve-System
eine Clustersoftware überwacht den Status der einzelnen Knoten
die Festplatten beider Knoten werden über DRBD synchronisiert

Question 13

Q

Was passiert wenn es ein Problem mit einem Knoten im Failover-Cluster gibt?

Answer

A

wenn auf dem aktiven Knoten ein Problem festgestellt wird, wird der passive Knoten zum aktiven Knoten hochgestuft und die Ressourcen werden auf dem Knoten gestartet
Dienste wie NFS oder Webserver können nach kurzer Unterbrechung weiter vom Client verwendet werden

Question 14

Q

Was ist das Cluster-Management?

Answer

A

wird in zwei Komponenten unterteilt:
1. Cluster Resource Management (CRM) -> Beispiel Pacemaker
2. Cluster Communication Management (CCM) -> Beispiel Corosync

Question 15

Q

Was ist Pacemaker?

Answer

A

eine Open Source Clustersoftware, die auf Linux-Systemen für Ressourcenverwaltung in Clustern eingesetzt wird
Pacemaker empfängt im Zusammenspiel mit Corosync Informationen über mehrere Knoten in einem Cluster und greift im Fehlerfall ein
im Fehlerfall sorgt Pacemaker dafür, dass der passive Knoten zum aktiven Knoten hochgestuft wird und die Dienste darauf gestartet werden

Question 16

Q

Was ist Corosync?

Answer

A

eine Open Source Software, die auf Linux-Systemen für die Kommunikation zwischen zwei oder mehreren Knoten im Cluster zuständig sind
stellt Schnittstellen und Funktionen zur Überwachung und Steuerung aller im Cluster befindlichen Knoten und Dienste zur Verfügung
Dadurch können die Knoten Nachrichten miteinander austauschen

Question 17

Q

Welche Arten von Clustern gibt es?

Answer

A

es gibt Aktiv/Passiv Cluster und Aktiv/Aktiv Cluster

Question 18

Q

Was ist ein Aktiv/Passiv-Cluster?

Answer

A

ein Knoten ist aktiv (Master) und stellt die Dienste zur Verfügung
ein Knoten ist passiv (Slave) und läuft als Reserve nebenbei
bei Ausfall des aktiven Knotens werden die Dienste auf dem Reserve-Knoten gestartet

Question 19

Q

Was ist ein Aktiv/Aktiv-Cluster?

Answer

A

alle Knoten im Cluster sind aktiv
eine Clustersoftware kann für Loadbalancing eingesetzt werden und damit die Lastenverteilung für den angebotenen Dienst verteilen
ein Knoten sollte in der Lage sein, alle Dienste zu übernehmen

Question 20

Q

Was sind Vorteile und Nachteile vom Aktiv/Passiv-Cluster?

Answer

A

Vorteile:

Failover-Fall sorgt für keine Performance-Einbußen, weil beide Knoten in der Regel die gleiche Hardware haben
einfache Konfiguration, schnell und sichere Lösung

Nachteile:

Passiv-Knoten läuft nebenbei im Standby und liefert keine zusätzliche Performance, durch den Betrieb fallen weiter Kosten an
im Failover-Fall sind die Dienste für die Dauer des Umschaltvorgangs nicht erreichbar

Question 21

Q

Was sind die Vorteile und Nachteile vom Aktiv/Aktiv-Cluster?

Answer

A

Vorteile:

durch die Verfügbarkeit von mehreren aktiven Knoten kann die Last auf beide Knoten verteilt werden
bei kurzen Unterbrechungen gibt es in der Regel keine Ausfallzeiten, sondern erhöhte Sicherheit durch Redundanz

Nachteile:

Schwieriger zu konfigurieren als der Aktiv/Passiv-Cluster
Dienste können für Aktiv/Aktiv nicht geeignet sein (z.B. eine Datenbank wo es zu Konsistenz-Problemen kommen würde)

Question 22

Q

Wie ist eine einfache Ressource aufgebaut?

Answer

A

Art Name Klassifizierung Provider Ressourcen-Agent Parameter
Beispiel:
primitive cluster_ip ocf:heartbeat:lpaddr \ params ip=”4.4.4.20” cidr_netmask=”24”

primitive -> Klassifizierung, einfache Ressource
cluster_ip -> Name der Ressource
ocf -> Open Cluster Framework, Art von Skript
heartbeat -> Provider
lpaddr -> Name vom Ressource Agent
\ -> Umbruch
params -> Schlüsselwort für Konfigurationsparameter