Failover-Cluster Flashcards
Was ist die Definition von Verfügbarkeit?
Ein System ist in der Lage Aufgaben zu erfüllen, mit denen es Beauftragt wurde -> Formel: Downtime / Downtime + Uptime in einem Jahr
Was ist die Definition von Hochverfügbarkeit?
Fähigkeit eines Systems, bei Ausfall einer seiner Komponenten, uneingeschränkten Betrieb zu gewährleisten
- ohne manuellen Eingriff
- Anwender merkt keine oder nur minimale Unterbrechung
Welche Hochverfügbarkeitsklassen gibt es?
6 Stück AEC-0 bis AEC-5 AEC-0 99% Verfügbarkeit pro Klasse eine Nachkomma-9 mehr - realistisch ist 0-1 erreichbar mit normalem Aufwand
Was ist die Definition von Cluster?
- Zusammenschluss von zwei oder mehreren Knoten, die einen bestimmten Dienst wie NFS oder Web-Server etc. zur Verfügung stellen, auch wenn ein oder mehrere Knoten ausfallen
Was ist ein SPOF und wie vermeidet man ihn?
- SPOF = Single point of Failure
- Systemkomponenten, die im Fehlerfall das System unnutzbar machen
- Knoten sollten verschiedene physikalische Maschinen sein
- möglichst viele Komponenten mit zentralen Funktionen für das System redundant machen
- es gibt immer einen SPOF wenn man weit genug geht (z.B. Router oder Internetleitung)
Was ist DRBD?
- Distributed Replicated Block Device
- im Linux Kernel enthalten
- Open Source Software von Linbit, ermöglicht TCP/IP-Raid 1
- Partition wird vom aktiven Knoten auf den passiven Knoten gespiegelt
Welche Raid Level sind besonders interessant?
- Raid 1: Mirroring -> Festplatte A auf B gespiegelt, daher nur 50% des Platzes nutzbar
- SPOF durch den Raid Controller
- Schreiben gleich schnell, lesen kann schneller sein (bei richtigem Controller)
- Raid 5: 5 Platten mit einem Hot-Spare
- jede Platte hat ein Paritätsteil von einer anderen Platte -> 5 Platten optimal für die Nutzung des Bruttoplatzes, je weniger Platten desto mehr Platz geht für Parität verloren
Was ist ein Knoten?
- physikalischer oder virtueller Computer, der Teil eines Clusters ist
- nur sinnvoll auf unterschiedlichen physikalischen Rechnern, wegen SPOF
Was ist eine Ressource?
- alles was von der Clustersoftware verwaltet wird, das kann eine IP-Adresse, die Partition einer Festplatte oder Dienst wie ein Web-Server sein
Was ist ein Failover?
- ein ungeplanter Wechsel zwischen zwei Knoten bei einem einseitigem Ausfall
- Ziel ist trotz Ausfall die Dienste verfügbar zu halten
Was ist ein Split Brain?
- Verbindung von zwei Knoten ist getrennt, aber beide halten sich für den aktiven Knoten
- kann zu inkonsistenten Zuständen führen
- STONITH
- mit 3 Instanz zu beheben, die die beiden Knoten überwacht und Mehrheitsentscheidungen ermöglicht
Was ist Clustermanagement?
- Cluster Resource Management (CRM) -> mit Pacemaker
2. Cluster Communication Management (CCM) -> mit Corosync
Was ist Pacemaker?
- Open Source
- empfängt im Zusammenspiel mit Corosync Informationen über mehrere Knoten in einem Cluster, überwacht Ressourcen und greift im Fehlerfall ein
- sorgt im Fehlerfall dafür, dass der passive zum aktiven Knoten hochgestuft wird und die Dienste dort gestartet werden
Was ist Corosync?
- Open Source
- Kommunikation zwischen zwei Knoten in einem Cluster
- Schnittstellen und Funktionen zur Überwachung und Steuerung von Knoten und Dienste (Heartbeat etc.)
Was ist ein aktiv/passiv Cluster?
- ein Knoten aktiv, Master, stellt Dienste zur Verfügung
- ein Knoten passiv, Slave, läuft als Reserve nebenbei
- bei Ausfall des aktiven Knoten werden die Dienste auf dem passiven Knoten gestartet