Failover-Cluster Flashcards
1
Q
Wie kann man Verfügbarkeit definieren?
A
- ein System ist verfügbar, wenn es in der Lage ist seine Aufgaben zu erfüllen, für welche es vorgesehen ist
- Verfügbarkeit ist die Wahrscheinlichkeit, dass ein System innerhalb eines spezifischen Zeitraums funktionstüchtig ist
- Verfügbarkeit wird als Verhältnis von Downtime und Uptime eines Systems gemessen
- Formel: Verfügbarkeit = Uptime / (Downtime + Uptime)
2
Q
Was ist die Definition von Hochverfügbarkeit?
A
- ein System ist hochverfügbar, wenn eine Anwendung auch im Fehlerfall weiterhin verfügbar ist und ohne unmittelbaren menschlichen Eingriff weiter genutzt werden kann
- der Anwender darf keine oder maximal eine kurze Unterbrechung wahrnehmen
- Hochverfügbarkeit bezeichnet also die Fähigkeit eines Systems bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten
3
Q
Weöche Hochverfügbarkeits-Klassen gibt es?
A
- wird in 6 Klassen unterteilt
1. AEC-0 = 99% (3,6 Tage)
2. AEC-1 = 99,9% (8,76 Stunden)
3. AEC-2 = 99,99% (52 Minuten)
4. AEC-3 = 99,999% (5 Minuten)
5. AEC-4 = 99,9999% (30 Sekunden)
6. AEC-5 = 99,99999% (3 Sekunden)
4
Q
Was ist ein Cluster?
A
- ein Cluster ist ein Zusammenschluss von zwei oder mehr Knoten, die bestimmte Dienste wie z.B. einen NFS oder einen Web-Server auch dann noch zur Verfügung stellen, wenn einer der Knoten ausfällt
5
Q
Was ist ein Knoten?
A
- ein physikalischer oder virtueller Computer, der Teil eines Clusters ist, auf dem eine Clustersoftware läuft
- virtuelle Computer müssen auf verschiedenen physikalischen Rechnern laufen, da andernfalls keine Redundanz gegeben wäre und ein SPOF besteht
6
Q
Was ist DRBD?
A
- Distributed Replicated Block Device
- Open Source Software von Linbit
- Stellt Geräte im System zur Verfügung, die als block device eingebunden werden können
- dabei wird eine Partition von einem aktiven Knoten auf einen anderen passiven Knoten gespiegelt
- ein Raid 1 über das Netzwerk mit TCP/IP
- Teil des Linux Kernels
7
Q
Was ist eine Ressource?
A
- kann eine IP-Adresse, die Partition einer Festplatte oder ein Dienst wie z.B. ein Webserver sein, welche von der Clustersoftware verwaltet wird
- es gibt einfache Ressourcen (primitive) oder Komplexe Ressourcen (Gruppen, Multi-State, Klone)
8
Q
Was ist ein Failover?
A
- ein ungeplanter Wechsel zwischen zwei Knoten im Falle eines einseitigen Ausfalls
- Ziel ist es die Dienste trotzdem verfügbar zu halten
9
Q
Was ist ein SPOF?
A
- Singe Point of Failure
- Systemkomponenten, die im Fehlerfall des Systems nicht mehr betriebsbereit sind
- im Idealfall müssen so viele Komponenten wie möglich redundant ausgelegt sein, damit der SPOF so weit weg vom System ist wie möglich
10
Q
Was ist ein Split-Brain?
A
- wenn die Verbindung zwischen zwei Knoten dauerhaft oder temporär getrennt ist
- beide Knoten wissen nicht in welchem Status sich der jeweils andere befindet und denken sie wären der Master und verhalten sich als Master um den Dienst fortzusetzen
- das kann zu Konsistenz-Problemen führen
11
Q
Was ist ein NFS?
A
- Network File System
- ermöglicht Zugriff auf Daten über ein Netzwerk
- dabei werden die Dateisysteme von entfernten Rechnern auf dem lokalen Dateisystem zugeordnet (gemountet)
12
Q
Wie ist ein Failover-Cluster aufgebaut?
A
- besteht aus mindestens zwei Knoten
- einer ist aktiv, einer passiv
- auf dem aktiven laufen die Ressourcen
- der passive läuft als Reserve-System
- eine Clustersoftware überwacht den Status der einzelnen Knoten
- die Festplatten beider Knoten werden über DRBD synchronisiert
13
Q
Was passiert wenn es ein Problem mit einem Knoten im Failover-Cluster gibt?
A
- wenn auf dem aktiven Knoten ein Problem festgestellt wird, wird der passive Knoten zum aktiven Knoten hochgestuft und die Ressourcen werden auf dem Knoten gestartet
- Dienste wie NFS oder Webserver können nach kurzer Unterbrechung weiter vom Client verwendet werden
14
Q
Was ist das Cluster-Management?
A
- wird in zwei Komponenten unterteilt:
1. Cluster Resource Management (CRM) -> Beispiel Pacemaker
2. Cluster Communication Management (CCM) -> Beispiel Corosync
15
Q
Was ist Pacemaker?
A
- eine Open Source Clustersoftware, die auf Linux-Systemen für Ressourcenverwaltung in Clustern eingesetzt wird
- Pacemaker empfängt im Zusammenspiel mit Corosync Informationen über mehrere Knoten in einem Cluster und greift im Fehlerfall ein
- im Fehlerfall sorgt Pacemaker dafür, dass der passive Knoten zum aktiven Knoten hochgestuft wird und die Dienste darauf gestartet werden