V5_Cluster Flashcards
Cluster
Eine Anzahl von vernetzten Computern, die von außen in vielen Fällen als ein Computer gesehen werden können.
Die einzelnen Cluster-Knoten sind untereinander über ein schnelles Netzwerk verbunden.
Ziel: Erhöhung der Rechenkapazität oder Erhöhung der Verfügbarkeit gegenüber einem einzelnen Computer.
Hochverfügbarkeitscluster
HA-Cluster dienen der Steigerung der Verfügbarkeit.
Tritt auf einem KNoten ein Fehler auf, werden die Dienste und Ressourcen dieses Clusters auf andere Clusterknoten migriert.
Clusterknoten
Eigenständiger Computer mit eigenem Betriebssystem und Applikationen
Heartbeat
Beim heartbeat benachrichtigen sich die Clusterknoten gegenseitig, dass sie immer noch betriebsbereit sind.
Ausbleiben mehrerer aufeinanderfolgender heartbeats eines Knotens: löst Fehlerbehandlungsmechanismen in den anderen Knoten aus.
Gründe für das Ausbleiben des Heartbeats:
- Verlorengegangene Nachrichten
- Exzessive Verzögerung der Nachrichten
- Ausfall des Netzwerkinterfaces.
- Ausfall des Clusterknotens
Netzwerkeinflüsse kann man minimieren indem man Netzwerkinterfaces und Switches redundant macht (mehrere)
Cluster Interconnect
Optionale Separierung des cluster-internen Netzwerks vom “öffentlichen” Netzwerk des Clusters.
- Verhindert störende externe Einflüsse auf cluster-interne Kommunikation.
Cluster Membership
Der Cluster braucht zu jeder Zeit unbedingt ein genaues und korrektes Bild der Membership.
Relevante Situationen:
- Ausfälle von Clusterknoten und Cluster-Ressourcen
- Initialer Start des Clusters.
- Hinzufügen oder Entfernen von Clusterknoten.
Quorum
Das Quorum des Clusters setzt sich zusammen aus den Knoten, die den operativen und einzig gültigen Teild es Clusters darstellen.
Ein Quorum in einem Cluster ist die Mindestzahl von Knoten (Mitgliedern), die funktionieren müssen, damit der Cluster arbeitet. Es hilft, Konsistenz zu bewahren und verhindert, dass isolierte Teile des Clusters falsche oder widersprüchliche Daten erzeugen. Bei einem Ausfall oder Netzwerkproblem stoppt der Cluster, wenn nicht genügend aktive Knoten für ein Quorum vorhanden sind, um Dateninkonsistenzen zu vermeiden.
Cluster Manager
ist die Steuer-Software des Clusters.
Überwachung der Knoten: Der Cluster-Manager überprüft regelmäßig den Status der Knoten im Cluster, um sicherzustellen, dass sie korrekt funktionieren. Steuerung der Arbeitslastverteilung: Der Cluster-Manager verteilt die Aufgaben und Ressourcen auf die Knoten im Cluster basierend auf verschiedenen Faktoren wie Kapazität, Auslastung und Prioritäten. Fehlerbehandlung: Wenn ein Knoten ausfällt, ist es die Aufgabe des Cluster-Managers, diesen Ausfall zu erkennen und die Aufgaben auf andere Knoten zu verlagern.
Cluster Information Base (CIB)
Zentrale Cluster Datenbank.
- Enthält alle Informationen über die aktuelle Konfiguration des Clusters.
- CIB ist auf jedem Knoten.
Cluster Resource Manager (CRM)
Verwaltet die CIB, behandelt alle ÄNderungen von clusterrelevanten Konfigurationsdaten.
Reagiert auf Events im Cluster..
Z.B. auf einen Ausfall eines Knotens -> versucht optimale Lösung zu finden um Cluster nicht zu belasten.
CRM ist Teil des Cluster Managers.
Überwachung der Ressourcen: Er hält den Überblick über die verfügbaren Ressourcen in einem Cluster und ihren Status. Ressourcenverwaltung: Er stellt sicher, dass Ressourcen (wie Speicher, CPU-Zeit, Netzwerkbandbreite etc.) den verschiedenen Aufgaben und Diensten im Cluster zugewiesen werden. Wiederherstellung nach Fehlern: Wenn ein Knoten oder eine Ressource ausfällt, ist der Cluster Resource Manager dafür verantwortlich, die Ressourcen neu zuzuweisen und den Cluster wieder in einen funktionierenden Zustand zu bringen.
Designated Coordinator
Der DC ist ein zugewiesene Rolle, die jeweils immer genau ein Clusterknoten innehat. Der DC ist der, Chef unter GLeichen”, hält die “Master-CIB”
- Entscheidet über Beitritts-Requests neuer Knoten.
- Cluster-Konfigurationsänderungen: zuerst im DC, welcher die Änderung dann in alle anderen Knoten propagiert (über das Messaging).
- Erste Aktion: Informiert alle Knoten über seine DC Ernennung.
- Propagiert ggf. seine CIB Änderungen rund um die Fehlersituation, um die Konsistenz der CIB sicherzustellen.
Cluster-Ressourcen
Auf Clusterebene verwaltete Dienste, Objekte wie (Cluster) IP Adressen, Partitionen.
Im Gegensatz zu den lokalen Resourcen der Clusterknoten.
Diese werden nicht auf Clusterebene verwaltet.
Local Resource Manager (LRM)
Der Local Resource Manager (LRM) ist eine Komponente eines Clusters, die auf jedem Knoten läuft. Seine Hauptaufgabe besteht darin, die lokalen Ressourcen zu verwalten, die auf diesem speziellen Knoten laufen. Wenn es Änderungen an den Ressourcen gibt, die durch den Cluster Resource Manager (CRM) angefordert werden, ist der LRM dafür verantwortlich, diese Änderungen durchzuführen. Der LRM fungiert also als eine Art Vermittler zwischen dem CRM und den lokalen Ressourcen auf jedem Knoten.
Resource Agents
Abstrahiert von den konkreten Details der Ressourcen.
Starten der Ressource oder des Dienstes: Der Resource Agent initialisiert und startet die Ressource oder den Dienst auf einem Knoten. Stoppen der Ressource oder des Dienstes: Der Resource Agent kann die Ressource oder den Dienst sicher stoppen, wenn sie nicht mehr benötigt wird oder wenn sie auf einen anderen Knoten verschoben werden soll. Überwachen der Ressource oder des Dienstes: Der Resource Agent prüft regelmäßig den Status der Ressource oder des Dienstes und meldet diesen an den Cluster Resource Manager. Wiederherstellen der Ressource oder des Dienstes: Wenn die Ressource oder der Dienst ausfällt oder ein Problem auftritt, ist der Resource Agent dafür verantwortlich, den Fehler zu beheben und die Ressource oder den Dienst wiederherzustellen.