DEV Community

Uhltak Therestismysecret
Uhltak Therestismysecret

Posted on

Proxmox HA-Cluster: Split-Brain verhindern und Quorum richtig konfigurieren - Eine wichtige Übung für Serververantwortliche im Homelab

Hook-Einleitung

Haben Sie jemals einen Proxmox-Cluster in Ihrem Homelab gehabt, bei dem plötzlich nur noch eine Maschine startete, obwohl sie als redundante Ausfallsicherung konfiguriert war? Oder haben Sie erlebt, dass zwei Server gleichzeitig versucht haben, den primären Knoten desClusters zu starten und dadurch den Cluster in einen sogenannten "Split-Brain"-Zustand gebracht haben? Dies ist alles andere als schön und kann zu einem absoluten Chaos im Laufe der Zeit führen.

Deshalb werden wir in diesem Artikel auf drei Dinge eingehen, die Sie verstehen sollten, um Ihr Proxmox HA-Cluster erfolgreich zu konfigurieren und um Split-Brain-Szenarien zu vermeiden.

Verständnis der HA-Cluster-Konfiguration

Bevor wir in die Tiefe gehen, sollten wir wissen, was ein HA-Cluster im Allgemeinen ist. Ein HA-Cluster ist eine Gruppe von Servern, die miteinander kommunizieren und gemeinsam eine Last tragen. Im Falle von Proxmox ist dies wichtig, um die Verfügbarkeit von virtuellen Maschinen sicherzustellen.

Ein wichtiger Aspekt bei der Konfiguration eines HA-Clusters ist die Wahl des Quorums. Im Allgemeinen wird das Quorum auf dem Node mit der höchsten ID bestimmt. Beim Start des Clusters muss der Knoten mit der höchsten ID automatisch zum primären Knoten werden, um sicherzustellen, dass der Cluster ordnungsgemäß funktioniert.

Im Folgenden sehen wir das Beispiel eines Proxmox-Clusters mit drei Knoten:
Name | ID | Quorum
-----|----|-------
Knoten 1 | 1 | 4
Knoten 2 | 2 | 2
Knoten 3 | 3 | 6

Im hier beschriebenen Beispiel ist Knoten 1 der primäre Knoten.

Beispiel: Wie konfiguriert man das Quorum in Proxmox?

Um nun das Quorum auf Ihrem Proxmox-HA-Cluster zu konfigurieren, müssen Sie den Knoten mit der höchsten ID als primären Knoten festlegen. Dazu müssen Sie den Befehl pvesm status ausführen und überprüfen, auf welchem Knoten sich die virtuellen Maschinen befinden. Anschließend müssen Sie das Parameter quorum des primären Knotens entsprechend anpassen.

Sie können dies tun, indem Sie dem Betriebssystem des Knotens mit der höchsten ID, also Knoten 1 im oben gezeigten Beispiel, den Parameter quorum direkt hinzufügen oder, wenn der Knoten mit der höchsten ID nicht auf das Betriebssystem zugreifen kann, verwenden Sie den Proxmox-Befehl pvesm set-quorum und die Quorum-IDs der Knoten einpflegen. Um dies zu tun können Sie folgenden Befehl in der Proxmox-Weboberfläche ausführen:

# Sie haben 3 Nodes: pve1, pve2 und pve3 (ID: 1, 2 und 3)
pvesm set-quorum Quorum=6 pve1-1
Enter fullscreen mode Exit fullscreen mode

Im obigen Beispiel ist pve1-1 der Name des Knotens mit der höchsten ID. Der Wert Quorum=6 stellt das gewünschte Quorum dar, sodass Quorum beim Start des Clusters auf 6 gesetzt wird.

Hinweis: Stellen Sie sicher, dass Quorum auf den verbleibenden Knoten (im Beispiel pve1, pve2) und damit auf die verbleibenden Instanzen der HA-Gruppe gesetzt ist und der Wert kleiner ist als für pve1.

Häufige Fehler und Lösungen

Ein häufiges Problem, mit dem Sie sich bei der Konfiguration Ihrem HA-Clusters auseinandersetzen müssen, ist die falsche Einrichtung des Quorums oder das Fehlen dieses wichtigen Parameters. Dies kann dazu führen, dass der Cluster sich in ein nicht vorhersehbares Zustand befindet und die virtuellen Maschinen fehlverhalten oder nicht starten.

Lösung

Um dies zu vermeiden, müssen Sie sicherstellen, dass alle Knoten des Clusters korrekt konfiguriert sind, indem Sie die Quorum-IDs auf alle Knoten des Clusters anpassen und das Quorum so einrichten, dass es auf dem Knoten mit der höchsten ID im Falle des Startes des Cluster aktiviert wird. Dazu müssen Sie das pvesm set-quorum-Tool verwenden.

Häufige Fragen und Antworten

Häufig gestellte Fragen zu HA-Clusters und Quorum:
Frage 1: Was passiert, wenn ich meine HA-Cluster konfiguriert habe und der Cluster fehlschlägt?
Antwort 1: Bei einem fehlerhaften Clusterstart führt dies zu einem Angriffszeitpunkt. Daher ist es wichtig die genaue Konfiguration beziehungsweise überprüfung der HA-Gruppe auf ihren korrekten Status zu vergewissern.

Ein guter Tipp im Umgang mit HA-Clusters ist, dass Sie immer einen separaten Server oder Knoten für die Wartung des Clusters bereit halten. Dieser sollte nicht in die Hauptlast des Clusters eingeschlossen sein und für den Fall eines Fehlers nur dann aktiviert werden, wenn ein Knoten ausfällt, damit der Cluster nicht in einen Split-Brain-Zustand geraten kann und Sie Ihren Cluster erfolgreich konfigurieren können, um sicherzustellen, dass Ihre virtuellen Maschinen immer verfügbar sind.

Fazit

Die Einrichtung eines Proxmox HA-Clusters setzt eine sorgfältige Planung und Konfiguration voraus. Das korrekte Verständnis und Anwenden von Quorum-Konfiguration ist von entscheidender Bedeutung, um sicherzustellen, dass der Cluster nach einem vorübergehenden Ausfall eines der Knoten automatisch wiederhergestellt wird.

Damit Sie Ihre Proxmox-HA-Cluster so effizient wie möglich konfigurieren können, ist es wichtig, die Schritte und Konfigurationen, die wir Ihnen in diesem Artikel gezeigt haben, genau zu befolgen. Indem Sie dies tun, können Sie sicherstellen, dass Ihr Cluster robust und zuverlässig ist und Ihre virtuellen Maschinen, die in Ihrem Proxmox-Cluster laufen, immer verfügbar sind.

Top comments (0)