- Nach dem TodNach dem Tod
Ursachenanalyse
Ausgabe:Am 9. Februar 2026 beeinträchtigte ein Problem mit der Netzwerksynchronisation in Verbindung mit einem gezielten Anstieg des Datenverkehrs vorübergehend die Verfügbarkeit virtueller Maschinen in der Region Frankfurt-2.
Zeitleiste (UTC)
9. Februar 2026 – 11:04 Uhr: Unbekannte, einmalige Überschwemmung beginnt
9. Februar 2026 - 11:07 Uhr: Erster Rechenknoten stürzt ab (pcb19)
9. Februar 2026 – 11:37 Uhr: Vorfall-/Statusseite erstellt
9. Februar 2026 – 12:04 Uhr: ARP-Eintrag läuft ab; Flooding wird gestoppt
9. Februar 2026 – 12:30 Uhr: VM-Evakuierung abgeschlossen; Umgebung stabilisiert sich
9. Februar 2026 – 16:32 Uhr: Kubernetes-Cluster vollständig wiederhergestellt
9. Februar 2026 – 20:09–20:16 Uhr: Wiederherstellung der Kunden-VM abgeschlossen
9. Februar 2026 – 21:09 Uhr: Vorfall abgeschlossen
Grundursache
Es gibt einen Zustand im Netzwerk-Workflow, bei dem der MAC-Eintrag von den Zugriffs-Switches (ToR) entfernt wird, während der entsprechende ARP-Eintrag auf dem Upstream-Gateway bis zu seinem natürlichen Ablauf aktiv bleibt.
Diese vorübergehende Inkonsistenz zwischen den Zuständen der Schicht 2 und der Schicht 3 kann zu unerklärlichen Unicast-Überflutungen innerhalb des betroffenen VLANs führen.
Unter normalen Verkehrsbedingungen hat diese Zustandsabweichung keine signifikanten Auswirkungen. In diesem Fall war der Server jedoch gleichzeitig einem massiven DDoS-Angriff ausgesetzt, was das Flooding-Verhalten verstärkte und zu weitreichender Recheninstabilität führte.
Maßnahmen
Implementieren Sie Mechanismen, um veraltete Netzwerk-Einträge bei Portänderungen umgehend zu löschen und so genaue Routing-Informationen zu gewährleisten.
Es wird ein automatisierter Prozess entwickelt, um Netzwerkeinträge zu löschen, wenn bestimmte Abhebungsereignisse auf zentralen Netzwerkgeräten auftreten.
Überprüfen Sie das Geräteverhalten im Zusammenhang mit statischen Bindungen und erkunden Sie alternative Konfigurationen, um die Synchronisierung der Netzwerkadresszuordnungen zu verbessern.
Die bestehenden Evakuierungsverfahren bewerten und anpassen, um sie mit den Prozessen zur Sicherung der Lagerintegrität und -wiederherstellung in Einklang zu bringen.
Verbesserung der Überwachungsfunktionen zur Erkennung abnormaler Verkehrszustände auf Netzwerksegmentebene, einschließlich Schwellenwerten für die Verkehrsrate und Systemzustandsindikatoren.
- GelöstGelöst
Wir freuen uns, Ihnen mitteilen zu können, dass die Teilstörung unserer Cloud- und DDoS-Schutzdienste in Frankfurt-2 behoben wurde. Sollten Sie dennoch weiterhin Probleme haben, zögern Sie bitte nicht, unser Support-Team zu kontaktieren. Wir helfen Ihnen gerne weiter und kümmern uns umgehend um Ihr Anliegen.
Wir wissen Ihre Geduld und Ihr Verständnis während dieses Vorfalls zu schätzen und danken Ihnen für Ihre Kooperation.
Eine formale Ursachenanalyse (Root Cause Analysis, RCA) wird derzeit erstellt und wird nach ihrer Fertigstellung veröffentlicht.Für weitere Unterstützung kontaktieren Sie bitte unser Support-Team unter support@gcore.com.
- ÜberprüfungÜberprüfung
Wir freuen uns, Ihnen mitteilen zu können, dass unser Entwicklungsteam eine Lösung implementiert hat, um den teilweisen Ausfall unserer Cloud- und DDoS-Schutzdienste in Frankfurt-2 zu beheben. Wir überwachen die Situation jedoch weiterhin genau, um eine stabile Leistung zu gewährleisten.
Wir werden Sie informieren, sobald wir bestätigt haben, dass das Problem vollständig behoben ist.
- IdentifizierungIdentifizierung
Wir haben das Problem identifiziert und arbeiten daran, die Ursache zu finden, um das Netzwerkproblem zu beheben.
- AnalyseAnalyse
Aktuell kommt es zu einer Teilstörung unserer Cloud- und DDoS-Schutzdienste, die sowohl unsere privaten als auch unsere öffentlichen Netzwerke betrifft. Dies kann zu vorübergehenden Ausfällen für Nutzer führen. Wir entschuldigen uns für die Unannehmlichkeiten und danken Ihnen für Ihr Verständnis und Ihre Geduld.
Wir werden Sie informieren, sobald weitere Informationen zum Stand der Bearbeitung vorliegen. Vielen Dank für Ihr Verständnis und Ihre Mitarbeit.

