Gcore - Protection contre les attaques DDoS dans le cloud | Détails de l'incident Frankurt-2 – Détails de l'incident

Tous les systèmes sont opérationnels

Protection contre les attaques DDoS dans le cloud | Détails de l'incident Frankurt-2

Résolu
Panne partielle
Signalé le il y a 26 joursA duré environ 16 heures
Mises à jour
  • Postmortem
    Postmortem

    Analyse des causes profondes

    Problème:

    Le 9 février 2026, un problème de synchronisation réseau, combiné à une augmentation ciblée du trafic, a temporairement affecté la disponibilité des machines virtuelles dans la région de Francfort-2.

    Chronologie (UTC)

    • 9 février 2026 - 11h04 : Début d'une inondation unicast inconnue

    • 9 février 2026 - 11h07 : Le premier nœud de calcul plante (pcb19)

    • 9 février 2026 - 11h37 : Création de la page d'incident/d'état

    • 9 février 2026 - 12h04 : L’entrée ARP expire ; les inondations cessent.

    • 9 février 2026 - 12h30 : L’évacuation de la machine virtuelle est terminée ; l’environnement se stabilise.

    • 9 février 2026 - 16:32 : Les clusters Kubernetes sont entièrement restaurés

    • 9 février 2026 - 20:09–20:16 : Restauration de la machine virtuelle client terminée

    • 9 février 2026 - 21h09 : Incident clos

    Cause première

    Il existe une condition dans le flux de travail du réseau où l'entrée MAC est supprimée des commutateurs d'accès (ToR) tandis que l'entrée ARP correspondante reste active sur la passerelle en amont jusqu'à son expiration naturelle.

    Cette incohérence temporaire entre les états de la couche 2 et de la couche 3 peut entraîner une inondation unicast inconnue au sein du VLAN concerné.

    Dans des conditions de trafic normales, cette incohérence d'état n'a pas d'impact significatif. Cependant, dans ce cas précis, le serveur a subi simultanément une attaque DDoS de grande ampleur, ce qui a amplifié le phénomène d'inondation et entraîné une instabilité généralisée des ressources de calcul.

    Éléments d'action

    • Mettre en œuvre des mécanismes permettant de supprimer rapidement les entrées réseau obsolètes lors de modifications de ports afin de maintenir des informations de routage précises.

    • Développer un processus automatisé pour effacer les entrées réseau lorsque certains événements de retrait se produisent sur les périphériques réseau centraux.

    • Analysez le comportement des périphériques en lien avec les liaisons statiques et explorez des configurations alternatives pour améliorer la synchronisation des mappages d'adresses réseau.

    • Évaluer et ajuster les procédures d'évacuation existantes afin de les aligner sur les processus d'intégrité et de récupération du stockage.

    • Améliorer les capacités de surveillance pour détecter les conditions de trafic anormales au niveau des segments de réseau, notamment les seuils de débit et les indicateurs de santé du système.

  • Résolu
    Résolu

    Nous avons le plaisir de vous informer que la panne partielle de nos services Cloud et de protection DDoS à Francfort-2 est désormais résolue. Si toutefois vous rencontrez toujours des difficultés, n'hésitez pas à contacter notre équipe d'assistance. Elle se fera un plaisir de vous aider et de répondre rapidement à toutes vos questions.

    Nous vous remercions de votre patience et de votre compréhension tout au long de cet incident, et nous vous remercions de votre coopération.
    Une analyse formelle des causes profondes (ACR) est actuellement en cours de préparation et sera publiée dès qu'elle sera disponible.

    Pour obtenir de l'aide supplémentaire, veuillez contacter notre équipe d'assistance à l'adresse support@gcore.com

  • Surveillé
    Surveillé

    Nous avons le plaisir de vous informer que notre équipe d'ingénieurs a mis en œuvre un correctif pour résoudre l'indisponibilité partielle de nos services Cloud et de protection DDoS à Francfort-2. Nous continuons toutefois de surveiller de près la situation afin de garantir une performance stable.

    Nous vous tiendrons informés dès que nous aurons confirmé que le problème est entièrement résolu.

  • Identifié
    Identifié

    Nous avons identifié le problème et nous travaillons à en trouver la cause profonde afin de résoudre le problème de réseau.

  • Détecté
    Détecté

    Nos services de protection contre les attaques DDoS et le cloud sont actuellement partiellement indisponibles, affectant nos réseaux privés et publics. Il est possible que certains utilisateurs ne puissent pas les utiliser. Nous vous prions de nous excuser pour la gêne occasionnée et vous remercions de votre patience et de votre compréhension.

    Nous vous tiendrons informés dès que nous aurons plus d'informations sur l'avancement du dossier. Merci de votre compréhension et de votre coopération.