Gcore - Nube, protección DDoS | Detalles del incidente de Frankurt-2 – Detalles del incidente

Sistema en Mantenimiento

Nube, protección DDoS | Detalles del incidente de Frankurt-2

Resuelto
Interrupción parcial
Iniciado el hace 29 díasDuró alrededor de 16 horas
Actualizaciones
  • Después de la muerte
    Después de la muerte

    Análisis de causa raíz

    Asunto:

    El 9 de febrero de 2026, un problema de sincronización de red, combinado con un aumento repentino del tráfico, afectó temporalmente la disponibilidad de máquinas virtuales en la región Frankfurt-2.

    Cronología (UTC)

    • 9 de febrero de 2026 - 11:04 : Comienza una inundación unicast desconocida

    • 9 de febrero de 2026 - 11:07: Falla del primer nodo de cómputo (pcb19)

    • 9 de febrero de 2026 - 11:37: Se creó la página de incidente/estado

    • 9 de febrero de 2026 - 12:04: La entrada de ARP vence; las inundaciones se detienen

    • 9 de febrero de 2026 - 12:30: Se completa la evacuación de VM; el entorno se estabiliza

    • 9 de febrero de 2026, 16:32: Clústeres de Kubernetes completamente restaurados

    • 9 de febrero de 2026 - 20:09–20:16: Se completó la restauración de la máquina virtual del cliente

    • 9 de febrero de 2026 - 21:09: Incidente cerrado

    Causa principal

    Hay una condición en el flujo de trabajo de la red donde la entrada MAC se elimina de los conmutadores de acceso (ToR) mientras que la entrada ARP correspondiente permanece activa en la puerta de enlace ascendente hasta su vencimiento natural.

    Esta inconsistencia temporal entre los estados de la Capa 2 y la Capa 3 puede generar inundaciones de unidifusión desconocidas dentro de la VLAN afectada.

    En condiciones normales de tráfico, esta discrepancia de estado no causa un impacto significativo. Sin embargo, en este caso, el servidor fue sometido simultáneamente a un ataque DDoS de gran volumen, lo que amplificó la inundación y provocó una inestabilidad computacional generalizada.

    Elementos de acción

    • Implementar mecanismos para borrar rápidamente las entradas de red obsoletas cuando se producen cambios de puerto para mantener información de enrutamiento precisa.

    • Desarrollar un proceso automatizado para borrar las entradas de la red cuando ocurren ciertos eventos de retiro en los dispositivos de la red central.

    • Revise el comportamiento del dispositivo relacionado con los enlaces estáticos y explore configuraciones alternativas para mejorar la sincronización de las asignaciones de direcciones de red.

    • Evaluar y ajustar los procedimientos de evacuación existentes para alinearlos con la integridad del almacenamiento y los procesos de recuperación.

    • Mejorar las capacidades de monitoreo para detectar condiciones de tráfico anormales a nivel de segmento de red, incluidos los umbrales de velocidad de tráfico y los indicadores de salud del sistema.

  • Resuelto
    Resuelto

    Nos complace informarle que la interrupción parcial de nuestros servicios de protección contra DDoS y en la nube en Frankfurt-2 se ha solucionado. Sin embargo, si continúa experimentando problemas, no dude en contactar con nuestro equipo de soporte. Nuestro equipo estará encantado de ayudarle y se asegurará de que cualquier otra inquietud se resuelva con prontitud.

    Agradecemos su paciencia y comprensión durante este incidente y le agradecemos su cooperación.
    Actualmente se está preparando un Análisis de Causa Raíz (RCA) formal y se publicará una vez que esté disponible.

    Para obtener más ayuda, comuníquese con nuestro equipo de soporte a través de support@gcore.com

  • Supervisando
    Supervisando

    Nos complace informarles que nuestro equipo de ingeniería ha implementado una solución para resolver la interrupción parcial de nuestros servicios de protección en la nube y DDoS en Frankfurt-2. Sin embargo, seguimos monitoreando de cerca la situación para garantizar un rendimiento estable.

    Le proporcionaremos una actualización tan pronto como confirmemos que el problema se ha resuelto por completo.

  • Identificado
    Identificado

    Hemos identificado el problema y estamos trabajando para encontrar la causa raíz para resolver el problema de la red.

  • Investigando
    Investigando

    Actualmente estamos experimentando una interrupción parcial en nuestros servicios de protección en la nube y contra DDoS, que afecta tanto a nuestras redes privadas como públicas. Esto podría resultar en una indisponibilidad parcial para los usuarios. Disculpen las molestias que esto pueda causar y agradecemos su paciencia y comprensión durante este periodo.

    Proporcionaremos actualizaciones en cuanto tengamos más información sobre el progreso de la resolución. Gracias por su comprensión y cooperación.