SERVICIO | UBICACIÓN Detalles del incidente - Detalles del incidente

SERVICIO | UBICACIÓN Detalles del incidente

Resuelto

Interrupción mayor

Iniciado el hace 2 meses13 mayo 2026Duró alrededor de 13 horas19:24 GMT+014 mayo 202608:41 GMT+0UTC

Afectado

Gcore Systems

API

Billing System

Customer Portal

Website

CDN

Actualizaciones

Después de la muerte

15 mayo 2026 a 19:32 GMT+0UTC

Después de la muerte

15 mayo 2026 a 19:32 GMT+0UTC

Análisis público de la causa raíz del incidente:

Fecha: 13 de mayo de 2026 | Duración: 19:08 – 20:14 UTC (1 hora y 6 minutos)

Resumen

El 13 de mayo de 2026, entre las 19:08 y las 20:14 UTC, parte del servicio CDN de Gcore sufrió una interrupción global. Los nodos de la CDN en todo el mundo no pudieron procesar las solicitudes y devolvieron errores HTTP 502 para un subconjunto de recursos de clientes. La interrupción afectó a gcore.com , al Portal del Cliente, a los puntos finales de la API pública y a la entrega de la CDN en parte de la infraestructura.

Impacto

gcore.com y portal.gcore.com no estaban disponibles.
api.gcore.com devolvió errores 502, lo que afectó a las operaciones basadas en API en los servicios CDN, Cloud, DNS, Streaming, Storage, WAAP e IAM.
La autenticación basada en SSO/SAML para acceder al portal se vio interrumpida durante y brevemente después de la ventana de tiempo afectada.
Los clientes que utilizaban recursos de CDN a través de la infraestructura afectada experimentaron errores 502 en su tráfico de usuario final.

Causa principal

Se trató de un incidente de defectos acumulativos : tres fallos independientes en la configuración de la CDN se combinaron para convertir un único cambio de configuración en un fallo global de la red perimetral. Cualquiera de los tres defectos, de no haber existido, habría evitado la interrupción del servicio.

Fallo en la validación de la entrada de la API: Un campo de enrutamiento de origen interno, originalmente concebido como un parámetro de configuración exclusivo para administradores, perdió su restricción de acceso en una reescritura de la API en 2023 y posteriormente se publicó en la documentación pública de la API (marzo de 2026) sin especificar sus valores permitidos. Esto permitió que se enviara y aceptara un valor no estándar a través de la API.
Error en la lógica de generación de configuración: Cuando la canalización de configuración de la CDN procesó el recurso con el valor no estándar, un error en la generación de configuración a nivel de regla eliminó silenciosamente todos los servidores de origen, lo que produjo una configuración con una lista de servidores ascendentes vacía.
Fallo en la inicialización del borde: Cuando un nodo de borde de la CDN recibió una configuración con una lista de servidores ascendentes vacía, un script del lado del borde falló durante la fase de inicialización. Dado que el archivo de configuración es global (compartido entre todos los recursos de un nodo), esta única entrada mal formada provocó que todo el nodo fallara en su inicialización, devolviendo un código HTTP 502 para todo el tráfico, no solo para el recurso afectado. Este fallo se propagó a todos los nodos de borde de la infraestructura afectada.

Cronograma (UTC)

Tiempo	Evento
19:08	Configuración de CDN que contiene el recurso mal formado enviado a los nodos de borde globalmente.
19:08–19:14	Los nodos de borde comienzan a devolver HTTP 502 globalmente.
19:15	Se declara el incidente P1
19:24	Incidente publicado en la página de estado público
19:42	Comienza la mitigación: los servicios críticos se enrutan a través de una infraestructura de borde alternativa.
19:53	El portal de clientes se migró a una infraestructura alternativa.
20:01	Recursos adicionales migrados
20:14	Se aplicó la solución, el recurso problemático se deshabilitó a través de la API; los nodos de borde se recuperan.
22:05	Se ha fusionado la corrección de validación a nivel de API.
23:06	Corrección de la API implementada en producción

Resolución

El servicio se restableció a las 20:14 UTC al deshabilitar el recurso que contenía la configuración defectuosa. Los ingenieros habían estado mitigando el impacto desde las 19:42 UTC redirigiendo los servicios críticos del plano de control (API, portal) a través de una infraestructura de borde alternativa.

Medidas correctivas

#	Acción	Estado
1	Validación de entrada a nivel de API: rechazar valores no permitidos para el campo de enrutamiento de origen.	Desplegado
2	Corrige la lógica de generación de configuración para manejar correctamente los grupos de origen heredados, eliminando el error de eliminación silenciosa de origen.	En curso
3	Reforzar la inicialización del borde para que se degrade de forma controlada (nivel de regla 502) en lugar de provocar el fallo de todo el nodo en una configuración ascendente vacía.	En curso
4	Auditar los campos de la API relacionados con la reescritura de 2023 para detectar regresiones similares en el control de acceso.	En curso
5	Revisar y actualizar la documentación de la API para especificar claramente los valores permitidos para todos los campos de configuración de origen.	En curso

Pedimos disculpas sinceras por las molestias ocasionadas. Nos comprometemos a completar las correcciones restantes e implementar medidas de seguridad adicionales para evitar que un fallo similar en la configuración de la canalización tenga un impacto global en el futuro.

Resuelto
14 mayo 2026 a 08:41 GMT+0UTC
Resuelto
14 mayo 2026 a 08:41 GMT+0UTC
Nos complace informarles que la interrupción importante en nuestro sitio web, la entrega global de CDN, el acceso a la API para todos los servicios y el portal del cliente se ha resuelto. Sin embargo, si continúa experimentando algún problema, no dude en ponerse en contacto con nuestro equipo de soporte. Estaremos encantados de ayudarle y garantizar que cualquier otra inquietud se resuelva con prontitud.
También proporcionaremos un análisis detallado de la causa raíz (ACR) una vez que esté disponible.
Agradecemos su paciencia y comprensión durante este incidente, y le damos las gracias por su cooperación.
Para obtener más ayuda, póngase en contacto con nuestro equipo de soporte a través de support@gcore.com.
Supervisando
13 mayo 2026 a 20:27 GMT+0UTC
Supervisando
13 mayo 2026 a 20:27 GMT+0UTC
Nos complace informarles que nuestro equipo de ingeniería ha implementado una solución para resolver la interrupción importante del servicio en nuestro sitio web, Global CDN Delivery, el acceso a la API para todos los servicios y el Portal del Cliente, que provocó su indisponibilidad total. No obstante, seguimos monitoreando la situación de cerca para garantizar un rendimiento estable.
Les informaremos tan pronto como confirmemos que el problema se ha resuelto por completo.
Actualizar
13 mayo 2026 a 20:23 GMT+0UTC
Actualizar
13 mayo 2026 a 20:23 GMT+0UTC
Nos estamos recuperando y todos los servicios están operativos. El servicio CDN se ha restablecido casi por completo; sin embargo, es posible que aún no esté disponible parcialmente para algunos usuarios. Continuamos monitoreando la situación y trabajando para solucionarlo.
Actualizar
13 mayo 2026 a 20:15 GMT+0UTC
Actualizar
13 mayo 2026 a 20:15 GMT+0UTC
El sitio web y el portal del cliente ya están funcionando de nuevo. Seguimos solucionando problemas en otros servicios.
Identificado
13 mayo 2026 a 20:05 GMT+0UTC
Identificado
13 mayo 2026 a 20:05 GMT+0UTC
Se ha restablecido el acceso a la API y seguimos solucionando los problemas en otros servicios. Les mantendremos informados.
Investigando
13 mayo 2026 a 19:24 GMT+0UTC
Investigando
13 mayo 2026 a 19:24 GMT+0UTC
Actualmente estamos experimentando una interrupción importante en nuestro [INSERTAR SERVICIO ESPECÍFICO o DETALLES DE LA OPERACIÓN], lo que ha provocado la indisponibilidad total del servicio. Le pedimos disculpas por cualquier inconveniente que esto pueda causar y agradecemos enormemente su paciencia y comprensión durante este momento crítico.
Nuestro equipo de ingeniería está trabajando activamente para identificar la causa raíz e implementar una solución lo antes posible. Proporcionaremos actualizaciones periódicas a medida que recibamos más información sobre el progreso de la solución.
Gracias por su comprensión y cooperación.

Gcore - SERVICIO | UBICACIÓN Detalles del incidente – Detalles del incidente

Experimentando un apagón menor