SERVICE | EMPLACEMENT Détails de l'incident - Détails de l'incident

SERVICE | EMPLACEMENT Détails de l'incident

Résolu

Panne majeure

Signalé le il y a 2 mois13 mai 2026A duré environ 13 heures19:24 GMT+014 mai 202608:41 GMT+0UTC

Concernés

Gcore Systems

API

Billing System

Customer Portal

Website

CDN

Mises à jour

Postmortem

15 mai 2026 à 19:32 GMT+0UTC

Postmortem

15 mai 2026 à 19:32 GMT+0UTC

Analyse publique des causes profondes de l'incident :

Date : 13 mai 2026 | Durée : 19h08 – 20h14 UTC (1 heure 6 minutes)

Résumé

Le 13 mai 2026, de 19h08 à 20h14 UTC, une partie du service CDN de Gcore a subi une interruption de service globale. Les points de présence du CDN dans le monde entier n'ont pas pu traiter les requêtes et ont renvoyé des erreurs HTTP 502 pour certains services clients. Cette interruption a affecté gcore.com , le portail client, les points de terminaison de l'API publique et la diffusion CDN sur une partie de l'infrastructure.

Impact

Les sites gcore.com et portal.gcore.com étaient inaccessibles.
api.gcore.com a renvoyé des erreurs 502, affectant les opérations basées sur l'API sur les services CDN, Cloud, DNS, Streaming, Storage, WAAP et IAM.
L'authentification SSO/SAML au portail a été interrompue pendant et brièvement après la période d'indisponibilité.
Les clients dont les ressources CDN étaient diffusées via l'infrastructure affectée ont constaté des erreurs 502 pour leur trafic utilisateur final.

Cause première

Il s'agissait d'un incident dû à une accumulation de défauts : trois failles indépendantes dans le pipeline de configuration du CDN se sont combinées pour transformer une simple modification de configuration en une panne globale du réseau périphérique. L'absence de chacun de ces trois défauts aurait suffi à éviter la panne.

Lacune dans la validation des entrées de l'API : un champ de routage d'origine interne, initialement conçu comme une option de configuration réservée aux administrateurs, a vu sa restriction d'accès levée lors d'une refonte de l'API en 2023 et a ensuite été publié dans la documentation publique de l'API (mars 2026) sans préciser les valeurs autorisées. Cela a permis la soumission et l'acceptation d'une valeur non standard via l'API.
Erreur de logique de génération de configuration : lorsque le pipeline de configuration du CDN a traité la ressource avec la valeur non standard, un bogue dans la génération de configuration au niveau des règles a silencieusement supprimé tous les serveurs d’origine, produisant une configuration avec une liste en amont vide.
Plantage lors de l'initialisation d'un nœud périphérique : lorsqu'un nœud périphérique d'un CDN a reçu une configuration avec une liste de serveurs en amont vide, un script côté périphérique a planté pendant la phase d'initialisation. Le fichier de configuration étant global (partagé par toutes les ressources du nœud), cette unique entrée malformée a entraîné l'échec de l'initialisation de l'ensemble du nœud, provoquant le renvoi d'une erreur HTTP 502 pour tout le trafic, et non seulement pour la ressource concernée. Ce plantage s'est propagé à tous les nœuds périphériques de l'infrastructure affectée.

Chronologie (UTC)

Temps	Événement
19:08	Configuration CDN contenant la ressource malformée diffusée globalement aux nœuds périphériques
19:08–19:14	Les nœuds périphériques commencent à renvoyer globalement des erreurs HTTP 502.
19:15	Incident P1 déclaré
19:24	Incident publié sur la page d'état public
19:42	Mesures d'atténuation : les services critiques sont acheminés via une infrastructure périphérique alternative.
19:53	Le portail client a été migré vers une infrastructure alternative.
20:01	Des ressources supplémentaires ont été migrées.
20:14	Correctif appliqué, ressource incriminée désactivée via l'API ; récupération des nœuds périphériques
22:05	Correction de validation au niveau de l'API intégrée
23:06	Correctif d'API déployé en production

Résolution

Le service a été rétabli à 20h14 UTC en désactivant la ressource contenant la configuration erronée. Depuis 19h42 UTC, les ingénieurs s'efforçaient d'atténuer l'impact en acheminant les services critiques du plan de contrôle (API, portail) via une infrastructure périphérique alternative.

Mesures correctives

#	Action	Statut
1	Validation des entrées au niveau de l'API : rejeter les valeurs non autorisées pour le champ de routage d'origine	Déployé
2	Correction de la logique de génération de configuration pour gérer correctement les groupes d'origine hérités, éliminant ainsi le bug de suppression silencieuse de l'origine.	En cours
3	Renforcer l'initialisation du périphérique pour une dégradation progressive (règle 502) au lieu de provoquer le plantage du nœud entier en cas de configuration amont vide.	En cours
4	Champs d'API liés à l'audit issus de la réécriture de 2023 pour des régressions similaires du contrôle d'accès	En cours
5	Examiner et mettre à jour la documentation de l'API afin de spécifier clairement les valeurs autorisées pour tous les champs de configuration d'origine.	En cours

Nous vous prions de bien vouloir accepter nos excuses pour la gêne occasionnée. Nous nous engageons à finaliser les correctifs restants et à mettre en place des mesures de sécurité supplémentaires afin d'éviter qu'une défaillance similaire du pipeline de configuration n'ait un impact mondial à l'avenir.

Résolu
14 mai 2026 à 08:41 GMT+0UTC
Résolu
14 mai 2026 à 08:41 GMT+0UTC
Nous avons le plaisir de vous informer que la panne majeure affectant notre site web, notre CDN global, l'accès API à tous nos services et notre portail client est désormais résolue. Si toutefois vous rencontrez toujours des difficultés, n'hésitez pas à contacter notre équipe d'assistance. Elle se fera un plaisir de vous aider et de répondre rapidement à toutes vos questions.
Nous fournirons également une analyse détaillée des causes profondes (ACR) dès qu'elle sera disponible.
Nous vous remercions de votre patience et de votre compréhension tout au long de cet incident, et nous vous remercions de votre coopération.
Pour obtenir de l'aide supplémentaire, veuillez contacter notre équipe d'assistance à l'adresse support@gcore.com
Surveillé
13 mai 2026 à 20:27 GMT+0UTC
Surveillé
13 mai 2026 à 20:27 GMT+0UTC
Nous avons le plaisir de vous informer que notre équipe technique a déployé un correctif pour résoudre la panne majeure qui affectait notre site web, notre CDN global, l'accès API à tous nos services et notre portail client, les rendant totalement indisponibles. Nous continuons toutefois de surveiller de près la situation afin de garantir un fonctionnement optimal.
Nous vous tiendrons informés dès que nous aurons confirmé que le problème est entièrement résolu.
Mettre à jour
13 mai 2026 à 20:23 GMT+0UTC
Mettre à jour
13 mai 2026 à 20:23 GMT+0UTC
Nous sommes en voie de rétablissement et tous les services sont de nouveau opérationnels. Le service CDN est presque entièrement rétabli ; cependant, il peut encore être partiellement indisponible pour certains utilisateurs. Nous continuons de surveiller la situation et travaillons à sa résolution.
Mettre à jour
13 mai 2026 à 20:15 GMT+0UTC
Mettre à jour
13 mai 2026 à 20:15 GMT+0UTC
Le site web et le portail client sont de nouveau opérationnels. Nous poursuivons les travaux de réparation des autres services.
Identifié
13 mai 2026 à 20:05 GMT+0UTC
Identifié
13 mai 2026 à 20:05 GMT+0UTC
L'accès à l'API a été rétabli et nous poursuivons la résolution des problèmes des autres services. Nous vous tiendrons informés.
Détecté
13 mai 2026 à 19:24 GMT+0UTC
Détecté
13 mai 2026 à 19:24 GMT+0UTC
Nous subissons actuellement une panne majeure sur notre [INSÉRER LES DÉTAILS DU SERVICE OU DE L'OPÉRATION], entraînant une indisponibilité totale du service. Nous vous prions de nous excuser pour la gêne occasionnée et vous remercions de votre patience et de votre compréhension pendant cette période critique.
Notre équipe d'ingénieurs travaille activement à identifier la cause du problème et à mettre en œuvre une solution dans les meilleurs délais. Nous vous tiendrons régulièrement informés de l'avancement de la résolution.
Merci pour votre compréhension et votre coopération.

Gcore - SERVICE | EMPLACEMENT Détails de l'incident – Détails de l'incident

Panne mineure