Облачные технологии | Подробности инцидента в Лондоне-2 - Детали инцидента

Облачные технологии | Подробности инцидента в Лондоне-2

Решено

Полная недоступность

Началось 3 месяца назаддлился около 5 часов

Затронутые

Cloud

Compute

Лондон-2

Baremetal

Лондон-2

Networking

Обновления

После смерти

22 апреля 2026 в 06:59 GMT+0

После смерти

22 апреля 2026 в 06:59 GMT+0

Отчет об инциденте: Инцидент с электроснабжением — Лондонский регион (NDLO)

Дата: 28 марта 2026 г. Затронутый регион: Лондон-2 (NDLO) Период воздействия: 08:51 – 11:41 UTC (2 ч 50 мин) Статус: Решено

Проблема

В субботу, 28 марта 2026 года, в регионе London-2 (NDLO) компании Gcore произошел сбой в работе сервисов, вызванный отключением электроэнергии в нашем центре обработки данных в Лондоне. Неисправность электросети привела к полному отключению электроэнергии в зоне размещения нашей инфраструктуры, что сделало недоступными облачные вычисления, сети, хранилище данных и физические серверы в регионе примерно на 2 часа 50 минут. После восстановления работы сервисов последовал длительный период снижения уровня резервирования электроэнергии, который был полностью устранен позже в тот же день.

Мы понимаем, как это повлияло на вашу деятельность, и приносим искренние извинения за возникшие неудобства.

Что случилось

В 07:29 UTC в вышестоящем электрическом компоненте центра обработки данных возникла неисправность, которая привела к отключению основного источника питания в зоне инфраструктуры. Источник бесперебойного питания (ИБП) обеспечивал работу на батарейном питании в течение приблизительно 80 минут, но переключение на альтернативный высоковольтный источник заняло больше времени, чем позволяла доступная емкость батарей ИБП. В 08:49 UTC батареи ИБП разрядились, и в зоне произошло полное отключение электроэнергии.

В 10:32 UTC электроснабжение объекта было восстановлено через альтернативный высоковольтный источник, и наша инфраструктура начала возвращаться в строй. Сначала было восстановлено сетевое соединение, затем — облачная панель управления и рабочие нагрузки клиентов. К 11:41 UTC было подтверждено восстановление всех сервисов, доступных клиентам, и они были переведены под пристальное наблюдение.

В течение нескольких часов после основного восстановления работы часть шкафов работала от одного источника питания из-за неисправности компонента в цепи распределения электроэнергии. Во всех шкафах сохранился как минимум один работающий источник питания, поэтому услуги оставались доступными, но резервирование было снижено. В 19:08 UTC объект отключил неисправный компонент, и полное резервирование электропитания было восстановлено. Замена батареи ИБП была завершена к 19:20 UTC.

Хронология (все время указано по UTC)

Время	Событие
07:29	Неисправность электропроводки в вышестоящем звене; отключение основного источника питания; ИБП переключается на питание от батареи.
08:49	Запас энергии батареи ИБП исчерпан; в пострадавшем районе полностью отсутствует электроснабжение.
08:51	Инцидент обнаружен системой Gcore; начато расследование.
09:24	Привлечен подрядчик по обслуживанию объекта; на месте ведутся работы по устранению неполадок.
10:32	Электропитание восстановлено через альтернативный высоковольтный источник.
10:43 – 11:41	Поэтапное восстановление сервисов: сеть, плоскость управления облаком, вычислительные ресурсы, физические серверы.
11:41	Все сервисы, доступные для клиентов, восстановлены и находятся под наблюдением.
13:51	Инцидент на странице состояния закрыт.
19:08	Полное резервирование электропитания восстановлено на всех шкафах.

Влияние

Затронутые сервисы: облачные вычисления (виртуальные машины), физические серверы, облачные сети, подключение по общедоступному IP-адресу, облачное хранилище и облачный API в регионе London-2 (NDLO).
Время простоя, видимое клиентом: приблизительно 2 часа 50 минут (08:51 – 11:41 UTC).
В период с 08:51 UTC до 19:08 UTC было снижено резервирование электропитания в части шкафов. В течение этого промежутка времени услуги оставались доступными.
Другие регионы Gcore не пострадали.

Первопричина

Первопричиной стала неисправность электропроводки в центре обработки данных, а также недостаточная автономность батарей ИБП, которая не позволила переключить нагрузку на альтернативный высоковольтный источник питания. Вторичная неисправность компонента в цепи распределения электроэнергии продлила период снижения резервирования после первоначального восстановления.

Что мы делаем

В тесном сотрудничестве с нашим партнером по дата-центрам, а также со стороны Gcore, мы предприняли следующие действия:

С поставщиком услуг

Запросил полный, формальный анализ первопричин, охватывающий электрическую неисправность, соотношение времени автономной работы ИБП и проектных параметров, а также отказ вторичного компонента.
Отслеживание плана по восстановлению объекта, включая замену батарей ИБП (завершено 28 марта), тестирование на отказоустойчивость и профилактическое техническое обслуживание.
Пересмотр договорных обязательств по уровню обслуживания.

Наше обязательство

Мы относимся к этому инциденту с наивысшим приоритетом. Надежность электроснабжения на уровне центра обработки данных является основополагающим принципом нашей работы, и выявленный в результате этого инцидента пробел — когда автономность ИБП не покрыла время, необходимое для переключения на альтернативный источник питания — для нас неприемлем. Мы работаем с нашим партнером по объекту, чтобы гарантировать невозможность повторения подобного сбоя, и самостоятельно укрепляем собственную архитектуру, чтобы подобные инциденты в будущем оказывали меньшее влияние на наших клиентов.

Если у вас есть вопросы о том, как этот инцидент повлиял на вашу конкретную рабочую нагрузку, или если вы хотите обсудить компенсацию в рамках вашего договора на оказание услуг, пожалуйста, свяжитесь со службой поддержки Gcore.

Благодарим вас за терпение и неизменное доверие к Gcore.

Решено
28 марта 2026 в 13:51 GMT+0
Решено
28 марта 2026 в 13:51 GMT+0
Мы рады сообщить вам, что инцидент с отключением электроэнергии в центре обработки данных полностью устранен, и все сервисы успешно восстановлены. Как только будет готов подробный анализ первопричин, мы предоставим его.
Если у вас по-прежнему возникают какие-либо проблемы, пожалуйста, не стесняйтесь обращаться в нашу службу поддержки. Наша команда с удовольствием поможет вам и обеспечит оперативное решение любых дальнейших вопросов.
Мы ценим ваше терпение и понимание на протяжении всего инцидента и благодарим вас за сотрудничество.
Для получения дополнительной помощи, пожалуйста, свяжитесь с нашей службой поддержки по адресу support@gcore.com.
Мониторинг
28 марта 2026 в 11:46 GMT+0
Мониторинг
28 марта 2026 в 11:46 GMT+0
Все сервисы восстановлены. Небольшое количество физических серверов все еще находится в процессе восстановления, и наши команды продолжают внимательно следить за ситуацией.
Благодарим вас за терпение и понимание на протяжении всего этого инцидента.
Обновление
28 марта 2026 в 10:58 GMT+0
Обновление
28 марта 2026 в 10:58 GMT+0
Мы получили дополнительную информацию от центра обработки данных, подтверждающую начало процесса восстановления электроснабжения. Некоторые сервисы, такие как API и сеть, снова работают. Восстановление работы сервисов происходит постепенно, и выездные бригады работают над полным восстановлением работоспособности как можно быстрее и безопаснее.
Мы понимаем последствия этого инцидента и высоко ценим ваше терпение. Мы будем продолжать сообщать обновления по мере поступления новой информации и после полного восстановления работы сервиса.
Обновление
28 марта 2026 в 09:50 GMT+0
Обновление
28 марта 2026 в 09:50 GMT+0
Мы получили подтверждение от центра обработки данных о перебоях в электроснабжении, затронувших объект. Инженеры на месте активно работают над восстановлением электроснабжения в кратчайшие и безопасные сроки. Мы будем продолжать сообщать обновления по мере поступления новой информации.
Определено
28 марта 2026 в 09:31 GMT+0
Определено
28 марта 2026 в 09:31 GMT+0
Инженеры на месте активно расследуют проблему с электропитанием в центре обработки данных. Мы работаем над ее устранением и вскоре предоставим обновленную информацию.
Изучается
28 марта 2026 в 09:12 GMT+0
Изучается
28 марта 2026 в 09:12 GMT+0
В настоящее время в нашей сети произошел крупный сбой, затронувший облачные сервисы в регионе Лондон-2, что привело к полной недоступности сервиса. Мы приносим искренние извинения за любые неудобства, которые это может вызвать, и высоко ценим ваше терпение и понимание в это критическое время.
Наша инженерная команда активно работает над выявлением первопричины и скорейшим внедрением решения. Мы будем регулярно предоставлять обновления по мере получения дополнительной информации о ходе решения проблемы.
Благодарим вас за понимание и сотрудничество.

Gcore - Облачные технологии | Подробности инцидента в Лондоне-2 – Детали инцидента

Система на обслуживании