Gcore - Облачные технологии | Подробности инцидента в Лондоне-2 – Детали инцидента

Все системы работают

Облачные технологии | Подробности инцидента в Лондоне-2

Решено
Полная недоступность
Началось около 1 месяца назаддлился около 5 часов

Затронутые

Cloud

Полная недоступность от 9:12 AM до 11:46 AM, Работает от 11:46 AM до 1:51 PM

Compute

Полная недоступность от 9:12 AM до 11:46 AM, Работает от 11:46 AM до 1:51 PM

Лондон-2

Полная недоступность от 9:12 AM до 11:46 AM, Работает от 11:46 AM до 1:51 PM

Baremetal

Полная недоступность от 9:12 AM до 11:46 AM, Работает от 11:46 AM до 1:51 PM

Лондон-2

Полная недоступность от 9:12 AM до 11:46 AM, Работает от 11:46 AM до 1:51 PM

Networking

Полная недоступность от 9:12 AM до 11:46 AM, Работает от 11:46 AM до 1:51 PM

Обновления
  • После смерти
    После смерти

    Отчет об инциденте: Инцидент с электроснабжением — Лондонский регион (NDLO)

    Дата: 28 марта 2026 г. Затронутый регион: Лондон-2 (NDLO) Период воздействия: 08:51 – 11:41 UTC (2 ч 50 мин) Статус: Решено

    Проблема

    В субботу, 28 марта 2026 года, в регионе London-2 (NDLO) компании Gcore произошел сбой в работе сервисов, вызванный отключением электроэнергии в нашем центре обработки данных в Лондоне. Неисправность электросети привела к полному отключению электроэнергии в зоне размещения нашей инфраструктуры, что сделало недоступными облачные вычисления, сети, хранилище данных и физические серверы в регионе примерно на 2 часа 50 минут. После восстановления работы сервисов последовал длительный период снижения уровня резервирования электроэнергии, который был полностью устранен позже в тот же день.

    Мы понимаем, как это повлияло на вашу деятельность, и приносим искренние извинения за возникшие неудобства.

    Что случилось

    В 07:29 UTC в вышестоящем электрическом компоненте центра обработки данных возникла неисправность, которая привела к отключению основного источника питания в зоне инфраструктуры. Источник бесперебойного питания (ИБП) обеспечивал работу на батарейном питании в течение приблизительно 80 минут, но переключение на альтернативный высоковольтный источник заняло больше времени, чем позволяла доступная емкость батарей ИБП. В 08:49 UTC батареи ИБП разрядились, и в зоне произошло полное отключение электроэнергии.

    В 10:32 UTC электроснабжение объекта было восстановлено через альтернативный высоковольтный источник, и наша инфраструктура начала возвращаться в строй. Сначала было восстановлено сетевое соединение, затем — облачная панель управления и рабочие нагрузки клиентов. К 11:41 UTC было подтверждено восстановление всех сервисов, доступных клиентам, и они были переведены под пристальное наблюдение.

    В течение нескольких часов после основного восстановления работы часть шкафов работала от одного источника питания из-за неисправности компонента в цепи распределения электроэнергии. Во всех шкафах сохранился как минимум один работающий источник питания, поэтому услуги оставались доступными, но резервирование было снижено. В 19:08 UTC объект отключил неисправный компонент, и полное резервирование электропитания было восстановлено. Замена батареи ИБП была завершена к 19:20 UTC.

    Хронология (все время указано по UTC)

    Время

    Событие

    07:29

    Неисправность электропроводки в вышестоящем звене; отключение основного источника питания; ИБП переключается на питание от батареи.

    08:49

    Запас энергии батареи ИБП исчерпан; в пострадавшем районе полностью отсутствует электроснабжение.

    08:51

    Инцидент обнаружен системой Gcore; начато расследование.

    09:24

    Привлечен подрядчик по обслуживанию объекта; на месте ведутся работы по устранению неполадок.

    10:32

    Электропитание восстановлено через альтернативный высоковольтный источник.

    10:43 – 11:41

    Поэтапное восстановление сервисов: сеть, плоскость управления облаком, вычислительные ресурсы, физические серверы.

    11:41

    Все сервисы, доступные для клиентов, восстановлены и находятся под наблюдением.

    13:51

    Инцидент на странице состояния закрыт.

    19:08

    Полное резервирование электропитания восстановлено на всех шкафах.

    Влияние

    • Затронутые сервисы: облачные вычисления (виртуальные машины), физические серверы, облачные сети, подключение по общедоступному IP-адресу, облачное хранилище и облачный API в регионе London-2 (NDLO).

    • Время простоя, видимое клиентом: приблизительно 2 часа 50 минут (08:51 – 11:41 UTC).

    • В период с 08:51 UTC до 19:08 UTC было снижено резервирование электропитания в части шкафов. В течение этого промежутка времени услуги оставались доступными.

    • Другие регионы Gcore не пострадали.

    Первопричина

    Первопричиной стала неисправность электропроводки в центре обработки данных, а также недостаточная автономность батарей ИБП, которая не позволила переключить нагрузку на альтернативный высоковольтный источник питания. Вторичная неисправность компонента в цепи распределения электроэнергии продлила период снижения резервирования после первоначального восстановления.

    Что мы делаем

    В тесном сотрудничестве с нашим партнером по дата-центрам, а также со стороны Gcore, мы предприняли следующие действия:

    С поставщиком услуг

    • Запросил полный, формальный анализ первопричин, охватывающий электрическую неисправность, соотношение времени автономной работы ИБП и проектных параметров, а также отказ вторичного компонента.

    • Отслеживание плана по восстановлению объекта, включая замену батарей ИБП (завершено 28 марта), тестирование на отказоустойчивость и профилактическое техническое обслуживание.

    • Пересмотр договорных обязательств по уровню обслуживания.

    Наше обязательство

    Мы относимся к этому инциденту с наивысшим приоритетом. Надежность электроснабжения на уровне центра обработки данных является основополагающим принципом нашей работы, и выявленный в результате этого инцидента пробел — когда автономность ИБП не покрыла время, необходимое для переключения на альтернативный источник питания — для нас неприемлем. Мы работаем с нашим партнером по объекту, чтобы гарантировать невозможность повторения подобного сбоя, и самостоятельно укрепляем собственную архитектуру, чтобы подобные инциденты в будущем оказывали меньшее влияние на наших клиентов.

    Если у вас есть вопросы о том, как этот инцидент повлиял на вашу конкретную рабочую нагрузку, или если вы хотите обсудить компенсацию в рамках вашего договора на оказание услуг, пожалуйста, свяжитесь со службой поддержки Gcore.

    Благодарим вас за терпение и неизменное доверие к Gcore.

  • Решено
    Решено

    Мы рады сообщить вам, что инцидент с отключением электроэнергии в центре обработки данных полностью устранен, и все сервисы успешно восстановлены. Как только будет готов подробный анализ первопричин, мы предоставим его.

    Если у вас по-прежнему возникают какие-либо проблемы, пожалуйста, не стесняйтесь обращаться в нашу службу поддержки. Наша команда с удовольствием поможет вам и обеспечит оперативное решение любых дальнейших вопросов.

    Мы ценим ваше терпение и понимание на протяжении всего инцидента и благодарим вас за сотрудничество.

    Для получения дополнительной помощи, пожалуйста, свяжитесь с нашей службой поддержки по адресу support@gcore.com.

  • Мониторинг
    Мониторинг

    Все сервисы восстановлены. Небольшое количество физических серверов все еще находится в процессе восстановления, и наши команды продолжают внимательно следить за ситуацией.

    Благодарим вас за терпение и понимание на протяжении всего этого инцидента.

  • Обновление
    Обновление

    Мы получили дополнительную информацию от центра обработки данных, подтверждающую начало процесса восстановления электроснабжения. Некоторые сервисы, такие как API и сеть, снова работают. Восстановление работы сервисов происходит постепенно, и выездные бригады работают над полным восстановлением работоспособности как можно быстрее и безопаснее.

    Мы понимаем последствия этого инцидента и высоко ценим ваше терпение. Мы будем продолжать сообщать обновления по мере поступления новой информации и после полного восстановления работы сервиса.

  • Обновление
    Обновление

    Мы получили подтверждение от центра обработки данных о перебоях в электроснабжении, затронувших объект. Инженеры на месте активно работают над восстановлением электроснабжения в кратчайшие и безопасные сроки. Мы будем продолжать сообщать обновления по мере поступления новой информации.

  • Определено
    Определено

    Инженеры на месте активно расследуют проблему с электропитанием в центре обработки данных. Мы работаем над ее устранением и вскоре предоставим обновленную информацию.

  • Изучается
    Изучается

    В настоящее время в нашей сети произошел крупный сбой, затронувший облачные сервисы в регионе Лондон-2, что привело к полной недоступности сервиса. Мы приносим искренние извинения за любые неудобства, которые это может вызвать, и высоко ценим ваше терпение и понимание в это критическое время.

    Наша инженерная команда активно работает над выявлением первопричины и скорейшим внедрением решения. Мы будем регулярно предоставлять обновления по мере получения дополнительной информации о ходе решения проблемы.

    Благодарим вас за понимание и сотрудничество.