Ошибка резервного копирования привела к утере 77 Тб данных суперкомпьютера

Изображение: Сергей Кайсин © ИА Красная Весна
Системный сбой
Системный сбой

Данные 14 групп пользователей суперкомпьютера университета Киото были утеряны в результате некорректной работы системы резервного копирования японского подразделения компании HPE, 30 декабря сообщает интернет-издание об информационной безопасности Bleeping Computer.

Сам инцидент произошел в середине декабря, но информация была опубликована университетом лишь 30 декабря. Ошибка системы резервного копирования привела к утере 77 Тб данных в 34 млн файлах, причем для четырех из 14 групп пользователей безвозвратно. Бы ли потеряны результаты работы за полтора дня.

Исследование проблемы, проведенное сотрудниками японского подразделения HPE, показало, что сбой произошел в результате обновления сценария для командной оболочки Bash прямо во время его работы. Сценарий является частью системы резервного копирования.

В результате попытки обновления сценария во время работы были потеряны значения переменных окружения. Посреди процесса резервного копирования начала работать уже новая версия сценария, а в начале процедуры — старая. Защитных механизмов на такой случай в систему резервного копирования предусмотрено не было.

На данный момент система резервного копирования остановлена. Она вновь будет запущена в конце января после внесения необходимых исправлений и доработки. Помимо создания полной копии данных будет дополнительно предусмотрен механизм инкрементального резервного копирования.