Amazon рассказала, почему произошел сбой в работе облачных сервисов

Изображение: (сс) Tim Reckmann
В серверной
В серверной

Отказ в работе инструментов, предназначенных для автоматизации процессов, стал причиной недавнего масштабного сбоя в работе облачной инфраструктуры, заявила компания Amazon, 10 декабря сообщило издание Bloomberg.

Уточняется, что 7 декабря одна из программ, обеспечивающая надежность работы сети, прекратила функционирование, вызвав ряд непредсказуемых действий большого числа систем. Сбой привел к всплеску активности в инфраструктуре Amazon, лишив пользователей доступа к некоторым облачным ресурсам.

Читайте также: Крупный сбой в работе серверов Amazon затронул ряд видеоигр и сервисов

Специалистам понадобилось несколько часов на то, чтобы выявить и исправить проблему. Однако за это время пользователи столкнулись с отказом систем умного дома и многих приборов, работа которых зависит от подключения к интернету. Кроме того, начались перебои в работе игровых сервисов и онлайн-кинотеатров.

«Некорректный фрагмент кода, выполняющегося в автоматическом режиме, вызвал эффект снежного кома. Из-за этой проблемы отключились системы внутреннего контроля и мониторинга», — пояснил аналитик Forrester Брент Эллис (Brent Ellis).

Однако многих специалистов не устроило такое объяснение, так как ничего конкретного сказано не было.

«Они не пояснили, что это было за непредсказуемое поведение систем, потому что не знают, что это было. Они пытались исправить проблему наугад, поэтому работа заняла так много времени», — утверждает Кори Куинн (Corey Quinn), эксперт по облачным технологиям в компании Duckbill Group.

Напомним, в последний раз подобный крупный сбой произошел с серверами Amazon в 2017 году. Как удалось выяснить, причиной отказа систем, оказалось отключение большего числа серверов, чем требовалось, сотрудником компании, осуществлявшим ремонт биллинговой системы.

Произошедший сбой показывает, насколько зависимы информационно-технологические компании от сторонних серверных услуг. Работа серверов Amazon считается высоконадежной. От сбоев серверного оборудования и программного обеспечения для него не застрахована ни одна компания.