Дублинское падение в России почти не заметили

Источник: mskit
Алексей Писарев

 

 

Удар молнии в воскресенье вечером вывел из строя крупные дата-центры Amazon и Microsoft, расположенные в Дублине. В таких ситуациях у всех компаний ущерб всегда одинаковый: потеря данных, неработающие ресурсы, финансовые потери. Однако данное происшествие интересно, в первую очередь, тем насколько быстро пресловутые "облачные" технологии позволяют гибко и безболезненно для клиентов воскресить и снова запустить данные в любых нештатных ситуациях.

 

Как сообщила Amazon, молния, ударившая в трансформатор, стала причиной пожара  и отключения электричества в дата-центре. Вышли из строя автоматические системы резервирования, а также штатные системы подачи электричества. Результатом стала  остановка работы сайтов, работающих на базе  "облачной" платформы Amazon EC2, проблемы с RDS и сервисом Amazon CloudWatch. Пользователи Microsoft лишились доступа к сервису Business Productivity Online Suite.

Восстановление работоспособности сервисов заняло порядка 4 часов, и уже к вечеру, по сообщениям компаний, все работало. 

В России "падение" Amazon осталось практически не замеченным: блогосфера и СМИ  пока просто констатируют факт. С одной стороны, это можно объяснить тем, что количество российских сайтов, расположенных на Amazon пока не велико, поэтому больших потерь не зафикисировано.

"На текущий момент сервисы Amazon еще не столь распространены среди российских компаний, что бы говорить про массовые потери. Традиционно миграция высокотехнологичных сервисов на новые площадки, тем более расположенные за рубежом - очень долгий процесс, на который идут, как правило, самые "продвинутые" компании, - отметил Павел Васильев, технический директор группы компаний Hosting Community. - Играют роль и настороженное отношение ко всему новому, и сложности работы с зарубежными партнерами. Но для тех компаний, которые всё же решились сотрудничать с Amazon, последствия можно оценить только с точки зрения простоя сервисов в течение нескольких часов. Думаю, что наработанные данные останутся целыми и будут доступны после полного восстановления работы сервисов, это 2-3 дня".

 В компании "1С-Битрикс" комментирует ситуацию так.

"Собственные сайты "1С-Битрикс" (клиентский, партнерский, сайт для разработчиков) расположены в "облаке" Amazon. Конкретнее, в одном из дата-центров в Ирландии. В воскресенье вечером именно в этом дата-центре из-за попадания молнии начались проблемы с электропитанием и, как следствие, с доступностью всех ресурсов, расположенных в нем",  - сообщил Александр Демидов,  руководитель направления арендных решений компании "1С-Битрикс".

"Облачная" архитектура позволила компании достаточно оперативно поднять копии сайтов в другом дата-центре. Сайты были недоступны для посетителей всего несколько часов. Все сайты клиентов, работающие на платформе "1С-Битрикс: Управление сайтом" продолжали работать без каких-либо проблем. Для успешной их работы доступ к сайту www.1c-bitrix.ru не требуется. Он нужен только в момент установки обновлений администраторами. При этом даже если они не будут доступны, на работе сайтов это никак не сказывается, обновления просто устанавливаются позже.

Возвращаясь собственно к происшествию, необходимо признать, что, действительно, имела место очень серьезная авария. И, по мнению Павла Васильева, учитывая масштабы дата-центров, восстановление не может быть быстрым и дешевым: "Достаточно сказать, что кабели питания, обеспечивающие электричеством таких потребителей, бывают толщиной в руку и более. Соответственно, всё сопутствующее оборудование примерно тех же масштабов. Ремонт таких систем очень сложен. Так же не стоит забывать, что помимо восстановления электричества, необходимо заново запустить сложную систему "облачных вычислений". Информация в таких случаях часто теряется безвозвратно, причем на разных серверах по-разному. При восстановлении информацию придется актуализировать, восстановить ее целостность и снова запустить в обработку". 

Назвать аварию ошибкой инженеров сложно, поскольку от всего на свете застраховаться нельзя, хотя одновременное падение систем резервирование немного озадачивает.  Профессионализм восстановивших подачу электричества в течение нескольких часов, - это тоже очень неплохой результат. Чего нельзя сказать о том, насколько быстро заработало "облако".  

Напомним, что одним из ключевых преимуществ "облачных" вычислений является обеспечение сохранности и работоспособности сервисов вне зависимости от ситуации. По сути, клиента призывают не задумываться о том, где расположены его данные, поскольку в случае нештатной ситуации они "перетекут" в резервный дата-центр. В данном случае можно говорить, что "облако" Amazon со своей главной задачей эффективно и незаметно не справилось. 

"По идее, никто из пользователей облачной структуры вообще не должен был ничего заметить, разве что некоторое замедление работы сервисов, - говорит Павел Васильев. -  Вот тут инженерам и разработчикам предстоит очень большая работа по оптимизации облачных технологий таким образом, чтобы несколько дата-центров резервировали друг друга. В этом случае "облако" работало внутри одного дата-центра, без внешнего резервирования, что и определило столь серьезные последствия". 

"4 часа для восстановления ДЦ после крупной аварии - это быстро. Но, по сути,  облачные технологии не отменяют таких простых правил как резервирование своих данных, создание бэкапов и т.п",-  напомнил  вице-президент компании "Агава" Мартин Громов. 

Российские игроки рынка,  как показал опрос  закладывают возможность подобных форс-мажоров в свои проекты. Так по словам Александра Демидова, "1С-Битрикс" постарается использовать опыт, полученный в результате этого инцидента: в следующий релиз платформы "1С-Битрикс" 10.5, который выйдет осенью, будет включена поддержка симметричного кластера, что позволит размещать веб-проекты сразу в нескольких дата-центрах в любой удаленности друг от друга и тем самым минимизировать время простоя. 

Совсем скоро Агава запускает Reserved-хостинг, которому не страшны ни гром, ни молния. Данные клиента будут синхронизироваться между двумя различными дата-центрами, и при малейших неполадках на одной площадке, переключаться на другой. Технология находится на завершающей стадии тестирования, и как сообщили в пресс-службе "Агава" планируется запустить eserved-Хостинг уже к началу осени.


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=26335