Dumb ways to die, или 7 популярных ошибок при подключении оборудования

Источник: habrahabr
dataline

Не хотелось бы никого расстраивать, но даже самый "нарядный" ЦОД - с резервированием по схеме N в кубе и вообще ваш собственный - еще не гарантия бесперебойной работы оборудования: это самое оборудование, прежде всего, нужно правильно подключить.

"Спасибо, Кэп!" - снисходительно улыбнется мой читатель, а я ему отвечу: не стоит благодарностей, сходите лучше в ЦОД и проверьте еще раз ваши стойки. Да-да, те самые, с которыми сто лет как все в порядке. Вы не поверите, как часто именно с такими вот "беспроблемными" стойками и случается прискорбное. Я даже чеклист набросал.

Итак, что НЕ должно встретиться вам на этой послеобеденной прогулке:

1. Сервер, СХД или сетевое оборудование о двух блоках питания, подключенных зачем-то к одному PDU*
Вот вроде бы азбука, - а вы все же проверьте. Бывает.

Вариация на ту же тему - АВР, обоими кабелями питания воткнутый в один и тот же PDU.

Во избежание: АВР (автоматический ввод резерва) - это такая штуковина, посредством которой к двум PDU (и, стало быть, к двум лучам) подключается оборудование с одним блоком питания - например, сетевое: коммутаторы, маршрутизаторы, вот это все.

Предположим, по чьей-то рассеянности АВР, к которому вот это все подключено, оказывается запитан от одного PDU. Чем это чревато? При пропадании соответствующего луча оборудование с таким АВР, разумеется, отключится, - а если это сетевое железо, вы и вовсе потеряете связь со всей стойкой. Звучит не очень, согласитесь.

2. Оборудование с одним блоком питания, подключенное вовсе без АВР.
Плохая, плохая идея. Понимаю, копейка рубль бережет, - но вам ведь важно, чтобы оно еще и безотказно работало, верно?

3. Загрузка АВР более чем на 75-80%.
​В чем тут засада: при запуске и перезагрузке оборудование потребляет гораздо больше тока, чем в обычном рабочем режиме. Соответственно, если "запаса" АВР на такие разовые "всплески" нет, у вас при запуске \ перезапуске просто "выбьет пробки" и привет.

4. Оборудование, подключенное в соседние стойки
​Возможно, кому-то покажется остроумным "отгрузить" немного электропотребления в соседний "шкаф", раз уж он простаивает недоутилизированным, пока рядом, что называется, некуда вешать. А теперь вопрос на засыпку: что там у нас к какому лучу подключено в итоге? А? Никто не в курсе? Вот то-то и оно.

Еще есть такой нюанс, как тепло, вырабатываемое оборудованием, и риски локального перегрева стойки, нагруженной этим оборудованием "под завязку". Перегрев и бардак с прокладкой проводов - не лучшее подспорье в ИТ-хозяйстве, поверьте.

5. Перегруженные секции PDU
Начну издалека: у PDU есть секции, и это все не просто так. Каждая секция стандартного PDU, суммарная мощность которого составляет, скажем, 32А, рассчитана на ток не более 16А. А на 20А уже не рассчитана. И на 25 тоже нет. Даже если вторая секция совершенно свободна. Такой вот нюанс.

А теперь представим, что кто-то (с самыми светлыми, заметим мы в скобках, намерениями) аккуратно заполняет стойку оборудованием и АВР - допустим, снизу вверх - и, понятно, подключает все это дело также строго снизу вверх. Чтобы как раз без бардака и красиво.

Казалось бы, все правильно сделал, и 32А еще не вычерпаны, а всего только 20 - живи да радуйся. Потом одним прекрасным утром в ЦОДе отключается один луч питания - и внезапно (!) на "перегретой" секции срабатывают защитные автоматы и вся эта секция (с подключенным к ней оборудованием, да-да) благополучно отключается. Изящно, правда? Хотите себе такое?

6. Стойка, перегруженная оборудованием настолько, что вынуждена в штатном режиме "кормиться" сразу от двух лучей, один из которых вообще-то резервный.
Тут такое дело: резерв, который задействован в штатной ситуации, - он как бы уже и не резерв, что ли…
Хорошая же новость заключается в том, что есть и человеческие способы увеличить мощность стойки,- причем без отключения активного оборудования. Заинтриговал? Тогда записывайте:

  • во-первых, можно добавить еще пару PDU аналогичной мощности и все новое оборудование… ладно, дальше сами, не маленькие;
  • во-вторых (вариант поэкзотичнее), можно заменить текущие PDU на более мощные

Здесь, пожалуй, потребуется некоторая сноровка, но в целом все, опять-таки, прозрачно: ставите более мощные автоматы, прокладываете более мощный кабель, устанавливаете новый (по совместительству более мощный) PDU рядом с прежним - и спокойно переключаете оборудование из одного PDU в другой. Ну, то есть как спокойно: если вдруг у вас недосмотр по пункту один нашего чеклиста, может получиться неловко. А если все четко - пройдет без помех. Далее повторяете процедуру со вторым PDU - и виват! Можно пойти перекурить.

7. Вы только не смейтесь, но… проверьте индикацию. Нет, правда, проверьте.
У самого бывало: подключили АВР, вроде бы все ok, - а плохой контакт, или нерабочий провод, или вовсе неплотно вставлен кабель… продолжать?

То же самое и с двумя блоками питания: внешне все прекрасно - оборудование работает, проблем нет. А на самом деле один из блоков давно помер, не оставив завещания.

В общем, не ленитесь раз в как получится проверить особенно дорогое вашему сердцу оборудование на наличие красных лампочек или отсутствие зеленых в нужных местах. Сами себе потом спасибо скажете.

На этом наш скромный хит-парад несуразностей при подключении оборудования исчерпан. Непрерывного вам сервиса и бесперебойных благ.

* Power Distribution Unit - блок розеток, если по-простому


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=34626