Dumb ways to die, или 7 популярных ошибок при подключении оборудованияИсточник: habrahabr dataline
Не хотелось бы никого расстраивать, но даже самый "нарядный" ЦОД - с резервированием по схеме N в кубе и вообще ваш собственный - еще не гарантия бесперебойной работы оборудования: это самое оборудование, прежде всего, нужно правильно подключить. "Спасибо, Кэп!" - снисходительно улыбнется мой читатель, а я ему отвечу: не стоит благодарностей, сходите лучше в ЦОД и проверьте еще раз ваши стойки. Да-да, те самые, с которыми сто лет как все в порядке. Вы не поверите, как часто именно с такими вот "беспроблемными" стойками и случается прискорбное. Я даже чеклист набросал. 1. Сервер, СХД или сетевое оборудование о двух блоках питания, подключенных зачем-то к одному PDU* Вариация на ту же тему - АВР, обоими кабелями питания воткнутый в один и тот же PDU. Во избежание: АВР (автоматический ввод резерва) - это такая штуковина, посредством которой к двум PDU (и, стало быть, к двум лучам) подключается оборудование с одним блоком питания - например, сетевое: коммутаторы, маршрутизаторы, вот это все. Предположим, по чьей-то рассеянности АВР, к которому вот это все подключено, оказывается запитан от одного PDU. Чем это чревато? При пропадании соответствующего луча оборудование с таким АВР, разумеется, отключится, - а если это сетевое железо, вы и вовсе потеряете связь со всей стойкой. Звучит не очень, согласитесь. 2. Оборудование с одним блоком питания, подключенное вовсе без АВР. 3. Загрузка АВР более чем на 75-80%. 4. Оборудование, подключенное в соседние стойки Еще есть такой нюанс, как тепло, вырабатываемое оборудованием, и риски локального перегрева стойки, нагруженной этим оборудованием "под завязку". Перегрев и бардак с прокладкой проводов - не лучшее подспорье в ИТ-хозяйстве, поверьте. 5. Перегруженные секции PDU А теперь представим, что кто-то (с самыми светлыми, заметим мы в скобках, намерениями) аккуратно заполняет стойку оборудованием и АВР - допустим, снизу вверх - и, понятно, подключает все это дело также строго снизу вверх. Чтобы как раз без бардака и красиво. Казалось бы, все правильно сделал, и 32А еще не вычерпаны, а всего только 20 - живи да радуйся. Потом одним прекрасным утром в ЦОДе отключается один луч питания - и внезапно (!) на "перегретой" секции срабатывают защитные автоматы и вся эта секция (с подключенным к ней оборудованием, да-да) благополучно отключается. Изящно, правда? Хотите себе такое? 6. Стойка, перегруженная оборудованием настолько, что вынуждена в штатном режиме "кормиться" сразу от двух лучей, один из которых вообще-то резервный.
Здесь, пожалуй, потребуется некоторая сноровка, но в целом все, опять-таки, прозрачно: ставите более мощные автоматы, прокладываете более мощный кабель, устанавливаете новый (по совместительству более мощный) PDU рядом с прежним - и спокойно переключаете оборудование из одного PDU в другой. Ну, то есть как спокойно: если вдруг у вас недосмотр по пункту один нашего чеклиста, может получиться неловко. А если все четко - пройдет без помех. Далее повторяете процедуру со вторым PDU - и виват! Можно пойти перекурить. 7. Вы только не смейтесь, но… проверьте индикацию. Нет, правда, проверьте. То же самое и с двумя блоками питания: внешне все прекрасно - оборудование работает, проблем нет. А на самом деле один из блоков давно помер, не оставив завещания. В общем, не ленитесь раз в как получится проверить особенно дорогое вашему сердцу оборудование на наличие красных лампочек или отсутствие зеленых в нужных местах. Сами себе потом спасибо скажете. На этом наш скромный хит-парад несуразностей при подключении оборудования исчерпан. Непрерывного вам сервиса и бесперебойных благ. * Power Distribution Unit - блок розеток, если по-простому |