Мы недавно были небольшой проблема с сетевым , где несколько серверов будут периодически теряют подключение к сети в довольно болезненном к решимости пути (требуется жесткие перезагрузки). Это продолжалось около двух недель, казалось бы, на разных серверах. Никакой конкретной модели, которую мы могли бы различить.
Немного покопавшись в этом, мы увидели, что коммутатор сообщает 100 Мбит / с для проблемного порта:
Это удивительно похоже на то, что произошло в статье Джоэла Спольски Five Whys.
Майкл провел некоторое время после вскрытия и обнаружил, что проблема заключается в простой проблеме конфигурации коммутатора. Существует несколько возможных скоростей, которые коммутатор может использовать для связи (10, 100 или 1000 мегабит в секунду). Вы можете установить скорость вручную или позволить коммутатору автоматически согласовывать максимальную скорость, с которой могут работать обе стороны. Неисправный коммутатор был настроен на автосогласование. Обычно это работает, но не всегда, а утром 10 января этого не произошло.
Теперь мы отключили автосогласование на нашем сетевом оборудовании и установили фиксированную скорость 1000 Мбит / с (гигабит).
Мои вопросы к тем, кто обладает большим опытом работы с серверным оборудованием:
- Насколько распространены проблемы автоматического согласования с современным сетевым оборудованием?
- Считается ли хорошей стандартной сетевой практикой отключать автосогласование и устанавливать фиксированные скорости при настройке сети?