Мой порт коммутатора Cisco плох?


9

Я преследовал проблему потери пакетов и стабильности сети для нескольких конечных пользователей внутренней сети в течение последних нескольких дней ... Эти проблемы всплыли на прошлой неделе, однако место было поражено молнией шесть недель назад.

Я видел потерю пакетов на 5-10% между стеком из четырех Cisco 2960 и несколькими ПК и телефонами с другой стороны 77-метровой трассы. ПК были подключены к телефонам через транкинговую связь ( настройка порта коммутатора pastebin ). Мы видели пропущенные вызовы и прерывания в клиент-серверных приложениях и подключении к Microsoft Exchange.

Я попытался выполнить обычные действия по устранению неполадок удаленно, когда местный технический специалист сделал следующее во время перерывов в работе пользователей и производственной деятельности:

  • поменяйте кабели между настенной розеткой и устройством.
  • поменяйте соединительные кабели между коммутационной панелью и портом (портами) коммутатора.
  • попробуйте разные порты коммутатора в стеке 2960.
  • заменить устройства конечного пользователя на заведомо исправное оборудование (новые телефоны, разные ПК).
  • очистить счетчики интерфейса порта коммутатора и внимательно следить за ошибками приращения. ( Pastebin выход изsh int )
  • Посмотрел журналы устройства и графики Observium RRD . Никаких проблем со связью вверх / вниз со стороны коммутатора.
  • поменяйте удлинители на стороне конечного пользователя.
  • тестовый кабель проходит от Cisco 2960 с использованием test cable-diagnostics tdr int Gi4/0/9(чистого) *
  • Тестовый кабель проходит с помощью тестера Tripp-Lite. (Чистый)
  • запустить диагностику на элементах стека коммутаторов. (Чистый)

В итоге потребовалось три смены портов коммутатора, чтобы найти стабильное решение. Единственный логический вывод состоит в том, что некоторые порты коммутатора Cisco 2960 являются плохими или ненадежными ... Не мертвыми, но и непоследовательными в поведении. Я не привык видеть, как отдельные порты умирают таким образом.

Что еще я могу проверить или проверить, чтобы определить, являются ли эти устройства плохими?

Каков наилучший подход для проверки этого?

Обычно у отдельных портов возникают проблемы, а не у смежного банка портов?


Кстати - show cable-diagnostics tdr int Gi4/0/14это очень круто ...

Interface Speed Local pair Pair length        Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14  1000M Pair A     79   +/- 0  meters Pair B      Normal              
                Pair B     75   +/- 0  meters Pair A      Normal              
                Pair C     77   +/- 0  meters Pair D      Normal              
                Pair D     79   +/- 0  meters Pair C      Normal              

Не могли бы вы добавить "show interface gi4 / 0/9" ... также ваш вывод tdr из gi4 / 0/14 ... сколько портов имеют проблему?
Майк Пеннингтон

@MikePennington 4 интерфейса из 48 показывали проблемы. Счетчики были очищены. Но только счетчик , который был приращение был:Total output drops: 1461
ewwhite

1461 падает из общего количества выходных пакетов? Все четыре проблемных порта показывают падение выхода?
Майк Пеннингтон

@MikePennington Интерфейс вывода пастбина для двух проблемных портов.
2012 года

1
Не технический ответ, но .. у вас есть действующий контракт TAC? Если да,
включите

Ответы:


7

Хотя банки портов часто используют ASIC, у каждого должен быть свой отдельный PHY. Если PHY был поврежден, у него могут быть проблемы, в то время как у соседей нет.

Тем не менее, снижение производительности является странным симптомом для физической проблемы - не невозможно, но не типично. Несмотря на полудуплексные каналы, выходные потери обычно больше связаны с исчерпанием буфера, чем с физическими проблемами.

Вы можете получить больше информации, настроив перехват пакетов на другой стороне провода. Ожидается, что плохой физический уровень будет проявляться с некоторым количеством ошибок физического уровня (плохой CRC, рунт / гигант и т. Д.) На одной или обеих сторонах канала.

В целом это звучит так, как будто вы устранили достаточно, чтобы преодолеть границу убывающей отдачи. Я бы порекомендовал RMA, если у вас есть контракт.


Так как это происходит на нескольких портах на нескольких (2) коммутаторах, но только для небольшого подмножества пользователей, то стоит ли мне заменять все четыре коммутатора? Мне просто трудно лоббировать замену, не зная основной проблемы, поскольку замена потребует значительных простоев, повторного включения и т. Д.
ewwhite

Молния - очень странное животное, и ущерб от него может проявиться гораздо позже и непредсказуемым образом. Время простоя, конечно, отстой, но его можно несколько уменьшить, включив сменный переключатель, переместив патчи, а затем вытянув старые. Хотелось бы, чтобы был более простой ответ, но если вы изолировали проблему для нескольких портов, то больше ничего не нужно делать.
rnxrx

PHY почти всегда интегрируется в ASIC в эти дни. Это намного дешевле. Магнетизм - единственная часть, которую они действительно не могут интегрировать в ASIC, которая может быть повреждена, но это не PHY. Кроме того, довольно распространено использование магнитов с четырьмя наборами, поэтому, если проблема в 4 портах, подойдет для этой теории.
Крис С

Не совсем - если вы проходите через архитектуру большинства коммутаторов Cisco (включая рассматриваемый), одни и те же ASIC часто используются для одного или двух оптоволоконных или медных GE или некоторой группировки 100TX. Гораздо больше функциональности перенесено на ASIC в архитектурах с коммутацией на кристалле, но в этих случаях физический уровень все еще обрабатывается подключаемой оптикой или каким-либо медным носителем. Учитывая, что один и тот же комплекс ASIC часто может обрабатывать несколько различных требований к скорости и мощности, не имеет большого смысла интегрировать эту функцию в одно и то же вращение?
rnxrx

Наконец заменил все коммутаторы после того, как слишком много портов ухудшилось до такой степени, что стало непригодным для использования. Наконец, хорошее использование для SmartNet!
октября

2

Да, один порт может быть плохим, но, насколько я помню, вы должны заменить весь модуль. (Предостережение: прошло много времени с тех пор, как я проделал значительную работу Cisco ...)

Я не уверен, может ли это помочь, но посмотрите FITB , Лори Деннесс, один из инженеров Ops в Etsy.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.