Комбинация ECMP (или других причин асимметричных путей) и HSRP по умолчанию нарушена в Cisco IOS; Поведение по умолчанию с этим дизайном чрезмерно затопляет одноадресный трафик.
Какова наилучшая практика использования HSRP с ECMP для предотвращения неизвестных наводнений одноадресной рассылки?
Детали / Фон
У нас есть топология HSRP, аналогичная первой диаграмме ниже для многих наших объектов. Наши маршрутизаторы Cisco WAN имеют равные по стоимости маршруты ко всем остальным сайтам; таким образом, мы можем постоянно видеть асимметричные эффекты маршрутизации. Обычно мы назначаем R1 первичным HSRP, но ECMP разрешает возврат трафика через R1 или R2.
Проблема заключается в том, что, когда ПК1 монтирует удаленный диск iSCSI через WAN, трафик покидает сайт через R1, но может возвращаться через R2. Пока трафик iSCSI возвращается через R1, проблем нет.
Проблема возникает, когда трафик PC1 возвращается через R2. Предположим, что сеанс iSCSI начинается в 8:00:00, и оба маршрутизатора и оба коммутатора одновременно изучают Mac PC1. Между 8:00:00 и 8:00:05 проблем с переполнением нет, поскольку оба коммутатора все еще имеют mac-адрес PC1 в своей таблице CAM.
Через пять минут после начала сеанса iSCSI запись CAM в S2 для Mac PC1 истекает из таблицы CAM, и S2 перенаправляет трафик PC1 через все порты (в данном случае в Po1, Gi0 / 3 и Gi0 / 4). Если сеанс iSCSI ПК1 потребляет большую полосу пропускания, это неизвестное одноадресное наводнение может высвободить нетривиальную емкость из каналов связи с ПК3 и ПК4.
Коммутаторы Cisco IOS имеют таймер CAM по умолчанию 300 секунд ...
S2# show mac address-table aging-time
Vlan Aging Time
---- ----------
1 300
17 300
Однако таймер ARP интерфейса Cisco IOS по умолчанию составляет 4 часа ...
R2# show interface gi0/0
GigabitEthernet0/0 is up, line protocol is up
Hardware is AmdP2, address is 000a.dead.beef (bia 000a.dead.beef)
Internet address is 172.17.1.252/24
MTU 1500 bytes, BW 10000 Kbit, DLY 1000 usec,
reliability 255/255, txload 1/255, rxload 1/255
Encapsulation ARPA, loopback not set
Keepalive set (10 sec)
ARP type: ARPA, ARP Timeout 04:00:00 <--------------
Поэтому S2 начинает заполнять трафик iSCSI PC1 через пять минут.