Фон
У нас был инцидент, когда отказоустойчивый кластер Windows был прерван. Посмертное вскрытие показало, что узел был «удален», как описано в этой статье .
Мы только недавно полностью переместили этот кластер в нашу среду VMware, и кажется, что описанное выше событие могло быть причиной сбоя.
В соответствующей статье VMware KB об этом говорится об увеличении Small Rx Buffers
и Rx Ring #1
настройке, но предостерегает, что слишком большое их увеличение может значительно увеличить нагрузку на память хоста.
После проверки Network Interface\Packets Received Discarded
счетчиков производительности для наших ~ 150 виртуальных машин с Windows у 22 виртуальных сетевых плат (16 виртуальных сетевых карт) было отброшено несколько пакетов.
Достаточно небольшого количества, чтобы я не беспокоился о том, чтобы облагать хостами дополнительную нагрузку на память, но я хочу понять, как память используется для этих настроек и откуда берется память.
Вопросов
- Какова связь между количеством буферов и размером кольца?
- Как рассчитать объем памяти, используемый для заданных значений этих настроек?
- Поскольку эти настройки находятся на самой сетевой карте в гостевой ОС, я предполагаю, что они являются настройками драйвера. Это заставляет меня думать, что используемая оперативная память может быть выгружаемой или не выгружаемой.
- Это верно?
- Если так, я должен волноваться об этом?
- Есть проблемы, которые я не принимаю во внимание здесь?
Мы пытаемся определить, есть ли недостаток для установки их максимальных значений на затронутых виртуальных машинах, кроме использования памяти хоста VMware. Например, если мы увеличиваем риск истощения памяти пула в гостевой системе, мы более склонны начинать с малого.
Некоторые (возможно, все) из этих вопросов могут не относиться к VMware или виртуализации.