У нас есть пара дюжин серверов Proxmox (Proxmox работает на Debian), и примерно раз в месяц один из них будет испытывать панику ядра и зависать. Наихудшая часть этих блокировок заключается в том, что, когда это сервер, который находится на отдельном коммутаторе, чем мастер кластера, все остальные серверы Proxmox на этом коммутаторе перестанут отвечать, пока мы не найдем действительно сбойный сервер и перезагрузим его.
Когда мы сообщали об этой проблеме на форуме Proxmox, нам посоветовали перейти на Proxmox 3.1, и мы занимались этим уже несколько месяцев. К сожалению, один из серверов, которые мы перенесли на Proxmox 3.1, был заблокирован с паникой ядра в пятницу, и снова все серверы Proxmox, которые были на том же коммутаторе, были недоступны по сети, пока мы не смогли найти сбойный сервер и перезагрузить его.
Ну, почти все серверы Proxmox на коммутаторе ... Мне было интересно, что серверы Proxmox на том же коммутаторе, которые все еще были на Proxmox версии 1.9, не пострадали.
Вот снимок экрана консоли аварийного сервера:
Когда сервер заблокирован, остальные серверы на том же коммутаторе, на которых также работал Proxmox 3.1, стали недоступными и издали следующее:
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
...etc...
uname -a вывод заблокированного сервера:
Linux ------ 2.6.32-23-pve #1 SMP Tue Aug 6 07:04:06 CEST 2013 x86_64 GNU/Linux
Вывод pveversion -v (сокращенно):
proxmox-ve-2.6.32: 3.1-109 (running kernel: 2.6.32-23-pve)
pve-manager: 3.1-3 (running version: 3.1-3/dc0e9b0e)
pve-kernel-2.6.32-23-pve: 2.6.32-109
Два вопроса:
Любые подсказки, что будет вызывать панику ядра (см. Изображение выше)?
Почему другие серверы на том же коммутаторе и версии Proxmox будут отключены от сети до перезагрузки заблокированного сервера? (Примечание. На том же коммутаторе были другие серверы, на которых работала более старая версия 1.9 Proxmox, которые не были затронуты. Также не были затронуты другие серверы Proxmox в том же кластере 3.1, которые не были подключены к тому же коммутатору.)
Заранее благодарю за любой совет.