У меня есть сервер под управлением VMware ESXi v4.1.0 348481. Он имеет аппаратный RAID10 и резервный диск SATA. У меня работает виртуальная машина, в которой есть основной загрузочный vmdk в хранилище данных RAID10, и 600 ГБ vmdk в хранилище данных резервного диска SATA. Виртуальная машина работает под управлением Debian Linux с ядром FreeBSD и использует ZFS для резервного диска.
РЕДАКТИРОВАТЬ: диск не подключен непосредственно к виртуальной машине . Он используется в качестве хранилища данных VMware, а виртуальная машина имеет vmdk в хранилище данных диска SATA. Хранилище данных не заполнено (заполнено только на 65%)
Я вошел на сервер с использованием SSH и обнаружил, что резервное копирование прошлой ночью зависло zfs list
или zpool list
оба зависли. Поэтому я открыл виртуальную консоль в ESXi, и мне было грустно видеть:
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
Я попытался перезагрузить виртуальную машину, и я получил сообщение о том, что система отключается для перезагрузки, а затем зависло. (^ C появляется, но не убивает shutdown
). Я не могу прерывания или или процессы - Ничего не происходит , когда я пытаюсь.kill -9
zpool list
zfs list
rsync
- Это указывает на сбой резервного диска SATA? Или это может быть просто ошибкой ESXi?
- Как в клиенте vSphere я могу определить, не работает ли диск? Я не видел никаких показаний, все под Hardware Health Status выглядит хорошо, и я ничего не видел в конфигурации хранилища.
- Как мне действовать отсюда? Должен ли я просто перезагрузить виртуальную машину?
ОБНОВЛЕНИЕ: я просто сильно перезагрузил ВМ. После того, как он вернулся в оперативный режим, резервная копия zpool была в сети:
root@timestandstill:/home/jnet# zpool status -v
pool: backup
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://www.sun.com/msg/ZFS-8000-8A
scrub: none requested
config:
NAME STATE READ WRITE CKSUM
backup ONLINE 0 0 0
da1 ONLINE 0 0 0
errors: Permanent errors have been detected in the following files:
/backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics
Я сильно склоняюсь к замене диска ...