У меня есть 24-ядерный компьютер с оперативной памятью 94,6 ГБ, на котором работает сервер Ubuntu 10.04. В боксе наблюдается высокий процент iowait, в отличие от другого нашего сервера (4 ядра), на котором выполняются процессы тех же типов и объемов. Обе машины подключены к файловому серверу VNX Raid, 24-ядерному компьютеру через 4 карты FC, а другие - через 2 гигабитные карты Ethernet. 4-ядерный компьютер в настоящее время превосходит 24-ядерный компьютер, имеет более высокую загрузку процессора и меньший% iowait.
За 9 дней безотказной работы, в среднем,% iowait составляет 16% и обычно превышает 30%. В большинстве случаев загрузка ЦП очень низкая, около 5% (из-за высокого iowait). Существует достаточно свободной памяти.
Одна вещь, которую я не понимаю, это то, почему все данные, кажется, проходят через устройство SDC, а не проходят напрямую через движки данных:
avg-cpu: %user %nice %system %iowait %steal %idle
6.11 0.39 0.75 16.01 0.00 76.74
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 0.00 0.00 0.00 1232 0
sdb 0.00 0.00 0.00 2960 0
sdc 1.53 43.71 44.54 36726612 37425026
dm-0 0.43 27.69 0.32 23269498 268696
dm-1 1.00 1.86 7.74 1566234 6500432
dm-2 0.96 1.72 5.97 1442482 5014376
dm-3 0.49 9.57 0.18 8040490 153272
dm-4 0.00 0.00 0.00 1794 24
dm-5 0.00 0.00 0.00 296 0
Другая часть головоломки состоит в том, что задачи часто переходят в режим бесперебойного сна (вверху), также, вероятно, из-за задержки ввода-вывода.
Что я могу посмотреть, чтобы помочь диагностировать проблему? Почему все данные проходят через / dev / sdc? Это нормально?
ОБНОВИТЬ:
Сетевое подключение и емкость чтения / записи VNX исключены как узкие места. Мы можем достичь скорости 800 МБ / с с помощью 4-х сетевых карт (циклический перебор). Карты Fibre Channel еще не используются. VNX хорошо справляется с операциями ввода-вывода (RAID6, 30x2 ТБ, 7,2 кПМ дисков на пул в двух пулах (всего 60 дисков), около 60% чтения).
Не обращайте внимания на dm и sdc, они все являются внутренними дисками и не являются частью проблемы.
Мы думаем, что проблема может быть связана с монтированием nfs или TCP (у нас есть 5 монтирований на 5 разделов в VNX), но мы не знаем, что именно. Любой совет?
dm
означает устройство отображения, а не перемещения данных. Этот вопрос, вероятно, будет гораздо лучше при сбое сервера.