Как освободить место, занятое индексом, который частично построен и был прерван отключением электроэнергии


9

Я использую Postgres (Postgis) 9.4.2 на Mac (10.10.4).

У меня есть пара больших столов (несколько ТБ).

Во время построения индекса для одного из них, который занимает около недели, я наблюдал падение доступного места на жестком диске, поскольку можно было ожидать, что он приблизится почти к той точке, в которой индекс будет завершен, когда перебои в подаче электроэнергии продолжались дольше, чем блок батареи и система. пошел вниз У меня были отключены буферы, и fillfactor=100во время сборки, так как это статический источник данных. При перезагрузке доступное пространство, оставшееся на диске, находится именно там, где оно было почти в конце построения индекса. Вакуумный анализ не освобождает пространство.

Я попытался уронить стол и снова проглотить, и это не оставило места. Сейчас я нахожусь в месте, где мне не хватает места для построения индекса.

Не застряли ли файлы, сгенерированные во время построения индекса, в каком-то подвешенном состоянии, где они не могут быть удалены системой из-за того, как машина вышла из строя во время отключения питания?

Когда я смотрю на размеры таблиц и индексы в БД (которые являются единственными данными на этом диске), они составляют примерно 6 ТБ . Объем накопителя составляет 8 ТБ , а на диске осталось менее 500 ГБ , поэтому кажется, что где-то потеряно около 1,5 ТБ , что примерно соответствует размеру индекса.

Любые идеи?


Индекс все еще перечислен с запросом как это? SELECT r.relname, r.relkind, n.nspname FROM pg_class r INNER JOIN pg_namespace n ON r.relnamespace = n.oid WHERE relkind = 'i';
Кассандри

Нет, он не отображается в результатах этого запроса.
dkitchel

1
У вас есть что-нибудь в списке, что SELECT indexrelid::regclass, indrelid::regclass FROM pg_catalog.pg_index WHERE NOT indisvalid;дает вам?
Дезсо

Нет, это приходит пустым.
dkitchel

Ответы:


5

Обычно мы ожидаем, что при перезапуске postgres процесс восстановления после сбоя удалит файлы, связанные с индексом отката, из каталога данных.

Давайте предположим, что это не сработало, или, по крайней мере, это нужно проверить вручную.

Список файлов, которые должны быть в каталоге данных, может быть создан с помощью запроса:

select pg_relation_filenode(oid)
   from pg_class
  where relkind in ('i','r','t','S','m')
    and reltablespace=0
  order by 1;

reltablespace=0для табличного пространства по умолчанию. Если проблемный индекс был создан в табличном пространстве не по умолчанию, его 0необходимо заменить на его OID in pg_tablespace.

i, r, t, S, m relkindсоответствуют соответственно индексам, таблицам, пространству тостов, последовательностям, материализованным представлениям. Все эти объекты имеют свои данные в файлах, имена которых совпадают pg_relation_filenode(oid).

На диске файлы данных находятся ниже, $PGDATA/base/oid/где oidнаходится oidбаза данных, полученная с помощью select oid,datname from pg_database. Если мы не говорим о табличном пространстве по умолчанию, baseвместо PG_version_somelabelнего вместо.

Вывести список и отсортировать файлы, соответствующие relfilenodes в этом каталоге:

ls | grep -E '^[0-9]+$' | sort -n > /tmp/list-of-relations.txt

(это фактически сохраняет только первый сегмент для отношений, которые больше чем 1 ГБ. Если есть задерживающиеся сегменты, ни к чему не привязанные, их следует рассматривать отдельно)

и измените этот файл с результатом запроса выше.

Если существуют устаревшие файлы данных, которые не соответствуют ни одному объекту, о котором знает БД, они должны появиться в этом diff.


Потрясающие! Я нашел 1 файл в datadir, который не отображался в списке выбора. Могу ли я безопасно удалить этот файл?
dkitchel

На самом деле это соответствует примерно 800 файлам с итерациями после точки - все как 499807.484 и т. Д. Могу ли я безопасно удалить эти файлы?
dkitchel

@dkitchel: это будут сегменты по 1 Гб каждый для огромного индекса. Возможно, убедитесь, что их метки времени совпадают с моментом создания индекса. Что касается их удаления, я надеюсь, что мои рассуждения верны, но это ваши данные, так что в конечном итоге это ваше решение!
Даниэль Верите

Да, временные метки согласуются с тем, когда индекс создавался, и сумма размеров файлов примерно соответствует тому, насколько большим должен быть индекс. Ваши рассуждения кажутся убедительными. Я сделаю это с большой уверенностью. Благодаря тонну.
dkitchel

Просто следите за тем, чтобы другие, оказавшиеся в том же затруднительном положении, могли с уверенностью использовать решение @ DanielVerite. Его решение действительно сработало для меня.
dkitchel
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.