В настоящее время я создаю экземпляр для EC2, на котором можно импортировать весь снимок Planet.osm всей информации о Земле для некоторых проектов, над которыми мы работаем. Я развернул большой экземпляр Ubuntu x64 и прикрепил множество отдельных хранилищ на томе EBS для базы данных Postgres и изменил его, чтобы разместить там данные PGSQL.
Теперь на сервере возникают проблемы с использованием osm2pgsql
для импорта снимка ... После нескольких попыток с различными конфигами памяти и еще чем-то, процесс продолжает выводить "Killed" после прохождения большей части пути; как только он был убит во время «прохождения отложенных путей», а в следующий раз, после небольшой настройки тонкого кэша, он достиг «путей обработки» перед тем, как выйти из строя. Из того, что я прочитал, это, как правило, из-за проблем с памятью.
Вот моя последняя попытка запустить импорт:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
И вот спецификации для Большого экземпляра на EC2:
Большой экземпляр 7,5 ГБ памяти, 4 вычислительных блока EC2 (2 виртуальных ядра по 2 вычислительных блока EC2 в каждом), 850 ГБ локального хранилища экземпляров, 64-разрядная платформа
Мой вопрос - есть ли хорошие тестовые ресурсы для определения требований к настройке для osm2pgsql и Postgres? Скорость импорта для меня даже не так важна, я просто хотел бы убедиться, что процесс завершен безопасно, даже если это займет 4 или 5 дней ... Я прочитал книгу Фредерика Рамма " Оптимизация рендеринга". цепочка "(PDF) документ из SOTM прошлого года, но есть ли другие хорошие мнения / ресурсы?