Я использую ArcGIS 10.0 на Windows 7 64-битной с 4 ГБ оперативной памяти.
У меня есть несколько очень больших таблиц в формате CSV для импорта в ArcGIS, все они имеют около 30 полей, более 5 миллионов записей на таблицу (в некоторых есть вдвое больше или больше), а размеры файлов составляют до 5 ГБ. Я пытаюсь импортировать каждый из них в файловую базу геоданных как отдельные таблицы, чтобы в конечном итоге я мог связать их с классом объектов и проанализировать результаты в таблицах в соответствии с их расположением.
Проблема состоит в том, что ArcGIS, похоже, просто прекращает импорт записей в определенный момент. Я использую инструмент «Таблица в таблицу» в «Конверсия> В базу геоданных», но у инструмента «Копировать строки» есть та же проблема. Даже если я просто добавлю CSV-файл непосредственно в ArcGIS, не пытаясь сначала преобразовать его в таблицу FGDB, проблема остается той же. В одной из моих таблиц около 11 миллионов записей, и ArcGIS импортирует только около 10 миллионов. ArcGIS не сообщает мне, что произошла какая-либо ошибка, инструмент просто завершает работу, как будто все в порядке.
Я уже пробовал это несколько раз, и количество записей, попадающих в таблицу FGDB, всегда одинаково и не является предельным размером файла, о котором я когда-либо слышал (не квадрат 2 или 16). ArcGIS смогла импортировать еще один CSV с примерно 6 миллионами записей, и все записи были получены (хотя из-за проблем, с которыми я сталкиваюсь с таблицей большего размера, меньшая тоже подозрительна). На веб-сайте ESRI перечислены следующие ограничения размера в файловой базе геоданных , и я далеко не выберу ни одного из них:
- Размер файловой базы геоданных: без ограничений
- Размер таблицы или класса объектов: 1 ТБ (по умолчанию), 4 ГБ или 256 ТБ с ключевым словом
- Количество классов объектов и таблиц: 2 147 483 647
- Количество полей в классе пространственных объектов или таблице: 65 534
- Количество строк в классе пространственных объектов или таблице: 2 147 483 647
- Длина имени базы геоданных: количество символов, разрешенных операционной системой в папке
- Длина имени класса объекта или таблицы: 160 символов
- Длина имени поля: 64 символа
- Ширина текстового поля: 2 147 483 647
Все, что мне действительно нужно сделать для этих таблиц, это добавить пару полей, удалить пару других и сгенерировать значения для новых полей (суммы нескольких из существующих полей). Я использую ArcGIS для этого, потому что я знаком с полевым калькулятором и знаю (или знал до сих пор), что он может обрабатывать таблицы, состоящие из миллионов записей, тогда как большинство других настольных программ у меня есть под рукой (MS Access / Excel) ) задыхается от такого количества записей. Так что я открыт для использования некоторого другого программного обеспечения для манипулирования исходной таблицей, а затем для экспорта (намного меньшей) результирующей таблицы в ArcGIS. Действительно, тот факт, что у меня возникла эта проблема и что ArcGIS не дает мне никаких ошибок или предупреждений о том, что проблема даже возникает, заставляет меня хотеть обрабатывать эти данные вне ArcGIS в максимально возможной степени.