Я пытаюсь выполнить пересечение между двумя слоями:
- Слой полилинии, представляющий некоторые дороги (~ 5500 рядов)
- Многоугольный слой, представляющий буферы неправильной формы вокруг различных точек интереса (~ 47 000 строк)
В конечном итоге я пытаюсь обрезать полилинии для этих многочисленных (иногда перекрывающихся) буферов, а затем суммировать общую длину проезжей части, содержащейся в каждом буфере.
Проблема в том, что все работает медленно. Я не уверен, сколько времени это займет, но я просто прервал свой запрос после> 34 часов. Я надеюсь, что кто-то может либо указать, где я допустил какую-то ошибку в своем запросе SQL, либо указать мне лучший способ сделать это.
CREATE TABLE clip_roads AS
SELECT
ST_Intersection(b.the_geom, z.the_geom) AS clip_geom,
b.*
FROM
public."roads" b,
public."buffer1KM" z
WHERE ST_Intersects(b.the_geom, z.the_geom);
CREATE INDEX "clip_roads_clip_geom_gist"
ON "clip_roads"
USING gist
(clip_geom);
CREATE TABLE buffer1km_join AS
SELECT
z.name, z.the_geom,
sum(ST_Length(b.clip_geom)) AS sum_length_m
FROM
public."clip_roads" b,
public."buffer1KM" z
WHERE
ST_Contains(z.the_geom, b.the_geom)
GROUP BY z.name, z.the_geom;
У меня есть индекс GiST, созданный для исходной таблицы дорог, и (на всякий случай?) Создать индекс перед созданием второй таблицы.
План запросов от PGAdmin III выглядит следующим образом, хотя, боюсь, у меня нет особых навыков в его интерпретации:
"Nested Loop (cost=0.00..29169.98 rows=35129 width=49364)"
" Output: st_intersection(b.the_geom, z.the_geom), b.gid, b.geo_id, b.address_l, b.address_r, b.lf_name, b.lfn_id, b.lfn_name, b.lfn_type_c, b.lfn_type_d, b.lfn_dir_co, b.lfn_dir_de, b.lfn_desc, b.oe_flag_l, b.oe_flag_r, b.fcode_desc, b.fcode, b.fnode, b.tnode, b.metrd_num, b.lo_num_l, b.lo_n_suf_l, b.hi_num_l, b.hi_n_suf_l, b.lo_num_r, b.lo_n_suf_r, b.hi_num_r, b.hi_n_suf_r, b.juris_code, b.dir_code, b.dir_code_d, b.cp_type, b.length, b.the_geom"
" Join Filter: _st_intersects(b.the_geom, z.the_geom)"
" -> Seq Scan on public."roads" b (cost=0.00..306.72 rows=5472 width=918)"
" Output: b.gid, b.geo_id, b.address_l, b.address_r, b.lf_name, b.lfn_id, b.lfn_name, b.lfn_type_c, b.lfn_type_d, b.lfn_dir_co, b.lfn_dir_de, b.lfn_desc, b.oe_flag_l, b.oe_flag_r, b.fcode_desc, b.fcode, b.fnode, b.tnode, b.metrd_num, b.lo_num_l, b.lo_n_suf_l, b.hi_num_l, b.hi_n_suf_l, b.lo_num_r, b.lo_n_suf_r, b.hi_num_r, b.hi_n_suf_r, b.juris_code, b.dir_code, b.dir_code_d, b.cp_type, b.length, b.the_geom"
" -> Index Scan using "buffer1KM_index_the_geom" on public."buffer1KM" z (cost=0.00..3.41 rows=1 width=48446)"
" Output: z.gid, z.objectid, z.facilityid, z.name, z.frombreak, z.tobreak, z.postal_cod, z.pc_area, z.ct_id, z.da_id, z.taz_id, z.edge_poly, z.cchs_0708, z.tts_06, z.the_geom"
" Index Cond: (b.the_geom && z.the_geom)"
Эта операция просто обречена на несколько дней? В настоящее время я использую это на PostGIS for Windows, но теоретически я могу использовать больше оборудования для решения проблемы, поставив его на Amazon EC2. Однако я вижу, что запрос использует только одно ядро за один раз (есть ли способ заставить его использовать больше?).