Я пытаюсь найти ближайшую линию к кучу точек (около 24 миллиардов точек, 4 миллиона строк). Точки существуют в одном GeoDataFrame, а линии существуют в другом. Я пытался следовать этому: https://github.com/geopandas/geopandas/issues/140, и сделал это:Как использовать пространственный индекс GeoPandas с линиями?
lines_sidx = lines_df['geom'].sindex
[list(lines_sidx.intersection((points.loc[i,'geom'].y, points.loc[i,'geom'].x))) for i in range(len(points))]
И это просто возвращает пустой список списков. Что здесь происходит?
(Обратите внимание, что я применяю это к первым 100 линиям и точкам из обоих наборов данных).