Я на самом деле работаю над высокоразмерными данными (~ 50.000-100.000 функций) и должен искать на нем поиск ближайших соседей. Я знаю, что KD-Trees имеют низкую производительность по мере роста размеров, а также я читал, что в целом все структуры данных пространственного разделения имеют тенденцию выполнять исчерпывающий поиск с использованием данных с высоким размером.Наилучшая структура данных для поиска по ближайшим соседям с высоким размерностью
Кроме того, там должны быть рассмотрены два важных факта (упорядоченных по релевантности):
- Precision: Ближайшие соседи должны быть найдены (не приближения).
- Скорость: Поиск должно быть как можно быстрее. (Время создания структуры данных не очень важно).
Итак, мне нужно несколько советов о:
- Структура данных для выполнения к-NN.
- Если будет лучше использовать подход aNN (приблизительный ближайший сосед), установите его как можно точнее ?.
Нечего сказать обо всех ответах? – gsamaras