0
Я использую dbscan для точек кластеризации, так как мои баллы более 1 миллиона, я использую r * -tree тоже.ELKI DBSCAN за миллионы файлов
Я использую Елки в командной строке:
java -cp elki.jar
de.lmu.ifi.dbs.elki.application.KDDCLIApplication
-db.index tree.spatial.rstarvariants.rstar.RStarTreeFactory
-algorithm clustering.DBSCAN
-dbc.in points1.txt
-dbscan.epsilon 20
-dbscan.minpts 10
-out results3/DBSCANeps20min10
для маленьких файлов его хорошо, но на 4 миллиона файлов произошла ошибка:
at de.lmu.ifi.dbs.elki.database.ids.integer.DoubleIntegerArrayQuickSort.quickSort(Unknown Source)
Любой шанс, что вы используете старую версию ELKI? Также используйте массовую загрузку для R * -tree. Его * намного быстрее. –
спасибо @ErichSchubert, я использовал версию 0.6.0 (2014, январь, 10), проблема в этом? –
Тогда это старая проблема. Используйте фиксированные, более новые версии! –