2017-02-22 14 views
0

Я запускаю локальный коэффициент выбросов в наборе данных, называемом челноком, загруженном из uci. Каждый раз, когда я запускаю алгоритм на данных челночного набора с классом решения или без него, но elki рисует другой выходной граф. Я смущен, почему каждый раз рисует разные выходные графики?График вывода на LOF

ответ

0

В визуализации используется Apache Batik, который требует как сложного XML-документа (точнее, SVG), так и дерева рендеринга Батика.

Это делает визуализацию не очень масштабируемым, и есть параметр

-vis.sampling 

Какие по умолчанию образца 10000. Таким образом, на больших наборах данных вы увидите различный образец каждый раз визуализированный. Разумеется, он все еще использует все данные для анализа. Было бы довольно легко добавить параметр, чтобы установить случайное семя, но люди, как правило, жалуются на слишком много параметров ...

Для вариантов данных челночного набора больше подходит для обнаружения аномального значения, увидеть этот сайт:

http://www.dbs.ifi.lmu.de/research/outlier-evaluation/DAMI/literature/Shuttle/

Обратите внимание, что правильно читать файлы, вам необходимо с использованием параметров -arff.externalid id -arff.classlabel outlier так, что столбец ID не используются для анализа, а столбец метка аномального используются в качестве класса для только оценки.

+0

Thx bro для вашего ответа. У меня есть еще одна проблема с Elki, потому что с 50000 точками вывода данных слишком много времени для создания, поэтому я хочу видеть вывод LOF только в текстовом файле. Возможно ли это в Эльки? –

+0

Да, выберите создатель результата вместо визуализатора. –