2015-02-27 3 views
0

Я новичок в RapidMiner, но я использую его для выполнения некоторого интеллектуального анализа текста и имею, вероятно, простой вопрос, который, похоже, не может найти ответ нигде.Создание подпроцесса RapidMiner для уменьшения повторения

Я извлекаю некоторые данные из базы данных в RapidMiner. Оттуда я фильтрую данные, используя атрибут_value_filter, чтобы получить несколько подмножеств из исходных данных.

После того, как все мои подмножества готовы к работе, мне нужно выполнить одни и те же операции над каждым подмножеством (извлечение одного столбца данных, создание документа, токенизация, создание, удаление стоп-слов и т. Д.).

Есть ли способ сделать «функцию», так сказать, в RapidMiner, поэтому мне не нужно дублировать тот же набор операций для каждого подмножества данных? Я попытался использовать оператор подпроцесса, но я не могу получить независимый вывод для каждого независимого ввода. Возможно, я не настроен правильно? У меня недостаточно очков репутации, чтобы отправлять изображения моих процессов, но если вам нужна дополнительная информация, пожалуйста, дайте мне знать.

Любая обратная связь будет очень признательна!

ответ

1

Оператор Execute Process является хорошим в использовании. Это позволяет создавать библиотеку процессов, которые будут использоваться модульным способом.

В моем блоге есть пример here.

+0

Это именно то, что я искал. Этот оператор неожиданно задокументирован, и я вижу, что это невероятно полезно, благодаря привлечению его к моему вниманию. – tcoop

+0

Сможете ли вы принять ответ, чтобы указать, что он работает для вас? – awchisholm

 Смежные вопросы

  • Нет связанных вопросов^_^