Я новичок в RapidMiner, но я использую его для выполнения некоторого интеллектуального анализа текста и имею, вероятно, простой вопрос, который, похоже, не может найти ответ нигде.Создание подпроцесса RapidMiner для уменьшения повторения
Я извлекаю некоторые данные из базы данных в RapidMiner. Оттуда я фильтрую данные, используя атрибут_value_filter, чтобы получить несколько подмножеств из исходных данных.
После того, как все мои подмножества готовы к работе, мне нужно выполнить одни и те же операции над каждым подмножеством (извлечение одного столбца данных, создание документа, токенизация, создание, удаление стоп-слов и т. Д.).
Есть ли способ сделать «функцию», так сказать, в RapidMiner, поэтому мне не нужно дублировать тот же набор операций для каждого подмножества данных? Я попытался использовать оператор подпроцесса, но я не могу получить независимый вывод для каждого независимого ввода. Возможно, я не настроен правильно? У меня недостаточно очков репутации, чтобы отправлять изображения моих процессов, но если вам нужна дополнительная информация, пожалуйста, дайте мне знать.
Любая обратная связь будет очень признательна!
Это именно то, что я искал. Этот оператор неожиданно задокументирован, и я вижу, что это невероятно полезно, благодаря привлечению его к моему вниманию. – tcoop
Сможете ли вы принять ответ, чтобы указать, что он работает для вас? – awchisholm