Какой оператор в Rapidminer можно использовать для создания образца из сумки в качестве набора для обучения и использовать оставшиеся данные в качестве тестового набора?Разделение данных на тестовый набор и набор тренировок
ответ
Оператор Split Data
является одним из вариантов. Это делает 2 или более примеров наборов разделенных так, как вы хотите, и вы можете делать то, что вы хотите с ними. Альтернативой, которая включает в себя аспекты обучения и тестирования, является Split-Validation
.
Используйте оператор X-validation.
Прикрепите свой набор данных к оператору X-validation, затем присоедините вывод оператора к выходному узлу.
После этого перейдите к оператору x-validation, дважды щелкнув по нему или нажав маленькое двойное синее окно в нижнем правом углу.
Внутри оператора присоедините любую модель, которую вы хотите создать (для этого экземпляра я использовал модель дерева решений) на стороне обучения данных, а затем на стороне тестирования присоедините оператора модели приложения к оператору производительности. Наконец, присоедините оператор производительности к выходу.
Затем нажмите кнопку воспроизведения. Он должен работать.