2015-12-08 4 views
0

Я новичок в Rapid Miner и использую SVM Linear в нем. Моя модель:
enter image description here

Я сделал набор учебных примеров, состоящий из 3552 примеров и всего 2 атрибутов, и я делаю номинальное числовое преобразование, проходя через линейную модель SVM, а затем подключая модельный вывод в применении модели. Это отлично.

В наборе тестовых примеров у меня есть 735 примеров с 2-мя атрибутами и с номинальным цифровым преобразованием, а затем с применением этого преобразованного примера, применяемого к Применению модели. На этом этапе я получаю сообщение об ошибке при запуске процесса, в котором говорится, что:Тестовый пример набора атрибутов должен быть равен OR Superset of Training example set Rapidminer SVM

enter image description here

Я искал много об этом, но не получить правильное направление. Я буду благодарен за вашу помощь.

ответ

2

Оператор Nominal to Numeric сделает новые атрибуты, имена которых будут получены из значений входных атрибутов. Это происходит, когда dummy encoding используется для параметра coding type. Если тестовые данные содержат разные значения по сравнению с данными обучения, то полученные атрибуты будут разными.

Для подтверждения этой проблемы установите точку останова после операторов Nominal to Numeric и проверьте атрибуты каждого примера.

Вы можете изменить способ работы оператора, установив параметр в unique integers, но это может не укладываться в проблему, которую вы пытаетесь решить.

Один из возможных способов решения этой проблемы состоит в объединении двух наборов данных, а затем их разделить. Это приводит к созданию допустимых уровней для каждого номинального атрибута, даже если данные могут не иметь пример значения. Затем каждый разделитель можно использовать с оператором Nominal to Numeric, и он должен создать все необходимые атрибуты.

+0

Большое спасибо, сплит-техника работала для меня. –