2013-03-20 2 views
1

В настоящее время мы изучаем развертывание Zementis ADAPA или их UPPI-плагина поверх кластера hadoop. Мы планируем выпустить модели SAS для PMML и развернуть их.Простые правила в PMML

Однако в дополнение к моделям, извлеченным из SAS, нам нужно выразить гораздо более простые «модели»/правила классификации в PMML.

Примером может служить:

input: var1, var2 
rule: var1 >= var2 
output: 'true' of 'false' 

В настоящее время я думал выразить это как очень простое дерево решений (TreeModel в PMML) или очень простой набор правил (Ruleset в PMML).

Вот мои вопросы:

  1. Могу ли я, используя правильные модели?
  2. Это даже правильный подход? Есть ли другой способ выражения правил в PMML?
  3. Это даже правильная вещь, чтобы спросить PMML? Кто-нибудь еще использует PMML для выражения таких правил?
+0

Благодарим за редактирование формата c4p! –

ответ

1

Поскольку документ PMML всегда ожидает наличия какой-либо «модели», вам придется по существу обмануть его, поставив модель фиктивной регрессии. Затем вы сделаете свое «правило/логику» с помощью PMML 'if-then-else', чтобы построить в вашей предварительной обработке (TransformationDictionary), чтобы «получить» ваше поле ответа. После этого вам нужно будет вывести это производное поле, используя элемент 'output'.

Я знаю, что это слишком много работы для слишком мало пользы. Я сделал это как доказательство концепции, и мы решили не делать простых правил в PMML.

 Смежные вопросы

  • Нет связанных вопросов^_^