2014-11-25 3 views
0

Я пытаюсь построить свой собственный экспортер pmml для модели Naive Bayes, которую я построил в scikit learn. При чтении документации PMML кажется, что для каждого вектора признаков вы можете либо выводить модель в терминах данных счета, если она дискретна, либо как распределение Гаусса/Пуассона, если она непрерывна. Но коэффициенты моей модели изучения scikit находятся в терминах эмпирической логарифмической вероятности признаков i.e p (y | x_i). Можно ли указать входные параметры Байеса в терминах этой вероятности, а не считать?наивные заливы особенности векторы в pmml

ответ

1

Поскольку представление PMML модели Naive Bayes реализует совместные вероятности через элемент «PairCounts», можно просто заменить это отношение с выходом вероятностей (а не лог-вероятностью). Поскольку конечные вероятности нормированы, разница не имеет значения. Если требования включают в себя большое количество возможностей, которые в основном равны 0, атрибут «пороговый» модели может использоваться для установки значений по умолчанию для таких вероятностей.