2016-02-27 4 views
2

Я использую функцию выбора атрибутов Weka для получения информации, и я пытаюсь выяснить, что использует конкретная формула Weka при работе с непрерывными данными.Что такое формула InfoGainAttributeEval от Weka для оценки Entropy с непрерывными значениями?

Я понимаю, что обычная формула для Entropy равна this, когда значения в данных являются дискретными. Я понимаю, что при работе с непрерывными данными можно либо использовать дифференциальную энтропию, либо дискретировать значения. Я пробовал посмотреть на объяснение Уки до InfoGainAttributeEval и посмотреть на многие другие ссылки, но ничего не могу найти.

Возможно, это только я, но кто-нибудь знает, как Weka реализует этот случай?

Спасибо!

ответ

0

Я спросил автора Марк Холл, и он сказал:

Он использует контролируемый метод дискретизации MDL-обоснованную Fayad и Ирани. Смотрите Javadocs:
http://weka.sourceforge.net/doc.stable-3-8/weka/attributeSelection/InfoGainAttributeEval.html

Также вы можете увидеть по этой ссылке для метода дискретизации:

http://weka.sourceforge.net/doc.stable-3-8/weka/filters/supervised/attribute/Discretize.html

+0

Это может быть немного поздно, но большое спасибо за информацию и усилия ! Не видел функцию Discretize. – eddybear