2016-02-28 4 views
1

Я использую алгоритм дерева j48 в наборе данных.Что делает параметр useLaplace в алгоритме WEKA j48?

Я пытался понять, что делает параметр useLaplace. Единственное, что я должен пойти на это:

рассчитывает ли на листья разглаживаются на основе Лаплас

который только документация, которая предоставила ВЕКА. У меня есть некоторые вопросы об этом:

  1. Что такое листья?
  2. Что такое сглаживание?
  3. Что такое LapLace? Это алгоритм, используемый для сглаживания?

Все, что я нашел в Интернете, не вдаваясь в подробности о том, что этот параметр действительно делает, а просто объясняет, что он «включает сглаживание Лапласа».

+0

Сейчас я делаю такую ​​же оценку;) –

ответ

2

Провост и Домингос обнаружили, что сглаживание частоты вероятности листа оценок, таких как коррекция Лапласа, значительно повышает производительность дерева решений. Из того, что я прочитал, считается у листьев (ака вероятность листьев в моем предыдущем предложении), используются для определения вероятностной оценки, которую можно определить:

P (для класса A | для атрибута x) = TruePositive/(TruePositive + FalsePositive)

Сглаживание состоит в уменьшении шума и ошибок среди результатов в дереве, чтобы получить более точную вероятностную оценку.

Лапласа является частота сглаживания коррекции формула:

PLaplace (чтобы быть класса А | для атрибута х) = (ТП + 1)/(ТР + ФП + С)

, где С представляет собой число класов в наборе данных.

+0

Итак, вы говорите, что если выпад или ошибка достигает листа, Лаплас попытается смягчить влияние, которое он оказывает на вероятность того, что экземпляры, попавшие в лист правильно ? Я не понимаю, почему это повышает производительность. Не могли бы вы объяснить это более подробно? Кроме того, не могли бы вы дать мне источник, из которого вы это прочитали? – Haych

+0

Это помогло мне понять: http://researchcommons.waikato.ac.nz/handle/10289/5701 – Haych

 Смежные вопросы

  • Нет связанных вопросов^_^