2013-09-30 5 views
1

Мне интересно, использует ли Weka Simple Logistic Function регуляризацию.Использует ли обычная функция Weka SimpleLogistic?

Я не вижу упоминания об этом в документации, но я не уверен. Кто-нибудь может это подтвердить?

* классификатор для построения моделей линейной логистической регрессии. LogitBoost с функциями простой регрессии в качестве базовых учащихся используется для установки логистических моделей. Оптимальное количество итераций LogitBoost для выполнения перекрестно проверяется, что приводит к автоматическому выбору атрибутов. Для получения дополнительной информации см .:

Нильс Ландвер, Марк Холл, Эйб Франк (2005). Деревья логистической модели. Марк Самнер, Эйб Франк, Марк Холл: Ускорение логической модели дерева. Индукция. В: 9 Европейской конференции о принципах и практике обнаружения знаний в базах данных, 675-683, 2005.

OPTIONS

отладки - Если установлено значение истинно, классификатор может выводить дополнительную информацию на консоль. useCrossValidation - устанавливает, следует ли перекрестно проверять количество итераций LogitBoost или использовать критерий остановки на обучающем наборе. Если не задано (и не задано фиксированное число итераций), используется количество итераций LogitBoost, которые минимизируют ошибку в наборе обучения (ошибка ошибочной классификации или ошибка вероятности в зависимости от errorOnProbabilities).

errorOnProbabilities - используйте ошибку для probabilties как показатель ошибки при определении наилучшего количества итераций LogitBoost. Если установлено, выбрано количество итераций LogitBoost, которое минимизирует среднеквадратичную ошибку (либо на обучающем наборе, либо в перекрестной проверке, в зависимости от useCrossValidation). weightTrimBeta - Установите значение бета, используемое для обрезки веса в LogitBoost. В следующей итерации используются только экземпляры, несущие (1 - бета)% от веса предыдущей итерации. Установите значение 0 без обрезки. Значение по умолчанию равно 0. numBoostingIterations - установить фиксированное количество итераций для LogitBoost. Если> = 0, это задает количество итераций LogitBoost для выполнения. Если < 0, число перекрестно проверяется или используется критерий остановки на обучающем наборе (в зависимости от значения useCrossValidation).

useAIC - AIC используется для определения времени остановки итераций LogitBoost (вместо перекрестной проверки или ошибки обучения).

heuristicStop - Если heuristicStop> 0, эвристика для жадной остановки при перекрестной проверке количества итераций LogitBoost включена. Это означает, что LogitBoost остановлен, если в последних итерациях эвристического стопа не было достигнуто минимальное количество ошибок. Рекомендуется использовать эту эвристику, она дает большое ускорение, особенно на небольших наборах данных. Значение по умолчанию - 50.

maxBoostingIterations - устанавливает максимальное количество итераций для LogitBoost. Значение по умолчанию - 500, для очень маленьких/больших наборов данных может быть предпочтительным более низкое/более высокое значение.*

ответ

5

Есть несколько логистических регрессий в Weka:

  • SimpleLogistic - не использует регуляризация
  • LogisticBase - не использует регуляризацию (это вспомогательный класс для SimpleLogistic)
  • LogitBoost - не (как это реализовано в качестве in this paper)
  • Logistic - использует регуляцию хребта (-r)