5

В системе правил или в любой системе рассуждений, которая выводит факты посредством правил вывода по прямой цепочке, как бы вы обрезали «ненужные» ветви? Я не уверен, что такое формальная терминология, но я просто пытаюсь понять, как люди могут ограничивать свои мысли, когда рассуждают о проблемах, тогда как все семантические рассуждения, которые я видел, не могут этого сделать.Сокращение вычетов в экспертных системах

Например, в статье Джона МакКарти An Example for Natural Language Understanding and the AI Problems It Raises он описывает потенциальные проблемы в получении программы для разумного ответа на вопросы о новостной статье в New York Times. В разделе 4 «Потребность в немонотонном рассуждении» он обсуждает использование Razer Оккама, чтобы ограничить включение фактов при рассуждении об истории. Типичная история, которую он использует, касается грабителей, которые становятся жертвами владельца мебельного магазина.

Если программе было предложено сформировать «минимальное завершение» истории в исчислении предикатов, возможно, необходимо включить факты, не упомянутые непосредственно в оригинальной истории. Тем не менее, ему также потребуется некоторый способ узнать, когда следует ограничить свою цепочку вычетов, чтобы не включать в себя нерелевантные детали. Например, он может захотеть включить точное число полицейских, вовлеченных в дело, что в статье отсутствует, но он не захочет включать тот факт, что у каждого полицейского есть мать.

+1

Способность машины учитывать все сразу, а не сосредотачиваться на узких «релевантных» вещах, является одной из причин, по которой в будущих машинах нет проблем с свержением своих человеческих повелителей. Из-за их мысли мы никогда не сможем спасти нас. Я просто надеюсь, что незначительный факт о плохом человеческой боли не будет зависеть от потребностей машин, когда придет Великий День освобождения роботов. Я не хотел бы, чтобы меня «обрезали» как «нерелигиозную деталь». Извините, что вы говорили? –

+0

Я говорил: сопротивление бесполезно. – Cerin

+0

Мне грустно, что никто не ответил на этот вопрос. Мне было интересно то же самое на днях, рассматривая загадку Зебры. –

ответ

2

Хороший вопрос.

С вашего вопроса я думаю, что вы называете «обрезкой», это выполненный шаг построения модели ex ante --ie, чтобы ограничить входы, доступные алгоритму для построения модели. Термин «обрезка» при использовании в машинном обучении относится к чему-то другому: ex post step, после модельной конструкции, которая работает на самой модели и не на доступных входах. (В области ML может существовать второй смысл для термина «обрезка», но я не знаю об этом.) Другими словами, обрезка - это буквально метод «ограничить свою цепочку вычетов», поскольку вы делаете это, но это делает ex post, путем исключения компонентов полной (рабочей) модели, а не путем ограничения входов, используемых для создания этой модели.

С другой стороны, выделение или ограничение входных данных, доступных для построения модели, - это то, что, я думаю, вы имели в виду, действительно является ключевой темой машинного обучения; это явно фактор, отвечающий за превосходную производительность многих из последних алгоритмов ML - например, поддержка векторных машин (понимание, которое лежит в основе SVM, - это построение гиперплоскости с максимальным запасом из небольшого подмножества данных, т. е. «поддерживающие векторы») и многоадаптивные регрессионные сплайны (метод регрессии, в котором не предпринимаются попытки подобрать данные путем «вычерчивания одной непрерывной кривой через него», вместо этого дискретный раздел данных подгоняется, один один, используя ограниченное линейное уравнение для каждой части, т. е. «сплайны», поэтому предикатный шаг оптимального разбиения данных, очевидно, является сущностью этого алгоритма).

Какова проблема при обрезке?

По крайней мере, ж/г/т конкретных алгоритмов ML я фактически закодированные и б - дерева решений, Марс и нейронные сети - обрезка выполняется на начальном этапе над подгонкой моделью (модель, которая подходит данные обучения настолько близко, что они не могут обобщить (точно предсказать новые экземпляры). В каждом случае обрезка включает в себя удаление маргинальных узлов (DT, NN) или терминов в уравнении регрессии (MARS) один за другим.

Second , Почему обрезка необходима/желательна?

Не лучше ли точно установить критерии конвергенции/расщепления? Это не всегда поможет. Обрезка работает от «снизу вверх»; модель построена сверху вниз, поэтому настройка модели (для достижения того же преимущества, что и обрезка) устраняет не только один или несколько узлов решения, но и дочерние узлы, которые (например, обрезают дерево ближе к стволу). Таким образом, устранение маргинального узла может также исключить один или несколько сильных узлов, подчиненных этому маргинальному узлу, но модельер никогда не узнает об этом, поскольку его настройка устраняет дальнейшее создание узла на этом маргинальном узле. Обрезка работает с другого направления - от самых подчиненных (низкоуровневых) дочерних узлов вверх в направлении корневого узла.

 Смежные вопросы

  • Нет связанных вопросов^_^