Minimax vs Alpha Beta Алгоритмы обрезки

Недавно я реализовал алгоритмы миниатюрной и альфа-бета-обрезки, и я уверен, что (100) уверен, что (autograder) я их правильно выполнил. Но когда я выполняю свою программу, они ведут себя по-другому. Я% 99 уверен, что конечное состояние минимакса и альфа-бета должно быть одинаковым. Я прав? Могут ли они различаться на своем пути для достижения результата? Поскольку мы игнорируем некоторые значения min, выберем, которые не будут выбраны max или vica versa.Minimax vs Alpha Beta Алгоритмы обрезки

источник

2016-11-08 Prethia

Они оба должны дать тот же результат. Обрезка в альфа-бетах относится к ветвям, которые никогда не могут способствовать лучшему результату 2 уровня вверх по дереву поиска. – trincot

Autograder - это программный инструмент из [Курса AI UC Berkeley] (http://ai.berkeley.edu/multiagent.html). Реализация заклинаний Minimax и Alpha beta является частью этой задачи для примера Pacman. Неясно, спрашивает ли OP, как добиться успеха на академических курсах или как играть в игру с искусственным интеллектом. –

Я не просил код. Я уже реализовал алгоритмы и протестировал их по разным сценариям, как я уже говорил (Thats, почему я% 100 уверен, autograder дал мне полные очки, поэтому этот вопрос не имеет ничего общего с получением лучшего класса.) Но даже несмотря на то, что autograder дал мне полный Я думал, что что-то не так, вот почему я спросил. – Prethia

Я знаю, что это старый вопрос, однако ....

Да альфа-бета и минимаксно возвращает тот же ответ. Вся Alpha-Beta не позволяет минимаксу выполнять вычисления, на 100% гарантированные, чтобы НЕ быть оптимальным состоянием для текущего игрока (MAX или MIN).

Однако вы можете иметь эквивалентные действия для данного состояния. Как ваш алгоритм решает, какие эквивалентные действия для возврата зависят от того, как он реализован. Если наборы/неупорядоченные списки используются где-то, порядок, в котором сделаны оценки, может измениться.

Это может также быть зависеть от того, что вы делаете, если значение альфа/бета равно текущему лучшему варианту. Поскольку равные значения не приведут к лучшему результату, нет смысла изучать этот путь дальше. Поэтому вы просто оставите «первое лучшее действие». Однако с помощью Minimax вы все равно исследуете все, чтобы вы могли сохранить «последнее лучшее» значение. Это один случай, когда Minimax вернет другое действие, чем Alpha-Beta. Но они по-прежнему эквивалентны в отношении вашей функции подсчета очков ...

источник

2018-02-14 21:19:00

ответ

Смежные вопросы