Существующая реализация:
В моей реализации Tic-Tac-Toe с минимаксным я ищу все коробки, в которых я могу получить лучший результат, и выбрал 1 из них случайным образом, чтобы одно и то же решение не отображалось каждый раз ,
Для примера. если возвращенный список будет [1, 0, 1, -1], в какой-то момент я буду случайным образом выбирать между двумя самыми высокими значениями.Будет ли обрезание альфа-бета удалять случайность в моем решении с минимаксным?
Вопрос о Альфа-бета отсечение:
Основываясь на том, что я понял, когда алгоритм не находит, что он выигрывает от одного пути, было бы больше не нужно искать другие пути, которые могли бы/не могли бы привести к выигрышный случай.
Так будет, как и я, причиной того, что самая ранняя возможная коробка приведет к лучшему решению, которое будет отображаться в результате, и кажутся одинаковыми каждый раз? Например, во время первого хода все ходы приводят к ничьей. Так будет каждый раз выбираться 1-й ящик?
Как я могу привести случайность к решению, как с минимаксным решением? Один из способов, о котором я думал сейчас, может состоять в том, чтобы случайным образом передавать индексы альфа-бета-алгоритму. Таким образом, результат будет первым лучшим решением в этом беспорядочно отсортированном списке позиций.
Заранее спасибо. Если есть литература по этому поводу, я был бы рад прочитать ее. Если кто-то может опубликовать хорошую ссылку на обрезку aplha-beta, это будет отлично, поскольку мне было трудно понять, как ее применять.
Будет ли альфа -beta алгоритм когда-либо возвращает несколько лучших решений (все равны) для определенного состояния? Я думал, что он остановится в первом наилучшем решении и сократит оставшиеся. –
@The_coder отредактировал ответ с дополнительной информацией об этом –