2014-10-22 4 views
5

Итак, есть компьютерные игры Texas Hold'em, в которых вы играете до 8 противников, и, предположительно, некоторые из этих компьютерных игр говорят вам, что ваша вероятность выигрыша при условии, что ваши противники будут случайными. В случае, если кто-то не знает, в Холдеме каждому игроку раздаются 2 частных карты, а затем в среднем 5 общих карт раздаются посередине (первые 3, затем 1, затем еще 1), а победителем является игрок, который может сделайте лучшую 5-карточную покерную комбинацию, в которой они могут использовать любую комбинацию из 2 личных карт и 5 общих карт. В Омахе каждому игроку раздаются 4 частных карты, а еще 5 общих карт, а победитель - игрок, который может сделать лучшую 5-карточную покерную комбинацию с использованием 2 частных карт и 3 общих карт.Как работает программное обеспечение, которое рассчитывает вероятность выигрыша в Техасском Холдеме или Омахе против 8 случайных рук противника?

Итак, в Hold'em, для личной руки любого игрока, существует более 10^24 способов, которыми можно было бы обмануть частные руки противников и 5 общих карт. Итак, как они вычисляют/оценивают вашу вероятность выигрыша в начале, если ваши руки противников 8 случайны? В Омахе ситуация еще хуже, хотя я никогда не видел компьютерную игру в Омахе, которая на самом деле дает вам ваши шансы против рук 8 случайных противников. Но так или иначе, есть ли какие-либо программные трюки, которые могут получить эти расчеты вероятности выигрыша (или сказать, исправить в пределах 3 или 4 десятичных знаков), быстрее, чем грубая сила? Я надеюсь, что кто-то может ответить здесь, кто написал такую ​​программу, прежде чем она пройдет достаточно быстро, поэтому я спрашиваю здесь. И я надеюсь, что ответ не предполагает оценку случайных выборок, потому что всегда есть небольшая вероятность, что это может быть далеко.

ответ

5

Как вы определили, ожидаемая скорость выигрыша - это невероятно большое суммирование и должна быть аппроксимирована. Стандартный подход заключается в использовании метода Монте-Карло, который включает в себя одновременное моделирование различных рук и принятие эмпирического среднего значения: # побед/# игр.

Интересно, что ошибка (MSE) этого приближения не зависит от размерности (количества комбинаций), в частности, позволяя X = 1, если вы выиграете, 0, если вы проиграете, MSE = var (X)/N = p * (1-p)/N где p = Prob (X = 1) (неизвестно), а N - количество выборок.

Существует целый ряд различных методов Монте-Карло, которые могут улучшить дисперсию подхода выборки ванили, такие как выборка важности, обычные случайные числа, Rao-Blackwellization, вариации управления и стратифицированная выборка, чтобы назвать лишь некоторые из них.

Редактирование: просто увидели, что вы ищете подход, основанный на неслучайном приближении. Я сомневаюсь, что у вас будет большая удача в подходах с детерминированными приближениями, я знаю, что современное состояние в области вычислений в покере использует методы Монте-Карло для вычисления эти вероятности, хотя и с несколькими трюками с уменьшением дисперсии.

Относительно «потому что всегда есть небольшой шанс, который может быть удален», вы всегда можете получить вероятность высокой вероятности ошибки с неравенством Хёффдинда.

+0

Если выборка является текущим уровнем техники, то я предполагаю, что так оно и есть. Печально, однако, что все еще есть очень небольшой шанс, что некоторые из расчетных оценок вероятности выигрыша уходят. И есть (52 выбор 2) шансы на то, чтобы это произошло. Спасибо за ваш ответ. – user2566092

+0

@ user2566092 нет шансов, что оценки ушли от вас - может верхняя граница этого, если у нас есть эмпирическое среднее $ m = 1/n \ sum_i X_i $, из IE Хоуффинга мы имеем Pr (| m - E [m] |> t) <= exp {-2nt^2}, установив RHS = \ delta и заметив, что X <= 1, имеем | m - E [m] | <= sqrt (log (1/\ delta)/(2n)) + 1 * (\ delta). Учитывая вашу точность (4 знака после запятой или что-то еще), вы можете определить требуемое значение для «n» – fairidox

+0

. Я согласен со всем, что вы говорите, но факт остается фактом: вы можете оценить вероятность выигрыша 1.0, хотя это на самом деле больше как 0.5, если вы очень, очень не повезло в вашей выборке. Я знаю, что я говорю о шансах, которые могут быть намного меньше, чем вероятность ошибки вычисления из-за космического излучения, если размер выборки достаточно велик. Но все же, шанс есть. Нет никакого способа использовать выборку, чтобы когда-либо получить, что вероятность большого отклонения равна 0. – user2566092

0

Я бы предпочел использовать вычисляемую таблицу коэффициентов вместо вычисления «на лету». Таблицы, которые перечисляют их, чрезвычайно легко найти и существовали довольно долго, поэтому они являются проверенными инструментами. Было бы довольно просто сопоставить ваши открытые карты + общие карты с процентом, указанным в предварительно вычисленной таблице, и сразу же вернуть вам значение, пропуская время вычисления «на лету».

В колоде имеется только 52 карты (классически), поэтому, если вы просто найдете все возможные решения заблаговременно, гораздо быстрее читать их, а не переучитывать шансы для каждой руки «на лету».

Вот ссылка к неполному таблице шансов: http://www.learn-texas-holdem.com/texas-holdem-odds-probabilities.htm

я думаю об этом, как взлома паролей. Вместо того чтобы грубо заставлять каждого персонажа индивидуально, используйте список общего пароля для уменьшения времени вычисления. Разница в этом случае заключается в том, что вы знаете все возможные комбинации загодя.

+0

Но даже предварительные вычисления, похоже, требуют каких-то трюков, если желательны точные вероятности, потому что для 8 случайных рук противника в Холдеме есть что-то вроде 10^21 возможностей для рук оппонентов, игнорирующих порядок оппонентов, и это идет до 10^24 возможностей, если средние 5 карт еще не сданы. В Омахе количество возможных противников рук для 8 противников примерно на 10-20 порядков выше. – user2566092