Как настроить распределение значений в случайном потоке данных?

Учитывая бесконечный поток случайных 0 и 1, который является из-за смещения (например, 1 более распространены, чем 0 из-за знающего фактора), но в остальном идеальный генератор случайных чисел, я хочу преобразовать его в (более короткий) бесконечный поток, который как идеальный, но и беспристрастный.Как настроить распределение значений в случайном потоке данных?

Поднимая definition of entropy, этот график показывает, сколько бит вывода я должен теоретически получить от каждого бита ввода.

Вопрос: Есть ли практический способ на самом деле реализовать преобразователь, который почти идеально эффективным?

источник

2010-03-10 BCS

Это известно как «отбеливание» данных. –

Существует известное устройство благодаря Фон Нейману за то, что он превратил несправедливую монету в честную монету. Мы можем использовать это устройство для решения нашей проблемы.

Повторно нанесите два бита из вашего смещенного источника, пока не получите пару, для которой бит отличается. Теперь верните первый бит, отбросив второй. Это создает непредвзятый источник. Причина, по которой это работает, заключается в том, что независимо от источника вероятность 01 равна той же вероятности, что и вероятность 10. Поэтому вероятность условия 0 на 01 или 10 равна 1/2 и вероятность 1-го условия на 01 или 10 равно 1/2.

источник

2010-03-10 20:27:31 jason

Кроме того, пары не должны пересекаться. –

Какова эффективность этого? Сколько бит необходимо использовать для генерации одного выходного бита? (Помимо этого, приятно и просто, +1) – BCS

Это зависит от распределения ваших данных. Если вы получите строку из 10000 бит «1», чередующуюся с одним «0» битом, алгоритм будет генерировать один выходной бит. –

Пожалуйста, см

источник

2010-03-10 20:43:03

Экстрактор случайности кажется самым близким к тому, что я ищу. (Другие, похоже, применимы к конечным наборам данных, и я действительно искал операцию потока) – BCS

Хоффман закодировать вход.

Учитывая, что входной сигнал имеет известное смещение, вы можете вычислить распределение вероятности для контрольных сумм каждого n битового сегмента. Из этой конструкции Hoffman code, а затем просто кодируйте последовательность.

Я не уверен, но одна потенциальная проблема заключается в том, что это может привести к некоторой корреляции между последовательными битами.

источник

2010-05-26 18:09:49 BCS

Как настроить распределение значений в случайном потоке данных?

ответ

Смежные вопросы