2009-12-12 6 views
3

Я работаю над цепями Маркова, и мне хотелось бы знать об эффективных алгоритмах построения вероятностных матриц перехода (порядка n) с учетом текстового файла в качестве входных данных.Вероятностная матрица перехода

У меня нет одного алгоритма, но я бы предпочел бы составить список таких алгоритмов. Документы по таким алгоритмам также более чем приветствуются, как и любые советы по терминологии и т. Д. Обратите внимание, что эта тема имеет сильное сходство с алгоритмами идентификации n-грамм.

Любая помощь будет высоко оценена.

+0

Мне тоже нужны они сейчас – dfa

+0

dfa: посмотрите http://nltk.googlecode.com/svn/trunk/doc/api/nltk.model.ngram.NgramModel-class.html, http: // www.d.umn.edu/~tpederse/nsp.html, для некоторых указателей у меня есть. –

+4

«Приведенный текстовый файл в качестве входного файла»: А что в этом текстовом файле ...? Какова связь между цепочкой марков, которую вы хотите построить, и вашим вкладом? – meriton

ответ

1

Похоже, есть два возможных вопросов, вы должны выяснить, какой из них:

  1. «текстовый файл» содержит значения вероятности и «п» и вы строите матрицу непосредственно, но как его код ? Этот вопрос тривиален, поэтому не будем его игнорировать

  2. «Текстовый файл» содержит что-то вроде сигналов данных, и вы хотите смоделировать его как цепь Маркова.

«цепи Маркова», как правило, относится к случайным процессом первого порядка, так что я не уверен, что то, что вы подразумеваете под «заказ», вероятно, размер матрицы, но это не типичная терминология. Во всяком случае, для 1-го порядка, n x n-матриц, дискретного случайного процесса времени, вы должны посмотреть на алгоритм Витерби: http://en.wikipedia.org/wiki/Viterbi_algorithm

+0

Вторичный Viterbi, и, в более общем смысле, hiden markov models (HMM). – Tobu

0

Когда я работаю с марковскими моделями, я склонен смотреть на crm114 Discriminator. Во-первых, он подробно разбирается в том, что на самом деле существуют разные модели (Марков не всегда лучший, в зависимости от того, что такое приложение), и предоставляет общие ссылки и множество справочной информации о том, как работают вероятностные модели. Хотя crm114 обычно используется в качестве своего рода средства идентификации SPAM, на самом деле это более общий механизм вероятности, который я использовал в других приложениях.