2015-05-04 10 views
3

Есть ли документация формата moses.ini для Моисея? Запуск moses в командной строке без аргументов возвращает доступные имена функций, но не их доступные аргументы. Кроме того, структура файла .ini не указана в руководстве, которое я вижу.Документация Моисея (статистический машинный перевод) Формат файла mose.ini?

ответ

1

Основная идея состоит в том, что файл содержит параметры, которые будут использоваться моделью перевода. Таким образом, документацию о значениях и параметрах в moses.ini следует искать в спецификациях Moses.

Вот несколько выдержек, которые я нашел в Интернете около moses.ini.

В Moses Core, у нас есть некоторые детали:

7.6.5 moses.ini
Все функции пространственных объектов, указанных в разделе [feature]. Он должен быть в формате:
* Feature-name key1=value1key2=value2 ....
Например, KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz

Кроме того, есть намек о том, как печатать основные статистические данные о всех компонентах, упомянутых в moses.ini.

Выполнить скрипт
analyse_moses_model.pl moses.ini
Это может быть полезно, чтобы установить порядок отображения шагов, чтобы избежать взрыва вариантов перевода или просто проверить, что компоненты модели являются большой/подробно, как мы ожидаем.

В Center for Computational Language and EducAtion Research (CLEAR) вики, есть пример файл с документацией:

Параметров

Рекомендуются сделать .ini файл в хранилище всех ваших настроек.

input-factors
- Используя фактор модели или не
mapping
- Для того, чтобы использовать LM в памяти (T) или прочитать файл на жестком диске непосредственно (G)
ttable-file
- Указывает Num. источника-фактора, мишени-фактора, кол-во баллов, и путь к трансляции файла таблицы
lmodel-file
- Указывает тип используя для LM (0: SRILM, 1: IRSTLM), используя количество фактора, порядок (п-г) ЛМ, и путь к языку файла модели

Если этого недостаточно, есть еще одно описание на this page, see "Decoder configuration file" section

секций [ttable-file] и [lmodel-file] содержат указатели на фразы таблицы файл файла и языка, соответственно.Вы можете не учитывать цифры на этих строках. В настоящее время достаточно знать, что последним из номеров в спецификации языковой модели является порядок n-граммовой модели.

Файл конфигурации также содержит некоторые весовые характеристики. Обратите внимание, что раздел [weight-t] имеет 5 весов, по одному для каждой функции, содержащейся в таблице фраз.

Файл moses.ini создан учебный процесс не будет работать с декодером без модификации, поскольку она опирается на модели библиотеки языка , не скомпилированная в наш декодер. Для того, чтобы сделать , он работает, откройте файл moses.ini и найдите языковую модель в строке сразу после заголовка [lmodel-file]. Первый номер на этой линии будет 0, что означает SRILM. Измените его на 8 и оставите остальную часть линии нетронутой. Тогда ваша конфигурация должна работать.

+0

Дополнительную документацию для таблицы перевода можно найти здесь: http://www.statmt.org/moses/?n=FactoredTraining.ScorePhrases – Kwame