Есть ли документация формата moses.ini для Моисея? Запуск moses в командной строке без аргументов возвращает доступные имена функций, но не их доступные аргументы. Кроме того, структура файла .ini не указана в руководстве, которое я вижу.Документация Моисея (статистический машинный перевод) Формат файла mose.ini?
ответ
Основная идея состоит в том, что файл содержит параметры, которые будут использоваться моделью перевода. Таким образом, документацию о значениях и параметрах в moses.ini
следует искать в спецификациях Moses.
Вот несколько выдержек, которые я нашел в Интернете около moses.ini
.
В Moses Core, у нас есть некоторые детали:
7.6.5 moses.ini
Все функции пространственных объектов, указанных в разделе[feature]
. Он должен быть в формате:
* Feature-name key1=value1
key2=value2
....
Например,KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz
Кроме того, есть намек о том, как печатать основные статистические данные о всех компонентах, упомянутых в moses.ini.
Выполнить скрипт
analyse_moses_model.pl moses.ini
Это может быть полезно, чтобы установить порядок отображения шагов, чтобы избежать взрыва вариантов перевода или просто проверить, что компоненты модели являются большой/подробно, как мы ожидаем.
В Center for Computational Language and EducAtion Research (CLEAR) вики, есть пример файл с документацией:
Параметров
Рекомендуются сделать
.ini
файл в хранилище всех ваших настроек.
input-factors
- Используя фактор модели или не
mapping
- Для того, чтобы использовать LM в памяти (T) или прочитать файл на жестком диске непосредственно (G)
ttable-file
- Указывает Num. источника-фактора, мишени-фактора, кол-во баллов, и путь к трансляции файла таблицы
lmodel-file
- Указывает тип используя для LM (0: SRILM, 1: IRSTLM), используя количество фактора, порядок (п-г) ЛМ, и путь к языку файла модели
Если этого недостаточно, есть еще одно описание на this page, see "Decoder configuration file" section
секций
[ttable-file]
и[lmodel-file]
содержат указатели на фразы таблицы файл файла и языка, соответственно.Вы можете не учитывать цифры на этих строках. В настоящее время достаточно знать, что последним из номеров в спецификации языковой модели является порядок n-граммовой модели.Файл конфигурации также содержит некоторые весовые характеристики. Обратите внимание, что раздел
[weight-t]
имеет 5 весов, по одному для каждой функции, содержащейся в таблице фраз.Файл
moses.ini
создан учебный процесс не будет работать с декодером без модификации, поскольку она опирается на модели библиотеки языка , не скомпилированная в наш декодер. Для того, чтобы сделать , он работает, откройте файл moses.ini и найдите языковую модель в строке сразу после заголовка[lmodel-file]
. Первый номер на этой линии будет0
, что означает SRILM. Измените его на8
и оставите остальную часть линии нетронутой. Тогда ваша конфигурация должна работать.
Дополнительную документацию для таблицы перевода можно найти здесь: http://www.statmt.org/moses/?n=FactoredTraining.ScorePhrases – Kwame