2015-07-21 16 views
1

Вопрос 1 ---> В настоящее время я работаю над проектом, в котором мы переводим английский контент на другие 17 языков. Чтобы уменьшить стоимость перевода, в настоящее время мы используем хэш-код MD5, и на основе результатов мы решаем, будет ли тема новой (Master) или ранее переведенной (Obselete). Но логика настолько сложна, и мы хотим уменьшить сложность на каком-то уровне. Также в настоящее время мы используем систему управления контентом, как Filenet и слишком старше .. :) В принципе мне нужно самое лучшее предложение для содержания дедупликации отдельно от MD5 хэшированияМетка: - XMLContent De-duplication

Примечания: - Тема означает файл XML с изображениями и отображается через XSLT и не является стандартом DITA.

Вопрос 2 --->

Что лучшая альтернатива для визуализации нестандартного файла XML или не Дита стандартный XML-файл на пользовательском интерфейсе, как HTML или PDF.?

Спасибо в adavance ... Ожидание лучших предложений.

ответ

1

Вопрос 1

Я рекомендую не полагаться на хэши или временных отметках, но это зависит от вашей среды. Если вы переформатируете переменные, измените отступы на добавление/удаление комментариев и т. Д., Что не меняет контент и не должно вызывать процесс перевода, вы можете полагаться на метаданные, чтобы вызвать полуавтоматический процесс. Кроме того, вы можете использовать различный механизм для сравнения текущей версии документа с более ранним.

Вопрос 2

В качестве первого вопроса, это один трудно ответить, не зная среды, тоже. Вероятно, более разумно сначала конвертировать ваши файлы в DITA или Markdown, а затем использовать DITA-OT или процессор Markdown для дальнейшей трансформации.