С результатами двух разных сводных систем (sys1 и sys2) и тех же ссылочных сводок я оценил их как с BLEU, так и с ROUGE. Проблема в том, что все ROUGE-оценки sys1 были выше, чем sys2 (ROUGE-1, ROUGE-2
Я использую API-интерфейс pyter для определения частоты ошибок перевода (TER) между двумя словами. Pyter обычно работает в терминале, но когда я использую его в коде Python, он не работает. Обычно он
Я импортировал nltk в python для вычисления показателя BLEU на Ubuntu. Я понимаю, как работает уровень BLEU на уровне предложения, но я не понимаю, как работает уровень BLEU на уровне корпуса. Ниже пр