Есть ли какая-либо библиотека C#, которая может определять язык определенного фрагмента текста? то есть для входного текста "This is a sentence"
, он должен определять язык как "English"
. Или для "Esto es una sentencia"
он должен определить язык как "Spanish"
.Определить язык текста
Я понимаю, что определение языка из текста не является детерминированной проблемой. Но у обоих Google Translate и Bing Translator есть опция «Автообнаружение», которая лучше всего угадывает язык ввода. Есть ли что-то подобное доступное публично, желательно на C#?
Только на днях я видел один из моих внутрисетевых веб-страниц на ПК с помощью Google Переводчик установлен. На странице было несколько слов, таких как ** mean ** и ** stddev ** и некоторые цифры. Google Translator сказал мне, что страница была в ** румынском ** и спросила, нужен ли мне перевод. Если это не ** детерминированная проблема **, то как программа может сделать хорошую работу? – pavium
Иногда они делают хорошую работу. Конечно, будут входы, для которых они полностью терпят неудачу, но для более вероятных входов они достаточно хорошо работают –
http://stackoverflow.com/questions/1192768/return-the-language-of-a-given-string/1192802 # 1192802 –