2016-03-16 1 views
5

Я использую модели OpenNLP для распознавания имен, но проблема заключается в том, что он будет распознавать только имена США и Великобритании (иностранные имена), поэтому мне нужно узнать индийские имена.Как распознать индийские имена через NER в OpenNLP?

Как это возможно?

ответ

0

Решения NER, как правило, зависят от домена, используя либо жестко кодированные списки слов как сигналы (функции) и/или внутреннюю буквенную структуру названных объектов.

Соединения Великобритании и США похожи друг на друга, а также на другие европейские названия, так как многие популярные названия и фамилии США происходят от неанглийских европейских иммигрантов. Индийские имена существенно различаются, и обычно используемые списки имен/фамилий и учебных материалов, как правило, не содержат много или каких-либо данных, относящихся к Индии.

Чтобы решить вашу проблему, вам необходимо обучить специализированную модель NER на основе данных, подходящих для вашего конкретного домена.

+0

Есть ли какой-либо другой вариант для признанных сущностей индийских имен? любит другие инструменты для open source и т. д. @peteris –

 Смежные вопросы

  • Нет связанных вопросов^_^