Решения NER, как правило, зависят от домена, используя либо жестко кодированные списки слов как сигналы (функции) и/или внутреннюю буквенную структуру названных объектов.
Соединения Великобритании и США похожи друг на друга, а также на другие европейские названия, так как многие популярные названия и фамилии США происходят от неанглийских европейских иммигрантов. Индийские имена существенно различаются, и обычно используемые списки имен/фамилий и учебных материалов, как правило, не содержат много или каких-либо данных, относящихся к Индии.
Чтобы решить вашу проблему, вам необходимо обучить специализированную модель NER на основе данных, подходящих для вашего конкретного домена.
Есть ли какой-либо другой вариант для признанных сущностей индийских имен? любит другие инструменты для open source и т. д. @peteris –