Я не эксперт в области машинного обучения, поэтому постараюсь быть максимально точным ...Именованное распознавание сущностей. Нужен ли нам внешний список для соответствия результатам?
В настоящее время я анализирую финансовые документы, которые предоставляют информацию о конкретном фонде. То, что я хотел бы сделать, - это получить название фонда.
Для этого я использую Named Entity Recognition (NER) на платформе Azure Machine Learning. После анализа ок. 100 документов, я получаю результаты, классифицированные как организации. В большинстве случаев это действительно организации. Это здорово, но моя проблема в том, что название фонда также классифицируется как организация. Я не могу различать название компании и название фонда.
С некоторых чтений в Интернете я мог обнаружить, что система Gazette может помочь, чтобы мы смогли сопоставить признанные организации с перечнем средств и, следовательно, удостовериться, что у нас есть имя фонда.
Считаете ли вы, что это будет хороший подход? Или есть ли какой-либо другой алгоритм, который я должен попытаться улучшить результаты?
Спасибо за любое предложение!
Спасибо, озборн за ваш ответ! Поэтому я сосредоточусь на справочнике и попробую классификатор. – DotNetMatt