Я использую множество разных корпусов для обработки естественного языка, и я искал корпус, который был аннотирован Word Word Word Senses.Wordnet (Word Sense Annotated) Corpus
Я понимаю, что с этой информацией, вероятно, нет большого корпуса, так как корпус нужно создавать вручную, но нужно что-то уйти.
Кроме того, если нет существующего корпуса, существует ли, по крайней мере, аннотированная база данных ngram (с каким процентом времени каждое слово является его определением или числовым числом каждого определения wordnet в зависимости от того, как общий смысл слова)?
SemCor был, безусловно, лучшим из всех связанных. Похоже, что сейчас нет большого количества высококачественных WordNet-аннотированных корпусов. – cardine
@cardine и cyborg, извините за комментарий, но я не смог найти вашу контактную информацию. не могли бы вы написать мне по электронной почте info @ panabee.com? основанный на ваших интересах НЛП, у меня есть небольшой проект, который может вас заинтересовать. – Crashalot