2012-01-11 5 views
4

Я использую множество разных корпусов для обработки естественного языка, и я искал корпус, который был аннотирован Word Word Word Senses.Wordnet (Word Sense Annotated) Corpus

Я понимаю, что с этой информацией, вероятно, нет большого корпуса, так как корпус нужно создавать вручную, но нужно что-то уйти.

Кроме того, если нет существующего корпуса, существует ли, по крайней мере, аннотированная база данных ngram (с каким процентом времени каждое слово является его определением или числовым числом каждого определения wordnet в зависимости от того, как общий смысл слова)?

ответ

8

Три видных корпусы аннотированный для WordNet:

+2

SemCor был, безусловно, лучшим из всех связанных. Похоже, что сейчас нет большого количества высококачественных WordNet-аннотированных корпусов. – cardine

+0

@cardine и cyborg, извините за комментарий, но я не смог найти вашу контактную информацию. не могли бы вы написать мне по электронной почте info @ panabee.com? основанный на ваших интересах НЛП, у меня есть небольшой проект, который может вас заинтересовать. – Crashalot

0

вы можете использовать senseval2, для java есть формат semcor и (jSemcor API) , а также senseval3. Эти два корпуса используются для смыслового значения смысла слова.

 Смежные вопросы

  • Нет связанных вопросов^_^