2015-09-06 5 views

ответ

3

Чтобы добавить @ abarisone Ответим, фактические идентификаторы synset сами могут отличаться от WordNet 3.0 и WordNet 3,1 :(

Например, в WordNet 3.1 стул является 103005231-n.

Однако в WordNet 3,0 это был103001627-н. но вы не можете смотреть, что в http://wordnet-rdf.princeton.edu/wn31/103001627-n ни http://wordnet-rdf.princeton.edu/wn30/103001627-n, но вместо этого вам нужно использовать http://wordnet-rdf.princeton.edu/wn30/03001627-n, которые неправильно перенаправляет 102992974-n.

Я думаю, что это ошибка в WordNet RDF 3.1 online app, потому что 102992974-n официально не существует. Вы даже не можете его искать (онлайн и офлайн). И если вы получите файл RDF/JSON-LD на этой странице, он даст вам 103005231-n.

В wn3.1.dict/dict/index.noun:

chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700 

Там нет никакого упоминания о 02992974 где-нибудь в этом файле.

Оба эти вопроса сбивают с толку. Интересно, почему они изменили идентификаторы синтаксиса в незначительной версии.


Что касается статуса WordNet synset идентификаторов:

вывода о том, в настоящее время, с помощью WordNet 3.0 идентификаторов synset является безопасным.

Для будущей работы можно рассмотреть возможность использования Inter-Lingual Index от Global Wordnet Association (в ближайшее время). Который будет иметь идентификаторы, совместимые с Wordnet 3.0.

Ссылки из wn-users mailing list, 30 Oct 2015:

От: Рафаэль, Николас

URI, построен из поля «dblocation», который представляет собой смещение байта от начала соответствующей базы данных символов на основе файл (я не знаю какой). Это будет изменяться с момента выпуска на выпуск, поскольку элементы удалены, добавлены и перемещены.

.

Из: Питер Кларк

Насколько мне известно .... FYI малоизвестный факт состоит в том, что клавиши определения (например, «способность% 1: 07: 00 ::») являются стабильными между релизами, , за исключением случаев, когда чувства разделены или объединены. Это обеспечивает стабильный путь к , см. Synsets по выпускам, а не использовать номера синхронизации. Также вы можете найти сопоставления между номерами симуляторов в разных выпусках , ища одинаковые ключи чувств. (sensekey-> synset - это многозначное отображение : Синхронизация может иметь несколько сенсорных клавиш, по одному для каждого слова + смысл в синтаксисе, но ключ ощущения соответствует точно одному синтезу). С наилучшими пожеланиями, Pete

.

От: Джон Маккрэ

Здравствуйте Хенди,

Да WordNet synset Идентификаторы основаны на байте дескриптора в данном выпуске WordNet, как таковые, они далеки от стабильной в разных версиях WordNets. Идентификаторы чувств больше стабильны, но все же могут быть ненадежными, так как смысл становится разделенным и объединенным. Кроме того, существуют две несколько разные версии WordNet 3.1, а версия WordNet RDF принимает идентификаторы синхронизации из любого ... это , конечно, как прокомментировали другие, все очень запутанно.

По этой причине Всемирной ассоциации WordNet начала работу над индексом Inter-языковом, который мы ожидаем, что на сайте в ближайшее время (то есть, во время на конференцию Global WordNet в январе), и дать каждые синхронизировать один неизменный URI.

Piek Фоссен дали хороший разговор об этом в последнее время и это слайды онлайн здесь: http://ldl2014.org/slides/Vossen-LOD-CILI.pdf

На данный момент, я бы рекомендовал использовать WN 3.0 идентификаторов связать synsets, которую WordNet Межъязыковой Index также будет основанный на.

С уважением, Джон

0

Если посмотреть под WordNet's Current Version section вы увидите, что:

Самая последняя версия Окна WordNet - 2.1, выпущен в марте 2005. Версия 3.0 для Unix/Linux/Solaris/etc. был выпущен в декабре 2006 года. Версия 3.1 в настоящее время доступна только онлайн.

Кроме того, речь идет о разнице между версии 3.0 и 3.1 вы можете прочитать:

WordNet 3.1 Файлы базы данных ТОЛЬКО

Вы можете загрузить файлы базы данных WordNet 3.1 отсюда. Обратите внимание: это не полный пакет, как указано выше, и он не содержит кода для запуска WordNet. Тем не менее, вы можете заменить файлы в каталоге базы данных вашей локальной локальной установки с этими файлами, а будет работать интерфейс WordNet, возвращая записи из базы данных 3.1 . Это просто сжатый tar-файл файлов базы данных WordNet 3.1 .

Разница в том, что WordNet 3.1 работает только в сети, но вы можете заменить базу данных версии 3.0 и использовать локальную установку.

Документация по версии 3.0 here.