2016-02-26 8 views
4

Так что я хотел бы использовать некоторые из this training data в spaCy, когда использую метод similarity().Использование различных данных обучения word2vec в spaCy

Я также хотел бы использовать предварительно подготовленные векторы также на этой странице.

Но, по-видимому, здесь нет недостатков в документации по спа-процедурам, кто-нибудь знает, как это сделать?

ответ

2

К сожалению, документы для этого еще не связаны на сайте! Мы перерабатываем документы. Но это ответ на ваш вопрос: https://spacy.io/tutorials/load-new-word-vectors

+0

В основном да. Вы знаете, совместимы ли связанные с Google векторы новостей? –

+0

Также есть ли какие-либо ресурсы по подготовке данных в векторы? –

+0

Векторы новостей Google, с которыми вы связаны, должны работать нормально. Я думаю, вы пропустили ссылку, хотя! В документах Gensim есть рекомендации относительно обучения векторам слов, как и группа пользователей для word2vec. Мы рекомендуем рассмотреть возможность предварительной обработки текста с помощью инструментов spaCy перед изучением вектора. Дополнительную информацию о том, почему это полезно, см. В блоге «sense2vec». –

 Смежные вопросы

  • Нет связанных вопросов^_^