Так что я хотел бы использовать некоторые из this training data в spaCy, когда использую метод similarity()
.Использование различных данных обучения word2vec в spaCy
Я также хотел бы использовать предварительно подготовленные векторы также на этой странице.
Но, по-видимому, здесь нет недостатков в документации по спа-процедурам, кто-нибудь знает, как это сделать?
В основном да. Вы знаете, совместимы ли связанные с Google векторы новостей? –
Также есть ли какие-либо ресурсы по подготовке данных в векторы? –
Векторы новостей Google, с которыми вы связаны, должны работать нормально. Я думаю, вы пропустили ссылку, хотя! В документах Gensim есть рекомендации относительно обучения векторам слов, как и группа пользователей для word2vec. Мы рекомендуем рассмотреть возможность предварительной обработки текста с помощью инструментов spaCy перед изучением вектора. Дополнительную информацию о том, почему это полезно, см. В блоге «sense2vec». –