2017-02-13 54 views
1

Я играю с FastText, https://pypi.python.org/pypi/fasttext, который очень похож на Word2Vec. Так как это, кажется, довольно новая библиотека, но не многие встроенные функции. Мне было интересно, как извлечь морфологические похожие слова, например, например: model.similar_word («dog») -> собаки. Но встроенная функция не работает.Как найти похожие слова в FastText?

Если я нахожу модель [«собака»], я получаю только вектор, который может использоваться для сравнения модели сходства косинусов. Cosine_similarity (модель [«собака»], модель [«собаки»]]. сделать какое-то петлю и сделать cosine_similarity на все возможные пары в тексте, что бы время ..

ответ

7

использования Gensim, загрузить fastText, подготовленный файл .vec с моделями load.word2vec и использовать метод most_similiar(), чтобы найти похожие слова!

2

Вы должны использовать gensim загрузить model.vec, а затем получить похожие слова:

m = gensim.models.Word2Vec.load_word2vec_format('model.vec') 
m.most_similar(...)