Невозможно найти слова при использовании freebase с word2vec

Я пытаюсь использовать freebase вместе с word2vec gensim, чтобы найти оценку подобия между векторами двух слов, используя следующий код.Невозможно найти слова при использовании freebase с word2vec

model = gensim.models.Word2Vec() 
model = models.Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000-en.bin.gz', binary=True)

после создания модели на основе freebase мой код дает мне ключевую ошибку для любого слова.

model.similarity('microsoft', 'apple')

Это дает мне KeyError: 'microsoft'

Но когда я использую GoogleNews вместо Freebase он работает отлично. Любая идея почему?

источник

2015-07-01 mribot

model.similarity('/en/microsoft', '/en/apple')

источник

2015-07-01 18:05:10 scottyli

Эта конкретная модель имеет Freebase/ен идентификаторами как этикетки для слов. Есть еще одна версия, которая использует MID (т.е./ID). Вы можете найти метку на английском языке (или любом другом языке), связанную со словом/сущностью, используя API-интерфейс Freebase или дамп данных (вы не можете просто щелкнуть «/ en /» в начале слова, как вы можете догадаться из @ scottyli's ответ).

Вы также можете захотеть взглянуть на этот вопрос & ответ: Using freebase vectors with gensim

источник

2015-07-01 19:33:54

Невозможно найти слова при использовании freebase с word2vec

ответ

Смежные вопросы