2015-07-01 6 views
1

Я пытаюсь использовать freebase вместе с word2vec gensim, чтобы найти оценку подобия между векторами двух слов, используя следующий код.Невозможно найти слова при использовании freebase с word2vec

model = gensim.models.Word2Vec() 
model = models.Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000-en.bin.gz', binary=True) 

после создания модели на основе freebase мой код дает мне ключевую ошибку для любого слова.

model.similarity('microsoft', 'apple') 

Это дает мне KeyError: 'microsoft'

Но когда я использую GoogleNews вместо Freebase он работает отлично. Любая идея почему?

ответ

0

Эта конкретная модель имеет Freebase/ен идентификаторами как этикетки для слов. Есть еще одна версия, которая использует MID (т.е./ID). Вы можете найти метку на английском языке (или любом другом языке), связанную со словом/сущностью, используя API-интерфейс Freebase или дамп данных (вы не можете просто щелкнуть «/ en /» в начале слова, как вы можете догадаться из @ scottyli's ответ).

Вы также можете захотеть взглянуть на этот вопрос & ответ: Using freebase vectors with gensim

 Смежные вопросы

  • Нет связанных вопросов^_^