2016-10-21 13 views
1

Я пытаюсь получить ключи, а также векторы в векторе model.syn0, который дает векторы model.syn0["word"], который дает n-мерный вектор. Есть ли лучший способ создать список всех слов в модели в том же порядке, что и векторы syn0, чем это? У меня 350000 слов, и это займет слишком много времени.Как получить пары значений ключа в numpy.ndarray? (Gensim Word2vec)

from gensim.models import word2vec as wv 
model = wv.Word2Vec.load('model') 
lab=[] 
for i in model.syn0: 
    lab.append(model.similar_by_vector(i)[0]) 

print(type(model.syn0)) 
    <type 'numpy.ndarray'> 

ответ

0

В направлении Gordon Mohr, я обнаружил, что ключевые пары значений сохраняются в model.index2word.

Таким образом, список пар ключ-значение легко может быть получено с помощью:

lab=model.index2word