2
Я использую gensim doc2vec
. Я хочу знать, есть ли эффективный способ узнать размер словаря из doc2vec. Один грубый способ - подсчитать общее количество слов, но если данные огромны (1 ГБ или более), то это не будет эффективным способом.Есть ли способ получить размер словаря из модели doc2vec?
Нет такого параметра, как vocab. – Yesh
Конечно, было - на момент написания! И все-таки - просто в другом месте! В более поздних версиях gensim объект 'vocab' был перенесен в составное свойство' wv', а в 1.0.0, выпущенном в феврале 2017 года после ответа на 1-ое письмо, появилась возможность обратной совместимости для доступа к 'vocab' через 'model.vocab' был удален. Ответ выше был обновлен, чтобы соответствовать текущему gensim. – gojomo
Welp, я удалил свой комментарий, так как ваши и мои были такими же. – Yesh